辉达申请具有自适应语音速率的音频驱动的面部动画专利,确定语音速率为音频片段生面部动画
更新时间:2025-01-24 19:31 浏览量:16
金融界2025年1月24日消息,国家知识产权局信息显示,辉达公司申请一项名为“具有自适应语音速率的音频驱动的面部动画”的专利,公开号 CN 119338956 A,申请日期为2023年7月。
专利摘要显示,本发明公开了具有自适应语音速率的音频驱动的面部动画。在各个示例中,用于具有自适应语音的音频驱动的面部动画的技术包括确定与音频片段相关联的语音速率超过阈值。该技术还包括至少基于该语音速率超过阈值,将与该音频片段相关联的第一特征集上采样为大小不同于第一特征集的第二特征集。该技术进一步包括使用一个或更多个机器学习模型并且至少基于第二特征集的至少子集来生成与该音频片段相对应的面部动画输出。