温馨提示:本站为童趣票务官方授权演出订票中心,请放心购买。
你现在的位置:首页 > 演出资讯  > 儿童亲子

亿道信息申请基于音频驱动的数字人生成方法相关专利,实现面部动画与音频的高同步

发布时间:2025-06-11 19:51:34  浏览量:2

金融界2025年6月11日消息,国家知识产权局信息显示,深圳市亿道信息股份有限公司申请一项名为“基于音频驱动的数字人生成方法、设备及计算机存储介质”的专利,公开号CN120125719A,申请日期为2025年02月。

专利摘要显示,本申请公开了一种基于音频驱动的数字人生成方法、设备及计算机存储介质,涉及数字人说话生成技术领域,该方法包括:提取输入音频的音频特征并按照振幅进行分块,得到音频块;将音频块输入至DIT模型,并结合随机噪声和时间向量对音频块进行滑块处理,获取音频驱动生成特征关键点;识别输入的人脸图像的脸部关键点,并对人脸图像进行特征提取,确定待驱动人脸原始特征关键点;根据输入音频的时序信息,将音频驱动生成特征关键点和待驱动人脸原始特征关键点进行特征融合,得到融合关键点特征;基于融合关键点特征,驱动数字人的面部表情和动作,生成与输入音频匹配的面部动画,实现面部动画与音频的高同步,提高了数字人说话的自然度。

天眼查资料显示,深圳市亿道信息股份有限公司,成立于2008年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本14144.63万人民币。通过天眼查大数据分析,深圳市亿道信息股份有限公司共对外投资了8家企业,参与招投标项目16次,财产线索方面有商标信息56条,专利信息159条,此外企业还拥有行政许可65个。