阿里发布的一款声音驱动人物动画的模型：EchoMimicV2

发布时间：2024-12-05 22:23:00 浏览量：108

choMimicV2 是蚂蚁金服的研究团队提出的一种半身人物动画技术，它能够通过一个参考图像、一段音频片段和一系列手部姿势来生成高质量的动画视频，确保音频内容与人物半身动作的一致性。

该方法通过音频 - 姿态动态协调策略，包括姿态采样和音频扩散，增强了半身动画的细节、面部和手势表情性，并减少了条件冗余。

体验地址：https://huggingface.co/spaces/fffiloni/echomimic-v2开源地址：https://github.com/antgroup/echomimic_v2项目主页：https://antgroup.github.io/ai/echomimic_v2

标签：模型音频动画