阿里发布的一款声音驱动人物动画的模型:EchoMimicV2
更新时间:2024-12-05 22:23 浏览量:46
choMimicV2 是蚂蚁金服的研究团队提出的一种半身人物动画技术,它能够通过一个参考图像、一段音频片段和一系列手部姿势来生成高质量的动画视频,确保音频内容与人物半身动作的一致性。
该方法通过音频 - 姿态动态协调策略,包括姿态采样和音频扩散,增强了半身动画的细节、面部和手势表情性,并减少了条件冗余。
体验地址:https://huggingface.co/spaces/fffiloni/echomimic-v2开源地址:https://github.com/antgroup/echomimic_v2项目主页:https://antgroup.github.io/ai/echomimic_v2