动画师喜获“AI神器”:提速100倍,视频直接转动画,告别动捕?
发布时间:2026-03-02 10:06:28 浏览量:3
在生成式AI快速渗透内容行业的当下,动画制作这一“既昂贵又耗时”的环节,正在成为创业公司最想撬动的一块硬骨头。
由前OpenAI科学家Andrew Carr与前谷歌Creative Lab创始成员Jonathan Jarvis联合创立的Cartwheel,近日在接受Games Beat采访时再次强调:其工具链能够让3D动画制作流程“最高快100倍”,并透露将“很快”发布API,以便把能力更深地接入外部工作流与生产管线。
这并不是Cartwheel第一次把“100倍”摆到台前。
早在2025年5月15日,Cartwheel就通过官方新闻稿宣布产品从封闭测试走向公开可用,并给出了一个极具“工业工具”意味的定位:它要做的不是生成一段不可编辑的视频成片,而是把文本、视频参考与动作库转化为“可直接进入现有工作流”的3D角色动画数据,让动画师能在Cartwheel或Maya、Blender等熟悉的软件里继续大幅优化与精修,而无需对既有流程做“破坏性变更”。
而基于该技术,商业层面,成立于2023年的Cartwheel在2024年6月便获得了由Accel领投的560万美元种子轮融资,2025年5月便又披露了一笔总金额达到1000万美元的投资,该轮由CraftVentures领投,WndrCo、TirtaVentures与AI视频生成工具Runway等参与。
专做“可控的动作数据”
具体来看,Cartwheel的核心思路,是把AI放在“控制rig(绑定)”这一层:用文本提示让系统驱动专业级骨架与控制器产出动作,再把这份动作数据交回给传统DCC/引擎继续打磨。
官方在采访中表示,Cartwheel并非生成最终帧画面,而是通过提示词让AI去“操控绑定”,并把数据发送到用户选择的3D软件进一步完善。
因此,Cartwheel的目标用户也并不只有“会做动画的人”。从官方叙事与投资方材料看,它更像是把动作资产的生产门槛整体下拉:专业动画师可以把它当作快速原型工具,把时间从“找参考、做blocking、反复试错”挪到真正决定质量的表演与节奏上。
经验较少的创作者则可以更快做出可用片段;而设计师与开发者也能把角色动画导出到既有项目里,用于交互演示、玩法验证或内容迭代。
而为了让“动作”像素材一样可检索、可复用,Cartwheel还把动作库作为重要产品组件。目前官方已经构建了一个拥有超过2.7万个可以投入生产的动作片段的精选库,用户可以面向动画、游戏等场景的快速取用与二次组合。
当然除了现有的动作库,以及AI的传统艺能「文本生成」,在输入侧,Cartwheel还支持使用视频参考,该工具可以从录制或上传的视频中提取3D动作,然后输出可编辑的动作数据。
根据官方介绍,产品在封闭测试阶段等待名单曾超过6万名创作者,并称测试用户来自DreamWorks、Duolingo、Sony、Roblox等公司。
值得注意的是,除了网页端,Cartwheel还发布了官方API。而API则意味着产品正在从“网页工具”走向“可嵌入式能力”,对游戏和互动内容行业来说,是否能通过API、插件或标准化导出格式进入现有生产线,往往比“网页端好不好用”更决定它能落地到多深。
与其配套的,从其定价页信息看,Cartwheel也在为“规模化使用”预留空间。
官方既提供面向个人创作者的免费起步方案,免费用户每月可进行150 Spin,39美元每月的订阅挡位则支持1500Spin,而最高每月95美元的订阅则支持不限次数的使用,也明确给出了API的入口,其中价格透明的标准挡,每月定价为300美元,适合4-8人的小团队,和有限的项目。
向Maya导出一次就需要100Spin
这意味着它很可能会沿着“低门槛获客—用量计费—企业/API方案”的路径,逐步把工具渗透到更重的生产场景里。
先别急着神化,它解决的不是“一键电影级成片”
而把Cartwheel放回到动画工业的真实语境里,在GameLook看来,它更像“加速器”而不是“替代者”。
首先,Cartwheel自己就承认生成动作仍处于早期阶段:在采访中,当被问到生成结果偶尔“很怪”时,Andrew Carr直言这是“幻觉”,并表示运动生成系统“还在婴儿期”,需要通过更密的标注与描述来持续改进。
目前网页上能够生成的也只有两个大类的内容
其次,Cartwheel目前公开强调的交付核心,是“基于rig的可编辑运动数据”。这类能力天然更擅长把人体大关节、重心、节奏等“主体动作”做快、做成型;但对于手指、面部表演、布料与毛发等高度依赖绑定细节、二级运动、物理约束与镜头级审美的部分,至少从其公开材料的重点来看,并未被呈现为当前主交付范围。
更现实的结果是:即便主体动作能快速产出,项目仍需要在Maya/Blender/引擎侧用传统动画、动捕清洗或物理模拟系统去补齐细节,才能达到“大制作关键镜头”的稳定标准——这也是为什么头部影视与3A级项目在关键节点上仍离不开动捕棚、成熟的动画团队与严格的质量控制。
此外,根据外媒此前的报道,Cartwheel短期内会优先聚焦“人类动画”,非人形角色仍在规划中。
对游戏行业而言,这个限制并不小:大量产品的核心卖点恰恰来自非人形角色、夸张比例、拟兽、怪物与超写实肌肉/盔甲等复杂体型,如何在不同骨架结构上保持可控与一致,决定了工具的通用性边界。
尽管如此,如果把视角从“顶级叙事过场”移到“真实产能结构”,Cartwheel这类工具对游戏行业的意义反而更清晰。
游戏项目里,动作资产的消耗往往是持续性的:战斗招式、受击与硬直、NPC日常行为、节日活动演出、版本更新带来的新动作与新镜头……其中相当一部分并不是“决定口碑的关键节点”,但又必须做、量还很大。
对这类需求,Cartwheel的价值不一定体现在“做出史诗级动作”,而在于把从“想法”到“可跑起来的动作雏形”这一步压到更短,让团队更早验证手感、节奏与镜头,然后把有限的人力集中到少数真正需要精修的片段上。
这与中国游戏行业的组织现实存在天然契合点。国内大量大型厂商与核心团队集中在一线与新一线城市,动捕资源往往以“自建少数核心能力+外部租用/外包”的方式配置;而对于中小团队来说,动作捕捉与高质量动画更是典型的“做得起和做不起”的分水岭。
只要工具在可用率上站稳,它就可能显著降低两类成本:一是把大量“够用即可”的日常动作从手工制作转为“生成+编辑”的组合;二是让缺乏动捕条件的团队也能更频繁地尝试复杂演出与过场表达,把原本只属于头部项目的“动作密度”带到更广的产品带宽里。
更进一步,配合API,Cartwheel对游戏行业的渗透方式可能不止是“动画师多了一个网页工具”,而会朝着“生产线的一环”演进:从策划/关卡对动作需求的文本化描述开始,到自动检索动作库、生成候选动作、按项目骨架导出到引擎,再由动画师进行关键帧修正与风格统一,最后进入版本构建与测试。
对于长线运营产品而言,这种“动作生产的半自动化流水线”一旦跑通,边际成本下降会非常明显。
不必立刻赢下“电影级镜头”,但可能先赢下“多数工作量”
在GameLook看来,Cartwheel其实把自己放在了一个相当明确的位置:用AI去解决动画工作里最耗时、最重复的部分,让“动作”像素材一样可生成、可检索、可编辑、可导出。
它离顶级项目在关键节点上所要求的极致表演与细节稳定性,显然还有距离;但对游戏行业而言,真正可被改写的往往不是那一小段“最重要的镜头”,而是占据绝大多数工期与预算的“日常内容”。
如果未来一两年Cartwheel能在稳定性、骨骼适配、风格一致性与工程化接入上持续推进,那么它更可能带来的不是“动捕棚消失”。
而是一个更现实的变化:更多团队可以把时间从“把动作做出来”转移到“把动作做得更好、更有表达”,并在相同预算下做出更密、更丰富、更具演出感的内容。
这或许才是“100倍”叙事真正值得被检验的地方。
