温馨提示:本站为童趣票务官方授权演出订票中心,请放心购买。
你现在的位置:首页 > 演出资讯  > 儿童亲子

Runway发布新模型:2美元干完180人动画团队一天的活

更新时间:2025-04-01 18:36  浏览量:3

就在昨晚,Runway 发布了最新的AI视频生成器 —— Runway Gen-4。

其号称迄今为止保真度最高。

从官方演示视频和X网友实测效果评估来看,可以说,Runway Gen-4 大幅度改善了视频生成中最关键的方面,即主体一致性和环境一致性。这一点和近期 GPT-4o实现的提升点是相似的。

只需要一张图像作为参考,Runway Gen-4 就能生成具有“连贯的环境背景”的视频,从背景中的不同视角和位置都能很好地还原主体。

Runway 还特别强调了提示词的简洁性要求:“因为图像传达了有关主题、构图、颜色、灯光和风格的关键视觉信息,所以文本提示应该几乎完全集中在描述所需的动作上。”

以下是展示主体一致性的生成效果。比如雕塑在日常户外、燃烧建筑、阴暗室内都能呈现一致的外形轮廓和细节,光照效果也非常自然。你甚至能看到视频后面部分,街头摆放的小球球面反射呈现了走动人群的真实动态。

以下是展示场景一致性的生成效果,很明显地貌上能保持一致,但真实地形上是否能够完全还原其实还有待更多考察。毕竟单个片段只有 5 秒和 10 秒两种视频长度,建议在制作时多提供同一个场景的不同视角的照片。

除了一致性,Runway Gen-4 生成的视频在动作层面具有相当好的真实性和动态性,以及物理理解能力。

在 Runway Gen-4 之前,真实性最好的视频生成器,应该是谷歌的 Veo 2,目前感觉两者不相伯仲。

Veo 2 价格昂贵(2.50美元/5秒),相比之下,按照 Runway 年付费 144 美元(每月12美元)的普通用户来估算,每个月 625 Credit,Gen-4 视频每秒 12 Credit,折合价格是 1.15 美元/5 秒,不到 Veo 2 的一半。

据网友的一个具体场景的单片段测试,在生成场景的动态性方面,Runway Gen-4可能比 Veo 2 更强大。

以下例子从一个 Midjourney 生成的图像作为第一帧,基于 Runway Gen-4、Luma Ray2、Kling 1.6、Pika 2.2、Veo 2 分别生成后续内容。Runway Gen-4 呈现了人物快速启动降落伞以及镜头下沉并拉远的动态,还兼顾背景的爆炸效果,无限接近电影级别。其它模型(包括Veo 2)则把内容限定在主体身上,运动速度慢,运镜也很一般,就是一个普通的动图。

再来看看网友实测的这个开车场景,动态性方面可以说刷爆了速度与激情指标。

不同主体或物体的交互带来的巨大动态变化也是视频生成的痛点,网友实测的这个海浪冲击人物的效果着实将碰撞瞬间处理的特别好,虽然呈现的不算完全真实,至少没翻车,也没显得过度魔幻。

再来看看多片段合成的玩偶动物纪录片的例子。

过去这类实物定格动画的耗资成本巨大。以黏土动画《小鸡快跑》为例,完成这部时长 84 分钟的影片需要 30 组布景、80 名动画师以及 180 名工作人员。整个影片耗费了 18 个月才拍摄而成,团队每天只能拍出大约 11 秒的成片。

黏土动画对材料依赖性也很高,其制作公司“阿德曼动画公司”在 2023 年底还被曝出差点因为 “ Newplast ” 黏土停产,而停止制作粘土动画。

现在你只需要一个人在网页上就可以做出来这类动画。对于风格多样的实景宣传片,那更是不在话下。

不仅是实景、动画,Runway Gen-4 还可以和电影视觉特效内容无缝集成。

Runway 通过一个例子来展示如何从草图生成真实的影像级概念图,并继而生成好莱坞级别的影片片段,最终拼接出了完整的故事。整个生成过程保持了高度的主体一致性和环境一致性。

最后的成品如下,讲述了一个农场背景中,一个年轻人通过智取逃离仇人追杀的故事片段。除了基础的主体一致性、场景一致性,成片在真实感、电影感方面都是好莱坞级别。

那么,如何用 Runway Gen-4 做出优质的视频呢?

实际上,官方也温馨提示:即便模型如此强大,也不要贪快。

Runway 特别写了一个博客介绍如何生成高质量的视频:

文本提示尽可能简洁;输入图像尽可能高质量(无视觉伪影);文本提示要重点描述动作;在提示中说明“需要什么”,而不是“不需要什么”;用一般术语来指代主体,例如“主体”;

参考图像是必须的。不要从过于复杂的提示开始,逐步迭代而不是一步到位能够更好地保证质量。

具体而言,先从简单的提示开始,然后根据需要添加更多细节。基础提示只捕捉场景中最基本的运动。

Runway 表示:“这样可以帮助你确定哪些添加内容可以改善视频,了解不同元素如何相互作用,以及更有效地排除意外结果的故障。”

比如对于这个机械公牛的输入图像:

给 Runway Gen-4 的提示词是:一架手持摄像机跟踪这头机械公牛穿越沙漠的轨迹。它的运动扰动了机械公牛身后扬起的尘土。电影真人版。

我们对提示词进行分解:

最后的生成视频如下。

Runway Gen-4 支持的分辨率是百万像素级别,支持 24 帧生成,你也可以在生成完成之后将视频分辨率提高到 4K。 这些基础能力足够满足好莱坞级别的影片制作。

一直以来,Runway 在全球的 AI 视频生成领域都能保持领先,用户活跃度也是最高的。主要原因应该是 Runway 在数据层面具有独到的优势,他们与好莱坞一家大型制片厂达成协议,并拨出数百万美元资助使用人工智能生成视频的电影。关于Gen-4 的训练数据细节,Runway 并未透露其来源。

目前,Runway Gen-4 正在分阶段向付费个人和企业客户推出,还没等到更新的可以先刷一下实测视频过过瘾。