AI视频正走出短片垃圾时代

The Verge AI·5月21日 23:30 UTC·作者 Janko Roettgers

关键信息

Luma 首席执行官 Amit Jain 说，短生成片段远远不够，因为它们既不是镜头，也不是段落，更不是场景，影视行业需要的是长期、端到端的工作。Google 新版 Flow 采用智能体引导用户完成多步骤流程，并可像在 Slack 里添加同事一样把已开发的角色加入提示词；而 Luma 的 Uni-1 模型则旨在无需极其复杂的提示词，也能理解一个设想中的世界。

资讯摘要

这篇文章认为，社交媒体上那些由 AI 生成的电影短片，并不意味着好莱坞就要被取代了。无论是伪造的 Daniel Craig 骑踏板车，还是 Godzilla 大战 King Kong、The Avengers 穿行曼哈顿，这些片段看起来很炫，但本质上仍只是短视频，不是真正可用的制作流程。文章指出，AI 视频公司真正发生的变化，是它们开始重新思考如何向影视公司销售自己的工具。Luma AI 首席执行官 Amit Jain 表示，公司最初向影视圈推销的方式，是说 AI 视频可以替代摄影机，让人们只靠提示词就能更快、更便宜、更好地拍电影。可是在与娱乐公司合作后，Luma 很快意识到，单纯生成一个片段并不能解决实际制作问题。Jain 说，10 到 16 秒的生成内容既不是镜头，也不是片段，更不是场景，影视行业需要的是不止于孤立输出的系统。

现在，Luma 希望自己的 AI 更像一个智能体，能够支持整个制作流程，这与 AI 编程工具从简单的 vibe coding 走向 agentic workflows 的演变很相似。Google 也在走类似路线，它新版的 Flow 是一个 AI 媒体创作平台，智能体会引导用户从概念出发，逐步完成剧情、角色和视觉风格的设计，然后再生成视频。新版 Flow 还强调一致性，用户可以像在 Slack 里添加同事一样，把已经开发好的角色通过标签加入项目。文章还提到，新一代视频模型在理解物理规律、特定年代的视觉风格以及电影语言方面也更强了，Flow 由 Google 的 Gemini Omni world model 驱动，而 Luma 则使用 Uni-1 作为统一模型。作为落地案例，Luma 最近还与 Amazon 合作制作了《The Old Stories: Moses》，这是 MGM《House of David》的一个配套特别节目；拍摄时，演员在显示 Luma 模型生成背景的 LED 屏前表演，连服装也由 AI 渲染。文章最后指出，如果某个镜头效果不理想，只需要重新给出一个提示词，就能快速生成新的素材，这说明 AI 对影视行业的影响更可能体现在加速和重塑制作流程，而不是简单地产出短片。

资讯正文

这是 Janko Roettgers 的 Lowpass，一份聚焦科技与娱乐不断演变交汇点的新闻简报，每周仅向 The Verge 订阅者同步一次。

好莱坞完了——至少，社交媒体上越来越多的人希望你相信这一点。他们所谓的证据，是一些 AI 生成的视频片段：丹尼尔·克雷格骑着 Vespa 穿过一座意大利城市、哥斯拉与金刚对打，或者《复仇者联盟》在曼哈顿上空飞驰。

但现实是，这种廉价的“垃圾内容”短期内不会取代好莱坞大片。不过，新一代 AI 视频解决方案可能会颠覆制片厂的工作方式。这是因为，直到最近，AI 公司基本上一直在向好莱坞兜售与那些 Twitter 用户相同的想法，只是包装得稍微更像那么回事一些。其核心卖点是：AI 视频将让每个人都能更快、更便宜、更好地拍电影——一条提示词就能完成。

Luma AI 首席执行官 Amit Jain 说：“前提是：把你们的摄像机换成我们的视频模型。”他的公司曾经也向制片厂兜售过同样的说法。但当它开始与娱乐行业合作时，便接受了一次关于好莱坞真实运作方式的速成课。

Jain 现在说：“光生成一个片段是不够的。因为然后呢？” 视频模型生成的片段通常只有 10 到 16 秒。“那不是一个镜头。那不是一个序列。那不是一个场景，”Jain 说。“单纯批量生成短视频是不够的。”

如今，像 Luma 这样的 AI 公司相信，他们已经找到了一种更好的方式来向好莱坞推销 AI。要点是什么？不要只把 AI 用在视频上——要把它用在一切环节上。

Luma 一直在开发 AI 智能体，帮助完成整个制作流程。Jain 将这一转变比作 AI 软件开发的演进路径：Anthropic 之类的公司正从简单的 vibe coding 转向 agentic workflow。

Jain 说：“光生成一点代码是不够的。我们需要这些系统去做长周期、端到端的工作。那才能真正帮人解决问题。”他相信，AI 智能体对好莱坞也同样如此。

采用这种思路的不只是 Luma。本周，Google 刚刚推出了其 AI 媒体创作平台 Flow 的新版本，同样强调以智能体驱动的端到端工作，而不是简单的片段生成。Google Labs 副总裁 Elias Roman 表示：“生成式工具正在发生一次巨大的演进。往前看，它们会越来越像智能体。”

在新版 Flow 中，智能体会引导用户完成多个步骤，从构思开始，到充实情节线，再到开发角色，最后确定所需的视觉风格和整体氛围。等到最终要生成视频时，智能体会利用一路上学到的信息来实现特定结果，而不必就每一个细节都反复提示。

这其中要解决的一个问题是一致性。生成式 AI 长期以来都难以让角色在不同片段之间保持同样的外观。在新版 Flow 中，用户只需像在 Slack 对话里添加同事那样，通过给一个角色打标签，就能把自己为项目开发出的角色加入到提示词中。

新一代视频模型在理解物理规律、特定时代的视觉风格以及电影语言方面也更胜一筹。Google 的 Flow 由公司新的 Gemini Omni 世界模型驱动，而 Luma 则开发了 Uni-1，作为一种统一模型，如今不再需要极其复杂的提示词，就能理解一个设想中的世界。

Luma 最近与 Amazon 联手制作了《The Old Stories: Moses》，这是 MGM 的《House of David》剧集的配套特别篇。在拍摄《Moses》时，演员会在显示由 Luma 视频模型生成背景的 LED 墙前表演，而他们的服装也会通过 AI 进行渲染。

[Media: https://twitter.com/LumaLabsAI/status/2044836893586854158]

如果某个镜头看起来不太对，只需要再输入一个新提示词，就能生成一个新的素材。Jain 说：“这种制作水平，每小时电视内容大约需要六到八周。现在，他们只需要一周。”

一些制片厂正越来越多地接受这种变化。Netflix 在 3 月收购了 Ben Affleck 的 AI 公司 InterPositive，并在同月推出了自己的 AI 动画工作室。Jain 声称，两家大型好莱坞制片厂已经在使用 Luma 的 AI 代理。他拒绝点名，但这家公司公开宣称的一些较小进展包括：Luma 最近宣布与独立制片公司 Wonder Project 成立合资企业，而后者制作了《Moses》。

这些变化无疑会导致失业，尽管影响规模目前仍不得而知。如果制片厂能在一个月内拍完一部电视剧，而不是 10 个月，那么就不需要在另外 9 个月里继续发工资。AI 支持者常提的反驳观点是，这将带来更多制作项目。对于洛杉矶而言，这或许尤其算得上是一线希望，因为近年来这里的制作天数大幅下滑。

现在，我们只需要看看好莱坞是否会把这项技术用在真正让人想看得内容上。

来源与参考

收录于 2026-05-22