2026-03-26 08:00 UTC+8站内改写2 分钟阅读更新: 2026-06-27 08:25 UTC+8

Runway 选择 Modal 为 Runway Characters 提供实时推理支持

Runway 与 Modal 合作，利用 Modal 的无服务器计算平台为 Runway Characters 提供实时视频推理。Runway Characters 是一个实时视频代理 API，可从单张图像生成可定制的数字角色，无需微调。该技术已应用于多个领域，包括客户支持、内部培训等。Modal 的基础设施使 Runway 能够在 30 天内从概念验证到生产，并支持全球低延迟部署。

来源Modal Blog

Runway 宣布与 Modal 达成合作，采用 Modal 的无服务器计算平台来支持其最新产品 Runway Characters 的实时推理。Runway Characters 是一个实时视频代理 API，允许开发者、初创公司、企业和消费者构建完全可定制的对话式数字角色。这些视频代理可以拥有任何外观和视觉风格，并完全控制语音、个性、知识和行为。该技术基于 Runway 的通用世界模型 GWM-1，只需一张图像即可生成富有表现力的数字角色，无需进行微调。

目前，已有数千家组织在使用 Characters，包括财富 10 强科技公司、主要好莱坞制片厂、全球广告代理公司和游戏公司。应用场景涵盖客户支持、内部培训、体验式广告和沉浸式游戏世界。Characters 代表了在线交互从文本向实时视频转变的第一步。

这种持续、富有表现力、低延迟的视频生成需要专门为实时交互构建的基础设施。Modal 的无服务器计算平台专为 GPU 密集型、延迟关键且需求高度可变的工作负载而设计。Modal 提供的迭代速度使 Runway 团队能够在不到 30 天的时间内从概念验证转向生产。

"实时视频推理与批量生成是完全不同的工程挑战，尤其是在我们的客户在全球范围内运行这些体验的情况下，"Runway 的 CTO Kamil Sindi 表示。"Runway Characters 需要在对话全程保持稳定低延迟——包括表情、唇语同步、手势——且不能出现性能下降。Modal 的基础设施为我们提供了所需的性能和可靠性，使我们能够在每个全球区域以生产规模交付。"

为了实现实时交互所需的延迟，需要跨多个 GPU 分配推理，并在节点之间进行高带宽通信。通过在 Modal 上添加一行代码，Runway 可以将其容器转变为具有 RDMA 网络的多节点 GPU 集群，并在每个区域即时可用。Modal 将这些工作负载跨地域部署为单一统一池，将路由靠近用户并按需扩展，因此 Runway 可以在任何地方服务用户，而无需预先配置或直接管理区域基础设施。

"Runway 正在推动世界模型的可能性边界，这需要以非常低的延迟大规模运行复杂模型。这正是 Modal 擅长的领域，"Modal 的 CEO Erik Bernhardsson 表示。"我们很自豪能为 Characters 提供基础设施支持。"

Runway Characters 现已向所有开发者和企业开放，可通过 dev.runwayml.com 访问，消费者可通过 runwayml.com 使用。企业团队可联系了解更多关于大规模部署自定义角色体验的信息。