Runway 选择 Modal 为 Runway Characters 提供实时推理支持
Runway 与 Modal 合作,利用 Modal 的无服务器计算平台为 Runway Characters 提供实时视频推理。Runway Characters 是一个实时视频代理 API,可从单张图像生成可定制的数字角色,无需微调。该技术已应用于多个领域,包括客户支持、内部培训等。Modal 的基础设施使 Runway 能够在 30 天内从概念验证到生产,并支持全球低延迟部署。
Runway 宣布与 Modal 达成合作,采用 Modal 的无服务器计算平台来支持其最新产品 Runway Characters 的实时推理。Runway Characters 是一个实时视频代理 API,允许开发者、初创公司、企业和消费者构建完全可定制的对话式数字角色。这些视频代理可以拥有任何外观和视觉风格,并完全控制语音、个性、知识和行为。该技术基于 Runway 的通用世界模型 GWM-1,只需一张图像即可生成富有表现力的数字角色,无需进行微调。
目前,已有数千家组织在使用 Characters,包括财富 10 强科技公司、主要好莱坞制片厂、全球广告代理公司和游戏公司。应用场景涵盖客户支持、内部培训、体验式广告和沉浸式游戏世界。Characters 代表了在线交互从文本向实时视频转变的第一步。
这种持续、富有表现力、低延迟的视频生成需要专门为实时交互构建的基础设施。Modal 的无服务器计算平台专为 GPU 密集型、延迟关键且需求高度可变的工作负载而设计。Modal 提供的迭代速度使 Runway 团队能够在不到 30 天的时间内从概念验证转向生产。
"实时视频推理与批量生成是完全不同的工程挑战,尤其是在我们的客户在全球范围内运行这些体验的情况下,"Runway 的 CTO Kamil Sindi 表示。"Runway Characters 需要在对话全程保持稳定低延迟——包括表情、唇语同步、手势——且不能出现性能下降。Modal 的基础设施为我们提供了所需的性能和可靠性,使我们能够在每个全球区域以生产规模交付。"
为了实现实时交互所需的延迟,需要跨多个 GPU 分配推理,并在节点之间进行高带宽通信。通过在 Modal 上添加一行代码,Runway 可以将其容器转变为具有 RDMA 网络的多节点 GPU 集群,并在每个区域即时可用。Modal 将这些工作负载跨地域部署为单一统一池,将路由靠近用户并按需扩展,因此 Runway 可以在任何地方服务用户,而无需预先配置或直接管理区域基础设施。
"Runway 正在推动世界模型的可能性边界,这需要以非常低的延迟大规模运行复杂模型。这正是 Modal 擅长的领域,"Modal 的 CEO Erik Bernhardsson 表示。"我们很自豪能为 Characters 提供基础设施支持。"
Runway Characters 现已向所有开发者和企业开放,可通过 dev.runwayml.com 访问,消费者可通过 runwayml.com 使用。企业团队可联系了解更多关于大规模部署自定义角色体验的信息。