AI News HubLIVE
站內改寫2 分鐘閱讀

Runway 選擇 Modal 為 Runway Characters 提供實時推理支持

Runway 與 Modal 合作,利用 Modal 的無服務器計算平台為 Runway Characters 提供實時視頻推理。Runway Characters 是一個實時視頻代理 API,可從單張圖像生成可定製的數字角色,無需微調。該技術已應用於多個領域,包括客户支持、內部培訓等。Modal 的基礎設施使 Runway 能夠在 30 天內從概念驗證到生產,並支持全球低延遲部署。

Runway 宣佈與 Modal 達成合作,採用 Modal 的無服務器計算平台來支持其最新產品 Runway Characters 的實時推理。Runway Characters 是一個實時視頻代理 API,允許開發者、初創公司、企業和消費者構建完全可定製的對話式數字角色。這些視頻代理可以擁有任何外觀和視覺風格,並完全控制語音、個性、知識和行為。該技術基於 Runway 的通用世界模型 GWM-1,只需一張圖像即可生成富有表現力的數字角色,無需進行微調。

目前,已有數千家組織在使用 Characters,包括財富 10 強科技公司、主要好萊塢製片廠、全球廣告代理公司和遊戲公司。應用場景涵蓋客户支持、內部培訓、體驗式廣告和沉浸式遊戲世界。Characters 代表了在線交互從文本向實時視頻轉變的第一步。

這種持續、富有表現力、低延遲的視頻生成需要專門為實時交互構建的基礎設施。Modal 的無服務器計算平台專為 GPU 密集型、延遲關鍵且需求高度可變的工作負載而設計。Modal 提供的迭代速度使 Runway 團隊能夠在不到 30 天的時間內從概念驗證轉向生產。

"實時視頻推理與批量生成是完全不同的工程挑戰,尤其是在我們的客户在全球範圍內運行這些體驗的情況下,"Runway 的 CTO Kamil Sindi 表示。"Runway Characters 需要在對話全程保持穩定低延遲——包括表情、唇語同步、手勢——且不能出現性能下降。Modal 的基礎設施為我們提供了所需的性能和可靠性,使我們能夠在每個全球區域以生產規模交付。"

為了實現實時交互所需的延遲,需要跨多個 GPU 分配推理,並在節點之間進行高帶寬通信。通過在 Modal 上添加一行代碼,Runway 可以將其容器轉變為具有 RDMA 網絡的多節點 GPU 集羣,並在每個區域即時可用。Modal 將這些工作負載跨地域部署為單一統一池,將路由靠近用户並按需擴展,因此 Runway 可以在任何地方服務用户,而無需預先配置或直接管理區域基礎設施。

"Runway 正在推動世界模型的可能性邊界,這需要以非常低的延遲大規模運行復雜模型。這正是 Modal 擅長的領域,"Modal 的 CEO Erik Bernhardsson 表示。"我們很自豪能為 Characters 提供基礎設施支持。"

Runway Characters 現已向所有開發者和企業開放,可通過 dev.runwayml.com 訪問,消費者可通過 runwayml.com 使用。企業團隊可聯繫瞭解更多關於大規模部署自定義角色體驗的信息。