Runway 選擇 Modal 為 Runway Characters 提供即時推理支援
Runway 與 Modal 合作,利用 Modal 的無伺服器計算平臺為 Runway Characters 提供即時影片推理。Runway Characters 是一個即時影片代理 API,可從單張影像生成可定製的數字角色,無需微調。該技術已應用於多個領域,包括客戶支援、內部培訓等。Modal 的基礎設施使 Runway 能夠在 30 天內從概念驗證到生產,並支援全球低延遲部署。
Runway 宣佈與 Modal 達成合作,採用 Modal 的無伺服器計算平臺來支援其最新產品 Runway Characters 的即時推理。Runway Characters 是一個即時影片代理 API,允許開發者、初創公司、企業和消費者構建完全可定製的對話式數字角色。這些影片代理可以擁有任何外觀和視覺風格,並完全控制語音、個性、知識和行為。該技術基於 Runway 的通用世界模型 GWM-1,只需一張影像即可生成富有表現力的數字角色,無需進行微調。
目前,已有數千家組織在使用 Characters,包括財富 10 強科技公司、主要好萊塢製片廠、全球廣告代理公司和遊戲公司。應用場景涵蓋客戶支援、內部培訓、體驗式廣告和沉浸式遊戲世界。Characters 代表了線上互動從文本向即時影片轉變的第一步。
這種持續、富有表現力、低延遲的影片生成需要專門為即時互動構建的基礎設施。Modal 的無伺服器計算平臺專為 GPU 密集型、延遲關鍵且需求高度可變的工作負載而設計。Modal 提供的迭代速度使 Runway 團隊能夠在不到 30 天的時間內從概念驗證轉向生產。
"即時影片推理與批次生成是完全不同的工程挑戰,尤其是在我們的客戶在全球範圍內執行這些體驗的情況下,"Runway 的 CTO Kamil Sindi 表示。"Runway Characters 需要在對話全程保持穩定低延遲——包括表情、唇語同步、手勢——且不能出現效能下降。Modal 的基礎設施為我們提供了所需的效能和可靠性,使我們能夠在每個全球區域以生產規模交付。"
為了實現即時互動所需的延遲,需要跨多個 GPU 分配推理,並在節點之間進行高頻寬通訊。透過在 Modal 上新增一行程式碼,Runway 可以將其容器轉變為具有 RDMA 網路的多節點 GPU 叢集,並在每個區域即時可用。Modal 將這些工作負載跨地域部署為單一統一池,將路由靠近使用者並按需擴充套件,因此 Runway 可以在任何地方服務使用者,而無需預先配置或直接管理區域基礎設施。
"Runway 正在推動世界模型的可能性邊界,這需要以非常低的延遲大規模執行復雜模型。這正是 Modal 擅長的領域,"Modal 的 CEO Erik Bernhardsson 表示。"我們很自豪能為 Characters 提供基礎設施支援。"
Runway Characters 現已向所有開發者和企業開放,可透過 dev.runwayml.com 訪問,消費者可透過 runwayml.com 使用。企業團隊可聯絡瞭解更多關於大規模部署自定義角色體驗的資訊。