AI News HubLIVE
站内改写

推出 Dubbing v2:我們革命性的全新配音模型

今天,ElevenLabs 推出了 Dubbing v2,這是一款革命性的 AI 配音模型。與傳統的基於文本的配音不同,Dubbing v2 直接利用原始表演的情感、語氣和節奏,在 90 多種語言中保持原聲的自然感和表現力。該模型解決了 AI 配音中一個長期未解決的問題:讓翻譯後的語音聽起來像是原說話者真正說的一樣。

文章情報

工程師進階

要點

  • Dubbing v2 直接基於原始表演進行配音,保留情感和語調
  • 支援 90 多種語言,自動同步翻譯與口型
  • 為創作者、營銷人員和製作團隊提供高質量多語言內容解決方案
  • 提供免費試用,7 天內可免費使用一定時長

為什麼重要

這條新聞值得關注,因為Dubbing v2 直接基於原始表演進行配音,保留情感和語調。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

ElevenLabs 今日宣佈推出 Dubbing v2,這是一款顛覆性的 AI 配音模型,能夠保留原聲表演的情感與表現力,並將其遷移至 90 多種語言。與傳統配音系統不同,Dubbing v2 並非僅依賴文本轉錄,而是直接以原始音訊表現為條件進行處理,從而保留語氣、節奏、語速和情感意涵,使得翻譯後的語音聽起來更加自然、真實,彷彿原說話者本人正在用目標語言表達。

傳統 AI 配音系統通常高度依賴文本轉錄,雖然能產生準確的翻譯,但生成的音訊往往失去了人類語言的自然韻味。情感、時機、強調、猶豫和能量等細微之處,很難僅從文本中重建。Dubbing v2 透過直接利用原始表演訊號,捕獲說話者的語調與口吻,並將其跨語言傳遞,顯著提升了配音的自然度和表現力,同時忠於原聲的傳達方式。

優秀的配音不僅僅是直接翻譯。不同語言需要不同的措辭、節奏和句子結構才能聽起來自然。Dubbing v2 包含同步感知翻譯系統,能自動對齊開始時間、結束時間和語速,減少手動調整需求,使最終輸出更接近專業級配音效果。

專業配音每分鐘的成本可能高達數百美元,且通常需要涉及翻譯、配音演員、編輯和音訊工程師的複雜製作流程。Dubbing v2 透過自動化大幅降低了門檻,創作者和企業無需構建複雜工作流或協調多個供應商,即可製作高質量的多語言內容。

對於創作者,Dubbing v2 可在 ElevenCreative 內一鍵完成 YouTube 影片等內容的本地化,保留創作者的個人風格和表達方式,快速觸達全球觀眾。同時,ElevenLabs 推出了創作者配音合作伙伴計劃,符合條件的創作者可享受折扣。對於營銷人員,該模型支援跨國際市場的高質量本地化,無需重新制作廣告、產品影片或品牌內容。對於工作室和廣播公司,ElevenProductions 將 Dubbing v2 與專業本地化服務結合,提供可擴充套件的端到端製作流程。

Dubbing v2 現已透過 ElevenCreative 和 ElevenProductions 提供。在未來 7 天內,使用者可在免費計劃中獲得 1 分鐘免費使用時長,入門計劃 15 分鐘,Creator+ 計劃 30 分鐘。API 訪問即將推出,詳情請聯絡銷售團隊。