2026-05-28站内改写

推出 Dubbing v2：我們革命性的全新配音模型

今天，ElevenLabs 推出了 Dubbing v2，這是一款革命性的 AI 配音模型。與傳統的基於文本的配音不同，Dubbing v2 直接利用原始表演的情感、語氣和節奏，在 90 多種語言中保持原聲的自然感和表現力。該模型解決了 AI 配音中一個長期未解決的問題：讓翻譯後的語音聽起來像是原說話者真正說的一樣。

文章情報

工程師進階

要點

Dubbing v2 直接基於原始表演進行配音，保留情感和語調
支援 90 多種語言，自動同步翻譯與口型
為創作者、營銷人員和製作團隊提供高質量多語言內容解決方案
提供免費試用，7 天內可免費使用一定時長

為什麼重要

這條新聞值得關注，因為Dubbing v2 直接基於原始表演進行配音，保留情感和語調。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

ElevenLabs 今日宣佈推出 Dubbing v2，這是一款顛覆性的 AI 配音模型，能夠保留原聲表演的情感與表現力，並將其遷移至 90 多種語言。與傳統配音系統不同，Dubbing v2 並非僅依賴文本轉錄，而是直接以原始音訊表現為條件進行處理，從而保留語氣、節奏、語速和情感意涵，使得翻譯後的語音聽起來更加自然、真實，彷彿原說話者本人正在用目標語言表達。

傳統 AI 配音系統通常高度依賴文本轉錄，雖然能產生準確的翻譯，但生成的音訊往往失去了人類語言的自然韻味。情感、時機、強調、猶豫和能量等細微之處，很難僅從文本中重建。Dubbing v2 透過直接利用原始表演訊號，捕獲說話者的語調與口吻，並將其跨語言傳遞，顯著提升了配音的自然度和表現力，同時忠於原聲的傳達方式。

優秀的配音不僅僅是直接翻譯。不同語言需要不同的措辭、節奏和句子結構才能聽起來自然。Dubbing v2 包含同步感知翻譯系統，能自動對齊開始時間、結束時間和語速，減少手動調整需求，使最終輸出更接近專業級配音效果。

專業配音每分鐘的成本可能高達數百美元，且通常需要涉及翻譯、配音演員、編輯和音訊工程師的複雜製作流程。Dubbing v2 透過自動化大幅降低了門檻，創作者和企業無需構建複雜工作流或協調多個供應商，即可製作高質量的多語言內容。

對於創作者，Dubbing v2 可在 ElevenCreative 內一鍵完成 YouTube 影片等內容的本地化，保留創作者的個人風格和表達方式，快速觸達全球觀眾。同時，ElevenLabs 推出了創作者配音合作伙伴計劃，符合條件的創作者可享受折扣。對於營銷人員，該模型支援跨國際市場的高質量本地化，無需重新制作廣告、產品影片或品牌內容。對於工作室和廣播公司，ElevenProductions 將 Dubbing v2 與專業本地化服務結合，提供可擴充套件的端到端製作流程。

Dubbing v2 現已透過 ElevenCreative 和 ElevenProductions 提供。在未來 7 天內，使用者可在免費計劃中獲得 1 分鐘免費使用時長，入門計劃 15 分鐘，Creator+ 計劃 30 分鐘。API 訪問即將推出，詳情請聯絡銷售團隊。