2026-05-12 08:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

語音查找器——一款可從600多種語音中快速為您的應用找到合適語音的新工具

語音查找器讓開發者能夠通過自然語言提示或上傳音頻樣本，搜索、匹配、篩選和試聽Together AI TTS模型中的600多種語音。

Together AI 今日正式發佈語音查找器（Voice Finder）——一款旨在幫助開發人員從超過600種聲音中快速篩選出最適合其應用的語音搜索工具。該工具整合了包括MiniMax、Cartesia、Deepgram、Rime在內的多家領先TTS模型的聲音庫，支持通過自然語言提示或上傳音頻樣本進行智能匹配與試聽。

語音查找器的核心是一個多模態模型，該模型對每個語音進行了15個以上維度的結構化標註，涵蓋音調、性別、口音、語言、年齡、情感和説話風格等屬性。這些元數據驅動了自然語言搜索和手動篩選功能。用户可以輸入諸如“冥想應用的平靜女聲”或“金融科技客服的自信聲音”等描述性提示，也可以上傳一段簡短的音頻樣本，系統將返回相關性排名並允許在線試聽。此外，用户還可以依據具體屬性進行精確過濾，確保找到的聲音完美契合應用場景。

對於正在開發語音代理的團隊而言，選擇合適的聲音至關重要。醫療接待員、餐廳點餐助手和娛樂陪伴型代理需要截然不同的聲音特質。傳統的做法是手動瀏覽廠商目錄，但往往缺乏有效指導。語音查找器將這一過程從數小時縮短到幾分鐘，讓開發者能夠快速迭代。

Together AI 同時提供了構建實時語音代理的統一平台，集成語音轉文字（STT）、大語言模型（LLM）和文本轉語音（TTS），所有組件在同一雲環境內部署，端到端延遲控制在500毫秒以內，足以支持實時交互。語音查找器作為該平台的前端工具，使聲音選擇步驟變得直觀高效。

目前，開發人員可以通過 findtherightvoice.com 體驗語音查找器，並可進一步查閲 Together AI 的語音平台文檔。企業客户可聯繫銷售團隊獲取專用端點和生產部署支持。Together AI 表示，未來將繼續擴展聲音庫並優化元數據模型，以覆蓋更多語言和場景。