語音查找器——一款可從600多種語音中快速為您的應用找到合適語音的新工具
語音查找器讓開發者能夠通過自然語言提示或上傳音頻樣本,搜索、匹配、篩選和試聽Together AI TTS模型中的600多種語音。
Together AI 今日正式發佈語音查找器(Voice Finder)——一款旨在幫助開發人員從超過600種聲音中快速篩選出最適合其應用的語音搜索工具。該工具整合了包括MiniMax、Cartesia、Deepgram、Rime在內的多家領先TTS模型的聲音庫,支持通過自然語言提示或上傳音頻樣本進行智能匹配與試聽。
語音查找器的核心是一個多模態模型,該模型對每個語音進行了15個以上維度的結構化標註,涵蓋音調、性別、口音、語言、年齡、情感和説話風格等屬性。這些元數據驅動了自然語言搜索和手動篩選功能。用户可以輸入諸如“冥想應用的平靜女聲”或“金融科技客服的自信聲音”等描述性提示,也可以上傳一段簡短的音頻樣本,系統將返回相關性排名並允許在線試聽。此外,用户還可以依據具體屬性進行精確過濾,確保找到的聲音完美契合應用場景。
對於正在開發語音代理的團隊而言,選擇合適的聲音至關重要。醫療接待員、餐廳點餐助手和娛樂陪伴型代理需要截然不同的聲音特質。傳統的做法是手動瀏覽廠商目錄,但往往缺乏有效指導。語音查找器將這一過程從數小時縮短到幾分鐘,讓開發者能夠快速迭代。
Together AI 同時提供了構建實時語音代理的統一平台,集成語音轉文字(STT)、大語言模型(LLM)和文本轉語音(TTS),所有組件在同一雲環境內部署,端到端延遲控制在500毫秒以內,足以支持實時交互。語音查找器作為該平台的前端工具,使聲音選擇步驟變得直觀高效。
目前,開發人員可以通過 findtherightvoice.com 體驗語音查找器,並可進一步查閲 Together AI 的語音平台文檔。企業客户可聯繫銷售團隊獲取專用端點和生產部署支持。Together AI 表示,未來將繼續擴展聲音庫並優化元數據模型,以覆蓋更多語言和場景。