一位匿名讀者引用了 Axios 的報告。 OpenAI 週五宣布,它已允許少數公司測試一種新工具,該工具可以在短短 15 秒的錄音中再現人聲。該公司表示,鑑於合成語音產生器濫用的風險很高,將採取「謹慎和知情的方式」更廣泛地發布該名為「語音引擎」的程式。
基於 15 秒的錄音,該程式可以創建聽起來自然的聲音,“情感豐富且真實”,並且與原始說話者非常相似。即使文字不是原始說話者的母語,這種合成語音也可用於讀取文字輸入。在該公司提供的一個範例中,英語演講者的音訊被翻譯成西班牙語、普通話、德語、法語和日語,同時保留了演講者的母語口音。
OpenAI 表示,語音引擎已被用於為不會閱讀的人提供閱讀幫助、翻譯內容以及幫助語言能力有限的人。該公司表示,該程式已經在其文字轉語音應用程式以及 ChatGPT 語音和語音工具中使用。 該公司表示:“我們希望就負責任地引入合成語音以及社會如何適應這些新功能展開對話。” “根據這些對話和小規模測試的結果,我們將就是否以及如何大規模部署這項技術做出更明智的決定。”