OpenAI 推出 Voice Engine 技術 15 秒音檔即可生成擬真語音 - 職人選物-職人選物

OpenAI 推出 Voice Engine 技術 15 秒音檔即可生成擬真語音

2年前发布

0526

OpenAI 推出 Voice Engine 技術，僅需 15 秒音檔即可生成自然合成語音，並可應用於協助病患保留聲音、跨語言溝通等用途。

日前推出可透過文字、靜態圖像生成長達1分鐘擬真影片的自動生成式人工智慧技術「Sora」之後，OpenAI稍早再次宣布推出以15秒長度聲音範本即可生成自然合成語音的Voice Engine技術。

不過，為了避免產生爭議，OpenAI目前並未對外開放使用Voice Engine技術，僅針對特定用途如協助因病逐漸喪失語言能力的病患保留其聲音，同時所有以此技術產生內容都會加上可追蹤來源的數位浮水印，避免有心人士濫用此技術。

而透過Voice Engine技術生成的合成語音，幾乎與本人發出聲音相仿，甚至也能讓合成語音轉以其他語言陳述，讓使用者能以自己聲音與國外對象溝通，而非透過其他合成語音對談。

類似技術，其實先前已經有不少業者提出，但通常需要長度更長的原始語音資料進行學習，因此OpenAI標榜僅需15秒長度即可完成學習訓練，並且生成貼近本人語音聲調內容，顯然是在做技術上的火力展示。

目前OpenAI僅先向特定企業提供此技術進行測試，並且透過反饋意見改善使用體驗與安全問題。包含線上教育公司Age of Learning、敘事視覺化平台HeyGen、健康資訊軟體商Dimagi、AI通訊App開發商Livox，以及健康系統商Lifespan都已經開始使用OpenAI此技術打造應用服務。

© 版权声明

文章版權歸作者所有，未經允許請勿轉載。

THE END

科技應用
# OpenAI # Voice Engine

喜歡就支持一下吧

相關推薦

評論抢沙发

歡迎您留下寶貴的見解！

提交

暂无评论内容