Google 發表語音理解與生成模型 AudioPaLM - 職人選物-職人選物

Google 發表語音理解與生成模型 AudioPaLM

3年前发布

08915

Google的研究團隊開發了一種名為AudioPaLM的大型自然語言模型，可以聆聽並理解語音內容，並自動生成口說內容，該模型還可以進行多語言翻譯，增進跨語言溝通便利性。

Google研究團隊近期提出一項名為AudioPaLM的大型自然語言模型，將能實現語音內容聆聽理解，並且自動生成口說內容。

AudioPaLM的背後是由PaLM 2與AudioLM兩種模型組合，並且對應多模運作框架，使其能聆聽、理解語言內容，並且藉由自動生成式人工智慧產生口說內容。

除了識別語音內容，並且進行自然互動之外，AudioPaLM更可對應多種語言翻譯功能，因此預期未來將能直接聆聽特定口語內容，隨即轉換成另一種語言呈現或許將能帶動更多跨語言溝通的便利性。

不過，目前此項技術仍處於研究階段，Google方面並未透露是否會將此技術應用在旗下諸如Google翻譯等服務，或是作為其他產品、服務應用。

© 版权声明

文章版權歸作者所有，未經允許請勿轉載。

THE END

科技應用
# Google # 語音內容 # AudioPaLM # 跨語言溝通

喜歡就支持一下吧

相關推薦

評論抢沙发

歡迎您留下寶貴的見解！

提交

暂无评论内容