配资好评炒股配资门户,实盘配资平台,期货配资查询

“語音引擎”可從15秒樣本復制原聲

信息來源：科技日報更新時間：2024-04-03

據著名科技網站The Verge報道，OpenAI公司3月29日最新推出了一項名為“語音引擎”（Voice Engine）的人工智能工具，其僅憑一段15秒的聲音樣本，便能夠精準模仿出該人的聲音。

OpenAI稱，該引擎自2022年底以來一直在開發中，實際已在ChatGPT應用程序的“大聲朗讀”功能中應用，該功能顧名思義會向用戶朗讀相關內容。

用戶只需利用15秒的樣本來訓練聲音，就可讓它以一種“情感和現實”的方式讀出喜歡的任何文本。OpenAI表示，它可用于教育目的，將播客翻譯成新語言。OpenAI發布的剪輯聽起來令人印象深刻，盡管它們有輕微生硬的機器人痕跡。

“語音引擎”展示了一些已經開始應用的例子。如生成更自然、更富有情感的聲音；將視頻內容翻譯成多種語言，以拓寬其全球受眾范圍。這項技術的一大特色是，在翻譯過程中能夠保留演講者原有的口音特征，為翻譯增添了更多真實感和個性化色彩。

“語音引擎”還可為語言障礙者提供支持，例如開發針對語言障礙者的治療應用，為有特殊學習需求的人提供教育輔助，使用戶能選擇最能體現其個性的聲音，并且對那些使用多種語言的用戶，保持在各種語言中聲音的一致性。“語音引擎”使用一位年輕患者之前為學校項目錄制的視頻音頻，成功恢復了她因血管性腦瘤而失去的流暢語言能力。

OpenAI目前并未立即向市場全面推廣，而是選擇與少數早期測試者謹慎地合作，共同探索“語音引擎”的應用可能和潛在風險。

“語音引擎”目前僅處于有限測試階段，主要原因是擔心被濫用。OpenAI指出，“語音引擎”可能導致語音身份驗證措施出現問題，以及讓大眾在誤以為自己與熟人通話的情況下涉入騙局。

OpenAI表示希望進行更多研究，以確保此類工具無法在未經同意的情況下用于傳播錯誤信息和復制聲音。

股融通配资,线下配资平台,线上股票配资炒股,10大配资公司

“語音引擎”可從15秒樣本復制原聲

相關推薦

9.4T超高場人體全身磁共振成像超導磁體通過鑒定

濟南試水“1+6+N”模式把技術成果聚起來、創業企業孵出來

中國高分16米數據正式面向全球開放共享

多方參與協同共治推動科技向善——專家暢談加強科技倫理治理

我國成功構建世界首個天地一體化量子通信網絡

股融通配资,线下配资平台,线上股票配资炒股,10大配资公司

歡迎登錄

選擇您感興趣的行業/領域，我們將推送相關信息

感興趣的行業：

感興趣的行業領域：

以下為推送內容

找回密碼

歡迎注冊

“語音引擎”可從15秒樣本復制原聲

相關推薦

9.4T超高場人體全身磁共振成像超導磁體通過鑒定

濟南試水“1+6+N”模式 把技術成果聚起來、創業企業孵出來

中國高分16米數據正式面向全球開放共享

多方參與 協同共治 推動科技向善——專家暢談加強科技倫理治理

我國成功構建世界首個天地一體化量子通信網絡

選擇您感興趣的行業/領域，我們將推送相關信息

濟南試水“1+6+N”模式把技術成果聚起來、創業企業孵出來

多方參與協同共治推動科技向善——專家暢談加強科技倫理治理