“大家好,歡迎來到科大訊飛官方直播間,我是你們的主播茜茜?!?/span>
“我是茜茜的妹妹西西,別忘記點個‘關注’哦,今天晚上福利可是很多的。”
……
5月15日,真人主播茜茜牽手“孿生妹妹”亮相科大訊飛抖音直播間。這對“雙胞胎主播”雖然是樣貌相同的“姐妹花”,但西西借助科大訊飛新推出的“AI虛擬人直播系統”,不僅復刻了真人主播茜茜的外在,還賦予了其驅動的能力,從而能夠實現虛擬主播實時直播。
AI虛擬主播性格可定制、角色能多選
當下,越來越多的AI虛擬主播走進了大眾視野,在直播間、短視頻平臺等頻頻“出道”,憑借多維度、全感官、沉浸式的交互體驗,成為時下的“主播熱選”,集“萬千寵愛于一身”。
“科大訊飛AI虛擬主播依托語音識別、人臉建模、口唇預測、音頻驅動等自主關鍵技術,支持用戶通過文本或者語音輸入驅動虛擬人進行直播,從而實現智能驅動,快速便捷地進行虛擬直播?!笨拼笥嶏w研究院執行院長劉聰告訴科技日報記者。
劉聰表示,科大訊飛基于大數據多模態預訓練的語種及說話人無關的口唇驅動框架,在保證高真實度的口唇合成效果的同時,還可以實現不同類型語音,包括不同語種、方言、音色的口唇驅動,讓虛擬主播無懼時空限制,哪怕是在臥室的床邊也能進行直播,而且隨時可以與真人主播“無縫切換”,方式更加靈活、多變?!岸瓵I虛擬人直播系統’還擁有豐富的場景庫,可以根據直播內容、虛擬人‘性格’等自由定制,打造專屬的虛擬人直播間?!眲⒙斦f。
據介紹,科大訊飛“AI虛擬人直播系統”擁有豐富的形象庫,不僅能根據受眾喜好、需求個性化選擇五官“捏臉”,創造一個全新的虛擬人,還可以根據不同場景賦予其相應的形象氣質,或2D或3D、或半身或全身、或“鹽”或“甜”……“科大訊飛先進的語音合成技術,還能為虛擬人定制個性化語音庫,還原真人主播的聲音或是定制特色聲音。多語種技術更是讓AI虛擬主播既支持中英混合播報,又支持日、韓、泰、越等多國語言,國際范兒十足?!眲⒙斦f。
可用于多個行業,未來也能“走進”尋常人家
記者在采訪中了解到,AI虛擬主播還可針對不同需求提供多端接口,并能面向多個場景提供垂直且完善的解決方案,可用于媒體、金融、文旅、政企等多行業,提供音視頻內容自動化生產、智能交互的AI產品服務,輔助實現自動化、智能化的客戶價值。
其中,在媒體新聞場景中,可針對海量的音視頻內容實現新聞內容的音視頻生產自動化。只要輸入文字即可“一站式”生產成品視頻,尤其是對重大、突發新聞等更新頻率較高的內容播報,能顯著提升效率。目前,央視新聞、人民日報數字傳播、合肥電視臺等媒體,與科大訊飛共同打造的AI虛擬主播均已“上崗”,表現出色。
“以‘虛擬人為載體的新一代人機交互’將快速進化,我們需要在感知、理解、表達等多個維度持續取得技術突破,讓人機交互體驗得到跨越式的提升。簡單來說,就是我們希望虛擬人越來越聰明,Ta們懂情感、有個性,能夠幫助人類協助我們的工作和生活?!眲⒙攲μ摂M人未來發展充滿信心。
劉聰認為,從生產生活到奧運賽場,人工智能早已不是沒有言語、冷冰冰的技術,而是飽含溫情、賦能萬物的科技力量?;贏I虛擬人交互平臺底座研發的“AI虛擬人直播系統”,未來將會逐漸開放上百個虛擬形象、上千個音庫,提供多模感知、多維表達、情感貫穿、自主定制的特色服務,讓虛擬主播的形象更真實、情感更靈動、交互更智能。
AI如同水和電一樣已融入百姓生活。劉聰表示,未來通過將技術與產品和應用場景深度融合,虛擬人也能“走進”尋常人家,給人們的工作和生活帶來更便捷的服務,成為人類的親密伙伴。