盲文AI實時翻譯算法是本軟件的核心技術之一,可以實時生成海量盲文數字資源。其運行邏輯是首先將中文、英文等文字編碼格式統一轉換為Unicode格式,然后選擇盲文類型,再調用盲文AI實時翻譯算法,就可以輸出國家通用盲文、現行盲文、全拼盲文、雙拼盲文。
——楊文珍 之江實驗室類人感知研究中心研究專家
◎洪恒飛 周立超 本報記者 江 耘
“西湖十景位于浙江省杭州市西湖區境內……”近日,在浙江杭州舉行的之江實驗室專場開放活動上,視障志愿者陸林松通過現場展示的智能盲文閱讀機,準確讀出了自己觸摸到的盲文內容。
他所體驗的盲文閱讀機,是由之江實驗室科研團隊聯合多家機構共同研發的集視、觸、聽等多類型感知為一體的盲文數字化智能設備,與之一并展出的還有盲文教學機及英語機,涵蓋盲人學習、閱讀、公共服務等三大核心應用場景。
“這三款盲文機搭載了團隊全球首創的密集點陣電磁驅動毫牛級精準觸覺再現技術,以及國內領先的盲文數字資源AI實時生成技術、視聽觸同步感知技術?!敝瓕嶒炇翌惾烁兄芯恐行难芯繉<覘钗恼浣榻B道,團隊盲文數字化科研工作始于2011年,經過4輪技術攻關和更新迭代,產品性能日益完善,已經在全國21個省份地區試點推廣。
視障群體受困于數字鴻溝
一套盲文讀物相比同樣內容的普通讀物,價格可貴數倍乃至更多。記者現場看到,一本盲文版的小學語文教材,不但紙張寬大,厚度也堪比一本字典。
“盲文圖書制作工序復雜、出版周期很長、信息承載量少、且易磨損不耐用?!敝瓕嶒炇翌惾烁兄芯恐行墓こ虒T陶文韜說,紙質盲文書依然是國內盲人學習知識和獲取信息的主要工具,盲文數字化設備普及率非常低。
相關統計顯示,我國視障人士人數達到1700多萬,其中800多萬為全盲,占世界失明人口的20%,每年會出現新盲人大約45萬。由于多方面原因,我國視障群體不會盲文的現象較為普遍,盲文師資同樣短缺。
2017年,財政部、中國殘聯等多部門聯合啟動“盲人數字閱讀推廣工程”,促成1000臺盲文電腦和盲文電子顯示器被配置到全國100所盲人教育機構,但仍難以滿足我國廣大視障群體的巨大需求。
“在知識爆炸且快速迭代的信息時代,盲文數字資源嚴重缺乏,視障群體的數字鴻溝問題越顯突出。”楊文珍表示,目前將人工智能技術用于盲文信息無障礙產品的還很少。結合我國視障群體的國情,團隊應用自研的柔性界面觸覺計量測試技術、視觸融合感知技術以及盲文AI實時翻譯算法等,專門研制了三款功能各有側重的產品。
楊文珍介紹,團隊提出了一種視覺、聽覺和觸覺同步刺激的數字化盲文學習方法,能夠提高視障人士的盲文學習效率,設計了一種多感知信息匹配AI算法,能夠輸出文字、聲音和盲文點位相同內容的信息,為視障人士無障礙學習盲文提供條件。
智能系統提高翻譯準確率
“盲文AI實時翻譯算法是本軟件的核心技術之一,可以實時生成海量盲文數字資源。”楊文珍介紹說,其運行邏輯是首先將中文、英文等文字編碼格式統一轉換為Unicode格式,然后選擇盲文類型,再調用盲文AI實時翻譯算法,就可以輸出國家通用盲文、現行盲文、全拼盲文、雙拼盲文。
漢盲翻譯是把漢字源文本自動轉化為對應的盲文文本,目前存在多音字混淆、未登錄詞不能增加、不符合盲文分詞連寫規則等問題。記者了解到,該團隊構建了一個基于逆向最大匹配分詞算法的漢盲翻譯系統,能夠較好地識別多音字,自主添加未登錄詞,得到較正確的分詞連寫結果,有效提高漢盲翻譯的準確率。針對英盲翻譯,團隊設計了盲文形符Unicode碼到盲文ASCII碼和盲文點序的轉換算法。
“該系統通過智能分詞和翻譯程序將文字輸出為盲文點序,最后按照輸入字符串的先后順序,合并盲文點序,就實現了盲文數字化。”楊文珍說,團隊還研發設計了一套適合盲人摸讀的自然人機交互程序,在盲文機上實現目錄識別、書簽存儲和文本閱讀等功能,構成完整的文件管理系統,便于盲人自主操作。
將U盤連接設備,通過簡易的按鍵操作,盲人即可快速上手使用……通過科研人員演示操作,記者注意到,智能盲文閱讀機各項模塊分工明確:視覺顯示模塊顯示普通文字和盲文,語音模塊則播報普通文字,盲文顯示裝置呈現盲文點字。
據介紹,該團隊研發的這三款產品目前已應用于全民閱讀工程、鄉村文化禮堂、融合教育、圖書館、城市書屋等場合,得到中國盲人協會、中國盲文圖書館、北京市盲人學校等單位或個人的良好反饋。
“數字時代,除了文字信息,圖像信息對于盲人來說也是很難理解和感知的?!睏钗恼浔硎?,團隊接下來將研發數字圖像觸覺二維圖形觸覺智能感知設備,基于人工智能技術快速準確地生成點陣式觸覺圖像,將圖像信息以觸覺獲取方式傳遞給盲人,以期建立視障人士與數字空間的觸覺通道,促進數字鴻溝問題的解決。