人說話時嘴唇動作跟語音åŒæ¥ï¼Œå¯ä»¥é€šéŽè˜åˆ¥å”‡å‹•ä¿¡æ¯é€²è¡Œèªžè¨€ä¿¡æ¯äº¤æµã€‚唇語å°è¬›è©±è€…å‹å¥½ï¼Œä½†æ˜¯å°è§£è®€å”‡èªžçš„è½çœ¾ä¾†èªªå»å¹¶ä¸è¼•æ¾ï¼Œå”‡èªžè§£è®€ä¸€ç›´ä»¥ä¾†æ˜¯å€‹é›£é¡Œï¼ŒæŽŒæ¡å”‡èªžè§£è®€æŠ€èƒ½çš„æˆæœ¬è¼ƒé«˜ã€‚
  據了解,為é™ä½Žå”‡èªžè§£è®€é›£åº¦ï¼Œç¾æœ‰æŠ€è¡“手段常采用ç£å ´ã€è¦–覺圖åƒã€è¶…è²æ³¢ç‰æ–¹æ³•ã€‚以最æµè¡Œçš„éžæŽ¥è§¸å¼è¦–覺圖åƒæ–¹æ³•ç‚ºä¾‹ï¼Œå…¶å”‡èªžè˜åˆ¥æº–確率較高,但ä¾ç„¶å®¹æ˜“å—到é¢éƒ¨è§’度ã€å…‰å¼·ã€é å‹•å’Œé®æ“‹ç‰å› ç´ å¹²æ“¾ã€‚ç‰¹åˆ¥æ˜¯åœ¨æ¤æ¬¡æ–°å† 病毒æµè¡ŒæœŸé–“,佩戴的å£ç½©çµ¦åŸºäºŽè¦–è¦ºçš„å”‡å‹•è§£è®€å¸¶ä¾†å…¨æ–°æŒ‘æˆ°ã€‚å› æ¤ï¼Œé€šéŽç›´æŽ¥æ•æ‰é¢éƒ¨è‚Œè‚‰ç´°å¾®å‹•ä½œè§£è®€å”‡èªžæŠ€è¡“具有é‡è¦çš„科å¸ç ”究價值與廣闊的應用å‰æ™¯ã€‚
  如果在ä¸ä¹…的將來,嘴唇掀動——“開門â€ï¼Œä¹Ÿè¨±é›»åé–€ç¦èƒ½ç§’懂,馬上è˜åˆ¥èº«ä»½å¹¶è§£éŽ–;與汽車å°è©±â€”—“左æ‹â€ï¼Œæˆ–許å¯æŽ§åˆ¶è»Šçš„æ–¹å‘é€æ¼¸å‘目標移動;å°äºŽè²å¸¶ã€å–‰èˆŒæ傷的失è²äººç¾¤ï¼Œå”‡èªžå¯èƒ½å°‡æ˜¯ä¸€ç¨®ä¸å 用雙手的ã€æ—¥å¸¸ç„¡éšœç¤™äº¤æµçš„有效方å¼â€¦â€¦
  這些想法,在近日清è¯å¤§å¸æ©Ÿæ¢°å·¥ç¨‹ç³»æ™ºèƒ½èˆ‡ç”Ÿç‰©æ©Ÿæ¢°åœ˜éšŠæŽ¨å‡ºä¸€ç¨®æ–°ç©Žçš„唇語解讀系統之åŽï¼Œå°‡å¾ˆæœ‰å¯èƒ½å¤¢æƒ³æˆçœŸã€‚ç›¸é—œç ”ç©¶æˆæžœç™¼è¡¨åœ¨æœ€æ–°çš„《自然·通訊》期刊上。
ã€€ã€€æ“šäº†è§£ï¼Œé€™é …æŠ€è¡“çš„ä¸»è¦è©¦é©—和測試工作由清è¯æ©Ÿæ¢°å·¥ç¨‹ç³»æ™ºèƒ½èˆ‡ç”Ÿç‰©æ©Ÿæ¢°å¯¦é©—室完æˆï¼Œä¸ç§‘院ç´ç±³èƒ½æºèˆ‡ç³»çµ±ç ”究所的王ä¸æž—院士å°æ•´å€‹ç§‘ç ”å·¥ä½œéŽç¨‹é€²è¡Œå»ºè°å’ŒæŒ‡å°Žã€‚
ã€€ã€€é‚£ä¹ˆï¼Œç©¶ç«Ÿé€™é …å”‡èªžè§£è®€ç³»çµ±çš„æ–°ç©Žä¹‹è™•ä½•åœ¨ï¼Ÿâ€œé€™å€‹åŸºäºŽæ·±åº¦å¸ç¿’輔助自供電柔性傳感器的唇語解讀技術,目標是解決è²å¸¶ã€å–‰èˆŒæ傷失è²äººç¾¤çš„日常無障礙交æµå•é¡Œï¼Œå…¶ä¸å 用雙手,ä¸å—é¢éƒ¨è§’度ã€å…‰å¼·ã€é®æ“‹å’Œé å‹•ç‰å¤–éƒ¨å› ç´ çš„å¹²æ“¾ï¼Œæ–°ç©Žä¹‹è™•åœ¨äºŽé–‹ç™¼è‡ªä¾›é›»çš„æŸ”æ€§å‚³æ„Ÿå™¨ï¼ˆéˆæ•åº¦0.61183 V/kPa)采集肌肉的微å°å‹•ä½œä¿¡è™Ÿï¼Œå¹¶é‡‡ç”¨åŸºäºŽåŽŸåž‹å¸ç¿’的深度å¸ç¿’模型,使用較少的數據訓練,測試準確率å¯é”94.5%,實ç¾å³æ™‚æ•æ‰å¤±è²äººç¾¤çš„唇動并轉è¯æˆèªžéŸ³ï¼Œå¯ç”¨äºŽå¤±è²äººç¾¤çš„日常無障礙語音交æµ?ï¼?月29日,該論文第一作者ã€æ¸…è¯å¤§å¸æ©Ÿæ¢°å·¥ç¨‹ç³»æ™ºèƒ½èˆ‡ç”Ÿç‰©æ©Ÿæ¢°åœ˜éšŠåŠ©ç†ç ”究員路益嘉在接å—ç§‘æŠ€æ—¥å ±è¨˜è€…é‡‡è¨ªæ™‚è¡¨ç¤ºã€‚
  這個唇語解讀系統是å¦æœƒé‹ç”¨å¤§æ•¸æ“šã€äººå·¥æ™ºèƒ½ç‰æŠ€è¡“,çªç ´çš„æŠ€è¡“ç“¶é ¸æ˜¯ä»€ä¹ˆï¼Ÿè·¯ç›Šå˜‰ç”é“,“實ç¾å°å”‡å‹•ä¿¡è™Ÿçš„è˜åˆ¥éœ€è¦ç”¨åˆ°äººå·¥æ™ºèƒ½æŠ€è¡“和機器å¸ç¿’算法。在實際測試ä¸ç™¼ç¾ï¼Œç”±äºŽä¸åŒäººçš„é¢éƒ¨éª¨éª¼è‚Œè‚‰ã€è‚Œè‚‰é‹å‹•å½¢å¼ã€è‚Œè‚‰å‹•ä½œå…ˆåŽé †åºå’Œç¿’慣語速ç‰å˜åœ¨ä¸åŒï¼Œå³ä½¿æ˜¯åŒä¸€å€‹è©žå’ŒåŒä¸€å¥è©±ï¼Œé‡‡é›†åˆ°çš„信號也有å€åˆ¥ï¼Œç‚ºäº†å¾—到通用的å¯ä»¥æŽ¥å—的測試準確率,需è¦é‡‡é›†æµ·é‡çš„數據進行模型訓練。然而,這樣的æˆæœ¬å高。â€
ã€€ã€€æ“šä»‹ç´¹ï¼Œç ”ç©¶äººå“¡æ²’æœ‰é‡‡ç”¨è¨“ç·´é€šç”¨æ¨¡åž‹çš„æŠ€è¡“è·¯ç·šï¼Œè€Œæ˜¯é‡‡ç”¨è¨“ç·´å€‹æ€§åŒ–çš„å°æ¨£æœ¬é‡æ•¸æ“šæ¨¡åž‹çš„方法,å³å°æ¯å€‹äººçš„æ¯å€‹è©žï¼ˆæˆ–æ¯å¥è©±ï¼‰åˆ†åˆ¥é‡‡é›†å°æ¨£æœ¬é‡ï¼ˆç›¸å°æµ·é‡æ•¸æ“šè€Œè¨€ï¼‰çš„數據進行模型訓練,考慮到æ¯äººèªªè©±çš„唇動都具有ç¨ç‰¹çš„習慣特å¾ï¼Œé€™æ¨£è¨“練出的模型缺少通用性但更有é‡å°æ€§ï¼Œè€Œä¸è€ƒæ…®é€šç”¨æ€§çš„è¦æ±‚é™ä½Žæ¨¡åž‹å°è¨“練數據é‡çš„需求,å°æ¨£æœ¬é‡ä¹Ÿèƒ½å¾—到å¯æŽ¥å—çš„æ¸¬è©¦æº–ç¢ºçŽ‡ã€‚ç ”ç©¶äººå“¡ä½¿ç”¨åŸºäºŽåŽŸåž‹å¸ç¿’的空洞循環神經網絡,來減少模型å°è¨“練樣本é‡çš„需求。例如,在測試ä¸å°20個常用水果å稱的唇動信號進行分類訓練,æ¯å€‹æ°´æžœå稱的唇動信號é¸å–100個樣本,測試準確率é”94.5%。
ã€€ã€€é€™é …ç ”ç©¶å°‡åœ¨å“ªäº›é ˜åŸŸæ‡‰ç”¨ï¼Œç™¼æ®ä½œç”¨ï¼Ÿâ€œè©²ç ”究通éŽè‡ªä¾›é›»å‚³æ„Ÿå™¨é‡‡é›†å”‡å‹•å¾®å‹•ä¿¡è™Ÿï¼Œå¹¶ä½¿ç”¨æ·±åº¦å¸ç¿’模型將信號è˜åˆ¥ç‚ºæœ‰å«ç¾©çš„語音信號或文å—信號,比較é©åˆæœå‹™å¤±è²äººç¾¤ï¼Œåœ¨æ—¥å¸¸ç”Ÿæ´»äº¤æµä¸å¯æ¢å¾©å¤±è²äººç¾¤çš„基本語音交æµèƒ½åŠ›ï¼Œå¹¶ä¿ç•™å¤±è²å‰çš„說話習慣。â€è·¯ç›Šå˜‰è¡¨ç¤ºã€‚
  æ¤å¤–,其還å¯æ‡‰ç”¨äºŽå€‹äººèº«ä»½è˜åˆ¥ã€‚ç ”ç©¶äººå“¡åˆ¶ä½œå‡ºä¸€å€‹å”‡å‹•æŒ‡ä»¤é–‹é–€çš„æ‡‰ç”¨æ¼”ç¤ºã€‚ç”±äºŽè©²æ–¹æ³•èžåˆç‰¹å®šå¯†ç¢¼å£ä»¤çš„éœæ…‹ç‰¹å¾å’Œå€‹äººç‰¹æ®Šçš„唇部動態特å¾ï¼Œå¯ä»¥å¯¦ç¾é›™é‡ç‰¹å¾é©—è‰ï¼Œç‰¹åˆ¥æ˜¯æˆ´å£ç½©ä¸ç™¼è²èªªå¯†ç¢¼çš„æ–¹å¼å¯é€²ä¸€æ¥æå‡ç³»çµ±å®‰å…¨æ€§ï¼Œé©ç”¨äºŽå®‰å…¨é©—è‰è¦æ±‚è¼ƒé«˜çš„å ´åˆã€‚
ã€€ã€€è©²ç ”ç©¶æˆæžœé‚„å¯ç”¨äºŽäººæ©Ÿäº¤äº’çš„ç ”ç©¶ã€‚ç ”ç©¶äººå“¡åˆ¶ä½œå‡ºä¸€å€‹å”‡å‹•ä¿¡è™ŸæŽ§åˆ¶æ¨¡åž‹è»Šé‹å‹•æ–¹å‘的應用演示,通éŽæª¢æ¸¬å”‡å‹•ç™¼å‡ºçš„æ–¹å‘指令,機器模型車å¯æ”¹è®Šè¡Œé€²æ–¹å‘。這為ç¾æœ‰äººæ©Ÿäº¤äº’方案æ供了新的å¯èƒ½æ€§ã€‚