AI技術要實現應用,首先數據要達到一定的體量,此外算力也要能支持大規模的模型訓練,而后算法方面需要達到一定的精度,端側算力也要具備一定的推理能力。
近日,知名人工智能學者吳恩達發表文章,闡述了他對于人工智能在傳統行業中應用緩慢的理解。無論是刷短視頻時的個性化推薦,還是外賣配送時的耗時預估,或者是移動支付時的人臉識別,以算法為代表的AI技術在消費互聯網行業被應用得“得心應手”。然而提到傳統行業,人們卻很難快速想起非常成熟的應用人工智能的典型案例。為何AI技術在傳統行業的應用速度和范圍遠不如消費互聯網等行業?
消費互聯網行業應用AI更具優勢
“AI技術的應用主要取決于數據、算力和算法?!碧旖虼髮W智能與計算學部副教授朱鵬飛介紹,首先數據要達到一定的體量,這是應用的基礎,此外算力也要能支持大規模的模型訓練,而后算法方面需要達到一定的精度,端側算力也要具備一定的推理能力。
之所以目前只有消費互聯網公司在大規模應用AI技術,主要是在這三方面消費互聯網公司都更具優勢。
前些年短視頻并沒有現在這么火爆,例如發展初期的淘寶,也并沒有很強的用戶黏性。而隨著推送越來越精準,用戶的體驗感也得到了極大的提升,最終呈現井噴式的用戶增長。
“精準推送主要依賴于算法精度的提升,而算法精度的提升又離不開海量的數據作為基礎?!敝禊i飛解釋,在這個單一的場景中,算法模型需要不斷進化,終身學習。由于不是封閉數據環境,總有新的數據加入,算法模型需要不斷通過學習進行調整、迭代升級,使其精度越來越高,形成一個良性循環。
“與此同時,雖然目前消費互聯網行業在算法精度上已經上升到一定的高度,但相比一些傳統行業的應用場景,消費互聯網行業對于AI算法精度接受的閾值都比較低。比如短視頻、淘寶偏好推薦、百度熱搜關鍵詞,只需要達到用戶產生黏性的目的,只要有一定準確性,用戶都可以接受?!敝禊i飛表示,相比之下,在很多傳統行業,對于技術精度的要求就高得多。比如基于視覺的AI技術在人臉識別方面的應用,在高鐵站、飛機場核實身份,1∶1的比對準確度要高達99.99%甚至更高才可以進行應用。
在算力方面,目前云端算力已經可以支持大規模模型訓練和推理,比如短視頻、淘寶推薦等。但在大量傳統行業應用場景中,智能終端上的端側算力還無法滿足推理的實時性和準確性要求。
“相比于社交網絡和電商系統,傳統行業應用場景的封閉生態系統使得云端算力無法得到有效應用?!敝禊i飛舉例說,以智能無人系統巡檢為例,電力巡檢、管道巡檢、交通巡檢、河道巡檢以及光伏巡檢等要求搭載在無人機和機器人上的算力滿足實時巡檢要求,由于視頻分析的模型復雜度較高,端側往往無法實現精準高效的實時推理,輕量級網絡在滿足實時性的同時損失了識別精度。由于算法精度達不到使用要求,使得在很多場景中無法實現AI技術的應用。
傳統行業應用AI面臨三大挑戰
吳恩達認為,在AI應用方面,消費互聯網行業之外的其他行業都面臨著三大挑戰:數據集很?。欢ㄖ苹杀竞芨?;從驗證想法到部署生產的過程很長。
對此,朱鵬飛也深有感觸,他以傳統制造業為例進行了分析。
“傳統制造企業在制造向智造轉型的過程中,數據是一個很突出的問題。”朱鵬飛介紹,首先在數據的獲取方面存在一定難度。傳統制造企業的數據是封閉的,因為很多傳統企業并不是新型信息化設備,沒有傳感器收集實時數據,也沒有數據中心,因此數據零散,缺失嚴重,很難獲取像消費互聯網企業里那種海量、高質量的數據。
其次,行業內部各個工廠的數據很多具有商業價值,因此工廠都嚴格保密,這導致數據不流通,沒有辦法進行共享,進而形成了數據孤島效應,影響了AI算法模型的優化。
“我們在開發一個AI算法模型的時候,因為數據的保密性,往往得到的數據都是經過‘脫敏’的,這也嚴重地影響了我們的判斷。而傳統行業的企業中,又缺乏具有AI算法模型開發能力的技術人員,因此雙方在合作研發過程中也存在著很高的壁壘。”朱鵬飛說。
此外,傳統行業中的數據來源并不像消費互聯網領域那樣來自單一場景,復雜的業務場景導致數據往往很“臟”,必須進行“清洗”,去掉大量無效信息,AI算法模型才能高效率的學習以提高精度?!斑@就像我們教小朋友知識,只講知識點,小朋友們才能學得快,如果在知識點中夾雜著大量無用的信息,小朋友無從分辨,學習效率肯定降低?!敝禊i飛介紹,而給數據標注“知識點”的工作是巨大而繁瑣的,需要企業有專人去做,要花費很多時間精力。
“傳統制造業要想獲得高質量的數據,就必須對生產設備進行信息化、智能化的改造?!敝禊i飛表示,這種改造需要企業投入大量的時間和精力,還會增加生產成本,這也成為AI在傳統制造業中應用的壁壘。
高質量數據是應用前提
過去這10年,大部分AI的研發和應用是“以軟件為中心”驅動的。在海量數據的支撐下,不斷優化軟件和算法,來獲得更高的算法精度。在傳統行業無法提高數據質量和數量的情況下,吳恩達認為,傳統行業應該采用“以數據為中心”的模式,把重點放在獲得質量更好、匹配度更高的數據上。
“在這種思路下,傳統行業也涌現了一些不錯的應用案例。比如醫學領域的影像識別AI系統,可以幫醫生‘看’CT影像片子,對腫瘤等病變加以識別,輔助醫生做出判斷。”朱鵬飛介紹,由于很多數據都由專業的放射科醫生在影像片子上進行了標注,因此數據比較準確,AI算法模型在學習的過程中進步很快。目前很多影像識別系統的準確率都能達到90%以上,由于是輔助醫生,最后還需醫生做醫療決策,但這個水平的準確率在很大程度上降低了醫生的工作強度。
“盡管傳統行業有了一些應用AI技術的成功案例,但是要想更好地和AI結合,還得在提高數據質量方面下功夫?!敝禊i飛建議,首先對于已經積累了海量數據的傳統行業,在保證數據安全的前提下,主動開放數據。挖掘數據中蘊藏的價值,和需求關聯起來,會有很大的發展空間。其次,對于新興行業,比如新能源汽車等,在構建智能工廠規劃的時候,就把獲取數據、智能化的因素考慮進去。
不過朱鵬飛強調,在傳統行業用好AI技術的同時,也不要濫用AI技術,在應用前做好評估,如果不能提高生產效率,對行業整體有所提升,那么盲目強行使用AI技術,就是對資源的浪費?!氨热缫恍脠鼍靶枰狝I算法達到99%以上的精度才可以使用,通過評估,現有模型算法只能達到90%的精度,那么這個場景就沒必要強行上馬AI技術了?!?/span>
“總而言之,對于AI技術的應用要數據先行,有高質量的數據再談應用,沒有好的數據很難有好的應用?!敝禊i飛說。