計算機視覺技術囊括很多能夠理解圖像(包括圖片和視頻)的算法,它們是許多創新型關鍵技術——從自動駕駛汽車到智能工業機械甚至手機上的軟件等的基礎,也是我們正在努力構建的能像人類自身一樣理解和學習周圍世界的機器的基礎。
到2022年底,計算機視覺技術的市場價值預計將達到480億美元,并可能成為許多持續創新和突破的來源。美國《福布斯》雜志網站在近日的報道中,列出了計算機視覺技術在2022年的五大發展和應用趨勢。
優化數據的質量
計算機視覺的飛速發展多虧了深度學習技術的不斷進步。
深度學習領域的重要開拓者吳恩達博士開發了一些基于深度學習的圖像識別模型,其目的是訓練計算機識別貓的圖片,這些模型尤其依賴它們被“喂食”的數據的質量,而不僅僅是數量。使用自動提取并標記數據的技術提升了對標記數據的質量,將使計算機視覺技術能用更少的數據獲得同樣的結果,從而降低資金投入和計算資源等方面的成本,并開辟出更多新的潛在使用案例。
應用于健康和安全領域
計算機視覺的一個關鍵應用是發現危險并在出現問題時發出警報??茖W家們已經開發出了一些方法,讓計算機能夠檢測建筑工地上的不安全行為,比如沒有佩戴安全帽等,以及監控叉車等重型機械工作范圍內的各種環境,如果有人誤入工作范圍,它們會自動關閉。美國勞工統計局的數據顯示,每年有270萬人受工傷,越來越多企業加大了在該領域的投入,以減少因疏忽造成的人力和財務成本。
當然,防止病毒的大范圍傳播也是一個重要的應用案例,計算機視覺技術正越來越多地被用于監控某人是否遵守社交距離規定以及是否佩戴口罩等。在新冠疫情肆虐期間,科學家們還開發出了計算機視覺算法,可以通過尋找感染證據和肺部圖像受損情況,幫助診斷患者的病情。
應用于零售業
2022年,計算機視覺技術將會在購物和零售領域大力普及。
此前,亞馬遜開創了無收銀員商店Amazon Go,該雜貨店配備了攝像頭,可以簡單識別顧客從貨架上拿走的物品。2022年預計將有更多分店開業,包括特易購在內的其他零售商也將加入其中,如特易購將在英國開設其首家無收銀員的超市。
除了能自動掃描商品外,計算機視覺在零售業還有許多其他用途,例如應用于庫存管理領域,攝像頭可檢查貨架上商品的擺放情況和倉庫內的庫存情況,并在必要時自動訂購補貨。它還被用來監控和了解顧客在商店內的移動模式,以優化商品的擺放位置,當然,也可以用來防止商品被盜。計算機視覺技術另一個越來越流行的使用案例是讓客戶可以用手機掃描條形碼來獲取產品信息。而在時裝零售業,計算機視覺的一個特別有趣的應用是“虛擬試衣間”,顧客可以在不觸摸物品的情況下虛擬試穿物品,甚至可以識別顧客正在試穿的產品,并提供搭配建議。
在自動駕駛汽車領域“大顯身手”
計算機視覺已經應用于現有的智能網聯汽車領域。智能網聯汽車指搭載先進的車載傳感器、控制器、執行器等裝置,并融合現代通信與網絡技術,實現車與人、路、后臺等智能信息交換共享,實現安全、舒適、節能、高效行駛,并最終可替代人來操作的新一代汽車。
科學家們已經開發出一些視覺系統,能使用攝像頭跟蹤駕駛員的面部表情,發出警告信號,如駕駛員可能很疲勞,并有可能在開車時睡著等,調查顯示,高達25%的致命和嚴重交通事故由這一因素引起,因此,這樣的技術和措施可以更好地挽救生命。
這項技術已經在貨運卡車等商用車輛上使用,到2022年,它有望進入私家車領域。計算機視覺在汽車領域的其他可能用途包括監控乘客是否系好安全帶,甚至下車時是否落下鑰匙和電話等。
當然,計算機視覺也將在自動駕駛汽車領域發揮重要作用。如特斯拉公司今年宣布,其汽車將主要依靠計算機視覺,而不是使用雷達來為汽車行駛周圍的環境建模。
應用于邊緣計算領域
邊緣計算是指在數據源頭的附近,采用開放平臺,就近直接提供最近端的服務。邊緣計算與云計算相反,云計算是指通過網絡,把眾多數據計算處理程序分解,通過服務器組成的系統,把這些分解的小程序再處理分析來得到結果。
在計算機視覺領域,邊緣計算技術的重要性與日俱增,因為計算機視覺系統經常需要快速作出決定,比如在自動駕駛汽車等領域,因此根本沒有時間將數據發送到云。
隨著邊緣計算的計算速度不斷提高,計算機視覺將在安全領域產生重大影響,鑒于企業商業和個人在捕獲和使用視頻數據的方式上面臨更嚴格的審查和監管,這一點日益重要。使用邊緣設備,如配備了計算機視覺的安全攝像頭,人們可以動態分析數據,并在沒有理由保留數據(如沒有檢測到可疑活動)的情況下丟棄數據。