隱私計算又被形象地稱為“可用不可見”的技術,是涵蓋眾多學科的交叉融合技術,目前主流的隱私計算技術主要分為三大類:以多方安全計算為代表的基于密碼學的隱私計算技術,以聯邦學習為代表的人工智能與隱私保護技術融合衍生的技術,以可信執行環境為代表的基于可信硬件的隱私計算技術。
4月4日,北京國家金融科技認證中心公布了首批“多方安全計算金融科技產品國推認證”名單,包括螞蟻集團兩項產品在內的首批5項產品通過了該認證。
這是國內首次對多方安全計算金融領域應用展開認證工作,也是目前國內唯一針對該領域的“認證”,此次認證結果的發布,意味著數據要素市場的相關市場準入標準和監管體系迎來進一步完善。
作為隱私計算產品的重要底層技術,多方安全計算技術能夠在保護數據隱私的同時,實現不同機構之間數據的合法合規融合,實現安全的多方數據查詢和分析,進一步打破各方之間的數據壁壘,連接數據孤島,有效實現數據價值的轉化與釋放。
為數據價值而生的隱私計算
伴隨著云計算、大數據、人工智能等新一代信息技術的快速發展,數據已經成為基礎性關鍵戰略資源,同時也是數字經濟時代的核心生產要素。
但是,在信息技術蓬勃發展的同時,數據也面臨著一系列嚴峻的安全挑戰,不僅包括公民個人信息和隱私的安全隱患,也包括政府和企業數據資產的泄露風險。近年來,數據泄露事件層出不窮,出于安全顧慮,數據價值鏈不同環節之間的流動受阻,分工協作關系脆弱,很難形成有效閉環。
大數據時代,如何在保障數據安全的同時又不影響數據要素的使用,是每一個數據生產者和獲益者應該考慮的事情。
1982年,著名計算機學家、中國科學院院士姚期智提出了經典的“百萬富翁”問題:張三和李四都是富翁,他們想知道誰更富有,但他們都想保護好自己的隱私,不愿意讓對方或者任何第三方知道自己真正擁有多少財富。如何在保護好雙方隱私的情況下,計算出誰更有錢?
在普通人看來,這幾乎是一個無解的悖論。但是姚期智就此提出了“多方安全計算”的概念,即“一組互不信任的參與方在需要保護隱私信息以及沒有可信第三方的前提下進行協同計算”。
近年來,我國多部與數據安全相關的法律法規落地實施,包括《網絡安全法》《個人信息保護法》《密碼法》《數據安全法》以及《民法典》,形成了較為完備的安全法律體系,隱私計算為需求強烈但瓶頸重重的數據流通提供了破局思路。
隨著政策落地以及各方關注度的提升,隱私計算已成為當下火熱的新興技術,躋身商業和資本競爭的熱門賽道,有業界人士將2020年稱為“隱私計算元年”。顧問咨詢公司高德納(Gartner)發布的《2021年重要科技戰略趨勢》中,也將隱私計算列為未來幾年科技發展的九大趨勢之一。
多技術融合保護數據安全
隱私計算又被形象地稱為“可用不可見”的技術??床灰姅祿瑓s又能實現對數據的計算分析,隱私計算是如何做到的?
螞蟻集團隱私智能計算技術部總經理王磊告訴科技日報記者,隱私計算是涵蓋眾多學科的交叉融合技術,發展初期匯聚了多種不同種類的技術,目前主流的隱私計算技術主要分為三大類。
第一類是以多方安全計算為代表的基于密碼學的隱私計算技術;第二類是以聯邦學習為代表的人工智能與隱私保護技術融合衍生的技術;第三類是以可信執行環境為代表的基于可信硬件的隱私計算技術。
以多方安全計算為例,其主要邏輯是在沒有可靠的第三方(中介)的情況下,各方通過事先約定的密碼學協議進行交互,完成預定的計算任務,每個參與方無法得知其他方輸入的信息,只能得到計算結果。
“每一類技術路線都有各自的特點,適用于不同的應用場景。”王磊說,例如聯邦學習適用于對性能和規模要求較高的建模場景,多方安全計算安全性更高,基于可信硬件的隱私計算可以支持更復雜的計算需求。
但是,從近年來的技術發展趨勢和行業需求來看,想要通過單一技術“包打天下”幾乎不可能,現實需求往往需要不同的隱私計算技術組合使用,在保證原始數據安全和隱私性的同時,完成對數據的計算和分析任務。
王磊告訴記者,以螞蟻集團隱私計算的技術路線為例,從最早基于矩陣掩碼的數據變換方案,到基于多方安全計算和可信執行環境的兩套技術路線,再到后來的多種技術融合路線,并催生了可信隱私計算開源框架“隱語”和隱語開放平臺?!半[語”提供的是代碼,主要面向開發者,好比把原材料都準備齊全,就看開發者怎么做出一桌色香味俱全的大菜;而隱語開放平臺則可以讓用戶直接調用各項功能,好比平臺提供了預制菜,只要根據個人需求簡單加熱調味即可。
金融領域應用最廣泛
當前,隱私計算應用最廣泛的是金融行業。例如,招商銀行啟動了“慧點隱私計算平臺互聯互通項目”,交通銀行則啟動了監管沙盒項目,中國工商銀行、中國農業銀行也不同程度的在相關業務中嘗試性地應用了隱私計算工具。
“傳統的金融機構風險管理模式,除了調查走訪外,主要是利用本單位數據和征信系統查詢用戶信息,這種方式對用戶的風險判斷不夠全面?!蓖趵诒硎荆诙喾桨踩嬎愕慕鹑陲L控全鏈路解決方案,可以調用不同機構的多個信息渠道對潛在用戶的歷史記錄進行多維度計算分析,各金融機構、信息渠道可形成征信系統聯盟,能為各方提供數據分析服務,且數據無須離開本地,調用數據的過程中,數據不再以明文(即數據不加密)形式出現,而是通過安全協議共享,任何人都無法從中窺探到原始信息,這就是隱私計算相較于傳統金融機構風險管理模式所帶來的重要改變。
除了金融行業,隱私計算在醫療行業、保險理賠、政務信息等領域也有非常大的應用空間。
例如,過去保險機構在理賠過程中,會向醫療機構明文查詢被保險人的診療情況,而獲得的原始數據往往涉及用戶隱私。2018年,螞蟻集團嘗試將隱私計算技術應用到保險理賠場景,通過設定數據邏輯查詢,利用多方安全計算等隱私計算技術,使得保險公司只獲得是否理賠的結果,不會獲得原始數據,從而實現數據“可用不可見”,保護理賠用戶隱私。
在醫療行業,全球抗擊新冠疫情數據共享也運用到了隱私計算,這使各方可以在不公布詳細數據的情況下,聯合其他科研人員協同進行病例樣本基因組的聯合分析并共享結果,實現了對病毒流行病學情況的實時追蹤和對未來毒株演化的預測,成為抗擊疫情的一把利劍。
王磊表示,自計算機誕生以來,數據一直是明文流通和應用,面向數字經濟時代,安全地用好數據成為繞不過去的坎。今后,法規政策和技術進步都將助推數據要素告別明文流通,開啟“數據密態時代”的新征程,在數據密態時代最有潛力的支撐性技術非隱私計算莫屬。