五問隱私計算:星星之火可以燎原嗎?

本文授權自微信公眾號「毛葦頻道」。

在 Gartner 發佈的2021年最新報告中,「隱私增強計算」(簡稱隱私計算)成為企業機構需要深挖的9項重要戰略科技趨勢之一。事實上,2020年隱私計算已經成為一個浮出水面的明星賽道。政府、金融機構、互聯網巨頭等都在積極擁抱這一新興技術,嗅覺敏銳的風險資本也都踴躍下注隱私計算領域的初創公司。

隱私計算為什麼突然火熱?隱私計算的星星之火是否可以燎原?

在信通院聯合數牘科技、阿里安全共同發佈的《隱私保護計算技術研究報告》(簡稱報告)中,筆者找到了部分答案,同時也產生了更多的問題。本文主要就五大問題進行分析闡述,歡迎業界專家批評指正。

一、為什麼隱私計算快速崛起成為熱點?

根據信通院報告的解釋,隱私保護計算是指在提供隱私保護的前提下,實現數據價值挖掘的技術體系。隱私保護計算並不是一種單一的技術,它是一套包含人工智能、密碼學、數據科學等眾多領域交叉融合的跨學科技術體系。隱私保護計算能夠保證滿足數據隱私安全的基礎上,實現數據「價值」和「知識」的流動與共享,真正做到「數據可用不可見」。

報告列舉了制約數據流通與協作的三大因素:數據孤島現象普遍存在;數據合規監管日趨嚴格;隱私洩露頻發導致信任鴻溝。報告認為這三大因素制約了數據流通與協作,而隱私計算技術提供了有效的解決之道。這較好地解釋了隱私計算技術能夠解決的部分現實問題,但尚不足以解釋為什麼隱私計算為什麼會快速成為企事業機構、互聯網巨頭、初創企業和資本追逐的熱點。

筆者認為,應該從需求側和供給側兩個方面來分析隱私計算的快速崛起。一是需求側,企事業機構對數據價值挖掘的巨大需求和日趨嚴格的安全合規監管之間的矛盾,為隱私計算技術的長期可持續發展提供了強大的驅動力。二是供給側,算力的普及,算法和大數據技術的日趨成熟,為隱私計算技術的工程落地提供了基礎設施和技術能力保障。

任何一個市場,只有在需求側和供給側同時到達一個臨界點後,才能產生共振效應,進而形成一股推動產業進步的潮流。

隱私計算的技術理論並不新穎,需求也一直存在,但很顯然,在數據價值挖掘和合規監管矛盾日趨尖銳,以及算力、算法和大數據技術日趨成熟的今天,需求側和供給側均到達了臨界點,導致了共振效應,推動了隱私計算的快速火熱。

二、隱私計算的主要價值是什麼?

據信通院報告分析,隱私保護計算的目標是在完成計算任務的基礎上,實現數據計算過程和數據計算結果的隱私保護。數據計算過程的隱私保護指參與方在整個計算的過程中難以得到除計算結果之外的額外信息。數據計算結果的隱私保護指參與方難以基於計算結果逆推原始輸入數據和隱私信息。

隱私計算主要有三個層面的價值:

一是消除數據孤島。隱私計算從技術角度實現了原始數據不出庫、數據可用不可見的目標,有效實現跨領域多維度數據的融合,完成了數據流通向「價值」流通的升級,打破了數據孤島,實現了數據隱私保護與價值挖掘之間的平衡。

二是合規避險。世界各國對安全合規的監管越來越嚴格,歐盟的GDPR、美國的CCPA相繼生效,中國的數據安全法和個人信息保護法草案等陸續出台,合規避險成為企事業機構的剛需。報告列舉了一個通過隱私計算技術合規避險的案例,愛沙尼亞在2015年的私人統計項目,1000萬條可識別納稅記錄與60萬條可識別學歷信息關聯在一起,通過安全多方計算技術對其進行統計分析。歐洲的PRACTICE項目(歐盟第七框架計畫)嚴格分析了安全計算技術的合規性,報告依據GDPR論證了該愛沙尼亞項目的合規性,為歐洲實現隱私保護合規的高效數據流通提供了重要範例。

三是彌合信任鴻溝。隱私計算技術憑藉其堅實的理論基礎和安全性證明,從技術角度實現了數據主體權利和數據使用者義務的平衡,增強了數據應用透明度,提升了數據價值挖掘下的隱私保護信任,能夠很大程度上彌合當前的信任鴻溝。

三、隱私計算有哪些關鍵技術?

報告對當前隱私計算領域的主流關鍵技術進行了深入剖析,主要包括五大關鍵技術:聯邦學習、安全多方計算、機密計算、差分隱私、同態加密。

一是聯邦學習(FL)。聯邦學習起源於谷歌的應用實踐,即通過一個中央服務器協調眾多結構鬆散的智能終端實現語言預測模型更新。聯邦學習通常可以理解為是由兩個或以上參與方共同參與,在保證數據方各自原始數據不出其定義的安全控制範圍的前提下,協作構建並使用機器學習模型的技術架構。聯邦學習的本質是以數據收集最小化為原則,在保持訓練數據去中心化分佈的基礎上,實現參與方數據隱私保護的特殊分佈式機器學習架構,且基於聯邦學習協同構建的機器學習模型與中心化訓練獲得的機器學習模型相比,性能幾乎是無損的。

二是安全多方計算(MPC)。MPC解決一組互不信任的參與方各自持有秘密數據,協同計算一個既定函數的問題。安全多方計算在保證參與方獲得正確計算結果的同時,無法獲得計算結果之外的任何信息。在整個計算過程中,參與方對其所擁有的數據始終擁有絕對的控制權。安全多方計算作為隱私計算領域的底層技術,在理論和工程實踐上都得到了很好的發展。

三是機密計算(CC)。機密計算是一種基於硬件可信執行環境實現數據應用保護的技術。為了減少機密計算環境對特有軟件的信任依賴,機密計算重點關注基於硬件可執行環境的安全保證。目前引入可信執行環境較為成熟的技術有 ARM 的 TrustZone 和 Intel 的 SGX(Software Guard Extensions,SGX)等。

四是差分隱私(DP)。差分隱私是量化和限制個人信息洩露的一種輸出隱私保護模型,其最主要的實現方式是在計算結果中添加噪聲。差分隱私被麻省理工科技評論為2020全球十大突破性技術之一,在美國2020年人口普查中的應用成為迄今為止差分隱私保護技術的最大規模應用,實現了在不損害個人隱私的前提下最大限度利用數據資源的核心訴求。

五是同態加密(HE)。同態加密是一種特殊的加密算法,它允許在加密之後的密文上直接進行計算,且計算結果解密後正好與明文的計算結果是一致的。

四、隱私計算有哪些主要應用場景?

經過大量的資料分析和專家訪談,筆者認為,總體而言國內在隱私計算領域尚處於應用場景探索的階段。目前,少數廠商在少數領域進行了有效的場景落地,但大規模的應用普及尚有待時日。

目前來看,隱私計算主要有這樣一些應用場景:

一是精準營銷。企業通過聯邦學習輸出模型,對高意向潛在客戶進行精準畫像,據此進行客戶線索挖掘,並對高潛客戶進行精準觸達和轉化。這種方式不僅可用於新增客戶挖掘,也可用於存量客戶的挖掘。例如,據數牘科技專家介紹,數牘在汽車、保險等行業就通過聯邦學習幫助客戶實現了精準客戶畫像和線索挖掘。

二是信用風險評估。隱私計算為金融機構間甚至跨行業的數據合作、共享提供了可能性。例如,銀行通過隱私求交、聯邦學習等隱私計算技術,對信貸主體的信用風險進行多方數據聯合建模、預測,可以更精準地評估信用風險,在提高放貸效率的同時降低違約率。據悉,在央行的發文指引下,工商銀行、建設銀行、招商銀行等大型商業銀行正在積極探索利用隱私計算技術進行金融科技創新。

三是政府治理。通過隱私保護計算和其他技術的結合,可以有效保護各部門的數據,在一定程度上解決政務「數據孤島」問題,提高政府治理能力。例如通過視頻、位置、交通等多部門數據對治安防控、突發事件進行研判,合理調配資源,提高應急處理能力和安全防範能力。

四是匿名查詢。報告介紹了一個疑犯信息查詢的場景,假設公安機關有一份疑犯名單,需要到其他部門查詢疑犯的相關信息,但是「疑犯」這個身份信息對個人而言比較敏感。利用隱私查詢技術,在查詢疑犯相關信息的同時,公安機關不需要跟其他部門共享疑犯名單,保護疑犯隱私。

五是輔助診斷。報告介紹了一個醫療領域的場景,為了應對新冠肺炎疫情帶來的醫療挑戰,醫療機構需要在全球範圍內共享新冠肺炎疫情數據。如通過人工智能識別肺部X光圖像來診斷新冠肺炎。各醫療機構先在本地建立模型,再通過SMPC等技術聯合其他醫療機構更新模型參數,在保護各方數據隱私安全前提下,提高圖像模型診斷能力。據悉,翼方健數等在用隱私計算技術輔助診斷治療方面進行了積極有效的探索。

實際上,隱私計算的應用場景遠遠不只上述幾種,筆者相信,隨著政府、金融機構和企業等對隱私計算技術的逐步深入理解,各行業都將不斷湧現出更多的應用場景。

五、隱私計算當前面臨哪些挑戰?

隱私計算雖然快速發展,但依然面臨如下一些挑戰:

一是應用場景落地。隱私計算是一種數據協作的技術,其商業價值取決於應用場景的落地能力。目前雖然有不少廠商都推出了隱私計算產品,但能實現應用場景落地的依然寥寥。可以預見,2021年將成為隱私計算應用場景落地元年。諸如數牘科技、阿里安全等已有應用場景落地的廠商或將在競爭中佔據優勢地位。

二是技術標準。隱私計算解決的是數據使用方和資源方之間的安全協作問題,使用方和數據資源方都有建設隱私計算平台的需求,那麼各平台之間的數據如何流通與協作就至關重要。當前看來,技術標準是關鍵的解決之道。能否在大的數據資源方和使用方之間形成某種事實上的標準,以及能否在各大主流標準之間實現兼容,對於推動行業整體技術標準的建立將具有重要作用。

三是市場教育。隱私計算作為一種新技術,對客戶的市場教育任重而道遠。Gartner的前瞻技術分析,以及信通院聯合數牘科技和阿里安全的報告,無疑對教育市場、推動隱私計算技術的普及具有重要價值。

四是核心技術人才的培養。隱私計算在國內剛剛興起,目前的核心技術人才大多來自於跨國企業的歸國技術人才,或者互聯網巨頭內部的安全技術人才。真正擁有自主知識產權、擁有核心技術的企業少之又少。在隱私計算快速推廣的過程中,不少廠商將在很長一段時間內面臨缺乏核心技術人才的挑戰。

2020年被稱為隱私計算元年。可以預見隱私計算面臨的挑戰還有很多,諸如客戶對安全性的顧慮、商業模式、產品化等問題,筆者將在後續陸續撰文分析。

隱私計算的星星之火,已經有了燎原之勢。

本文經授權發布,不代表36氪立場。
如若轉載請註明出處。來源出處:36氪