王國賽 李 藝 陳 琨 時 代 楊祖艷
(1.清華大學五道口金融學院,北京 100800;2.華控清交信息科技(北京)有限公司,北京 100129)
近年來,針對大數(shù)據(jù)應用中頻頻發(fā)生的隱私泄露事件,不同國家及地區(qū)相繼加強數(shù)據(jù)隱私保護立法。同時,隨著數(shù)據(jù)不能流通帶來的壟斷問題日益嚴重,各行業(yè)面臨的數(shù)據(jù)壁壘問題亟待解決。特別地,金融業(yè)由于其數(shù)據(jù)的高敏感性和高價值性特點,在行業(yè)內(nèi)及跨行業(yè)的數(shù)據(jù)共享流通頻頻受阻,使得行業(yè)無法充分利用數(shù)據(jù)要素的價值。2021年2月,《金融業(yè)數(shù)據(jù)能力建設(shè)指引》(JR/T 0218—2021)正式發(fā)布,首次將“可用不可見”作為金融業(yè)數(shù)據(jù)能力建設(shè)應遵循的基本原則,提出在保障原始數(shù)據(jù)“可用不可見”的前提下規(guī)范開展數(shù)據(jù)共享與融合應用。2022年1月,國務院辦公廳印發(fā)《要素市場化配置綜合改革試點總體方案》,明確提出要探索建立數(shù)據(jù)用途和用量控制制度,實現(xiàn)數(shù)據(jù)使用“可控可計量”。在旺盛的產(chǎn)業(yè)需求推動下,隱私計算技術(shù)開始受到各界廣泛關(guān)注。許多金融機構(gòu)積極探索隱私計算技術(shù)方案,以合規(guī)高效地使用數(shù)據(jù)。
隱私計算技術(shù)亦被稱作隱私增強技術(shù)(Privacy Enhancing Technologies,PET)。但此處“隱私”(privacy)一詞指某方(包括個人和機構(gòu))不愿公開的信息,如個人隱私信息或機構(gòu)的商業(yè)秘密信息,并非局限于法律意義上的“個人隱私”范疇??傮w來看,國內(nèi)外已有諸多金融機構(gòu)、科技公司、行業(yè)組織及咨詢公司發(fā)布了關(guān)于隱私計算技術(shù)的金融應用報告,為金融業(yè)了解典型隱私計算技術(shù)的特點、發(fā)展現(xiàn)狀、可用場景及實踐案例提供指引(World Economic Forum 和
Deloitte,2019;UN Global Working Group on Big Data,2019;中國信息通信研究院和阿里安全和數(shù)牘科技,2020;強鋒等,2021)。
然而,已有研究多為典型隱私計算技術(shù)的羅列,并未對所有技術(shù)進行系統(tǒng)性梳理,且缺乏對數(shù)據(jù)流通底層理念的討論。這使得金融業(yè)目前對隱私計算的理解還不夠深入,一些底層影響仍值得更多討論。一方面,行業(yè)對不同隱私計算技術(shù)原理的認識尚不清晰,對不同技術(shù)的區(qū)別認識還比較模糊,導致一些金融機構(gòu)在針對業(yè)務場景選擇技術(shù)時往往存在不少困惑。另一方面,行業(yè)尚未關(guān)注到隱私計算平臺架構(gòu)邏輯可能帶來的重大影響。目前已有探討多偏向純技術(shù)本身,忽略了宏觀層面平臺架構(gòu)邏輯對數(shù)據(jù)流通可監(jiān)管性的影響。在這種局面下,不可監(jiān)管的隱私計算平臺架構(gòu)投入大規(guī)模應用,將引發(fā)嚴重的數(shù)據(jù)流通安全隱患。
對此,本文系統(tǒng)總結(jié)了當前已有隱私計算應用實踐,指出其大規(guī)模商業(yè)化應用仍亟待解決的瓶頸問題,并提出加強標準、立法等政策建議,為下階段金融業(yè)安全地挖掘數(shù)據(jù)要素價值、實現(xiàn)數(shù)據(jù)要素利用社會價值最大化提供參考。
按照技術(shù)原理,隱私計算技術(shù)基本可劃分為三個流派(見圖1)。
圖1:隱私計算技術(shù)流派劃分
1.基于密碼學方法的技術(shù)?;诿艽a學的隱私計算技術(shù)的正確性和安全性具有密碼學證明,其特點是安全強度高,計算準確度高,但計算效率因密文計算有所下降。代表性的此類技術(shù)有同態(tài)加密和多方安全計算技術(shù),其中,同態(tài)加密技術(shù)是一種密碼算法。技術(shù)理論由Yao(1982)通過提出并解答著名的“百萬富翁問題”而創(chuàng)立。該技術(shù)通常采用一系列基礎(chǔ)密碼技術(shù)實現(xiàn),包括混淆電路(Garbled Circuit)、秘密共享(Secret Sharing)和同態(tài)加密(Homomorphic Encryption)。
2.基于統(tǒng)計學的技術(shù)。此類技術(shù)指基于明文數(shù)據(jù)變換的手段保護原始數(shù)據(jù)的計算技術(shù),其安全性一般缺乏嚴格的密碼學證明,且計算結(jié)果有損。常見的此類技術(shù)包括差分隱私和聯(lián)邦學習。其中,差分隱私通過加入隨機化噪聲隱藏原始數(shù)據(jù)。聯(lián)邦學習作為一種分布式機器學習方法,是近年來隨著人工智能技術(shù)發(fā)展而最受關(guān)注的一項技術(shù)。它最早由Google 提出(McMahan 等,2016),能夠讓多個互不信任的訓練數(shù)據(jù)提供方在不交換原始數(shù)據(jù)的情況下,通過交換梯度或參數(shù)等中間計算結(jié)果協(xié)同訓練機器學習模型。通用性方面,聯(lián)邦學習主要適用于分布式機器學習模型訓練場景,而不能靈活應用于需要其他通用計算的業(yè)務場景。
3.可信執(zhí)行環(huán)境(TEE)??尚艌?zhí)行環(huán)境是基于硬件機制的物理隔離,用Enclave 沙盒模型保證數(shù)據(jù)和計算的安全性和完整性,代表性的有Intel SGX 和ARM TrustZone。在計算過程中,參與計算的數(shù)據(jù)以加密形式進入可信執(zhí)行環(huán)境,并解密為明文進行計算。因此,可信執(zhí)行環(huán)境的硬件隔離保證了環(huán)境內(nèi)部明文數(shù)據(jù)和計算邏輯的安全以及結(jié)果準確性,但可信執(zhí)行環(huán)境的容量限制及數(shù)據(jù)出入環(huán)境時的加密和解密過程對整體計算性能有一定損耗。
本文將常見的隱私計算技術(shù)架構(gòu)分為代理計算架構(gòu)(數(shù)據(jù)方不互相直連)和無代理計算架構(gòu)(數(shù)據(jù)方互相直連),其中后者亦可稱為直連架構(gòu)。
1.無代理計算架構(gòu)(直連架構(gòu))。無代理計算架構(gòu)中,金融機構(gòu)及其他數(shù)據(jù)源平臺作為數(shù)據(jù)方,直接參與隱私計算過程,即數(shù)據(jù)方同時擔任計算方的角色。該架構(gòu)的常見形式是對等網(wǎng)絡(peer-to-peer)架構(gòu)、客戶端—服務器(client-server)架構(gòu)和主—從(master-worker)架構(gòu)。對等網(wǎng)絡架構(gòu)如圖2所示。具體地,兩個數(shù)據(jù)提供方A和B分別部署有一個計算節(jié)點,彼此通過網(wǎng)絡直連,在隱私計算過程中進行密文數(shù)據(jù)交互,從而實現(xiàn)雙方數(shù)據(jù)參與協(xié)同運算。
圖2:對等網(wǎng)絡(peer-to-peer)架構(gòu)
客戶端—服務器架構(gòu)常用于特定場景的兩方或隱私計算,例如兩方隱私集合求交(Private Set Intersection)計算、隱私信息檢索(Private Information Retrieval)計算以及某些同態(tài)加密計算和部分聯(lián)邦學習場景的聯(lián)合建模計算。典型隱私計算場景的客戶端—服務器架構(gòu)如圖3所示。各數(shù)據(jù)方通過網(wǎng)絡直連,其中不同的數(shù)據(jù)方作為服務器或客戶端協(xié)同參與計算任務。
圖3:多方無代理計算架構(gòu)
2.代理計算架構(gòu)。在代理計算架構(gòu)中,計算方參與隱私計算的過程,數(shù)據(jù)方和計算方可以不同。這種數(shù)據(jù)和計算耦合的架構(gòu)可以實現(xiàn)高可擴展性:隱私計算平臺可以在不定制化設(shè)計協(xié)議的情況下,支持接入任意兩方或多方的數(shù)據(jù)源完成計算任務。我們可以視為數(shù)據(jù)方將對其數(shù)據(jù)的計算任務代理給了其他節(jié)點(計算方)完成。
該架構(gòu)有兩種常見的形式,一種是由一套分布式集群執(zhí)行密碼學的協(xié)議(多方安全計算協(xié)議),其架構(gòu)如圖4所示。我們可將這類架構(gòu)中分布式的代理計算節(jié)點統(tǒng)一視為一個“虛擬的中心計算節(jié)點”。但這種“虛擬的中心計算節(jié)點” 和前文所述的無代理計算的客戶端—服務器架構(gòu)有本質(zhì)的不同:分布式的代理計算節(jié)點集群是通過分布式的密文數(shù)據(jù)計算實現(xiàn)了去中心化的信任,代理計算節(jié)點只執(zhí)行密碼學協(xié)議計算,不提供輸入數(shù)據(jù)。其安全性假設(shè)和實現(xiàn)的安全特性也和客戶端—服務器架構(gòu)不同。另一種形式的代理計算架構(gòu)通過利用可信執(zhí)行環(huán)境(TEE)技術(shù)構(gòu)建一個可信第三方。各數(shù)據(jù)方將其數(shù)據(jù)進行非對稱加密后上傳至TEE節(jié)點,在TEE節(jié)點內(nèi)部,數(shù)據(jù)被解密為明文,參與計算過程。
圖4:多方代理計算架構(gòu)
3.兩種架構(gòu)對比分析。首先,通用性方面。無代理計算的架構(gòu)通常難以實現(xiàn)通用的隱私計算。代理計算架構(gòu)通常支持任意多個數(shù)據(jù)方。如果數(shù)據(jù)方本地也有進行明文計算的能力,則代理計算架構(gòu)除純密文計算外,也可支持更通用的明密文混合計算(明密文混合計算可用于實現(xiàn)聯(lián)邦學習)。
其次,可擴展方面。無代理平臺對于數(shù)據(jù)方數(shù)量變化的場景需要重新定制化地設(shè)計算法,可擴展性低?;诙喾桨踩嬎慵夹g(shù)或TEE的代理計算架構(gòu)可實現(xiàn)通用的安全計算,適用的金融場景更廣泛。
最后,可監(jiān)管性方面。由于無代理計算沒有中心服務器,每個參與方的計算節(jié)點存證分布分散,監(jiān)管方無法有效監(jiān)測數(shù)據(jù)加密、傳輸及計算是否采用了正確的協(xié)議。因此,監(jiān)管方難以避免參與方利用監(jiān)管漏洞,通過平臺直接交換明文數(shù)據(jù)進行協(xié)同運算,導致嚴重的隱私泄露或數(shù)據(jù)不合規(guī)使用的風險。而在代理計算中,中間代理計算節(jié)點能為監(jiān)管方提供持久化的數(shù)據(jù)和計算任務的存證,便于監(jiān)管方進行統(tǒng)一監(jiān)管和審計,及時發(fā)現(xiàn)惡意節(jié)點違背協(xié)議造成參與方之間數(shù)據(jù)不合規(guī)使用的問題,實現(xiàn)高效數(shù)據(jù)治理。因此,代理計算模式更易實現(xiàn)“技術(shù)去中心化、監(jiān)管中心化”的安全數(shù)據(jù)融合。
根據(jù)公開資料,當前國內(nèi)外金融業(yè)已有的隱私計算技術(shù)應用主要有三種:一是通過聯(lián)邦學習實現(xiàn)的聯(lián)合建模,并結(jié)合多方安全計算技術(shù)、差分隱私以及基于硬件的可信執(zhí)行環(huán)境保護參與方的數(shù)據(jù)隱私;二是使用多方安全計算技術(shù)直接實現(xiàn)隱私查詢、聯(lián)合建模及聯(lián)合統(tǒng)計,通過密碼學協(xié)議保障參與方的數(shù)據(jù)信息安全;三是部署可信執(zhí)行環(huán)境,如Intel SGX 和ARM TrustZone,通過物理隔離各參與方的數(shù)據(jù)而進行的安全多方聯(lián)合統(tǒng)計及聯(lián)合建模。上述應用主要來自銀行業(yè)和保險業(yè),所覆蓋的場景包括產(chǎn)品營銷、風控及反洗錢業(yè)務等。根據(jù)金融機構(gòu)的反饋,這些技術(shù)在試點中均實現(xiàn)了內(nèi)外部數(shù)據(jù)的安全連通,聯(lián)合建立的模型預測準確度有顯著提升。
近年來,隨著人工智能金融應用逐步興起,基于該分支的聯(lián)邦學習金融應用逐步增多。由于交換的梯度或參數(shù)往往可用來推斷甚至恢復原始數(shù)據(jù)信息(Kairouz等,2019;Zhu等,2019),這些中間計算結(jié)果的交換過程通常需采用基于密碼學的技術(shù)(如多方安全計算)及差分隱私技術(shù)來規(guī)避這些風險。因此,在實踐中,聯(lián)邦學習往往與多種隱私計算技術(shù)相結(jié)合,以規(guī)避中間信息交互存在的隱私安全隱患。具體包括:
1.“聯(lián)邦學習+同態(tài)加密”較為流行。當前,由于某開源框架帶來的易獲得性,國內(nèi)金融業(yè)的聯(lián)邦學習試點應用多數(shù)采用基于同態(tài)加密的多方安全計算協(xié)議,在模型訓練環(huán)節(jié)將交換的梯度或參數(shù)進行加密以保證各建模參與方的數(shù)據(jù)隱私性。較為代表性的案例有神盾—聯(lián)邦計算平臺、FATE、百度金融安全計算平臺、蜂巢聯(lián)邦智能平臺以及Fedlearn。其中,蜂巢聯(lián)邦智能平臺亦可選擇差分隱私技術(shù),通過給交換的中間數(shù)據(jù)加入噪聲而避免各方信息被直接泄露(蔡芳芳,2020)。這些平臺已分別聯(lián)合商業(yè)銀行、互聯(lián)網(wǎng)金融平臺、消費金融機構(gòu)及保險公司開展試點應用,利用自身沉淀的用戶行為數(shù)據(jù),和銀行或保險機構(gòu)的客戶金融數(shù)據(jù)進行聯(lián)邦學習建模,建立更精準的保險產(chǎn)品定價(蔡芳芳,2020)、信貸風險預測(騰訊安全,2020;謝國斌,2020)以及洗錢行為偵測模型(FedAI 聯(lián)邦學習,2020)。
從平臺架構(gòu)角度看,上述試點應用的聯(lián)邦學習計算平臺架構(gòu)均為對等網(wǎng)絡模式,無法支持集中監(jiān)管和審計的功能。一旦出現(xiàn)以隱私計算技術(shù)的名義進行非法數(shù)據(jù)交易的現(xiàn)象,其難以監(jiān)管的潛在風險應引起高度警惕。
2.“聯(lián)邦學習+秘密共享”優(yōu)勢初顯?;诿孛芄蚕淼亩喾桨踩嬎銋f(xié)議實現(xiàn)的聯(lián)邦學習應用中,典型的有PrivPy 平臺。該平臺架構(gòu)為代理計算模式,各參與方在每輪迭代中在本地執(zhí)行明文數(shù)據(jù)的模型訓練,并將梯度或參數(shù)通過秘密共享加密后發(fā)送給代理計算中心進行密文聚合計算。計算完成后,更新的參數(shù)以密文形式發(fā)送給各參與方用于本地下一輪訓練。由于PrivPy平臺實現(xiàn)的是明密文混合計算,即本地訓練基于明文數(shù)據(jù),中間結(jié)果加密,其在保證無梯度信息泄露的情況下實現(xiàn)了高效建模(中國信息通信研究院,2021)。
3.“聯(lián)邦學習+可信執(zhí)行環(huán)境”在國外發(fā)展迅速。目前,也有一些金融機構(gòu)在聯(lián)邦學習建模過程中采用可信執(zhí)行環(huán)境實現(xiàn)各方數(shù)據(jù)及計算節(jié)點的物理隔離,從而防止數(shù)據(jù)在計算過程中被竊取。基于可信執(zhí)行環(huán)境的聯(lián)邦學習案例中,較為代表性的是美國金融科技公司Consilient 與Intel 合作建立的聯(lián)邦學習反洗錢平臺(Shiffman等,2020)。該平臺的架構(gòu)為代理計算模式,參與建模的銀行和中心計算服務器均部署有Intel SGX 提供的可信執(zhí)行環(huán)境。在建模過程中,各參與銀行在其可信執(zhí)行環(huán)境內(nèi)明文訓練本地模型,并將中間梯度或參數(shù)以加密形式傳輸至中心計算服務器的可信執(zhí)行環(huán)境內(nèi)進行聚合并計算,從而更新整體模型。隨后,新的參數(shù)再以加密形式反饋至各銀行的可信執(zhí)行環(huán)境內(nèi)進行解密并計算,更新本地模型。根據(jù)Consilient 的報告,與傳統(tǒng)反洗錢模型高達95%的誤報比例相比,該平臺聯(lián)合5 家銀行建立的反洗錢模型的誤報比例低至12%,在降低傳統(tǒng)反洗錢業(yè)務成本的同時大幅度提高了預測精準度(Shiffman 等,2020)。目前,該平臺處于測試階段,可實現(xiàn)大于兩家機構(gòu)的聯(lián)邦學習建模。
相較于聯(lián)邦學習,多方安全計算的通用性更強。除聯(lián)合建模外,后者亦可實現(xiàn)隱私查詢、聯(lián)合統(tǒng)計、數(shù)據(jù)交易等計算場景。在我國,金融行業(yè)充分重視多方安全計算技術(shù),頂層設(shè)計頻頻出臺。2019年8月22日,中國人民銀行發(fā)布《金融科技(FinTech)發(fā)展規(guī)劃(2019—2021年)》,要求“構(gòu)建適用互聯(lián)網(wǎng)時代的移動終端可信環(huán)境,充分利用可信計算、安全多方計算、密碼算法、生物識別等信息技術(shù),建立健全兼顧安全與便捷的多元化身份認證體系”。2020年11月24日,《多方安全計算金融應用技術(shù)規(guī)范》(JR/T 0196—2020)(以下簡稱《技術(shù)規(guī)范》)正式發(fā)布,其規(guī)定了多方安全計算技術(shù)金融應用的基礎(chǔ)要求、安全要求、性能要求等,為技術(shù)服務提供商、解決方案提供商和金融機構(gòu)在產(chǎn)品設(shè)計、開發(fā)和應用方面提供了指引。2021年7月,《多方安全計算金融應用評估規(guī)范》(T/PCAC 0009-2021)正式出臺,作為進一步落實《技術(shù)規(guī)范》的具體舉措,對《技術(shù)規(guī)范》中的各項條目明確了其適用性、評估方法和通過標準,為金融檢測評估機構(gòu)順利開展對多方安全計算產(chǎn)品的相關(guān)檢測認證工作提供依據(jù),將推動多方安全計算金融應用產(chǎn)品的大規(guī)模有序落地,在保障信息安全前提下實現(xiàn)多個主體間的數(shù)據(jù)共享與融合應用。
實踐方面來看,自2020年金融科技試點項目推廣以來,我國目前已有十個涉及多方安全計算技術(shù)的項目成功進入創(chuàng)新試點,涉及場景包括金融消費者人臉信息保護、產(chǎn)品營銷、跨境結(jié)算、小微企業(yè)融資和信貸風控等。筆者根據(jù)公開材料對相關(guān)試點進行了總結(jié),如表1所示。
表1:基于多方安全計算的金融科技創(chuàng)新應用試點總結(jié)
在海外,諸多國家和地區(qū)的金融監(jiān)管當局亦認識到多方安全計算技術(shù)對監(jiān)管科技發(fā)展的重要性,并積極在反金融犯罪領(lǐng)域開展試點。例如,英國金融行為監(jiān)管局(Financial Conduct Authority,F(xiàn)CA)在2019年舉辦了全球反洗錢和反欺詐技術(shù)競賽(2019 Global AML and Financial Crime TechSprint),共有由世界知名科技公司、金融集團及咨詢公司構(gòu)成的140 余個小組參賽。在勝出的十個小組中,三個小組應用了基于多方安全計算的技術(shù)方案,解決了欺詐行為識別、反洗錢客戶身份識別(Know Your Customer,KYC)、交易關(guān)聯(lián)分析等場景的數(shù)據(jù)壁壘痛點(Financial Conduct Authority,2019),具體信息如表2所示。
表2:2019年全球反洗錢和反欺詐技術(shù)競賽中多方安全計算試點匯總
具體應用方面,國內(nèi)外金融業(yè)已有一些多方安全計算技術(shù)的落地應用,典型的有螞蟻鏈摩斯多方安全計算平臺、XOR Secret Computing 平臺、Duality SecurePlus系列產(chǎn)品以及PrivPy平臺。其中,前三者主要針對的是銀行業(yè)信用卡評分及反欺詐場景。這些平臺應用基于同態(tài)加密及秘密共享協(xié)議的多方安全計算技術(shù),安全融合不同銀行沉淀的用戶金融數(shù)據(jù)以及外部機構(gòu)存儲的行為數(shù)據(jù),聯(lián)合建立信用卡評分模型以及信用卡反欺詐模型。PrivPy 平臺實現(xiàn)的應用更為全面,其定位為數(shù)據(jù)要素流通的基礎(chǔ)設(shè)施平臺,已落地的金融應用場景包括企業(yè)級數(shù)據(jù)融合平臺—人臉識別隱私保護、行業(yè)級數(shù)據(jù)融合平臺—個人合格投資者(QI)認證以及跨行業(yè)數(shù)據(jù)融合平臺——政務金融數(shù)據(jù)融合應用等(王云河和李藝,2021)。根據(jù)公開資料及市場調(diào)研結(jié)果,上述平臺中,前三者均采用的是對等網(wǎng)絡架構(gòu),因而存在較難監(jiān)管、潛在數(shù)據(jù)安全風險大的問題;PrivPy 采取的是代理計算模式,支持“中心化管理”,便于監(jiān)管方有效監(jiān)測數(shù)據(jù)交易的合規(guī)性。
當前一些金融機構(gòu)也實現(xiàn)了僅依賴可信執(zhí)行環(huán)境進行的多方協(xié)同計算,典型的應用有百度安全開發(fā)的Mesa TEE 計算平臺。該平臺為全球首個通用安全計算平臺,通過Intel SGX 提供的可信空間物理隔離各方數(shù)據(jù),從而完成安全的多方協(xié)同計算任務。Mesa TEE提供的安全計算解決方案包括金融聯(lián)合建模及可信身份認證,能夠幫助金融機構(gòu)在風控環(huán)節(jié)融合多維度的用戶特征數(shù)據(jù),建立跨機構(gòu)的精準風控模型。另外,Mesa TEE 采用代理計算模式,用可信中心節(jié)點代替多方互信,參與方的數(shù)據(jù)交互至中心節(jié)點進行計算,避免了各參與方兩兩交互數(shù)據(jù)造成的延遲和吞吐開銷,同時支持對數(shù)據(jù)使用情況的中心化監(jiān)管(FreeBuf,2019)。
上述實踐表明,金融業(yè)已經(jīng)領(lǐng)先其他行業(yè),先行探索隱私計算技術(shù)的各種應用。總體來看,這些應用存在以下特點:
一是重視技術(shù)應用,但對產(chǎn)品架構(gòu)關(guān)注不足。特別是整個行業(yè)在認知方面,雖已體現(xiàn)出技術(shù)組合的思路,但仍存在重視技術(shù)而忽略產(chǎn)品架構(gòu)的問題。多數(shù)探索應用采用的仍為網(wǎng)絡直連架構(gòu),其大規(guī)模商業(yè)化應用可能帶來的數(shù)據(jù)流通中負外部性及風險監(jiān)管值得高度關(guān)注(徐葳和楊祖艷,2021)。在整個行業(yè)發(fā)展初期,忽略上述安全隱患,可能造成后期一旦爆發(fā)嚴重的數(shù)據(jù)安全事件,出現(xiàn)“一刀切”的行業(yè)集中整治,導致“劣幣驅(qū)逐良幣”的不良后果。因此,在大規(guī)模商業(yè)化應用之前,金融業(yè)應就上述問題在業(yè)內(nèi)組織各方專家充分論證、審慎推進。
二是單點應用較多,尚未實現(xiàn)系統(tǒng)全面的業(yè)務創(chuàng)新。目前來看,已有探索均是單個機構(gòu)、單個集團基于自身需要,聯(lián)合相關(guān)機構(gòu)進行試點,而行業(yè)內(nèi)及跨行業(yè)的數(shù)據(jù)要素流通還有待進一步加強。從需求來看,金融業(yè)的數(shù)據(jù)融合需求,除涉及銀行、證券和保險等不同細分行業(yè)外,更多涉及政務、醫(yī)療、教育等行業(yè)外數(shù)據(jù)。要推動整個金融行業(yè)通過隱私計算,實現(xiàn)數(shù)據(jù)要素價值的充分釋放,更大的推動力來自金融業(yè)務人員認識到隱私計算技術(shù)的價值。因此,金融機構(gòu)還需進一步推動相關(guān)科技部門、業(yè)務管理部門加強溝通,為通過數(shù)據(jù)要素融合實現(xiàn)金融業(yè)務創(chuàng)新奠定基礎(chǔ)。另外,金融業(yè)現(xiàn)有隱私計算產(chǎn)品多由不同技術(shù)廠商自行搭建,造成產(chǎn)品間的差異性較大,難以互聯(lián)互通。隨著此類產(chǎn)品的建設(shè)及使用規(guī)模逐漸擴大,金融業(yè)極易出現(xiàn)“技術(shù)孤島”現(xiàn)象。同時,部分金融機構(gòu)及技術(shù)廠商已在小范圍內(nèi)自行探索產(chǎn)品互聯(lián)互通方案,將進一步造成行業(yè)“數(shù)據(jù)群島”的局面,將對日后實現(xiàn)金融業(yè)整體數(shù)據(jù)流通共享、數(shù)據(jù)生態(tài)建設(shè)造成阻礙。
三是微觀討論較多,對數(shù)據(jù)要素化的宏觀影響關(guān)注較少。長期以來,傳統(tǒng)金融機構(gòu)在數(shù)據(jù)維度、數(shù)據(jù)實時性等方面處于劣勢,不得不“讓資本去找數(shù)據(jù)”,出現(xiàn)金融業(yè)務“無牌經(jīng)營”的一系列市場亂象,給金融監(jiān)管帶來較大挑戰(zhàn)。與此同時,金融行業(yè)自身積累的在資本要素配置上的優(yōu)勢卻無法得到發(fā)揮。隱私計算技術(shù)為金融科技賦能,本質(zhì)上應致力于推動整個金融行業(yè)打破“擇數(shù)據(jù)而產(chǎn)”的低效狀態(tài)。特別是金融行業(yè)可構(gòu)建自身數(shù)據(jù)生態(tài),實現(xiàn)“數(shù)據(jù)找資本”,充分利用數(shù)據(jù)要素在信息獲取、風險判斷方面的核心價值,幫助互聯(lián)網(wǎng)平臺輸出數(shù)據(jù)使用價值,獲取有利報酬,實現(xiàn)互聯(lián)網(wǎng)平臺和傳統(tǒng)金融業(yè)的共同健康發(fā)展。
因此,金融業(yè)要實現(xiàn)隱私計算技術(shù)的商業(yè)化推廣,還需要解決以下四個方面問題:一是在技術(shù)層面,行業(yè)應統(tǒng)一對各技術(shù)原理和特性的認識,同時要提高技術(shù)架構(gòu)對數(shù)據(jù)安全、可監(jiān)管性影響的重要性認識,凝集行業(yè)共識,以易監(jiān)管的數(shù)據(jù)流通模式,提前防范技術(shù)錯用或濫用造成的信息泄露風險。二是在業(yè)務層面,金融機構(gòu)中目前關(guān)注隱私計算技術(shù)的多為技術(shù)部門,業(yè)務部門對這些新興技術(shù)的認識還較為有限,也沒有打開能充分利用數(shù)據(jù)要素的想象空間,基于數(shù)據(jù)融合的業(yè)務創(chuàng)新活力亟待激活。三是在行業(yè)統(tǒng)籌層面,金融業(yè)應適時規(guī)劃隱私計算平臺進行互聯(lián)互通,避免產(chǎn)品算法差異造成“技術(shù)孤島”。具體地,先在集團級、行業(yè)級、跨行業(yè)層級分別建立數(shù)據(jù)流通基礎(chǔ)設(shè)施,形成各層級的數(shù)據(jù)融合基礎(chǔ)設(shè)施。隨后,該三級生態(tài)體系的基礎(chǔ)設(shè)施可進行互聯(lián)互通,前一層級生態(tài)作為后一層級生態(tài)的有機組成部分,共同形成互利互惠、良性循環(huán)的金融數(shù)據(jù)生態(tài)圈(中國工商銀行股份有限公司金融科技研究院和華控清交信息科技(北京)有限公司,2021)。四是在法律層面,推廣隱私計算技術(shù)要能實現(xiàn)數(shù)據(jù)安全和數(shù)據(jù)開發(fā)利用并重,打破數(shù)據(jù)立法基于明文的隱憂,構(gòu)建一套符合我國國情需要的、讓數(shù)據(jù)流通和數(shù)據(jù)安全有效平衡的數(shù)據(jù)法律體系,為金融業(yè)數(shù)據(jù)生態(tài)健康發(fā)展提供司法保障。
展望未來,解決隱私計算大規(guī)模應用的問題,需從行業(yè)和立法兩方面入手。首先,金融領(lǐng)域應圍繞標準制定加強行業(yè)交流,重視對于數(shù)據(jù)外部性風險治理的考量,并將其根植于隱私計算平臺架構(gòu)。具體地,標準應納入“代理計算”架構(gòu),引領(lǐng)行業(yè)打造支持“去中心化計算、中心化監(jiān)管”的數(shù)據(jù)安全融合平臺,實現(xiàn)可監(jiān)管、可審計的安全數(shù)據(jù)流通。其次,金融機構(gòu)內(nèi)部應將隱私計算技術(shù)的理念從技術(shù)部門擴展到業(yè)務部門,讓后者能夠針對場景的數(shù)據(jù)需求廣泛開闊思路,更好發(fā)揮數(shù)據(jù)要素的倍增作用,實現(xiàn)各項金融業(yè)務創(chuàng)新發(fā)展。在此基礎(chǔ)上,金融業(yè)權(quán)威第三方機構(gòu)應統(tǒng)籌規(guī)劃隱私計算平臺互聯(lián)互通建設(shè),形成支持全行業(yè)范圍的數(shù)據(jù)融合共享基礎(chǔ)設(shè)施,促進金融數(shù)據(jù)生態(tài)共榮發(fā)展。最后,在法律層面,數(shù)據(jù)立法應加強技術(shù)思維,明晰隱私計算技術(shù)應用可以實現(xiàn)的數(shù)據(jù)共享價值,避免因立法思維止步于明文數(shù)據(jù)共享而無法取得數(shù)據(jù)融合與數(shù)據(jù)安全的平衡。
上述問題的有效解決將使機構(gòu)合理運用技術(shù),政府實施有效監(jiān)管,助力隱私計算技術(shù)在金融業(yè)的商業(yè)化應用。通過可監(jiān)管的技術(shù)架構(gòu),金融行業(yè)將有效避免利用隱私計算技術(shù)進行非法數(shù)據(jù)交易的行為,整體實現(xiàn)行業(yè)健康發(fā)展,同時為我國數(shù)據(jù)要素市場建設(shè)提供行業(yè)標桿性示范。
①兩方各有一個樣本集合,在每方不向?qū)Ψ奖┞蹲陨聿粚儆诮患臉颖咀蛹那闆r下求解兩個集合的交集。
②一方查詢另外一方或幾方的數(shù)據(jù),但不暴露自身的查詢條件。
③騰訊安全開發(fā)。
④深圳前海微眾銀行股份有限公司開發(fā)。
⑤北京百度網(wǎng)訊科技有限公司開發(fā)。
⑥平安科技(深圳)有限公司開發(fā)。
⑦京東科技集團開發(fā)。
⑧華控清交信息科技(北京)有限公司開發(fā)。
⑨螞蟻集團開發(fā)。
⑩美國隱私計算技術(shù)公司Inpher開發(fā)。
?美國隱私計算技術(shù)公司Duality Technologies開發(fā)。
?百度安全官方網(wǎng)站:https://anquan.baidu.com/product/mesatee.