當(dāng)前數(shù)字經(jīng)濟(jì)快速發(fā)展,數(shù)據(jù)生產(chǎn)要素的價(jià)值日益凸顯。金融行業(yè)是數(shù)據(jù)密集型和科技驅(qū)動(dòng)型行業(yè),商業(yè)銀行數(shù)字化轉(zhuǎn)型過程中對(duì)數(shù)據(jù)要素價(jià)值需求持續(xù)增長。聚焦商業(yè)銀行業(yè)務(wù)實(shí)際,存在數(shù)據(jù)壁壘難以打破、數(shù)據(jù)價(jià)值流通不暢、金融服務(wù)智能化受限、數(shù)據(jù)利用安全風(fēng)險(xiǎn)發(fā)生等問題。區(qū)塊鏈技術(shù)支持多方數(shù)據(jù)協(xié)作和數(shù)據(jù)存證,而隱私計(jì)算技術(shù)支持多方數(shù)據(jù)協(xié)同計(jì)算,兩者提供了解決數(shù)據(jù)安全與隱私問題的新手段,可以在不泄露原始數(shù)據(jù)的前提下,開展多方數(shù)據(jù)安全共享,釋放多方數(shù)據(jù)價(jià)值,實(shí)現(xiàn)數(shù)據(jù)“可用不可見,可控可計(jì)量”。針對(duì)數(shù)據(jù)共享難等痛點(diǎn),融合運(yùn)用區(qū)塊鏈和隱私計(jì)算技術(shù),探索多方數(shù)據(jù)安全跨域合作,提升數(shù)據(jù)價(jià)值利用效率,對(duì)更好地推動(dòng)商業(yè)銀行數(shù)字化轉(zhuǎn)型工作具有積極的現(xiàn)實(shí)意義。
區(qū)塊鏈技術(shù)應(yīng)用發(fā)展
2019年10月24日,習(xí)近平總書記在十九屆中央政治局第十八次集體學(xué)習(xí)時(shí)指出,區(qū)塊鏈技術(shù)的集成應(yīng)用在新的技術(shù)革新和產(chǎn)業(yè)變革中起著重要作用。區(qū)塊鏈技術(shù)應(yīng)用已延伸至數(shù)字金融、物聯(lián)網(wǎng)、智能制造、供應(yīng)鏈管理、數(shù)字藏品等多個(gè)領(lǐng)域,我國要積極推進(jìn)區(qū)塊鏈和經(jīng)濟(jì)社會(huì)融合發(fā)展。2020年以來,國家和地方政府高度重視區(qū)塊鏈技術(shù)與產(chǎn)業(yè)發(fā)展,積極出臺(tái)相關(guān)鼓勵(lì)政策。國家發(fā)展改革委明確將區(qū)塊鏈納入新基建范疇。工信
部、中央網(wǎng)信辦聯(lián)合發(fā)布的《關(guān)于加快推動(dòng)區(qū)塊鏈技術(shù)應(yīng)用和產(chǎn)業(yè)發(fā)展的指導(dǎo)意見》指出,到2025年,區(qū)塊鏈產(chǎn)業(yè)綜合實(shí)力達(dá)到世界先進(jìn)水平,產(chǎn)業(yè)初具規(guī)模。地方政府層面,截至2023年12月,全國已有29個(gè)省市將發(fā)展區(qū)塊鏈技術(shù)產(chǎn)業(yè)納入地方“十四五”規(guī)劃。區(qū)塊鏈?zhǔn)且环N由多方共同維護(hù)、分布式儲(chǔ)存的記賬技術(shù),具有數(shù)據(jù)難以篡改、信息抗抵賴、多中心、分布式記賬等特點(diǎn),可重構(gòu)信用形成機(jī)制,深刻影響金融交易過程,推動(dòng)金融基礎(chǔ)設(shè)施變革和商業(yè)價(jià)值低成本轉(zhuǎn)移。區(qū)塊鏈在銀行應(yīng)用場(chǎng)景可分為三類:一是對(duì)數(shù)據(jù)存證防偽、數(shù)據(jù)確權(quán)及數(shù)據(jù)全生命周期管理有較大需求的場(chǎng)景。例如,電子保函、數(shù)字保理、數(shù)字藏品等業(yè)務(wù)相關(guān)電子資料存證溯源,以及產(chǎn)業(yè)數(shù)字資產(chǎn)可信采集、有效識(shí)別、確權(quán)認(rèn)證、使用流通的全流程全生命周期管理。二是多主體間對(duì)提升協(xié)作效率、降低信任成本有較大需求的場(chǎng)景。區(qū)塊鏈作為多方協(xié)作系統(tǒng),通過數(shù)據(jù)防偽保真建立數(shù)字信任,并通過可信流程協(xié)作提升各方協(xié)作效率。例如,貿(mào)易金融、供應(yīng)鏈金融等場(chǎng)景需要多個(gè)參與方實(shí)現(xiàn)互信和業(yè)務(wù)高效協(xié)作。三是對(duì)數(shù)據(jù)安全共享和數(shù)據(jù)聯(lián)合計(jì)算有較大需求的場(chǎng)景。區(qū)塊鏈作為分布式數(shù)據(jù)庫,能夠?qū)崿F(xiàn)在一定程度上保障隱私數(shù)據(jù)安全前提下的數(shù)據(jù)共享。例如,反欺詐黑名單共享、聯(lián)合征信等。關(guān)于區(qū)塊鏈技術(shù)本質(zhì)及應(yīng)用發(fā)展,有三個(gè)要點(diǎn)值得關(guān)注。首先,密碼學(xué)是區(qū)塊鏈技術(shù)的基石——密碼學(xué)在區(qū)塊鏈技術(shù)中的主要用途在于保護(hù)鏈上數(shù)據(jù)信息的機(jī)密性、完整性、認(rèn)證性和不可抵賴性,并由此構(gòu)建基于數(shù)據(jù)的信任機(jī)制。第二,跨鏈技術(shù)是區(qū)塊鏈能在更大范圍內(nèi)開展數(shù)據(jù)要素和數(shù)據(jù)價(jià)值融通、共享和交換的橋梁——跨鏈主要解決鏈上與鏈下、鏈與鏈之間的數(shù)據(jù)等要素的互操作問題,通過跨鏈技術(shù),實(shí)現(xiàn)區(qū)塊鏈網(wǎng)絡(luò)中的資產(chǎn)、數(shù)據(jù)和業(yè)務(wù)的互操作,有助于構(gòu)建互聯(lián)互通的產(chǎn)業(yè)生態(tài),推動(dòng)數(shù)據(jù)要素和數(shù)據(jù)價(jià)值在全球范圍內(nèi)流通。第三,區(qū)塊鏈作為數(shù)據(jù)底座技術(shù)之一,能有力支撐數(shù)據(jù)中臺(tái)發(fā)展——區(qū)塊鏈匯聚了業(yè)務(wù)流程中的信息流、商流、物流、資金流等數(shù)據(jù),且有效保障了數(shù)據(jù)的可控共享、不可篡改,為授信、風(fēng)控等業(yè)務(wù)場(chǎng)景提供了相對(duì)安全可信的基礎(chǔ)分析數(shù)據(jù),能解決信息割裂和不可信等痛點(diǎn),支持大數(shù)據(jù)金融創(chuàng)新業(yè)務(wù)發(fā)展。
隱私計(jì)算技術(shù)應(yīng)用發(fā)展
隱私計(jì)算技術(shù)是一套包含人工智能、密碼學(xué)、數(shù)據(jù)科學(xué)等眾多領(lǐng)域交叉融合的跨學(xué)科技術(shù)體系,其核心作用是讓兩個(gè)或多個(gè)參與方在不泄露各自數(shù)據(jù)的前提下,實(shí)現(xiàn)加密狀態(tài)或非透明狀態(tài)下的數(shù)據(jù)協(xié)同計(jì)算,為隱私信息提供全生命周期保護(hù),實(shí)現(xiàn)數(shù)據(jù)價(jià)值挖掘和共享。從底層技術(shù)路徑視角出發(fā),隱私計(jì)算分為三個(gè)主流發(fā)展方向:多方安全計(jì)算(Multi-Party Computing,MPC)、聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)和可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE)。多方安全計(jì)算主要研究在無可信第三方的情況下,安全地進(jìn)行多方協(xié)同計(jì)算問題。該技術(shù)應(yīng)用了密碼學(xué)的一些重要隱私技術(shù)成果,包括同態(tài)加密、秘密共享、不經(jīng)意傳輸、混淆電路、零知識(shí)證明等。聯(lián)邦學(xué)習(xí)是一個(gè)多方協(xié)同的機(jī)器學(xué)習(xí)框架,可滿足多個(gè)參與方在保護(hù)數(shù)據(jù)安全和隱私信息的前提下進(jìn)行數(shù)據(jù)計(jì)算和模型訓(xùn)練。對(duì)于不同應(yīng)用場(chǎng)景的數(shù)據(jù)集特點(diǎn),聯(lián)邦學(xué)習(xí)又分為縱向聯(lián)邦學(xué)習(xí)、橫向聯(lián)邦學(xué)習(xí)和聯(lián)邦遷移學(xué)習(xí)三類??尚艌?zhí)行環(huán)境是數(shù)據(jù)計(jì)算平臺(tái)上由軟硬件方法構(gòu)建的一個(gè)安全區(qū)域,通過將模型及模型需要的數(shù)據(jù)匯集到可信安全區(qū)域中,實(shí)現(xiàn)互不信任的多個(gè)參與方進(jìn)行數(shù)據(jù)協(xié)同計(jì)算,輸出計(jì)算結(jié)果,同時(shí)保證在安全區(qū)域內(nèi)代碼和數(shù)據(jù)的機(jī)密性和完整性。
在銀行產(chǎn)業(yè)數(shù)字金融領(lǐng)域,產(chǎn)業(yè)價(jià)值鏈縱橫交織,產(chǎn)業(yè)數(shù)據(jù)多源異構(gòu)、海量高頻,存在數(shù)據(jù)要素安全共享融合難、數(shù)據(jù)價(jià)值挖掘難等問題。隱私計(jì)算技術(shù)在保護(hù)隱私數(shù)據(jù)安全的前提下,實(shí)現(xiàn)產(chǎn)業(yè)多方數(shù)據(jù)協(xié)同計(jì)算,可在風(fēng)險(xiǎn)控制、聯(lián)合營銷等場(chǎng)景中發(fā)揮重要作用?;陔[私求交、隱私查詢、聯(lián)合建模等隱私計(jì)算技術(shù)手段,在數(shù)據(jù)不出域的前提下,可實(shí)現(xiàn)產(chǎn)業(yè)生態(tài)不同主體多維度數(shù)據(jù)融合,橫向聯(lián)通電信運(yùn)營商數(shù)據(jù)、交通出行數(shù)據(jù)、消費(fèi)數(shù)據(jù)、征信數(shù)據(jù)等,并將多維度的數(shù)據(jù)納入反欺詐模型、聯(lián)合風(fēng)控模型、精準(zhǔn)營銷模型中,以此開展多方協(xié)同計(jì)算,釋放多方數(shù)據(jù)價(jià)值。
隱私計(jì)算技術(shù)本質(zhì)及應(yīng)用發(fā)展有三個(gè)要點(diǎn)值得關(guān)注。首先,密碼學(xué)是隱私計(jì)算技術(shù)的核心——隱私計(jì)算大量應(yīng)用了當(dāng)今密碼學(xué)在數(shù)據(jù)隱私保護(hù)領(lǐng)域的經(jīng)典研究成果,在密文計(jì)算、聯(lián)合計(jì)算、數(shù)據(jù)隱私保護(hù)等方面具有獨(dú)特優(yōu)勢(shì)。第二,隱私計(jì)算支持多方協(xié)同計(jì)算,有利于數(shù)據(jù)信息價(jià)值共享——隱私計(jì)算技術(shù)提供了打破數(shù)據(jù)孤島,解決數(shù)據(jù)安全與隱私問題的新技術(shù)手段,可在不泄露原始數(shù)據(jù)的前提下,開展多方數(shù)據(jù)安全共享,釋放多方數(shù)據(jù)價(jià)值,實(shí)現(xiàn)數(shù)據(jù)“可用不可見”。第三,隱私計(jì)算可與區(qū)塊鏈、大數(shù)據(jù)等技術(shù)融合應(yīng)用,更好地支持隱私數(shù)據(jù)保護(hù)——隨著歐盟《通用數(shù)據(jù)保護(hù)法案》(GDPR)的出臺(tái)和《中華人民共和國個(gè)人信息保護(hù)法》的施行,隱私立法時(shí)代正在開啟,隱私計(jì)算、密碼學(xué)、區(qū)塊鏈、大數(shù)據(jù)等技術(shù)快速迭代,日益成熟,融合運(yùn)用隱私計(jì)算與區(qū)塊鏈、大數(shù)據(jù)等技術(shù)來實(shí)現(xiàn)隱私數(shù)據(jù)保護(hù)和安全共享恰逢其時(shí)。
區(qū)塊鏈與隱私計(jì)算相互賦能、融合創(chuàng)新
區(qū)塊鏈與隱私計(jì)算可實(shí)現(xiàn)優(yōu)勢(shì)互補(bǔ)
區(qū)塊鏈技術(shù)大量應(yīng)用了密碼學(xué)技術(shù),實(shí)現(xiàn)數(shù)據(jù)可溯源、不可篡改和可審計(jì),在推動(dòng)數(shù)據(jù)要素共享和數(shù)據(jù)價(jià)值流動(dòng)方面具有先天優(yōu)勢(shì),但仍存在鏈上鏈下數(shù)據(jù)隱私保護(hù)手段不足、鏈上鏈下計(jì)算處理能力不足等問題。隱私計(jì)算技術(shù)博采密碼學(xué)之長,大量應(yīng)用了當(dāng)今密碼學(xué)在數(shù)據(jù)隱私保護(hù)領(lǐng)域的經(jīng)典研究成果,形成多方安全計(jì)算、聯(lián)邦學(xué)習(xí)等技術(shù)體系,在密文計(jì)算、聯(lián)合計(jì)算、數(shù)據(jù)隱私保護(hù)等方面具有獨(dú)特優(yōu)勢(shì),可有效彌補(bǔ)區(qū)塊鏈在數(shù)據(jù)隱私保護(hù)能力上的不足。但與此同時(shí),隱私計(jì)算亦存在在計(jì)算流程、模型參數(shù)更新和身份可信等方面缺乏有效監(jiān)督驗(yàn)證,以及協(xié)作平臺(tái)環(huán)境缺乏、激勵(lì)機(jī)制不完善等問題。區(qū)塊鏈與隱私計(jì)算融合應(yīng)用,可在如下方面實(shí)現(xiàn)互補(bǔ):一是在身份認(rèn)證方面,利用區(qū)塊鏈和分布式數(shù)字身份實(shí)現(xiàn)數(shù)字身份管理,確保參與方真實(shí)可信;二是在數(shù)據(jù)全生命周期保護(hù)方面,區(qū)塊鏈對(duì)隱私計(jì)算過程中的數(shù)據(jù)申請(qǐng)、授權(quán)、計(jì)算結(jié)果全過程上鏈記錄和存儲(chǔ),可保障隱私計(jì)算過程數(shù)據(jù)全生命周期的安全性,滿足全程可追溯、防作弊,以及監(jiān)管審計(jì)要求;三是在高效協(xié)作方面,可引入數(shù)據(jù)質(zhì)量評(píng)價(jià)體系和激勵(lì)機(jī)制,提升參與計(jì)算的數(shù)據(jù)質(zhì)量,推動(dòng)數(shù)據(jù)安全共享計(jì)算;四是在協(xié)同計(jì)算能力方面,隱私計(jì)算融合了密碼學(xué)重要隱私技術(shù)成果,包括同態(tài)加密、秘密共享、不經(jīng)意傳輸、混淆電路、零知識(shí)證明等多方安全計(jì)算技術(shù)和聯(lián)邦學(xué)習(xí)技術(shù),極大地拓展了區(qū)塊鏈在鏈上鏈下的隱私保護(hù)能力。
區(qū)塊鏈與隱私計(jì)算技術(shù)融合創(chuàng)新的三種模式
區(qū)塊鏈與隱私計(jì)算的技術(shù)融合創(chuàng)新包括存證溯源層、智能合約層和技術(shù)架構(gòu)層三種模式。
一是存證溯源層融合。隱私計(jì)算涉及的中間計(jì)算過程和最終結(jié)果等數(shù)據(jù)信息均通過區(qū)塊鏈進(jìn)行存證溯源,實(shí)現(xiàn)隱私計(jì)算過程中關(guān)鍵數(shù)據(jù)信息的全生命周期保護(hù)。在這種模式下,參與多方協(xié)同計(jì)算的各種任務(wù)記錄、源數(shù)據(jù)Hash摘要、中間計(jì)算過程、結(jié)果數(shù)據(jù)均上鏈存證,由此保障隱私計(jì)算的數(shù)據(jù)和算法全生命周期可信。
二是智能合約層融合。在區(qū)塊鏈系統(tǒng)中實(shí)現(xiàn)和部署具有隱私計(jì)算功能的智能合約。基于區(qū)塊鏈智能合約和隱私計(jì)算相關(guān)算法,開發(fā)具有隱私計(jì)算功能的智能合約,實(shí)現(xiàn)密鑰分發(fā)、同態(tài)加密、秘密共享、隱私查詢、聯(lián)合統(tǒng)計(jì)等功能,完成區(qū)塊鏈與隱私計(jì)算技術(shù)融合應(yīng)用。
三是技術(shù)架構(gòu)層融合。構(gòu)建統(tǒng)一和深度融合的“區(qū)塊鏈+隱私計(jì)算”開放架構(gòu)。通過對(duì)區(qū)塊鏈底層部分功能模塊重構(gòu)和開發(fā),在區(qū)塊鏈上層協(xié)議實(shí)現(xiàn)分布式模型聚合任務(wù),構(gòu)建支持隱私計(jì)算功能的新型區(qū)塊鏈底層平臺(tái)架構(gòu),實(shí)現(xiàn)區(qū)塊鏈和隱私計(jì)算在協(xié)議層面的深度融合。
區(qū)塊鏈與隱私計(jì)算技術(shù)融合的銀行應(yīng)用解決方案
在銀行業(yè)務(wù)發(fā)展過程中,為解決數(shù)據(jù)可用、數(shù)據(jù)可信等問題,需要將區(qū)塊鏈與隱私計(jì)算技術(shù)融合,形成聯(lián)合黑名單共享查詢、聯(lián)合統(tǒng)計(jì)分析、反欺詐標(biāo)簽補(bǔ)全、聯(lián)合風(fēng)控建模等創(chuàng)新數(shù)字化技術(shù)解決方案。
聯(lián)合黑名單共享查詢
銀行、小貸公司等金融機(jī)構(gòu)均維護(hù)逾期、失信、欺詐等行為的客戶黑名單信息,但各機(jī)構(gòu)的信息并不互通,黑名單信息難以共享。金融機(jī)構(gòu)若能夠在不泄露用戶隱私的前提下,共享黑名單信息,則可以大大降低各機(jī)構(gòu)盡調(diào)成本,完善用戶信息特征庫,提升金融應(yīng)用效率和效果。
在傳統(tǒng)數(shù)據(jù)查詢服務(wù)模式中,查詢方向數(shù)據(jù)源方發(fā)送明文或加密的身份要素發(fā)起查詢,數(shù)據(jù)源方直接返回?cái)?shù)據(jù)標(biāo)簽,這種查詢方式,存在數(shù)據(jù)源方將查詢方客戶身份要素等隱私信息泄露的風(fēng)險(xiǎn)隱患。隱私信息檢索技術(shù)則可以在不泄露用戶信息的前提下完成黑名單共享查詢。例如,機(jī)構(gòu)A向機(jī)構(gòu)B查詢用戶張三是否有逾期或者違約行為,該過程中不泄露用戶信息,機(jī)構(gòu)B不知道機(jī)構(gòu)A的具體查詢信息,機(jī)構(gòu)A也不知道除該張三用戶以外的其他用戶信息。
基于區(qū)塊鏈與隱私信息檢索技術(shù),在各參與方之間組成聯(lián)盟鏈,查詢方采用隱私信息檢索查詢方式向聯(lián)盟發(fā)起查詢申請(qǐng),對(duì)各參與方數(shù)據(jù)上傳、查詢等操作都記錄在鏈上存證,并設(shè)計(jì)數(shù)據(jù)質(zhì)量評(píng)價(jià)體系,推動(dòng)各方積極參與數(shù)據(jù)共享。在銀行業(yè)務(wù)場(chǎng)景下,具體業(yè)務(wù)流程為:用戶在機(jī)構(gòu)A申請(qǐng)貸款,機(jī)構(gòu)A驗(yàn)證用戶身份并受理;聯(lián)盟鏈驗(yàn)證機(jī)構(gòu)A身份,驗(yàn)證通過后機(jī)構(gòu)A發(fā)起黑名單隱私查詢;通過智能合約和消息中間件,進(jìn)行任務(wù)和密鑰分發(fā),并通過不經(jīng)意傳輸協(xié)議實(shí)現(xiàn)加密數(shù)據(jù)交互等;機(jī)構(gòu)A獲得其他機(jī)構(gòu)返回加密數(shù)據(jù),并使用私鑰解密,獲得黑名單查詢結(jié)果;最后,系統(tǒng)積分結(jié)算,激勵(lì)任務(wù)參與者。
聯(lián)合統(tǒng)計(jì)分析
產(chǎn)業(yè)生態(tài)中,多頭借貸行為利用各金融機(jī)構(gòu)之間“數(shù)據(jù)不互通、信息不對(duì)稱”實(shí)施欺詐。在多頭借貸等場(chǎng)景中,單個(gè)機(jī)構(gòu)掌握的數(shù)據(jù)不足以有效規(guī)避欺詐風(fēng)險(xiǎn),亟待打通機(jī)構(gòu)間的數(shù)據(jù)孤島,探索開展聯(lián)合征信工作。對(duì)于各金融機(jī)構(gòu)而言,用戶在該機(jī)構(gòu)辦理借貸等服務(wù)的信貸數(shù)據(jù)屬于商業(yè)秘密,需要一種安全可信且保護(hù)隱私的方法實(shí)現(xiàn)數(shù)據(jù)信息共享。
基于區(qū)塊鏈、同態(tài)加密、秘密共享等技術(shù),構(gòu)建多方協(xié)同計(jì)算平臺(tái),可在各方不披露具體貸款信息等業(yè)務(wù)數(shù)據(jù)的前提下,計(jì)算出具體借款人的跨金融機(jī)構(gòu)授信、用信總金額等信息,實(shí)現(xiàn)聯(lián)合征信查詢。在銀行業(yè)務(wù)場(chǎng)景下,具體業(yè)務(wù)流程為:客戶向機(jī)構(gòu)A發(fā)起借貸申請(qǐng),機(jī)構(gòu)A經(jīng)過身份認(rèn)證后通過協(xié)同計(jì)算平臺(tái)發(fā)起該客戶的聯(lián)合征信查詢?nèi)蝿?wù);各機(jī)構(gòu)計(jì)算節(jié)點(diǎn)接收申請(qǐng),并確認(rèn)有效后,參與聯(lián)合征信計(jì)算任務(wù);隱私計(jì)算智能合約對(duì)各機(jī)構(gòu)提交的加密或混淆數(shù)據(jù)進(jìn)行聯(lián)合計(jì)算,得到統(tǒng)計(jì)結(jié)果;金融機(jī)構(gòu)A通過智能合約查詢加密結(jié)果并解密,得到客戶的各機(jī)構(gòu)授信、用信總額等信息,完成聯(lián)合征信查詢流程。整個(gè)過程中,任務(wù)發(fā)起、身份驗(yàn)證、同態(tài)加密計(jì)算等操作均上鏈存證,實(shí)現(xiàn)操作記錄數(shù)據(jù)可追溯和可審計(jì)。此外,核心業(yè)務(wù)流程實(shí)現(xiàn)密文傳輸、密文計(jì)算、密文存儲(chǔ),保證數(shù)據(jù)安全。
反欺詐標(biāo)簽補(bǔ)全
銀行業(yè)務(wù)領(lǐng)域反欺詐識(shí)別工作往往需要電信運(yùn)營商、電商等外部機(jī)構(gòu)的標(biāo)簽數(shù)據(jù),以獲得更高的反欺詐識(shí)別率。客戶標(biāo)簽作為重要隱私數(shù)據(jù)不能直接跨域共
享。基于隱私求交技術(shù),數(shù)據(jù)持有方之間可在保護(hù)數(shù)據(jù)隱私的前提下對(duì)客戶數(shù)據(jù)集求交集,完成重疊客戶標(biāo)簽補(bǔ)全。由此,金融機(jī)構(gòu)從其他機(jī)構(gòu)獲得自有客戶更多涉及欺詐行為的標(biāo)簽數(shù)據(jù),以完善客戶畫像。
在反欺詐標(biāo)簽補(bǔ)全場(chǎng)景中,基于區(qū)塊鏈和隱私求交技術(shù),可實(shí)現(xiàn)持有各自數(shù)據(jù)集合的兩方執(zhí)行雙方集合的交集運(yùn)算,并在不泄露用戶隱私前提下得到交集結(jié)果。在銀行業(yè)務(wù)場(chǎng)景下,具體業(yè)務(wù)流程為:機(jī)構(gòu)A發(fā)起聯(lián)合標(biāo)簽補(bǔ)全查詢?nèi)蝿?wù);機(jī)構(gòu)B配置標(biāo)簽補(bǔ)全聯(lián)合查詢?nèi)蝿?wù),并同意開啟反欺詐標(biāo)簽補(bǔ)全任務(wù);雙方共同啟動(dòng)隱私計(jì)算任務(wù),任務(wù)完成后,反饋隱私查詢計(jì)算結(jié)果。在整個(gè)過程中,任務(wù)查詢、計(jì)算數(shù)據(jù)、授權(quán)行為記錄等數(shù)據(jù)操作均存證于區(qū)塊鏈,便于追溯和監(jiān)管審計(jì)。
聯(lián)合風(fēng)控建模
風(fēng)控模型是金融機(jī)構(gòu)風(fēng)險(xiǎn)管理的核心,風(fēng)控模型的構(gòu)建需要利用客戶多維數(shù)據(jù)實(shí)現(xiàn)。一般而言,數(shù)據(jù)樣本越多,特征維度越豐富,風(fēng)控模型效果就越好。銀行本地?fù)碛械目蛻籼卣骶S度往往有限,難以滿足精準(zhǔn)建模需求。特別是銀行對(duì)公業(yè)務(wù)領(lǐng)域,針對(duì)樣本量少、樣本不平衡等問題,可與外部機(jī)構(gòu)開展數(shù)據(jù)合作,基于區(qū)塊鏈和同態(tài)加密、秘密共享、差分隱私、聯(lián)邦學(xué)習(xí)等隱私計(jì)算技術(shù),在不泄露數(shù)據(jù)信息的前提下完成聯(lián)合建模,構(gòu)建更精準(zhǔn)高效的風(fēng)控模型。
聯(lián)邦學(xué)習(xí)是在各參與方無需共享數(shù)據(jù)資源,即數(shù)據(jù)不出本地的情況下,進(jìn)行數(shù)據(jù)建模聯(lián)合訓(xùn)練,建立共享的機(jī)器學(xué)習(xí)模型。根據(jù)參與方數(shù)據(jù)的特征和樣本空間的不同,聯(lián)邦學(xué)習(xí)可分為橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)和聯(lián)邦遷移學(xué)習(xí)。橫向聯(lián)邦學(xué)習(xí)適用于用戶特征重疊多、用戶樣本重疊少的情況;縱向聯(lián)邦學(xué)習(xí)適用于用戶樣本重疊多、用戶特征重疊少的情況;聯(lián)邦遷移學(xué)習(xí)適用于用戶特征和用戶樣本都重疊少的情況。聯(lián)邦學(xué)習(xí)一般包括加密樣本對(duì)齊、加密模型訓(xùn)練和效果激勵(lì)三個(gè)部分,目前業(yè)界主流的聯(lián)邦學(xué)習(xí)框架有TensorFlow Federated、Pysyft、FATE、FedML等。
基于區(qū)塊鏈與聯(lián)邦學(xué)習(xí)技術(shù)開展聯(lián)合風(fēng)控建模,利用區(qū)塊鏈?zhǔn)跈?quán)機(jī)制、身份管理等,建立安全可信合作,可提高聯(lián)合風(fēng)控建模可信度。在銀行業(yè)務(wù)場(chǎng)景下,具體業(yè)務(wù)流程為:聯(lián)盟鏈驗(yàn)證各參與方身份,啟動(dòng)聯(lián)合風(fēng)控建模任務(wù);模型參數(shù)初始化,各參與節(jié)點(diǎn)使用各自持有的數(shù)據(jù)在本地訓(xùn)練模型,模型參數(shù)更新;模型訓(xùn)練結(jié)果上鏈,并通過協(xié)同計(jì)算中間件匯聚各參與節(jié)點(diǎn)的訓(xùn)練結(jié)果,用于更新模型參數(shù),并開始下一輪迭代訓(xùn)練,直到模型訓(xùn)練結(jié)束。在上述過程中,對(duì)各參與方進(jìn)行貢獻(xiàn)評(píng)估,通過積分發(fā)放等方式實(shí)行利益分配及激勵(lì)機(jī)制,以鼓勵(lì)各方積極參與。在整個(gè)聯(lián)合建模流程中,任務(wù)發(fā)起、重要梯度等中間參數(shù)交互(可進(jìn)一步采用同態(tài)加密進(jìn)行參數(shù)保護(hù))、運(yùn)行結(jié)果等數(shù)據(jù)均進(jìn)行上鏈存證,便于后期追溯審計(jì)。
結(jié)語
銀行業(yè)務(wù)領(lǐng)域,通過區(qū)塊鏈與隱私計(jì)算技術(shù)在身份認(rèn)證、數(shù)據(jù)全生命周期保護(hù)、高效協(xié)作和協(xié)同計(jì)算等方面優(yōu)勢(shì)互補(bǔ)和融合應(yīng)用,有助于在隱私與數(shù)據(jù)保護(hù)的前提下,開展跨域數(shù)據(jù)合作,支撐產(chǎn)業(yè)多方數(shù)據(jù)安全融合、協(xié)同計(jì)算和數(shù)據(jù)價(jià)值挖掘,推動(dòng)銀行業(yè)務(wù)發(fā)展。未來,隨著區(qū)塊鏈和隱私計(jì)算技術(shù)持續(xù)更新迭代,在架構(gòu)和協(xié)議層面實(shí)現(xiàn)區(qū)塊鏈與隱私計(jì)算的深度融合應(yīng)用,將有效提高模型存儲(chǔ)和更新過程中的安全性、隱私性與效率,推動(dòng)可信AI發(fā)展,最終以各方數(shù)據(jù)資產(chǎn)的價(jià)值最大化實(shí)現(xiàn)數(shù)字經(jīng)濟(jì)時(shí)代多方共贏的局面。
(華夏銀行信息科技部賈蒴,龍盈智達(dá)〔北京〕科技有限公司楊璇、張?jiān)?、鄭宏、李廣龍、陽少杰對(duì)本文亦有貢獻(xiàn))
(作者單位:華夏銀行,龍盈智達(dá)〔北京〕科技有限公司)
責(zé)任編輯:孫爽
976639255@qq.com