陳曉靜 楊潤(rùn)昌 洪 璟 上海對(duì)外經(jīng)貿(mào)大學(xué)金融管理學(xué)院
聯(lián)邦學(xué)習(xí)作為隱私計(jì)算的一種,一方面,可以助力保險(xiǎn)行業(yè)實(shí)現(xiàn)精準(zhǔn)營(yíng)銷,細(xì)分客戶需求,提供差異化的保險(xiǎn)產(chǎn)品;另一方面,可以提高保險(xiǎn)行業(yè)對(duì)風(fēng)險(xiǎn)評(píng)分、風(fēng)險(xiǎn)篩查和反保險(xiǎn)欺詐監(jiān)測(cè)的風(fēng)險(xiǎn)管理能力,使更多保險(xiǎn)機(jī)構(gòu)服務(wù)中小微企業(yè),提升服務(wù)實(shí)體經(jīng)濟(jì)的水平。同類保險(xiǎn)公司的保險(xiǎn)產(chǎn)品類似、客戶特征相近,保險(xiǎn)公司可以建立橫向聯(lián)邦學(xué)習(xí)框架,得到更加精確的風(fēng)控及定價(jià)模型。保險(xiǎn)公司與醫(yī)院、通信公司等其他行業(yè)機(jī)構(gòu)開(kāi)展數(shù)據(jù)合作,建立縱向聯(lián)邦學(xué)習(xí)框架,從更多維度對(duì)客戶進(jìn)行畫(huà)像,提高業(yè)務(wù)水平,防范保險(xiǎn)欺詐。我國(guó)保險(xiǎn)業(yè)逐步進(jìn)入高質(zhì)量發(fā)展階段,需要加快轉(zhuǎn)變發(fā)展方式,以更加積極的心態(tài)迎接行業(yè)轉(zhuǎn)型,而聯(lián)邦學(xué)習(xí)則為保險(xiǎn)業(yè)創(chuàng)新發(fā)展提供了一種新思路。
聯(lián)邦學(xué)習(xí)由數(shù)據(jù)源、聯(lián)邦學(xué)習(xí)系統(tǒng)、多方客戶端三大要素構(gòu)成。聯(lián)邦學(xué)習(xí)本質(zhì)上是由各個(gè)參與方在本地將原始數(shù)據(jù)處理之后,進(jìn)行模型更新,再對(duì)各個(gè)參與方的模型進(jìn)行匯總優(yōu)化,最后將得到的優(yōu)化模型反饋給各個(gè)參與方。
根據(jù)參與方數(shù)據(jù)分布情況的不同,聯(lián)邦學(xué)習(xí)可以細(xì)分為橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)與遷移聯(lián)邦學(xué)習(xí)。橫向聯(lián)邦學(xué)習(xí)是指在參與方用戶重疊部分較少、數(shù)據(jù)特征相似性高的情況下,對(duì)數(shù)據(jù)按照橫向(用戶維度)進(jìn)行切分,并取出數(shù)據(jù)特征相似但用戶不同的部分進(jìn)行訓(xùn)練??v向聯(lián)邦學(xué)習(xí)是指在參與方用戶重疊部分較多、數(shù)據(jù)特征相似性低的情況下,對(duì)數(shù)據(jù)按照縱向(數(shù)據(jù)特征維度)進(jìn)行切分,并取出用戶相似但數(shù)據(jù)特征不同的部分進(jìn)行訓(xùn)練。遷移聯(lián)邦學(xué)習(xí)是指在參與方用戶與數(shù)據(jù)特征重疊部分都較少的情況下,采用遷移學(xué)習(xí)代替數(shù)據(jù)切分,以規(guī)避數(shù)據(jù)切分后規(guī)模較小的問(wèn)題。
根據(jù)是否具有中心服務(wù)器,聯(lián)邦學(xué)習(xí)架構(gòu)可以細(xì)分為去中心化聯(lián)邦學(xué)習(xí)架構(gòu)和中心化聯(lián)邦學(xué)習(xí)架構(gòu)。去中心化聯(lián)邦學(xué)習(xí)架構(gòu)不需要中心服務(wù)器,各個(gè)參與方將自有的原始數(shù)據(jù)在本地處理后梯度發(fā)送給下一個(gè)參與方,與其所有的數(shù)據(jù)進(jìn)行迭代。在每一個(gè)參與方都進(jìn)行迭代運(yùn)算更新模型之后,再將最終的模型分發(fā)到各個(gè)參與方,以達(dá)到聯(lián)邦學(xué)習(xí)的目的。
根據(jù)業(yè)務(wù)安全等級(jí)的不同,聯(lián)邦學(xué)習(xí)可以分為高安全等級(jí)業(yè)務(wù)和低安全等級(jí)業(yè)務(wù)。其中,高安全等級(jí)業(yè)務(wù)包括智能風(fēng)控、反保險(xiǎn)欺詐等;低安全等級(jí)業(yè)務(wù)包括智能營(yíng)銷、智能運(yùn)營(yíng)等。
1.智能風(fēng)控
保險(xiǎn)公司進(jìn)行風(fēng)險(xiǎn)控制所面臨的難題主要有以下幾點(diǎn):第一,內(nèi)部數(shù)據(jù)質(zhì)量欠佳。傳統(tǒng)保險(xiǎn)公司收集客戶信息主要通過(guò)保險(xiǎn)營(yíng)銷員進(jìn)行面對(duì)面的溝通驗(yàn)證,獲取的數(shù)據(jù)質(zhì)量參差不齊,部分?jǐn)?shù)據(jù)不能滿足保險(xiǎn)業(yè)或者保險(xiǎn)公司的要求。第二,內(nèi)部信息割裂。保險(xiǎn)公司承保、理賠等各個(gè)環(huán)節(jié)的數(shù)據(jù)信息流動(dòng)不暢,甚至各省市分支機(jī)構(gòu)內(nèi)部數(shù)據(jù)的共享也難以進(jìn)行。第三,與其他保險(xiǎn)公司合作困難,缺少統(tǒng)一可信的信息數(shù)據(jù)共享平臺(tái)。另外,從所需的數(shù)據(jù)類型來(lái)看,保險(xiǎn)公司的風(fēng)控活動(dòng)除了依賴內(nèi)部數(shù)據(jù),同時(shí)需要收集以下數(shù)據(jù):行業(yè)欺詐觀察名單、公共記錄、第三方聚合數(shù)據(jù)、社交媒體數(shù)據(jù)和個(gè)人設(shè)備數(shù)據(jù)。值得注意的是,非結(jié)構(gòu)化數(shù)據(jù)的使用率從2018 年的不到50%飆升至2021年的81%。
聯(lián)邦學(xué)習(xí)實(shí)現(xiàn)了數(shù)據(jù)融合、聯(lián)合建模以及模型發(fā)布等一體化方案,提高了大數(shù)據(jù)風(fēng)控能力,提升了風(fēng)控效果。大量非結(jié)構(gòu)化數(shù)據(jù)需要利用聯(lián)邦學(xué)習(xí)進(jìn)行處理分析,通過(guò)跨行業(yè)、跨公司建立聯(lián)邦學(xué)習(xí)框架,可以充分利用多維度的特征數(shù)據(jù),建立全方位的風(fēng)險(xiǎn)防控體系。以美國(guó)醫(yī)療信息局(MIB)為例,MIB為保險(xiǎn)公司提供投保人在其他機(jī)構(gòu)投保人壽保險(xiǎn)的記錄,以此幫助保險(xiǎn)公司篩查不合理的投保與理賠行為。這種數(shù)據(jù)共享方式與聯(lián)邦學(xué)習(xí)相比,多了一個(gè)數(shù)據(jù)信息的“中間商”,不可避免地會(huì)給保險(xiǎn)公司帶來(lái)綜合治理成本的增加,而聯(lián)邦學(xué)習(xí)直接將多方數(shù)據(jù)所有者聯(lián)結(jié)在一起,在減少數(shù)據(jù)流通環(huán)節(jié)的同時(shí),降低數(shù)據(jù)泄露的可能性。
2.反保險(xiǎn)欺詐
同證券、銀行等金融行業(yè)一樣,作為金融業(yè)三大支柱之一的保險(xiǎn)業(yè)面臨著保險(xiǎn)欺詐風(fēng)險(xiǎn)。在金融欺詐中,保險(xiǎn)領(lǐng)域的欺詐比例尤為突出。國(guó)際保險(xiǎn)監(jiān)督官協(xié)會(huì)測(cè)算,全球每年有20%~30%的保險(xiǎn)理賠案件涉嫌欺詐,損失金額約800億美元。
反保險(xiǎn)欺詐有四個(gè)難點(diǎn):第一,傳統(tǒng)的風(fēng)險(xiǎn)管理體系主要依賴人工,受員工業(yè)務(wù)水平以及職業(yè)道德影響,保險(xiǎn)機(jī)構(gòu)應(yīng)對(duì)反保險(xiǎn)欺詐的手段單一,難以實(shí)時(shí)察覺(jué)違規(guī)行為;第二,保險(xiǎn)機(jī)構(gòu)間缺少信息共享機(jī)制,客戶的投保信息涉及個(gè)人隱私,受法律法規(guī)限制,難以在不同保險(xiǎn)機(jī)構(gòu)間共享;第三,保險(xiǎn)詐騙罪的定罪量刑標(biāo)準(zhǔn)較高,使得犯罪分子有可乘之機(jī);第四,隨著科技進(jìn)步,機(jī)器學(xué)習(xí)、知識(shí)圖譜等技術(shù)得到廣泛應(yīng)用,反保險(xiǎn)欺詐手段日益多樣化。
針對(duì)層出不窮的保險(xiǎn)欺詐現(xiàn)象,保險(xiǎn)公司運(yùn)用多種反保險(xiǎn)欺詐技術(shù)?!斗幢kU(xiǎn)欺詐技術(shù)現(xiàn)狀》研究發(fā)現(xiàn),保險(xiǎn)公司最常用的反保險(xiǎn)欺詐技術(shù)包括:危險(xiǎn)信號(hào)自動(dòng)標(biāo)記、預(yù)測(cè)建模、文本挖掘、報(bào)表制作、案例管理、異常報(bào)告和數(shù)據(jù)可視化/關(guān)聯(lián)分析?;趩我槐kU(xiǎn)公司數(shù)據(jù)構(gòu)建的傳統(tǒng)反欺詐模型難以應(yīng)對(duì)更加復(fù)雜的欺詐手段,而聯(lián)邦學(xué)習(xí)可以打破保險(xiǎn)公司與銀行、醫(yī)療機(jī)構(gòu)等擁有投保人財(cái)務(wù)狀況以及健康信息等行業(yè)間的數(shù)據(jù)孤島現(xiàn)象,通過(guò)分析投保人的金融特征、健康狀況等信息,構(gòu)建反保險(xiǎn)欺詐體系,為保險(xiǎn)業(yè)風(fēng)險(xiǎn)管控提供更全面、完善的保障。
1.智能營(yíng)銷
《2019 年中國(guó)保險(xiǎn)行業(yè)智能風(fēng)控白皮書(shū)》統(tǒng)計(jì)數(shù)據(jù)顯示,保險(xiǎn)公司一年中與客戶的接觸次數(shù)僅為1—2次,長(zhǎng)期型保單如人身險(xiǎn)只有在需要理賠或到期時(shí),保險(xiǎn)公司才會(huì)與客戶聯(lián)系,而車險(xiǎn)等短期險(xiǎn)如果沒(méi)有保險(xiǎn)事故發(fā)生,則一般不與客戶接觸。傳統(tǒng)的保險(xiǎn)銷售工作由于與客戶接觸過(guò)少、了解不深,難以挖掘客戶的潛在需求,而過(guò)度營(yíng)銷往往會(huì)催生客戶的反感厭惡。聯(lián)邦學(xué)習(xí)通過(guò)多維度客戶畫(huà)像,對(duì)不同客戶的需求進(jìn)行細(xì)分。一方面,聯(lián)邦學(xué)習(xí)能夠快速捕捉生產(chǎn)生活中的風(fēng)險(xiǎn)因子并進(jìn)行定價(jià)分析,為保險(xiǎn)公司創(chuàng)新產(chǎn)品提供便利,在市場(chǎng)競(jìng)爭(zhēng)中占得先機(jī),同時(shí)能夠根據(jù)場(chǎng)景靈活定制保險(xiǎn)產(chǎn)品,識(shí)別客戶的潛在風(fēng)險(xiǎn),提供差異化的精準(zhǔn)定價(jià),提升銷售成功率,降低退保率;另一方面,聯(lián)邦學(xué)習(xí)通過(guò)持續(xù)收集客戶反饋信息,不斷提高模型精確度,實(shí)現(xiàn)模型迭代升級(jí),并隨著市場(chǎng)的發(fā)展而不斷完善。
2.智能運(yùn)營(yíng)
通過(guò)聯(lián)邦學(xué)習(xí),保險(xiǎn)公司可以實(shí)現(xiàn)對(duì)客戶的全維度用戶畫(huà)像,充分了解客戶日常生活所需,通過(guò)對(duì)客戶的特征標(biāo)簽進(jìn)行分類管理,節(jié)省運(yùn)營(yíng)管理成本;同時(shí),方便保險(xiǎn)營(yíng)銷員與特定客戶定期溝通聯(lián)系,建立良好的客戶關(guān)系,為保險(xiǎn)公司創(chuàng)造更多的價(jià)值和利潤(rùn)。智能運(yùn)營(yíng)將保險(xiǎn)從產(chǎn)品升級(jí)到服務(wù),實(shí)現(xiàn)以單個(gè)保險(xiǎn)產(chǎn)品的銷售激發(fā)出潛在的多險(xiǎn)種購(gòu)買需求,并且以聯(lián)邦學(xué)習(xí)為基礎(chǔ)構(gòu)建的人工智能能夠?qū)崿F(xiàn)24小時(shí)在線服務(wù),更快地響應(yīng)客戶需求,降低人力成本。
雖然發(fā)明聯(lián)邦學(xué)習(xí)的初衷是為了解決數(shù)據(jù)安全問(wèn)題,但時(shí)至今日,聯(lián)邦學(xué)習(xí)仍然要面對(duì)多種攻擊帶來(lái)的安全風(fēng)險(xiǎn),主要有四種攻擊:第一,投毒攻擊。投毒攻擊分為數(shù)據(jù)投毒攻擊和模型投毒攻擊。顧名思義,數(shù)據(jù)投毒攻擊,是指在參與方的本地?cái)?shù)據(jù)中加入錯(cuò)誤、有偏差的數(shù)據(jù),降低參與方模型的精確度,從而影響中心服務(wù)器模型的計(jì)算結(jié)果。模型投毒攻擊,是指通過(guò)向中心服務(wù)器發(fā)送參數(shù)錯(cuò)誤的模型數(shù)據(jù),影響中心服務(wù)器的模型運(yùn)算。第二,后門(mén)攻擊,即通過(guò)注入對(duì)抗性觸發(fā)器來(lái)操縱訓(xùn)練數(shù)據(jù)的子集,使得在被竄改數(shù)據(jù)集上訓(xùn)練的模型在嵌入相同觸發(fā)器的測(cè)試集上出現(xiàn)錯(cuò)誤預(yù)測(cè),目的是使模型在特定樣本上預(yù)測(cè)出錯(cuò),而不改變其在其他樣本上的預(yù)測(cè)結(jié)果(邱曉慧等,2022)。第三,搭便車攻擊,即不進(jìn)行本地?cái)?shù)據(jù)處理,而是通過(guò)構(gòu)建虛假參數(shù)發(fā)送至中心服務(wù)器,以此獲得由中心服務(wù)器生成的最終模型數(shù)據(jù)。這種攻擊方式具體又分為普通搭便車與偽裝搭便車,后者更加隱蔽,危害更大。第四,女巫攻擊,即通過(guò)偽造多個(gè)惡意節(jié)點(diǎn),影響中心服務(wù)器的模型運(yùn)算,導(dǎo)致最終模型喪失精確性。相較于搭便車攻擊,女巫攻擊的危害更大。
目前,聯(lián)邦學(xué)習(xí)的標(biāo)準(zhǔn)主要有國(guó)際、國(guó)內(nèi)兩大類。《聯(lián)邦學(xué)習(xí)技術(shù)金融應(yīng)用白皮書(shū)》顯示,國(guó)際標(biāo)準(zhǔn)以IEEE 發(fā)布的《聯(lián)邦學(xué)習(xí)基礎(chǔ)架構(gòu)與應(yīng)用指南》(IEEE/P3652.1-2020:IEEE Guide for Architectural Framework and Application of Federated Machine Learning)為主。而國(guó)內(nèi)標(biāo)準(zhǔn)則分為三個(gè)團(tuán)體標(biāo)準(zhǔn),第一個(gè)是中國(guó)信息通信研究院發(fā)布的《基于聯(lián)邦學(xué)習(xí)的數(shù)據(jù)流通產(chǎn)品技術(shù)要求與測(cè)試方法》(BDC 41-2020);第二個(gè)是中國(guó)人工智能開(kāi)源軟件發(fā)展聯(lián)盟發(fā)布的《信息技術(shù)服務(wù)聯(lián)邦學(xué)習(xí)參考架構(gòu)》(AIOSS-03-2019);第三個(gè)是中關(guān)村金融科技產(chǎn)業(yè)發(fā)展聯(lián)盟發(fā)布的《聯(lián)邦學(xué)習(xí)金融行業(yè)應(yīng)用指南》(T/ZFIDA0004-2020)。目前,我國(guó)尚未形成全國(guó)統(tǒng)一的聯(lián)邦學(xué)習(xí)技術(shù)標(biāo)準(zhǔn)體系。由于多方參與以及利用多種隱私信息計(jì)算的特性,不同的聯(lián)邦學(xué)習(xí)技術(shù)標(biāo)準(zhǔn)體系將會(huì)對(duì)數(shù)據(jù)安全性、模型精確性等方面產(chǎn)生影響。因此,亟待有關(guān)政府部門(mén)或行業(yè)協(xié)會(huì)聯(lián)合行業(yè)內(nèi)的金融科技企業(yè)統(tǒng)一制訂聯(lián)邦學(xué)習(xí)技術(shù)標(biāo)準(zhǔn)。
一方面,不同體量保險(xiǎn)公司的客戶數(shù)量差異巨大,頭部保險(xiǎn)公司更容易占據(jù)優(yōu)質(zhì)的客戶資源,規(guī)模效應(yīng)帶來(lái)的低成本使得頭部保險(xiǎn)公司在個(gè)性化產(chǎn)品定價(jià)與建立精確的風(fēng)控模型中處于有利地位;另一方面,中小型保險(xiǎn)公司獲取信息的渠道有限,所獲取的數(shù)據(jù)量也難以滿足風(fēng)險(xiǎn)建模需要。聯(lián)邦學(xué)習(xí)僅提供了數(shù)據(jù)隱私處理的方法,無(wú)法解決激勵(lì)效應(yīng)不足導(dǎo)致參與方不愿意投入資源建設(shè)相關(guān)平臺(tái)的現(xiàn)狀。正如《聯(lián)邦學(xué)習(xí)技術(shù)金融應(yīng)用白皮書(shū)》所述:“建立聯(lián)邦學(xué)習(xí)激勵(lì)機(jī)制的難點(diǎn)在于,一是如何盡量公平地評(píng)估每個(gè)參與方的貢獻(xiàn)量;二是如何吸引更多的機(jī)構(gòu)參與聯(lián)邦學(xué)習(xí)貢獻(xiàn)其數(shù)據(jù)與計(jì)算資源,并形成正向激勵(lì);三是如何對(duì)惡意的參與方進(jìn)行識(shí)別和懲罰,量化貢獻(xiàn)價(jià)值并對(duì)聯(lián)邦學(xué)習(xí)系統(tǒng)的最終模型性能進(jìn)行建模?!?/p>
聯(lián)邦學(xué)習(xí)需要參與方進(jìn)行數(shù)據(jù)分析處理后上傳平臺(tái),因此,每一個(gè)參與方的數(shù)據(jù)處理能力應(yīng)當(dāng)盡量相當(dāng),否則會(huì)出現(xiàn)因數(shù)據(jù)處理速度不同,導(dǎo)致其他參與方在模型迭代過(guò)程中需要等待較長(zhǎng)時(shí)間,最終影響模型建設(shè)的效率,增加各個(gè)參與方的運(yùn)營(yíng)成本。《反保險(xiǎn)欺詐技術(shù)現(xiàn)狀》調(diào)查顯示,有68%的受訪者表示,有限的IT 資源是反保險(xiǎn)欺詐最大的挑戰(zhàn)。技術(shù)能力以及資源的不足導(dǎo)致中小型保險(xiǎn)公司很難有效地參與聯(lián)邦學(xué)習(xí)框架。
激勵(lì)機(jī)制的設(shè)定主要從兩個(gè)方面考慮,即正向激勵(lì)機(jī)制與反向激勵(lì)機(jī)制。正向激勵(lì)機(jī)制鼓勵(lì)參與方盡可能整合數(shù)據(jù)資源以及提高數(shù)據(jù)質(zhì)量,而反向激勵(lì)機(jī)制則是對(duì)貢獻(xiàn)數(shù)據(jù)量較少以及數(shù)據(jù)質(zhì)量不高的參與方采取懲罰措施。第一,激勵(lì)機(jī)制的設(shè)定可以從數(shù)據(jù)的數(shù)量及質(zhì)量入手,比如數(shù)據(jù)貢獻(xiàn)量較大的參與方可以向數(shù)據(jù)貢獻(xiàn)量較少的參與方收取一定的費(fèi)用,從而提高行業(yè)內(nèi)頭部保險(xiǎn)公司數(shù)據(jù)共享的積極性。第二,以政府為核心建立信息數(shù)據(jù)共享中心,這樣既能夠保證數(shù)據(jù)的高質(zhì)量,又可以確保本地?cái)?shù)據(jù)的安全性,同時(shí)還可以為金融監(jiān)管提供便利。
各機(jī)構(gòu)的聯(lián)邦學(xué)習(xí)平臺(tái)一般都是基于自有知識(shí)產(chǎn)權(quán)的算法,引入更多的參與方需要對(duì)平臺(tái)進(jìn)行適配性調(diào)整。為了使數(shù)據(jù)流通管理更加便捷高效,業(yè)內(nèi)應(yīng)建立統(tǒng)一的標(biāo)準(zhǔn)數(shù)據(jù)庫(kù),采用相同的技術(shù)協(xié)議,如此既可以減少平臺(tái)維護(hù)成本,避免資源浪費(fèi),又可以使數(shù)據(jù)共享流程易于操作。同時(shí),構(gòu)建數(shù)據(jù)共享平臺(tái)有利于數(shù)據(jù)確權(quán),保護(hù)數(shù)據(jù)所有者的合法權(quán)益,避免數(shù)據(jù)被濫用,也便于被監(jiān)管。
雖然聯(lián)邦學(xué)習(xí)可以保證極高的隱私安全性,但通過(guò)模型反演,仍然可以使數(shù)據(jù)重現(xiàn)。因此,聯(lián)邦學(xué)習(xí)需要其他輔助技術(shù)諸如可信執(zhí)行環(huán)境、同態(tài)加密、安全多方計(jì)算等技術(shù)的支持,才能做到既保護(hù)隱私數(shù)據(jù)安全,又能高效地獲得可靠的結(jié)果。以保險(xiǎn)公司查詢投保人疾病史為例,在該場(chǎng)景下,保險(xiǎn)公司和醫(yī)療機(jī)構(gòu)建立縱向聯(lián)邦學(xué)習(xí)框架,保險(xiǎn)公司需要向相關(guān)醫(yī)療機(jī)構(gòu)提供查詢條件,醫(yī)療機(jī)構(gòu)根據(jù)查詢條件進(jìn)行查詢并反饋結(jié)果。借助隱私保護(hù)計(jì)算的PSI(隱私集合求交)能夠?qū)崿F(xiàn)數(shù)據(jù)庫(kù)數(shù)據(jù)及查詢條件的“雙盲”,保護(hù)數(shù)據(jù)和個(gè)人隱私的安全。再者,以智能風(fēng)控為例,所需數(shù)據(jù)上傳前要經(jīng)過(guò)加密以及脫敏程序,授權(quán)使用的數(shù)據(jù)需要在區(qū)塊鏈存證,既要對(duì)上鏈前的數(shù)據(jù)來(lái)源、生成機(jī)制、存儲(chǔ)過(guò)程進(jìn)行真實(shí)性交叉驗(yàn)證,又要做到上鏈后的數(shù)據(jù)使用可記錄、過(guò)程可審計(jì)、不可篡改等。