許多人工智能專家常說AI最適合應(yīng)用于金融行業(yè)。因?yàn)榻鹑谑菤v史記錄數(shù)據(jù)最豐富且準(zhǔn)確的領(lǐng)域之一,甚至斷言金融行業(yè)將被AI取代。但有個(gè)極大的問題是,人工智能無法解釋自己的行為,這使得強(qiáng)監(jiān)管的金融行業(yè)很難大規(guī)模采用AI。
當(dāng)銀行考慮采用人工智能時(shí),這個(gè)所謂的“黑盒子”問題就會(huì)反復(fù)出現(xiàn),無論是信用評(píng)分,貸款還是其它類型業(yè)務(wù)。一位長期從事金融風(fēng)控領(lǐng)域的業(yè)內(nèi)高管直言,傳統(tǒng)銀行普遍都希望利用社交網(wǎng)站來進(jìn)行營銷,但如果銀行不能明確掌握所有客戶屬性數(shù)據(jù),就很容易被合規(guī)部門擋下。
這類限制使得銀行在AI導(dǎo)入的實(shí)際業(yè)務(wù)上,存在著理想與現(xiàn)實(shí)的巨大落差。根據(jù)“麻省理工斯隆管理評(píng)論”(MTT Sloan ManagementReview)與“波士頓顧問集團(tuán)”(The BostonConsulting Group)于2017年所做研究”RESHAPING BUSINESS WITH ARTIFICIALINTELLIGENCE”,調(diào)查人工智能在各行業(yè)的被采納程度。結(jié)果金融服務(wù)業(yè)評(píng)估目前AI對(duì)其產(chǎn)品服務(wù)、工作流程的影響程度僅約10%,
甚至許多情況下,銀行即便導(dǎo)入AI,效果也不如想象神奇。例如金融機(jī)構(gòu)導(dǎo)入傳統(tǒng)規(guī)則引擎系統(tǒng)來進(jìn)行檢核其實(shí)已行之有年,但缺點(diǎn)是真實(shí)金融場景的維度太多,人工定義的規(guī)則引擎無法做到很精準(zhǔn)判別。為了寧枉勿縱,系統(tǒng)就存在大量誤報(bào)。因此即使采用規(guī)則引擎,對(duì)人工審核的要求仍然非常巨大。
“國際上各大金融機(jī)構(gòu)對(duì)反洗錢都是投入大量的人力,人工審核部門都非常巨大。”一位業(yè)內(nèi)人士表示,這除了使成本居高不下之外,更大的風(fēng)險(xiǎn)是繁復(fù)檢核容易使客戶不滿、甚至失去客戶。業(yè)者解釋,洗錢行為必須經(jīng)過司法部門調(diào)查才能確立罪責(zé),所以要求要很強(qiáng)的解釋性。如果A1只能指出某個(gè)帳號(hào)可疑,卻無法自我解釋原因時(shí),調(diào)查人員就無法據(jù)以展開進(jìn)一步調(diào)查。
而機(jī)器學(xué)習(xí)中的一個(gè)晚近分支——無監(jiān)督式學(xué)習(xí)(UML),正是一種能夠自我解釋的AI。
無監(jiān)督式學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種方式,訓(xùn)練時(shí)不需要人力給予標(biāo)簽,僅須對(duì)機(jī)器提供數(shù)據(jù)輸入。因?yàn)闆]有預(yù)設(shè)標(biāo)簽,無監(jiān)督式學(xué)習(xí)機(jī)器不會(huì)知道其分類結(jié)果是否正確,但優(yōu)點(diǎn)在于它會(huì)自動(dòng)從數(shù)據(jù)中找出潛在的規(guī)則,因此其結(jié)果具有較強(qiáng)的可解釋性。臉書人工智能負(fù)責(zé)人、也是AI領(lǐng)域最有影響力的專家之一的Yann LeCun,就多次提倡無監(jiān)督式學(xué)習(xí)是AI技術(shù)的未來。
有監(jiān)督機(jī)器學(xué)習(xí)模型通常單獨(dú)查看每個(gè)賬戶,類似于每次看這幅畫中的一個(gè)點(diǎn)。無監(jiān)督機(jī)器學(xué)習(xí)可分析賬戶間的關(guān)聯(lián)性,即便個(gè)體賬戶無任何可疑表象,也能從數(shù)據(jù)中檢測到可疑模型。這種方式類似于我們能看到并理解畫中的整體圖案而不是每一點(diǎn),即便每個(gè)點(diǎn)的顏色和形狀都不盡相同
DataVisor聯(lián)合創(chuàng)始人兼CEO謝映蓮(左)、DataVisor CTO俞舫(右)
無監(jiān)督式學(xué)習(xí)雖已在學(xué)研界是一大主流方向,但在產(chǎn)業(yè)界大規(guī)模成功應(yīng)用的例子還并不多,用于金融領(lǐng)域的更是少之又少。但一家由兩名華人女性共同在美國硅谷創(chuàng)辦的人工智能新創(chuàng)公司DataVisor,卻是最領(lǐng)先將無監(jiān)督式學(xué)習(xí)應(yīng)用在金融領(lǐng)域的公司之一。
DataVisor以“無監(jiān)督機(jī)器學(xué)習(xí)”(UML)引擎為核心,結(jié)合傳統(tǒng)自動(dòng)規(guī)則引擎和全球數(shù)據(jù)庫,致力于解決金融領(lǐng)域的在線欺詐和金融犯罪檢測難題,可對(duì)每小時(shí)新發(fā)生的10億數(shù)量級(jí)的事件進(jìn)行分析,自動(dòng)判斷并發(fā)現(xiàn)潛在的惡意攻擊,至今在全球范圍內(nèi)已處理超6000億用戶事件和1.4億壞用戶,保護(hù)全球40億互聯(lián)網(wǎng)用戶,最近并入選《華爾街日?qǐng)?bào)》最新發(fā)布的“2018最值得關(guān)注科技公司Top25”榜單。
DT君獨(dú)家專訪DataVisor,剖析無監(jiān)督機(jī)器學(xué)習(xí)在金融領(lǐng)域的應(yīng)用優(yōu)勢。聯(lián)合創(chuàng)始人兼CEO謝映蓮說明,金融行業(yè)數(shù)據(jù)豐富,但數(shù)字化并不完善,這是對(duì)所有機(jī)器學(xué)習(xí)模式的一個(gè)普遍存在的挑戰(zhàn)。而無監(jiān)督式學(xué)習(xí)的好處在于對(duì)數(shù)據(jù)缺失的容忍力較高,并不依賴數(shù)據(jù)的完整性。
“無監(jiān)督機(jī)器學(xué)習(xí)的優(yōu)勢是可以將海量數(shù)據(jù)在沒有標(biāo)簽的情況下進(jìn)行檢測,且產(chǎn)出的結(jié)果具有很強(qiáng)的可解釋性?!敝x映蓮進(jìn)一步說明,無監(jiān)督式學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,相較于監(jiān)督式學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等其它分支,無監(jiān)督學(xué)習(xí)并不需要人力來輸入標(biāo)簽,而是主動(dòng)實(shí)時(shí)找尋新的模式,進(jìn)行新的學(xué)習(xí)。
為何無監(jiān)督式學(xué)習(xí)有助于解決人工智能在金融行業(yè)應(yīng)用的痛點(diǎn)呢?
“這跟金融行業(yè)自身的發(fā)展改變有關(guān)”,DataVisor聯(lián)合創(chuàng)始人兼CTO俞舫解釋,“過去金融工具比較單純,欺詐形式與危害程度都比較有限。但現(xiàn)在網(wǎng)路交易愈來愈頻繁,犯罪形式也日新月異,等到有標(biāo)簽后再做機(jī)器學(xué)習(xí)很多時(shí)候已經(jīng)晚了,在反應(yīng)新型攻擊上是非常滯后的?!?/p>
而無監(jiān)督學(xué)習(xí)可以使海量數(shù)據(jù)在沒有標(biāo)簽的情況下進(jìn)行檢測,把群組性的異常找出來,且產(chǎn)出的結(jié)果具有很強(qiáng)的可解釋性,甚至能在攻擊未發(fā)生前就防患于未然。以國內(nèi)猖獗的網(wǎng)絡(luò)黑產(chǎn)主導(dǎo)的數(shù)字金融欺詐為例,DataVisor中國區(qū)總經(jīng)理吳中說明,金融欺詐如要惡意轉(zhuǎn)帳,通常會(huì)有個(gè)過程。首先攻擊者需要?jiǎng)?chuàng)建大量惡意帳號(hào),接著需要“養(yǎng)號(hào)”,也就是為帳號(hào)制造一些貌似正常的紀(jì)錄,接下來才能用這些帳號(hào)進(jìn)行欺詐。而傳統(tǒng)規(guī)則引擎、或有標(biāo)簽的監(jiān)督式學(xué)習(xí),比較難檢測出養(yǎng)號(hào)早期、貌似正常的惡意帳號(hào)。無監(jiān)督式學(xué)習(xí)則是會(huì)主動(dòng)把群組性的異常找出來,提供人員進(jìn)行預(yù)判。
吳中觀察,正因國內(nèi)黑產(chǎn)盛行,可以看到金融機(jī)構(gòu)將對(duì)人工智能產(chǎn)生更多的需求,會(huì)更有意識(shí)地去探索。在數(shù)據(jù)飛速增長的情況下,國內(nèi)金融機(jī)構(gòu)勢必將進(jìn)入升級(jí)換代的過程。盡管目前仍有其限制,但整個(gè)行業(yè)已在加速奔向由人工智能驅(qū)動(dòng)的未來。沒人能夠真正準(zhǔn)確預(yù)測人工智能下一個(gè)突破將何時(shí)出現(xiàn),但更有意識(shí)地探索,將是保持領(lǐng)先的關(guān)鍵。(摘自美《深科技》)(編輯/華生)