国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

金融知識圖譜技術(shù)在銀行業(yè)的應(yīng)用探索

2019-09-10 07:22沈棟王巧燕陳波
新金融世界 2019年12期
關(guān)鍵詞:圖譜框架節(jié)點

沈棟 王巧燕 陳波

隨著人們對掌握事物全貌和關(guān)聯(lián)性分析需求的日漸增長,知識圖譜在學(xué)術(shù)界與工業(yè)界掀起了一股研究與應(yīng)用的熱潮。

知識圖譜是一個基于圖模型實現(xiàn)多源異構(gòu)和互聯(lián)數(shù)據(jù)建模與應(yīng)用的整體解決方案。遵循萬物互聯(lián)的理念,通過用頂點表示實體、邊表示關(guān)系,以符合人類認(rèn)知的方式對現(xiàn)實世界進(jìn)行概念建模,將人類世界爆發(fā)式增長的海量多源異構(gòu)數(shù)據(jù)沉淀為知識,建立了各種知識服務(wù),同時提供了基于圖技術(shù)的高鏈接關(guān)系挖掘和關(guān)聯(lián)性知識推理。

知識圖譜基本概念

知識圖譜。知識圖譜(KG,Knowledge Graph)是指用于提升搜索引擎性能的一個多源知識庫。相比于傳統(tǒng)知識庫,KG強(qiáng)調(diào)使用圖模型中的節(jié)點和邊來分別描述關(guān)聯(lián)知識的概念和關(guān)系,使得知識可以使用圖論、圖計算、圖學(xué)習(xí)等進(jìn)行深度查詢、關(guān)系計算分析和鏈接預(yù)測。

通用知識圖譜與行業(yè)知識圖譜。繼KG概念被提出之后,世界各大互聯(lián)網(wǎng)公司紛紛布局了知識圖譜,主要應(yīng)用于語義搜索、個性化推薦、智能問答和關(guān)系決策等領(lǐng)域。而隨著知識圖譜在行業(yè)應(yīng)用的不斷探索落地,知識圖譜分化出通用知識圖譜和行業(yè)知識圖譜的概念。通用知識圖譜更類似于百科全書,面向全領(lǐng)域,比較著名的有Freebase、Wikidata、Yago、DBPedia等;行業(yè)知識圖譜面向特定領(lǐng)域,如金融、公安、電商等。兩者在構(gòu)建流程和應(yīng)用要點上存在較大差異,通用知識圖譜側(cè)重于圖譜的構(gòu)建技術(shù),是從海量非結(jié)構(gòu)化數(shù)據(jù)中進(jìn)行實體與關(guān)系的抽取、融合;行業(yè)知識圖譜則側(cè)重于圖譜的應(yīng)用場景,是在知識圖譜之上應(yīng)用知識計算與推理技術(shù),進(jìn)行業(yè)務(wù)場景的落地。

金融知識圖譜核心技術(shù)內(nèi)容。作為行業(yè)知識圖譜,金融知識圖譜的核心技術(shù)在于圖引擎,圖引擎包含了圖存儲、圖計算、圖算法和圖可視化四個核心層級。圖存儲層實現(xiàn)了將數(shù)據(jù)以圖結(jié)構(gòu)存儲于以圖模型指導(dǎo)設(shè)計的圖數(shù)據(jù)庫載體中,同時提供圖數(shù)據(jù)的增刪改查操作的能力,根據(jù)存儲方式不同,圖數(shù)據(jù)庫又可以劃分為原生圖和非原生圖;圖計算層將復(fù)雜而專業(yè)的圖的迭代式計算過程進(jìn)行抽象并封裝成接口暴露給外部,使得圖的計算變得簡單易用;圖應(yīng)用建模層承載了場景建模所需的基礎(chǔ)圖算法和在其基礎(chǔ)上構(gòu)建的自定義模型;圖可視化層封裝了圖高效渲染和友好交互的技術(shù)框架。

知識圖譜存儲技術(shù)

知識圖譜面向海量的圖結(jié)構(gòu)數(shù)據(jù),需要依賴于圖數(shù)據(jù)庫進(jìn)行數(shù)據(jù)存儲,圖數(shù)據(jù)庫基于圖模型進(jìn)行指導(dǎo)設(shè)計,根據(jù)存儲方式的不同又可分為原生圖(native)和非原生圖(no-native)。相比于傳統(tǒng)關(guān)系型數(shù)據(jù)庫,圖數(shù)據(jù)庫一是具有靈活的schema,支持多源異構(gòu)的數(shù)據(jù)入圖;二是具有優(yōu)異的關(guān)聯(lián)分析性能,能夠支撐知識圖譜高效深度關(guān)系挖掘和模型分析的需求。

1.圖模型

圖模型是基于圖結(jié)構(gòu)設(shè)計的概念模型,主要有資源描述框架(RDFs,Resource Description Frameworks)和屬性圖(LPGs,Labeled Property Graphs)兩種模型。RDFs是W3C制定的用于描述實體/資源的標(biāo)準(zhǔn)數(shù)據(jù)模型,由節(jié)點和弧組成,適用于離線分析,主要應(yīng)用于語義網(wǎng)、文本處理與分析以及學(xué)術(shù)研究領(lǐng)域;屬性圖是為了解決互聯(lián)數(shù)據(jù)的高效查詢、使用和存儲問題而被定義的數(shù)據(jù)模型,由頂點、邊(Edge)、標(biāo)簽、關(guān)系類型以及屬性組成,適用于在線查詢,相比于RDFs,屬性圖因為使用屬性折疊了大部分邊而獲得了較高的查詢性能,主要應(yīng)用于工業(yè)實踐。目前主流的開源圖存儲多基于屬性圖模型,包括Neo4j(企業(yè)版于2018年11月已閉源)、TigerGragph、OrientDB、ArangoDB、Azure Cosmos DB等。

2.圖存儲方式

圖存儲方式是影響圖數(shù)據(jù)處理效率的關(guān)鍵因素之一,根據(jù)存儲設(shè)計是否為圖數(shù)據(jù)進(jìn)行特定優(yōu)化,圖存儲被劃分為原生圖和非原生圖。原生圖的優(yōu)化設(shè)計實現(xiàn)了無鄰接索引(index-free adjacency),極大地提高了遍歷和更新性能,其優(yōu)化主要包含了三點:1)節(jié)點和關(guān)系以固定長度進(jìn)行存儲;2)每個節(jié)點域包含了指向關(guān)系和屬性列表第一個元素的ID信息,實現(xiàn)了節(jié)點記錄的輕量級存儲;3)每個關(guān)系域包含了指向關(guān)系起點和終點的節(jié)點ID。主流開源圖存儲使用原生圖設(shè)計的相對較少,有Neo4j、TigerGraph等。非原生圖的存儲多依賴于已有的第三方存儲系統(tǒng)和索引系統(tǒng),如JanusGraph使用Hadoop進(jìn)行圖處理分析,支持?jǐn)U展Apache Cassandra、Apache HBase、Google Cloud BigTable等存儲系統(tǒng),和Elasticsearch、Apache Solr等索引系統(tǒng)。

3.圖數(shù)據(jù)庫

圖數(shù)據(jù)庫是基于圖模型實現(xiàn)數(shù)據(jù)創(chuàng)建、讀取、更新和刪除(CRUD)的實時數(shù)據(jù)庫管理系統(tǒng)。根據(jù)數(shù)據(jù)量級、存儲形式、處理和遍歷性能進(jìn)行劃分,圖數(shù)據(jù)庫分為內(nèi)存圖、磁盤圖、分布式圖三種類型,處理性能依次遞減,所能承載的數(shù)據(jù)量依次遞增。開源的圖數(shù)據(jù)庫中,內(nèi)存圖如NetworkX、 iGraph,磁盤圖如Neo4j、 OrientDB,分布式圖如TigerGraph、JanusGraph和百度HugeGraph等。此外,國內(nèi)各大互聯(lián)網(wǎng)公司也提供了非開源的分布式圖數(shù)據(jù)庫,如騰訊星圖、螞蟻金服Geabase等。國內(nèi)主流知識圖譜廠商在圖數(shù)據(jù)庫上的選型不一,海致知識圖譜平臺和企業(yè)知識圖譜采用ArangoDB,邦盛關(guān)聯(lián)圖譜的圖存儲組件正在從Neo4j向JanusGraph遷移,明略的Scopa產(chǎn)品采用JanusGraph,騰訊的知識圖譜解決方案則使用了自研的分布式磁盤圖—星圖。同時,一是由于圖數(shù)據(jù)庫產(chǎn)品的百花齊放、各有千秋,二是由于行業(yè)內(nèi)已經(jīng)沉淀了一部分開源圖數(shù)據(jù)庫的技術(shù)棧,客戶對廠商的圖數(shù)據(jù)庫有特定的要求,三是圖數(shù)據(jù)庫領(lǐng)域也在探索圖存儲設(shè)計的標(biāo)準(zhǔn)化,如封裝了基本圖操作和計算接口的開源框架TinkerPop,迫使各廠商逐漸開展了圖數(shù)據(jù)庫無關(guān)性的架構(gòu)解耦工作。

金融知識圖譜計算框架

金融知識圖譜的計算主要是基于圖的計算,業(yè)內(nèi)將圖的一系列操作進(jìn)行了封裝,形成了統(tǒng)一的圖計算框架,通過接口抽象的方式,不僅使得高門檻的圖技術(shù)變得易用,還實現(xiàn)了圖存儲、圖計算和圖應(yīng)用模塊的高內(nèi)聚、低耦合設(shè)計。根據(jù)適用場景進(jìn)行劃分,圖計算框架分為兩種,一種是提供圖增刪改查操作、面向少量圖數(shù)據(jù)離線分析的基本圖計算框架,另一種是面向海量、TB級圖數(shù)據(jù)離線分析挖掘的巨型圖處理框架。

1.基本圖計算框架

基本圖計算框架通常由圖數(shù)據(jù)庫進(jìn)行實現(xiàn),實現(xiàn)同一套框架的圖數(shù)據(jù)可以相互替代,目前主流的Apache TinkerPop開源圖計算框架,提供了實時事務(wù)處理(OLAP)和離線數(shù)據(jù)分析(OLTP)的一套標(biāo)準(zhǔn)化抽象接口,以及“一次編寫、到處運行”和協(xié)調(diào)多機(jī)器圖遍歷能力的圖遍歷語言Gremlin。目前實現(xiàn)了TinkerPop接口的主流圖數(shù)據(jù)庫有Titan、OrientDB、Neo4j、JanusGraph等。

2.巨型圖處理框架

巨型圖處理框架多基于分布式圖進(jìn)行設(shè)計,提供TB級數(shù)據(jù)的離線分析能力,而且相較于傳統(tǒng)的大數(shù)據(jù)框架設(shè)計,其綜合考慮了基于圖算法的迭代式計算的特殊性、圖數(shù)據(jù)結(jié)構(gòu)的不均衡性等,面對圖計算問題具有更加高效的處理能力。巨型圖處理框架的核心技術(shù)內(nèi)容包含了圖切分模型和圖計算模型,即存儲的分布式和計算的分布式。

圖的切分模型。圖切分是基于最小化通信、圖計算和存儲開銷的權(quán)衡對連通的圖數(shù)據(jù)進(jìn)行分區(qū),是圖分布式處理的基礎(chǔ)。目前主流巨型圖的存儲模型有邊切分和點切分兩種存儲方式。兩種方式各有優(yōu)缺點,自2013年GraphLab2.0推出,將其存儲方式由邊切分變?yōu)辄c切分,且在性能上取得大提升,點切分策略逐漸被業(yè)界廣泛接受并使用,其原因可以概括為三點:一是點切分消耗存儲資源,邊切分消耗網(wǎng)絡(luò)資源,而存儲的成本小于內(nèi)網(wǎng)通信資源擴(kuò)展的成本;二是目前應(yīng)用場景中,大多數(shù)網(wǎng)絡(luò)都是遵循冪律分布的“無尺度網(wǎng)絡(luò)”,即1%的節(jié)點占有了50%的邊,邊切分會使得鄰居多的點所相連的邊大多數(shù)都會被分配到不同的機(jī)器上,在信息同步時對內(nèi)網(wǎng)帶寬造成巨大壓力;三是實際應(yīng)用場景中,邊(關(guān)系)的數(shù)量往往比節(jié)點(實體)數(shù)量大很多,邊切分中,大多數(shù)邊會被打斷多副本保存,帶來存儲和計算上的不均衡。

圖的計算模型?;趫D的算法通常為迭代式計算,每一輪迭代中信息通過邊在節(jié)點間傳遞,參與計算的節(jié)點集不斷變化,直到算法收斂或達(dá)到一定的迭代次數(shù)。針對此,分布式圖計算模型基于超步迭代和柵欄同步的BSP模式進(jìn)行設(shè)計,目前存在兩種比較成熟的圖計算模型:Pregel和GAS。

(1)Pregel模型由Google公司提出,借鑒了MapReduce的思想,采用了中心點編程(Vertex-centric Programming)的圖計算模式,讓用戶將復(fù)雜的迭代過程抽象為由一個頂點更新函數(shù)所實現(xiàn)的基于頂點的計算和基于邊的消息通信。

(2)GAS模型由GraphLab提出,將頂點操作抽象成Gather、Apply、Scatter這三個階段,Gather階段搜集所有計算節(jié)點圖數(shù)據(jù)中某個頂點的相鄰邊和頂點的數(shù)據(jù)進(jìn)行計算,Apply階段將gather到的數(shù)據(jù)應(yīng)用到計算節(jié)點上,Scatter階段將新的節(jié)點狀態(tài)廣播給鄰居節(jié)點。相比Pregel模型的消息通信范式的同步模式,GAS模型更偏向共享內(nèi)存風(fēng)格的異步模式。

圖計算框架概述。如表1所示,在眾多分布式圖處理框架中,綜合考慮處理性能、易用性和社區(qū)活躍度等,憑借著Spark一體化流水線處理的GraphX更具市場競爭優(yōu)勢。

金融知識圖譜應(yīng)用建模方法

知識圖譜提供了一系列的圖分析方法,用于應(yīng)用場景建模,如表2所示。作為人工智能(AI)技術(shù)的分支,知識圖譜的分析方法遵循過去50年領(lǐng)域形成的三大范式,分為邏輯規(guī)則、概率方法和深度學(xué)習(xí)三個層級。現(xiàn)階段,金融知識圖譜的應(yīng)用分析主要以用于靜態(tài)分析的邏輯規(guī)則為主。

1.邏輯規(guī)則

業(yè)務(wù)規(guī)則。通過給實體、關(guān)系和屬性附加一定的常識或業(yè)務(wù)規(guī)則,再將這些規(guī)則映射成圖的邏輯,基于知識圖譜上的鏈?zhǔn)揭?guī)則推導(dǎo),實現(xiàn)關(guān)系驗證或?qū)嶓w查詢。

子圖結(jié)構(gòu)?;诠?jié)點鄰居、路徑和其他節(jié)點中心性,查找滿足一定結(jié)構(gòu)的子圖,如多節(jié)點共享的鄰居節(jié)點、強(qiáng)連通圖、緊密中心節(jié)點、中介節(jié)點等,或是更深層次地查詢符合特定模式的子圖,例如環(huán)型、分散匯聚型、火山型、黑洞型等。

2.概率方法

基于隨機(jī)游走理論。以PageRank算法為典型模型,通過均等概率在圖上有關(guān)系的節(jié)點上進(jìn)行跳轉(zhuǎn)(游走),多次跳轉(zhuǎn)后達(dá)到算法收斂,將鏈接關(guān)系信息映射成到每個節(jié)點的概率分布,從而得到關(guān)鍵信息在圖上的分布,例如節(jié)點重要度排名、節(jié)點信任度排名、節(jié)點惡意指數(shù)分布。在PageRank基礎(chǔ)上,不同的應(yīng)用場景變換出了不同鏈接分析算法:TrustRank從專家評估篩選出的可靠性高的種子集出發(fā),將其高信任等級向外鏈接傳播,且信任等級隨鏈接次數(shù)增多而降低,以此尋找到同樣可靠的節(jié)點;SibylRank根據(jù)虛假賬號與真實賬號鏈接的有限性,從真實賬號出發(fā)基于Early-Termination 隨機(jī)游走,讓信息阻斷在真實賬號所在群體,實現(xiàn)在線社交網(wǎng)絡(luò)虛假賬號檢測。

基于社交網(wǎng)絡(luò)理論。以LPA算法為基礎(chǔ),通過鏈接關(guān)系將已標(biāo)記節(jié)點的標(biāo)簽傳播給未標(biāo)記節(jié)點,最終形成統(tǒng)一標(biāo)簽的“社區(qū)”結(jié)構(gòu),再基于社交網(wǎng)絡(luò)理論進(jìn)行社區(qū)分析,如基于“Guilt-by-association”假設(shè),一個社區(qū)的欺詐樣本占比很高,那這個社區(qū)的其他實體存在欺詐風(fēng)險的可能性也會隨之提高。相關(guān)的算法有根據(jù)迭代形成的歷史標(biāo)簽數(shù)進(jìn)行策略更新的SLPA,考慮標(biāo)簽傳播隨距離衰減進(jìn)行策略更新的HANP,計算每個節(jié)點所屬標(biāo)簽概率分布進(jìn)行多社區(qū)劃分的BMLPA,基于模塊度計算的Fast Unfolding,基于Belonging Coefficient進(jìn)行多社區(qū)劃分的COPRA等。其中,F(xiàn)ast Unfolding在各計算框架中的集成應(yīng)用較為廣泛。

3.深度學(xué)習(xí)

結(jié)合深度學(xué)習(xí)對圖數(shù)據(jù)進(jìn)行社區(qū)檢測、行為分析、節(jié)點分類、鏈路預(yù)測和聚類等。圖數(shù)據(jù)不同于用一維序列表示的聲音數(shù)據(jù)或二維矩陣表示的圖像數(shù)據(jù),由于沒有規(guī)則的空間結(jié)構(gòu)(Non Euclidean Structure),傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)在處理時無法保持平移不變性。針對此,行業(yè)發(fā)展提供了兩種解決思路:一是通過圖嵌入(Graph Embedding)將離散化的圖結(jié)構(gòu)(高維稠密的矩陣)映射為低微稠密向量,再輸入到機(jī)器學(xué)習(xí)模型;二是直接構(gòu)建適用于圖學(xué)習(xí)的圖神經(jīng)網(wǎng)絡(luò),可直接輸入圖進(jìn)行深度學(xué)習(xí)。2018、2019年圖學(xué)習(xí)理論蓬勃發(fā)展,有關(guān)圖學(xué)習(xí)的論文如過江之鯽,相關(guān)的應(yīng)用框架也逐漸開源,如阿里的Euler、谷歌的Neural Structured Learning(NSL)等。

知識圖譜可視化

知識圖譜可視化是對海量網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行高效而直觀地渲染,專業(yè)的圖可視化框架有KeyLines、Gephi、Linkurious、Cytoscape、Centrifuge,Tom Sawyer等,上述框架不僅針對圖數(shù)據(jù)渲染優(yōu)化了性能,還提供了一定的網(wǎng)絡(luò)分析能力。而我們所熟悉的主流的前端可視化框架,如D3、Echarts等也提供了對圖形數(shù)據(jù)可視化的支持,但對圖的適配性不及專業(yè)的框架。

金融知識圖譜應(yīng)用難點與要點

1.金融知識圖譜的認(rèn)知

知識圖譜在金融行業(yè)的應(yīng)用仍處于初級階段。金融知識圖譜雖然已廣泛應(yīng)用于風(fēng)控、營銷、IT資產(chǎn)管理和數(shù)據(jù)管理等領(lǐng)域,但大部分是應(yīng)用于簡單數(shù)據(jù)查詢和邏輯規(guī)則方式。在應(yīng)用初級階段,金融知識圖譜發(fā)力的核心內(nèi)容:一是將多源異構(gòu)數(shù)據(jù)有機(jī)融合為一張關(guān)聯(lián)圖譜,二是將反映整體的網(wǎng)絡(luò)特征提煉到單個實體信息中,實現(xiàn)關(guān)系特征從無到有的跨越。

知識圖譜是一個可以廣泛應(yīng)用的輔助工具。知識圖譜應(yīng)用的廣泛性在于拓?fù)溥B接的廣泛性,任何事物都可以在賦范空間建立連接。同時,由于關(guān)聯(lián)分析在整個數(shù)據(jù)分析方案中的有限性,金融知識圖譜在應(yīng)用過程中,往往作為一個輔助工具和其他技術(shù)結(jié)合使用,作為數(shù)據(jù)挖掘在關(guān)系維度的一個補(bǔ)充完善,對既有業(yè)務(wù)模型進(jìn)行升級完善。

2.金融知識圖譜的應(yīng)用挑戰(zhàn)

數(shù)據(jù)完整性面臨挑戰(zhàn)。知識圖譜面向關(guān)系密集型數(shù)據(jù),相較于其他數(shù)據(jù)挖掘技術(shù)更要求數(shù)據(jù)的完整性。若關(guān)聯(lián)關(guān)系數(shù)據(jù)不全或圖數(shù)據(jù)量過小,圖將無法連通而形成一個個孤立的子圖孤島,會導(dǎo)致信息無法傳播,基于此的關(guān)聯(lián)分析可能退化成毫無價值的應(yīng)用。上述問題在業(yè)務(wù)數(shù)據(jù)體量較小的中小銀行中尤為凸顯。針對此,不僅要考慮數(shù)據(jù)的積累,也要優(yōu)化分析模型,減少數(shù)據(jù)完整性對分析結(jié)果的影響。

模型精準(zhǔn)性需要關(guān)注。知識圖譜建模的精準(zhǔn)性同時依賴于對模型的業(yè)務(wù)特征和技術(shù)方法的深刻理解和實踐經(jīng)驗,一是知識圖譜數(shù)據(jù)建模的模型,即如何定義知識本體,例如,在異構(gòu)圖和同構(gòu)圖的選擇上,是選擇構(gòu)建全量數(shù)據(jù)的異構(gòu)圖,還是針對特殊場景對實體和屬性進(jìn)行簡化、對關(guān)系進(jìn)行折疊的同構(gòu)圖;在關(guān)系定義尤其是抽象關(guān)系定義上,如何在無限制的關(guān)系定義中概括出對應(yīng)用有價值的關(guān)系,包括實體間的共同愛好、共同購買關(guān)系、在特殊時段的聯(lián)系、處理后獲得的某種特征上的相似性等;二是數(shù)據(jù)分析的模型,如何對業(yè)務(wù)邏輯進(jìn)行概括并映射成圖能理解處理的模式,如擔(dān)保風(fēng)險中的擔(dān)保鏈、擔(dān)保圈、平臺擔(dān)保,映射到圖分析中環(huán)形路徑查找、擔(dān)保社區(qū)發(fā)現(xiàn)和高維度節(jié)點算法等。

金融知識圖譜應(yīng)用

目前銀行業(yè)內(nèi)的知識圖譜技術(shù)主要應(yīng)用于以下三大方面:

1.銀行數(shù)字化營銷

智能產(chǎn)品推薦:銀行面對的客戶數(shù)量眾多,千人千面,行為各異,要如何給客戶作精準(zhǔn)的產(chǎn)品推薦是一大難題。而知識圖譜的構(gòu)建過程,剛好可以把客戶各類數(shù)據(jù)有機(jī)整合在一起,并且通過產(chǎn)品的關(guān)聯(lián)分析和客群的關(guān)聯(lián)分析,就可以精準(zhǔn)地對客戶進(jìn)行產(chǎn)品推薦。另外,因為知識圖譜的運算速度非常之快,所以給客戶的推薦可以實時進(jìn)行決策判斷,提升客戶體驗。

潛在客戶挖掘:通過關(guān)系梳理,知識圖譜可以識別同一類客戶,或者關(guān)聯(lián)類客戶,通過類似聚類分析的算法,我們可以將人工難以發(fā)現(xiàn)的潛在用戶發(fā)掘出來,一可以提高產(chǎn)品營銷成功率,二可以發(fā)現(xiàn)原來潛在的客戶為我所用。比如企業(yè)客戶的供應(yīng)鏈,經(jīng)銷商,股東和其他關(guān)聯(lián)方,通過外部數(shù)據(jù)配合,做好企業(yè)信息的提取、整合和加工,形成知識圖譜中的相應(yīng)節(jié)點,通過知識圖譜算法進(jìn)行挖掘和推薦,從而形成有效的潛在商機(jī),助力銀行客戶經(jīng)營轉(zhuǎn)型升級。

客戶關(guān)系梳理:銀行客戶營銷的前期工作,就是全面地了解客戶(KYC),過去沒有金融科技的幫助,KYC工作只能依賴于客戶經(jīng)理手工完成。如今,在金融科技的助力下,我們運用大數(shù)據(jù)和知識圖譜等技術(shù),可以非常方便地梳理和展示企業(yè)的基本信息、關(guān)聯(lián)信息和行為信息等全貌,可以有效識別客戶的供應(yīng)鏈、關(guān)聯(lián)關(guān)系、集團(tuán)關(guān)系等信息,通過知識圖譜技術(shù),可以識別任意多層關(guān)聯(lián)關(guān)系,把原來人工難以識別的隱密關(guān)聯(lián)信息都展示出來,極大程度解決了傳統(tǒng)人工KYC信息調(diào)查不全,信息失真等問題,使得銀企信息達(dá)到了充分對稱。

2.銀行風(fēng)險控制管理

風(fēng)險控制是銀行的重中之重,但是長期以來,在很多風(fēng)控領(lǐng)域,一直沒有找到效果好、效率高的風(fēng)控手段。隨著金融科技的發(fā)展,知識圖譜技術(shù)的進(jìn)步,我們看到這些問題有望得到解決:

信用卡欺詐識別:應(yīng)用知識圖譜技術(shù),可以有效解決信用卡虛假申請、信用卡套現(xiàn)、信用卡申請分欺詐等難點痛點問題,助力信用卡業(yè)務(wù)更加健康的發(fā)展。

電子銀行反欺詐:在O2O的時代下,客戶辦理業(yè)務(wù)得到了前所未有的便利,但也隨之而來并且愈演愈烈的反欺詐問題,羊毛黨、職業(yè)欺詐團(tuán)伙層出不窮,通過知識圖譜技術(shù),可以有效解決電子渠道被薅羊毛、被惡意申請等問題,為電子銀行的發(fā)展保駕護(hù)航。

反洗錢:反洗錢需要對交易進(jìn)行大量的決策分析和判斷,對實時性的要求也很高,除了事后的批量分析和報告外,加強(qiáng)事中的交易分析和阻斷也是未來的發(fā)展方向之一,通過知識圖譜技術(shù),可以有效提升反洗錢交易判斷精準(zhǔn)性,加快計算的速度,提升反洗錢的能效。

資金中介識別:通過知識圖譜對資金匯劃的數(shù)據(jù)分析,可以有效識別人工難以識別的資金中介,幫助業(yè)務(wù)部門做好排查,防范資金中介風(fēng)險。

3.銀行數(shù)據(jù)資產(chǎn)管理

銀行的數(shù)據(jù)相互的關(guān)聯(lián)性非常緊密,我們通過知識圖譜,可以應(yīng)用在數(shù)據(jù)血緣分析、數(shù)據(jù)標(biāo)準(zhǔn)遷移分析、統(tǒng)計指標(biāo)口徑溯源分析、科技的CMDB等方面,幫助梳理數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,厘清統(tǒng)計口徑的計算方法,讓數(shù)據(jù)“看得清來龍去脈、算的明統(tǒng)計口徑、查的到底層數(shù)據(jù)”,知識圖譜在數(shù)據(jù)資產(chǎn)管理上必將發(fā)揮更大的作用。

結(jié)語

可以預(yù)見在未來很長一段時間內(nèi),知識圖譜將成為大數(shù)據(jù)智能的前沿研究問題。學(xué)術(shù)界在持續(xù)地推進(jìn)技術(shù)的研究與創(chuàng)新,工業(yè)界在積極地探索業(yè)務(wù)落地的場景。金融業(yè)要做好基礎(chǔ)平臺建設(shè),把握技術(shù)發(fā)展動態(tài),從實際業(yè)務(wù)發(fā)展痛點出發(fā),用好知識圖譜這把利器。

猜你喜歡
圖譜框架節(jié)點
“植物界大熊貓”完整基因組圖譜首次發(fā)布
精武門的武術(shù)圖譜與徐悲鴻
框架
基于移動匯聚節(jié)點和分簇的改進(jìn)節(jié)能路由算法
CAE軟件操作小百科(48)
基于點權(quán)的混合K-shell關(guān)鍵節(jié)點識別方法
淺談框架網(wǎng)頁的學(xué)習(xí)
圖表
基于Jmeter對Node框架性能的測試研究
淺談基于P2P的網(wǎng)絡(luò)教學(xué)系統(tǒng)節(jié)點信息收集算法
阜康市| 江永县| 永登县| 泸水县| 镇雄县| 定西市| 墨脱县| 十堰市| 通辽市| 昌江| 阳西县| 布尔津县| 扶沟县| 囊谦县| 温泉县| 北京市| 突泉县| 正镶白旗| 荥阳市| 林州市| 汉川市| 宝丰县| 宁波市| 霍邱县| 阿巴嘎旗| 奎屯市| 庆阳市| 绥阳县| 胶州市| 武强县| 长沙市| 古交市| 南雄市| 华阴市| 安吉县| 蓬溪县| 临漳县| 淮北市| 含山县| 乌兰浩特市| 衡阳县|