李猛 朱迎際 莊軼
[關(guān)鍵詞]自然語言 內(nèi)部審計(jì) 非結(jié)構(gòu)化數(shù)據(jù) 風(fēng)險(xiǎn)預(yù)警
風(fēng)
一、文獻(xiàn)綜述
現(xiàn)今商業(yè)銀行面臨的風(fēng)險(xiǎn),影響最大的是當(dāng)前經(jīng)濟(jì)下行周期形勢(shì)下,不斷頻發(fā)的信用風(fēng)險(xiǎn)以及對(duì)信用風(fēng)險(xiǎn)的控制及其穩(wěn)定情況的影響。因此,建立商業(yè)銀行授信風(fēng)險(xiǎn)預(yù)警機(jī)制是防范風(fēng)險(xiǎn)、避免爆發(fā)危機(jī)的重要措施之一。風(fēng)險(xiǎn)預(yù)警機(jī)制在商業(yè)銀行中的應(yīng)用,分為宏觀層面和微觀層面,本文重點(diǎn)關(guān)注商業(yè)銀行審計(jì)風(fēng)險(xiǎn)預(yù)警機(jī)制的構(gòu)建,即風(fēng)險(xiǎn)預(yù)警機(jī)制微觀層面模型方法的選擇。
(一)自然語言處理技術(shù)
自然語言處理(Natural Language Processing)是人工智能中最難解決的問題之一,是運(yùn)用人類自然語言與計(jì)算機(jī)系統(tǒng)進(jìn)行通信、交互等不可缺少的技術(shù)。借助人工智能的優(yōu)勢(shì),該技術(shù)可以全面運(yùn)用商業(yè)銀行內(nèi)部生成的大數(shù)據(jù),不斷訓(xùn)練和調(diào)整風(fēng)險(xiǎn)預(yù)警模型,使風(fēng)險(xiǎn)預(yù)警模型通過自我學(xué)習(xí)適應(yīng)商業(yè)銀行內(nèi)外部環(huán)境的變化,提高風(fēng)險(xiǎn)預(yù)警的正確性和預(yù)測(cè)效率。自然語言處理技術(shù)在新時(shí)代下可運(yùn)用于語義分析、信息抽取、文本挖掘、機(jī)器翻譯(PF Brown等,1993)、信息檢索、問答系統(tǒng)、對(duì)話系統(tǒng)(Su P H等,2016)等高新技術(shù)領(lǐng)域,并顯著提升工作效率,更早發(fā)現(xiàn)各類風(fēng)險(xiǎn)。
自然語言處理被定義為一門研究人與人之間交流以及人與計(jì)算機(jī)交流中語言問題的基礎(chǔ)學(xué)科。Bill Manaris(1998)認(rèn)為,自然語言處理要研究表示語言能力和語言應(yīng)用的模型,建立計(jì)算機(jī)自動(dòng)框架來實(shí)現(xiàn)特定的語言模型,提出對(duì)應(yīng)方案,逐漸改進(jìn)語言模型,根據(jù)語言模型設(shè)計(jì)各種應(yīng)用系統(tǒng)并探討這些應(yīng)用系統(tǒng)的測(cè)評(píng)技術(shù)。李生(2013)指出,自然語言處理的研發(fā)方法分為基于規(guī)則和基于統(tǒng)計(jì)兩種,前者是手動(dòng)獲取語言規(guī)則,后者則是通過對(duì)海量語料庫的計(jì)量分析,對(duì)自然語言進(jìn)行處理。自然語言處理的底層研究主要包括詞法、句法、語義、語用、語境與篇章等分析研究。林奕歐等(2017)指出,深度學(xué)習(xí)方法逐步在機(jī)器翻譯、機(jī)器問答、自動(dòng)文摘、閱讀理解等自然語言理解領(lǐng)域發(fā)展,逐漸成為自然語言處理的主流工具?!胺植际教卣鞅硎尽笔巧疃葘W(xué)習(xí)與自然語言處理相結(jié)合的切入點(diǎn),這些分布式特征是通過神經(jīng)網(wǎng)絡(luò)語言模型學(xué)習(xí)得到的。
自然語言處理的常見算法包括隱馬爾可夫模型、條件隨機(jī)場(chǎng)和神經(jīng)網(wǎng)絡(luò)等。微軟亞洲研究院(2017)指出,自然語言處理技術(shù)的研究與應(yīng)用主要包括以下方面:一是句法語義分析。對(duì)于給定的句子進(jìn)行句法分析、語義角色解析和多義詞消歧等。二是信息抽取。從給定文本中抽取重要信息,涉及實(shí)體解析、時(shí)間抽取、因果關(guān)系抽取等關(guān)鍵技術(shù)。三是文本數(shù)據(jù)挖掘。包括文本聚類、分類、信息抽取等以及對(duì)挖掘信息和知識(shí)的可視化、交互式的表達(dá)界面等。四是機(jī)器翻譯。把輸入的源語言文本通過自動(dòng)翻譯獲得另外一種語言的文本,可細(xì)分為文本翻譯、語音翻譯、圖形翻譯等。五是信息檢索。為大規(guī)模文檔中的詞匯建立索引,并對(duì)輸入的查詢表達(dá)式(如一個(gè)檢索詞或者一個(gè)句子)進(jìn)行分析,然后在索引中查找匹配的候選文檔。六是問答系統(tǒng)。對(duì)自然語言表達(dá)的問題,由問答系統(tǒng)給出精準(zhǔn)答案。七是對(duì)話系統(tǒng)。通過一系列的對(duì)話,同用戶進(jìn)行聊天,完成某一項(xiàng)任務(wù)。
(二)內(nèi)部審計(jì)風(fēng)險(xiǎn)預(yù)警
從模型方法選擇來看,風(fēng)險(xiǎn)預(yù)警的傳統(tǒng)模型有其自身固有的局限性,如一般依托于線性和結(jié)構(gòu)化數(shù)據(jù),難以處理復(fù)雜的非線性和非結(jié)構(gòu)化數(shù)據(jù)形成的新模型,缺少自我訓(xùn)練和自我調(diào)整商業(yè)銀行環(huán)境變化的能力。新常態(tài)下的金融背景加劇了商業(yè)銀行內(nèi)外部環(huán)境的變化,促使商業(yè)銀行風(fēng)險(xiǎn)呈現(xiàn)出繁雜性和不穩(wěn)定性,因而傳統(tǒng)風(fēng)險(xiǎn)預(yù)警模型難以符合當(dāng)前金融形勢(shì)下對(duì)內(nèi)部審計(jì)提出的要求,亟待一種新技術(shù)的引入以進(jìn)一步擴(kuò)大審計(jì)范圍、優(yōu)化審計(jì)工具、提高審計(jì)效率,同時(shí)具有自我學(xué)習(xí)能力,適應(yīng)不斷變化的現(xiàn)代業(yè)務(wù)模式。
魯愛民等(2012)指出,審計(jì)預(yù)警系統(tǒng)的主要構(gòu)成應(yīng)該包括對(duì)商業(yè)銀行內(nèi)外部經(jīng)營環(huán)境的評(píng)測(cè)、對(duì)企業(yè)治理機(jī)制與貫徹執(zhí)行程度的審計(jì)、對(duì)關(guān)聯(lián)風(fēng)險(xiǎn)解析的審計(jì)以及數(shù)據(jù)分析與預(yù)警通知四大部分。生麗英(2017)認(rèn)為,風(fēng)險(xiǎn)模型是在選擇具有一定特征樣本的基礎(chǔ)上,借助統(tǒng)計(jì)分析方法,在預(yù)警自變量指標(biāo)與問題發(fā)生的概率性因變量指標(biāo)之間,通過實(shí)際驗(yàn)證分析建立間接或直接的函數(shù)性關(guān)系。一個(gè)實(shí)用的風(fēng)險(xiǎn)預(yù)警系統(tǒng)應(yīng)包括四個(gè)部分:風(fēng)險(xiǎn)的檢查測(cè)試與分析、評(píng)價(jià)風(fēng)險(xiǎn)水平、傳送高效可靠的預(yù)警信息、確定風(fēng)險(xiǎn)應(yīng)急處理機(jī)制。譚紅艷(2015)提出了金融內(nèi)部審計(jì)預(yù)警系統(tǒng)構(gòu)建的初步設(shè)想,即設(shè)定預(yù)警目標(biāo)、設(shè)計(jì)預(yù)警標(biāo)準(zhǔn)、明確預(yù)警閥值、預(yù)警信息反饋等五個(gè)步驟。包商銀行股份有限公司審計(jì)部(2017)從建立預(yù)警監(jiān)測(cè)信息平臺(tái)、實(shí)現(xiàn)資源整合管理、完善預(yù)警監(jiān)測(cè)基本方法和工具三個(gè)方面構(gòu)建了非現(xiàn)場(chǎng)審計(jì)預(yù)警監(jiān)測(cè)體系運(yùn)作模式。武慕汐等(2017)認(rèn)為政府審計(jì)預(yù)警系統(tǒng)應(yīng)當(dāng)由預(yù)警模塊、信息模塊、干預(yù)模塊及反饋調(diào)節(jié)模塊構(gòu)成。中國建設(shè)銀行審計(jì)部(2017)運(yùn)用非現(xiàn)場(chǎng)審計(jì)系統(tǒng),整合銀行多個(gè)系統(tǒng)數(shù)據(jù)資源,定義相關(guān)指標(biāo),編制非現(xiàn)場(chǎng)模型群組,建立企業(yè)經(jīng)營狀況定量分析、企業(yè)重大風(fēng)險(xiǎn)事項(xiàng)定性評(píng)價(jià)兩大核心模塊,再通過風(fēng)險(xiǎn)整合工具,形成對(duì)公授信客戶分類預(yù)警名單。
(三)授信業(yè)務(wù)審計(jì)
當(dāng)前商業(yè)銀行授信業(yè)務(wù)工作中存在貸前風(fēng)險(xiǎn)防范意識(shí)淡薄、內(nèi)部控制制度執(zhí)行不嚴(yán)、貸后檢查管理不到位、授信從業(yè)人員素質(zhì)有待提高等問題。SC Chen等(2011)以某銀行的授信審計(jì)數(shù)據(jù)為例,構(gòu)建了能夠有效識(shí)別授信業(yè)務(wù)規(guī)則的潛在關(guān)鍵因素的模型,最大限度地降低授信風(fēng)險(xiǎn)相關(guān)損失,從而有效提升銀行授信業(yè)務(wù)的穩(wěn)定性和盈利能力。李燁等(2013)通過分析新時(shí)期農(nóng)商行授信風(fēng)險(xiǎn)的內(nèi)容和授信管理的現(xiàn)狀,指出內(nèi)部審計(jì)工作有助于識(shí)別授信風(fēng)險(xiǎn)領(lǐng)域,確定授信管理戰(zhàn)略目標(biāo),指導(dǎo)授信管理戰(zhàn)略調(diào)整。中國農(nóng)業(yè)銀行審計(jì)局成都分局課題組(2013)根據(jù)各業(yè)務(wù)品種建立起貸款金額抽樣模型、風(fēng)險(xiǎn)要素抽樣模型和風(fēng)險(xiǎn)特征抽樣模型,對(duì)商業(yè)銀行授信業(yè)務(wù)審計(jì)中的抽樣問題進(jìn)行了研究,使得抽取的樣本更集中于高風(fēng)險(xiǎn)領(lǐng)域。侯景波等(2015)對(duì)商業(yè)銀行集團(tuán)授信業(yè)務(wù)中資金運(yùn)用失控、多頭授信套利、放大信用風(fēng)險(xiǎn)等問題的審計(jì)檢查與監(jiān)督進(jìn)行了探討。甘肅銀行股份有限公司(2017)在項(xiàng)目實(shí)施中引入群組化模型來完成數(shù)據(jù)整合、挖掘和分析,形成了一套較為系統(tǒng)的適用于城市商業(yè)銀行授信業(yè)務(wù)內(nèi)部審計(jì)工作的方法體系,提高了內(nèi)部審計(jì)質(zhì)量。
以上風(fēng)險(xiǎn)模型實(shí)際案例多基于傳統(tǒng)形式為線性范式的各類模型,而這些模型僅基于結(jié)構(gòu)化數(shù)據(jù)才能實(shí)現(xiàn),有一定的局限性。隨著大數(shù)據(jù)、人工智能技術(shù)的發(fā)展,基于人工智能技術(shù)的深度學(xué)習(xí)、自然語言處理技術(shù)的智能化模型逐步產(chǎn)生。大數(shù)據(jù)技術(shù)可以解析處理文本、圖片、音視頻等非結(jié)構(gòu)化數(shù)據(jù),機(jī)器的深度學(xué)習(xí)可以模仿人類的學(xué)習(xí)技巧不斷提高。最著名的案例是2017年戰(zhàn)勝世界排名第一圍棋手柯潔的阿爾法狗。2018年5月,谷歌公司發(fā)布的語音助手實(shí)現(xiàn)了機(jī)器向飯店、發(fā)廊打電話預(yù)約時(shí)間等,這些成就再次讓人感受到人工智能的魅力。
二、框架構(gòu)建
隨著我國市場(chǎng)經(jīng)濟(jì)的不斷發(fā)展,商業(yè)銀行授信業(yè)務(wù)已經(jīng)成為主要的資產(chǎn)業(yè)務(wù),授信業(yè)務(wù)的發(fā)展是商業(yè)銀行發(fā)展的重要基礎(chǔ),也是商業(yè)銀行利益增長的重要途徑。其中的授信風(fēng)險(xiǎn)管理和控制就變得更加重要,如果授信風(fēng)險(xiǎn)管理和控制不到位很可能影響商業(yè)銀行自身的發(fā)展,甚至威脅市場(chǎng)經(jīng)濟(jì)的穩(wěn)定。我國商業(yè)銀行授信風(fēng)險(xiǎn)管理過程中存在的問題包括不良貸款率較高、授信風(fēng)險(xiǎn)管理內(nèi)部控制機(jī)制不健全等。新常態(tài)下加強(qiáng)對(duì)商業(yè)銀行授信風(fēng)險(xiǎn)的管理和控制,對(duì)我國商業(yè)銀行發(fā)展乃至經(jīng)濟(jì)金融的穩(wěn)定都具有重要意義,商業(yè)銀行也可以利用對(duì)授信風(fēng)險(xiǎn)的合理控制,實(shí)現(xiàn)利益的增長,從而提高在市場(chǎng)經(jīng)濟(jì)中的核心競(jìng)爭(zhēng)力。
當(dāng)前,國內(nèi)外尚無將自然語言處理技術(shù)成功用于授信業(yè)務(wù)內(nèi)部審計(jì)風(fēng)險(xiǎn)預(yù)警、落實(shí)授信業(yè)務(wù)規(guī)定、防范授信業(yè)務(wù)風(fēng)險(xiǎn)的框架?;谧匀徽Z言處理技術(shù)的內(nèi)部審計(jì)風(fēng)險(xiǎn)預(yù)警框架(如圖1所示)屬于商業(yè)銀行風(fēng)險(xiǎn)預(yù)警框架,目的是借助內(nèi)部審計(jì)部門構(gòu)建的自然語言處理項(xiàng)目,評(píng)估商業(yè)銀行授信業(yè)務(wù)相關(guān)風(fēng)險(xiǎn)水平,輸出商業(yè)銀行授信業(yè)務(wù)風(fēng)險(xiǎn)預(yù)警信息,明確授信風(fēng)險(xiǎn)來源,提供風(fēng)險(xiǎn)處理非現(xiàn)場(chǎng)監(jiān)控意見,從而達(dá)到降低甚至清除風(fēng)險(xiǎn)狀態(tài)或應(yīng)對(duì)風(fēng)險(xiǎn)、降低風(fēng)險(xiǎn)損失的目標(biāo)。
本框架以授信業(yè)務(wù)中的審批意見或調(diào)查報(bào)告為數(shù)據(jù)基礎(chǔ),應(yīng)用自然語言技術(shù)解析與核驗(yàn)后,輸出授信業(yè)務(wù)風(fēng)險(xiǎn)記錄,進(jìn)一步進(jìn)行風(fēng)險(xiǎn)預(yù)警。主要處理步驟如下。
(一)資料準(zhǔn)備
通過跑批腳本從商業(yè)銀行大數(shù)據(jù)平臺(tái)批量自動(dòng)提取來自授信業(yè)務(wù)系統(tǒng)各環(huán)節(jié)(評(píng)級(jí)、授信、授信調(diào)整、用信、放款等環(huán)節(jié))的非結(jié)構(gòu)化數(shù)據(jù)(審批意見、調(diào)查報(bào)告等)和結(jié)構(gòu)化數(shù)據(jù)等資料,實(shí)現(xiàn)數(shù)據(jù)的每日自動(dòng)更新。
(二)數(shù)據(jù)要素解析
數(shù)據(jù)資料準(zhǔn)備完成后,由計(jì)算機(jī)系統(tǒng)自動(dòng)運(yùn)用自然語言技術(shù)智能解析授信業(yè)務(wù)各環(huán)節(jié)非結(jié)構(gòu)化數(shù)據(jù)中的業(yè)務(wù)要素和關(guān)注點(diǎn),作為步驟3要素核驗(yàn)的數(shù)據(jù)來源。
(三)要素核驗(yàn)
由計(jì)算機(jī)系統(tǒng)自動(dòng)將授信業(yè)務(wù)各環(huán)節(jié)非結(jié)構(gòu)化數(shù)據(jù)解析出的要素與授信業(yè)務(wù)各環(huán)節(jié)內(nèi)授信業(yè)務(wù)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行核驗(yàn),某一環(huán)節(jié)解析出的要素與后續(xù)環(huán)節(jié)解析出的要素或授信業(yè)務(wù)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行核驗(yàn),并基于相似度或概率算法判定授信業(yè)務(wù)各環(huán)節(jié)中的各要素是否存在不一致的情況,形成授信業(yè)務(wù)疑似風(fēng)險(xiǎn)線索清單。
(四)數(shù)據(jù)輸出
將步驟2數(shù)據(jù)要素解析中形成的非結(jié)構(gòu)化數(shù)據(jù)要素解析結(jié)果、要素核驗(yàn)步驟形成的結(jié)果等輸出,形成關(guān)系數(shù)據(jù)庫可存儲(chǔ)的二維化關(guān)系表,每日自動(dòng)傳送至操作型數(shù)據(jù)存儲(chǔ),并可在商業(yè)銀行審計(jì)系統(tǒng)中查看分析,作為審計(jì)模型編寫人員編制非現(xiàn)場(chǎng)核查審計(jì)模型的數(shù)據(jù)基礎(chǔ)。
(五)非現(xiàn)場(chǎng)內(nèi)部審計(jì)核實(shí)
采用“初核—下發(fā)核實(shí)—復(fù)核”的作業(yè)流程,對(duì)于步驟4數(shù)據(jù)輸出中形成的授信業(yè)務(wù)疑似風(fēng)險(xiǎn)清單,經(jīng)總部內(nèi)部審計(jì)人員初次復(fù)核后,通過商業(yè)銀行審計(jì)系統(tǒng)的非現(xiàn)場(chǎng)監(jiān)控模塊下發(fā)給各分支機(jī)構(gòu),由各分支機(jī)構(gòu)內(nèi)部審計(jì)人員進(jìn)行專人核實(shí),并由總部內(nèi)部審計(jì)人員進(jìn)行再次復(fù)核。
(六)風(fēng)險(xiǎn)預(yù)警
對(duì)于非現(xiàn)場(chǎng)內(nèi)部審計(jì)核實(shí)中已查證屬實(shí)的風(fēng)險(xiǎn)記錄,通過非現(xiàn)場(chǎng)監(jiān)控報(bào)告定期通報(bào),并作進(jìn)一步處理,作為今后現(xiàn)場(chǎng)審計(jì)發(fā)現(xiàn)問題的重要線索,充分發(fā)揮內(nèi)部審計(jì)第三道防線的作用。
三、框架解析算法與流程
基于自然語言處理技術(shù)的內(nèi)部審計(jì)風(fēng)險(xiǎn)預(yù)警框架,主要通過自然語言處理技術(shù)中的語義分析算法來實(shí)現(xiàn)解析授信業(yè)務(wù)系統(tǒng)非結(jié)構(gòu)化數(shù)據(jù)的業(yè)務(wù)要素。
(一)自然語言處理解析算法
對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行有效處理,需要對(duì)其進(jìn)行統(tǒng)一的描述。在技術(shù)層面,首先,采用自然語言處理技術(shù)中的語義分析算法來處理非結(jié)構(gòu)化數(shù)據(jù)中的文本信息較為合適,引入中文核心語義庫,劃分出積極、中性、消極三個(gè)不同詞性的詞庫,然后解析句子結(jié)構(gòu)并根據(jù)文字傾向性進(jìn)行拆分,進(jìn)而對(duì)整篇文檔進(jìn)行語境解析,自動(dòng)生成摘要并提取關(guān)鍵信息;其次,將多份相同類型的文檔進(jìn)行橫向比較,從而挖掘出信息間的關(guān)聯(lián)關(guān)系;最后,對(duì)海量信息進(jìn)行挖掘,解析出關(guān)注熱點(diǎn),發(fā)掘潛在價(jià)值。非結(jié)構(gòu)化數(shù)據(jù)主要挖掘流程如下:
1. 詞語。語別與詞匯的意義。
2. 句子。解析句子結(jié)構(gòu),解析文字傾向性。
3. 篇章。解析篇章語境,自動(dòng)生成摘要,提取關(guān)鍵信息。
4. 多文檔。事件發(fā)現(xiàn)與跟蹤,解析信息關(guān)聯(lián)性。
5. 海量信息。解析熱點(diǎn),發(fā)掘價(jià)值。
語義分析是在分解辨析句子的語法構(gòu)成和詞義上,推演出可以反映該語句含義的形式化表達(dá),從而使計(jì)算機(jī)解析出人類自然語言,并進(jìn)行深層次的知識(shí)獲取,抽取出句子背后的語義信息,其處理流程如圖2所示。對(duì)于待處理的文本數(shù)據(jù),通過語義分析技術(shù)解析出其中包含的語義信息,并建立索引;而對(duì)于使用者的查詢數(shù)據(jù),采用相同的方法以備查詢所用。通過計(jì)算關(guān)鍵字和語義片段的相似度,將各個(gè)語義的相似程度進(jìn)行融合,最終得到查詢語句的相似度,從數(shù)據(jù)源中找出對(duì)應(yīng)文本信息。
語義分析技術(shù)目前已廣泛運(yùn)用于語義檢索和查詢結(jié)果優(yōu)化的研究中,審計(jì)底稿中絕大部分材料是非結(jié)構(gòu)化的文字描述,有很多底稿還包含審計(jì)人員的主觀評(píng)價(jià)。因此,可以通過語義分析技術(shù)挖掘出文本中的主客觀性、觀點(diǎn)、審批意見等,對(duì)其情感傾向作出判斷。
(二)解析算法實(shí)現(xiàn)流程
自然語言處理解析算法實(shí)現(xiàn)語義信息提取的全流程,主要包括以下環(huán)節(jié):
1. 語法處理。在傳統(tǒng)自然語言算法處理的基礎(chǔ)上,引入深度學(xué)習(xí)領(lǐng)域先進(jìn)的算法,主要做法是對(duì)文本中的語句進(jìn)行切分、詞性標(biāo)注,并確定詞性間的語法關(guān)系,如主謂、動(dòng)賓、定中等關(guān)系。
2. 語句過濾。由于后一階段的需要,對(duì)于語法處理中某些無意義的信息或獲取不到正常語義信息的句子,本階段會(huì)將其過濾。
3. 主干提取。通過分析主干句子的詞性來明確語句所屬的句型,如在語句中出現(xiàn)狀中關(guān)系和定中關(guān)系時(shí),可以去掉其中表示狀語和定語的詞。
4. 句型解析。通過提取的句子主干成分,分析詞性來明確該句子的句型,如某一語句結(jié)構(gòu)為“代詞—?jiǎng)釉~—名詞”時(shí),即可明確該語句符合陳述句的句型。
5. 修飾詞獲取。在最終確定語義信息之前,需要分析語句中的修飾詞,提取其中修飾性詞語包含的信息,如定語、補(bǔ)語等。
6. 信息生成。根據(jù)上一階段的處理結(jié)果,提取出語義片段,通過結(jié)構(gòu)化信息的形式表現(xiàn)出來。
四、框架應(yīng)用——以NJ銀行授信業(yè)務(wù)為例
NJ銀行授信業(yè)務(wù)流程中產(chǎn)生了大量非結(jié)構(gòu)化文本數(shù)據(jù),比如各類審批意見和調(diào)查報(bào)告等,而現(xiàn)有的非現(xiàn)場(chǎng)監(jiān)控模型由人工基于結(jié)構(gòu)化二維數(shù)據(jù)構(gòu)建,缺少對(duì)審批意見等數(shù)據(jù)的分析應(yīng)用。本文提出的基于自然語言處理技術(shù)的內(nèi)部審計(jì)風(fēng)險(xiǎn)預(yù)警框架的目的,是結(jié)合實(shí)踐經(jīng)驗(yàn),運(yùn)用自然語言處理技術(shù)對(duì)此類非結(jié)構(gòu)化文本信息進(jìn)行解析和挖掘,將文本中的關(guān)鍵信息數(shù)據(jù)化,與傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)結(jié)合分析,作出具有前瞻性、實(shí)用性的成果。利用大數(shù)據(jù)和人工智能與銀行業(yè)務(wù)相結(jié)合的應(yīng)用,提高非現(xiàn)場(chǎng)審計(jì)中風(fēng)險(xiǎn)預(yù)警工作效率和業(yè)務(wù)洞察力。
本項(xiàng)目需運(yùn)用自然語言處理技術(shù)對(duì)客戶評(píng)級(jí)環(huán)節(jié)的審批意見、授信環(huán)節(jié)的審批意見和調(diào)查報(bào)告、授信環(huán)節(jié)額度或利率歷次調(diào)整(個(gè)別業(yè)務(wù)會(huì)有要素調(diào)整)的會(huì)簽意見和調(diào)查報(bào)告、用信環(huán)節(jié)的審批意見和調(diào)查報(bào)告進(jìn)行解析,從而進(jìn)一步落實(shí)審批意見。
(一)業(yè)務(wù)需求
1.授信審批意見和調(diào)查報(bào)告語義解析。解析NJ銀行授信業(yè)務(wù)流程,自動(dòng)批量采集并展現(xiàn)NJ銀行尚未結(jié)清的所有授信業(yè)務(wù)每個(gè)環(huán)節(jié)的審批意見和調(diào)查報(bào)告等。運(yùn)用自然語言處理技術(shù)解析客戶評(píng)級(jí)環(huán)節(jié)的審批意見、授信環(huán)節(jié)的審批意見和調(diào)查報(bào)告、授信環(huán)節(jié)額度或利率歷次調(diào)整的會(huì)簽意見和調(diào)查報(bào)告,用信環(huán)節(jié)的審批意見和調(diào)查報(bào)告,解析出業(yè)務(wù)要素等關(guān)注點(diǎn)(如業(yè)務(wù)品種、申請(qǐng)金額等),如表1所示。
2.對(duì)比和核驗(yàn)。利用豐富的語料庫,結(jié)合深度學(xué)習(xí)平臺(tái),從NJ銀行存量及新增審批意見和調(diào)查報(bào)告中解析出重點(diǎn)關(guān)注點(diǎn)并進(jìn)一步結(jié)構(gòu)化,提供與授信業(yè)務(wù)中業(yè)務(wù)要素進(jìn)行對(duì)比、核驗(yàn)的依據(jù),對(duì)比與核驗(yàn)的要素主要包括業(yè)務(wù)品種、額度等。對(duì)比與核驗(yàn)主要包括三部分:一是用信環(huán)節(jié)是否突破授信環(huán)節(jié)(如有授信額度的要素調(diào)整環(huán)節(jié),以調(diào)整后的為準(zhǔn))的限制。二是用信環(huán)節(jié)解析出的要素與信貸系統(tǒng)中記錄實(shí)際發(fā)生的放款環(huán)節(jié)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行對(duì)比和核驗(yàn)。三是客戶評(píng)級(jí)環(huán)節(jié)、授信環(huán)節(jié)、授信要素調(diào)整環(huán)節(jié)、用信環(huán)節(jié)等解析出的業(yè)務(wù)要素等關(guān)注點(diǎn)與各自環(huán)節(jié)內(nèi)信貸系統(tǒng)存在的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行對(duì)比和核驗(yàn)。
將上述解析出的業(yè)務(wù)要素等關(guān)注點(diǎn),形成結(jié)構(gòu)化數(shù)據(jù),傳送至操作型數(shù)據(jù)存儲(chǔ),輔助完成對(duì)審批意見和調(diào)查報(bào)告落實(shí)情況的檢查,進(jìn)一步拓展應(yīng)用范圍。通過整合NJ銀行內(nèi)外部數(shù)據(jù),構(gòu)建支撐各類應(yīng)用的語義實(shí)體庫,提供智能、靈活的交互式圖譜分析解決方案。在解析過程中,幫助NJ銀行完成授信業(yè)務(wù)語料庫(業(yè)務(wù)要素等關(guān)注點(diǎn))的智能積累,實(shí)現(xiàn)系統(tǒng)深度學(xué)習(xí),不斷調(diào)優(yōu),推動(dòng)授信風(fēng)險(xiǎn)管理的智能化。
(二)系統(tǒng)實(shí)現(xiàn)
基于自然語言處理技術(shù)的內(nèi)部審計(jì)風(fēng)險(xiǎn)預(yù)警框架所開發(fā)的應(yīng)用系統(tǒng)采用B/S架構(gòu)(即Browser/Server,瀏覽器/服務(wù)器),兼容性強(qiáng)。軟件方面采用主流語言和數(shù)據(jù)庫Java、Hadoop、ArangoDB、MySQL、Elastic Search等,硬件方面采用3臺(tái)數(shù)據(jù)庫服務(wù)器、1臺(tái)Web服務(wù)器、1臺(tái)自然語言解析與核驗(yàn)服務(wù)器。系統(tǒng)每日從操作型數(shù)據(jù)存儲(chǔ)中提取數(shù)據(jù),經(jīng)自然語言處理要素解析與核驗(yàn)后,形成授信業(yè)務(wù)風(fēng)險(xiǎn)記錄輸出,系統(tǒng)詳細(xì)架構(gòu)如圖3所示。
(三)應(yīng)用成效
NJ銀行運(yùn)用基于自然語言處理技術(shù),每日處理公司客戶約10,000戶,未結(jié)清授信業(yè)務(wù)約50,000筆,在授信環(huán)節(jié)核驗(yàn)方面發(fā)現(xiàn)風(fēng)險(xiǎn)記錄約300條,在授信調(diào)整環(huán)節(jié)核驗(yàn)方面發(fā)現(xiàn)風(fēng)險(xiǎn)記錄約50條,在用信環(huán)節(jié)核驗(yàn)方面發(fā)現(xiàn)風(fēng)險(xiǎn)記錄約3500條,用信環(huán)節(jié)是否突存授信環(huán)節(jié)核驗(yàn)方面發(fā)現(xiàn)風(fēng)險(xiǎn)記錄約830條,放款環(huán)節(jié)與用信環(huán)節(jié)核驗(yàn)方面發(fā)現(xiàn)風(fēng)險(xiǎn)記錄約3600條,可見授信業(yè)務(wù)用信環(huán)節(jié)是內(nèi)部審計(jì)需重點(diǎn)關(guān)注的方向,是貸后管理的重要參考。
通過智能審計(jì)系統(tǒng)分發(fā)給各分行進(jìn)行非現(xiàn)場(chǎng)審計(jì)核實(shí)查證,經(jīng)內(nèi)部審計(jì)人員比對(duì)授信業(yè)務(wù)系統(tǒng)中的審批意見與執(zhí)行信息,核實(shí)確認(rèn)兩者不一致的風(fēng)險(xiǎn)記錄,發(fā)現(xiàn)了主要問題,充分發(fā)揮了運(yùn)用自然語言處理技術(shù)進(jìn)行內(nèi)部審計(jì)風(fēng)險(xiǎn)預(yù)警的效果。
(作者單位:南京銀行,郵政編碼:210008,電子郵箱:lim9@njcb.com.cn)
主要參考文獻(xiàn)
李生.自然語言處理的研究與發(fā)展[J].燕山大學(xué)學(xué)報(bào), 2013(5):377-384
林奕歐,雷航,李曉瑜等.自然語言處理中的深度學(xué)習(xí):方法及應(yīng)用[J].電子科技大學(xué)學(xué)報(bào), 2017(6):913-919
魯愛民,盂志青.審計(jì)預(yù)警系統(tǒng)的構(gòu)建研究[J].會(huì)計(jì)之友, 2012(29):91-98
生麗英.企業(yè)風(fēng)險(xiǎn)的內(nèi)部審計(jì)預(yù)警機(jī)制研究:基于大數(shù)據(jù)與ANN模型的應(yīng)用[J].中國內(nèi)部審計(jì), 2017(9):12-18
武慕汐,馮淑霞.關(guān)于構(gòu)建政府審計(jì)預(yù)警機(jī)制的思考[J].經(jīng)濟(jì)師, 2017(8):160-161