王彥博 施京華 張軍
隨著計(jì)算機(jī)信息科技的迅猛發(fā)展,大量的銀行業(yè)務(wù)數(shù)據(jù)以電子信息形式存儲(chǔ)于銀行的數(shù)據(jù)庫(kù)系統(tǒng)中,為大數(shù)據(jù)技術(shù)在商業(yè)銀行審計(jì)業(yè)務(wù)中的應(yīng)用提供了豐富的素材。然而,商業(yè)銀行業(yè)務(wù)領(lǐng)域具有客戶(hù)數(shù)眾多、數(shù)據(jù)量龐大、產(chǎn)品服務(wù)個(gè)性化、操作處理批量化、未來(lái)業(yè)務(wù)發(fā)展不確定性高等特點(diǎn),如何從浩瀚的審計(jì)對(duì)象中有效地發(fā)現(xiàn)實(shí)質(zhì)性違規(guī)與風(fēng)險(xiǎn)是商業(yè)銀行審計(jì)工作必須攻克的難題。在現(xiàn)有審計(jì)人力資源有限的情況下,完全依靠現(xiàn)場(chǎng)審計(jì)不現(xiàn)實(shí),銀行需要運(yùn)用先進(jìn)的信息科技手段推進(jìn)非現(xiàn)場(chǎng)審計(jì),以達(dá)到業(yè)務(wù)“全方位、全覆蓋”檢查的審計(jì)目標(biāo),為此“大數(shù)據(jù)審計(jì)”應(yīng)運(yùn)而生。發(fā)展大數(shù)據(jù)審計(jì)因此成為了商業(yè)銀行審計(jì)工作的必然趨勢(shì)。
商業(yè)銀行大數(shù)據(jù)審計(jì)是銀行合規(guī)內(nèi)控的重要技術(shù)手段,其主要目標(biāo)是依托銀行內(nèi)部數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市等大數(shù)據(jù)綜合平臺(tái),在大量錯(cuò)綜復(fù)雜的銀行業(yè)務(wù)數(shù)據(jù)中抽絲剝繭、追根溯源,穿透式地發(fā)現(xiàn)隱藏在海量數(shù)據(jù)背后的業(yè)務(wù)違規(guī)與風(fēng)險(xiǎn)狀況。其核心思想是通過(guò)構(gòu)建一個(gè)用以衡量審計(jì)對(duì)象在審計(jì)期內(nèi)業(yè)務(wù)數(shù)據(jù)是否存在異常的標(biāo)準(zhǔn),從而支持對(duì)非現(xiàn)場(chǎng)審計(jì)任務(wù)的狀態(tài)進(jìn)行標(biāo)記,必要時(shí)觸發(fā)預(yù)警,為現(xiàn)場(chǎng)審計(jì)人員后續(xù)有的放矢的深入查找問(wèn)題所在提供依據(jù)。
然而,在商業(yè)銀行具體內(nèi)部審計(jì)工作中,審計(jì)任務(wù)門(mén)類(lèi)眾多,審計(jì)應(yīng)用數(shù)量龐大,如何構(gòu)建一套大數(shù)據(jù)審計(jì)應(yīng)用模式體系,支持對(duì)各項(xiàng)審計(jì)任務(wù)進(jìn)行有效管理,已經(jīng)成為了對(duì)當(dāng)下銀行內(nèi)部審計(jì)核心課題之一。本文著重從“衡量標(biāo)準(zhǔn)”入手,探索提出商業(yè)銀行大數(shù)據(jù)審計(jì)的“5S”應(yīng)用模式框架體系,并以國(guó)內(nèi)某商業(yè)銀行為例進(jìn)行大數(shù)據(jù)審計(jì)案例研究,展現(xiàn)在“5S”框架下商業(yè)銀行大數(shù)據(jù)審計(jì)應(yīng)用實(shí)踐效果。
商業(yè)銀行大數(shù)據(jù)審計(jì)應(yīng)用模式體系
在大數(shù)據(jù)審計(jì)工作中,審計(jì)人員對(duì)存儲(chǔ)于計(jì)算機(jī)信息系統(tǒng)中以電子數(shù)據(jù)形式所反映的企業(yè)經(jīng)濟(jì)業(yè)務(wù)進(jìn)行審查,通過(guò)數(shù)據(jù)分析技術(shù)手段把握審計(jì)重點(diǎn),收集審計(jì)證據(jù),實(shí)現(xiàn)審計(jì)目標(biāo)。其中,最為關(guān)鍵的技術(shù)點(diǎn)是構(gòu)建一個(gè)用以衡量審計(jì)對(duì)象在審計(jì)期內(nèi)業(yè)務(wù)數(shù)據(jù)是否存在異常的標(biāo)準(zhǔn),而該標(biāo)準(zhǔn)往往是一種知識(shí)模型(Knowledge?Model)。通過(guò)對(duì)國(guó)內(nèi)某商業(yè)銀行過(guò)往非現(xiàn)場(chǎng)審計(jì)任務(wù)進(jìn)行歸納整理,相關(guān)知識(shí)模型主要分為五類(lèi):
Specialist?Knowledge?Model,即基于專(zhuān)家經(jīng)驗(yàn)知識(shí)的審計(jì)模型。該類(lèi)標(biāo)準(zhǔn)主要依賴(lài)審計(jì)專(zhuān)家的業(yè)務(wù)經(jīng)驗(yàn)知識(shí),相關(guān)模型是基于“業(yè)務(wù)邏輯驅(qū)動(dòng)”的,尤其在大數(shù)據(jù)時(shí)代到來(lái)之前或相關(guān)業(yè)務(wù)領(lǐng)域無(wú)法采集到充足的過(guò)往數(shù)據(jù)以支持建模時(shí),開(kāi)展非現(xiàn)場(chǎng)審計(jì)則主要運(yùn)用該類(lèi)模型方法形成比照標(biāo)準(zhǔn);當(dāng)涉及多名專(zhuān)家共同貢獻(xiàn)經(jīng)驗(yàn)知識(shí)時(shí),可采用頭腦風(fēng)暴法、德?tīng)柗品ǖ染唧w操作方法予以實(shí)現(xiàn);
Static?Knowledge?Model,即基于靜態(tài)知識(shí)的審計(jì)模型。不同于“專(zhuān)家經(jīng)驗(yàn)知識(shí)模型”,該類(lèi)標(biāo)準(zhǔn)是純粹基于“數(shù)據(jù)邏輯驅(qū)動(dòng)”的,通過(guò)過(guò)往大量數(shù)據(jù)經(jīng)驗(yàn)形成靜態(tài)數(shù)學(xué)公式化模型,模型一旦形成將不再改變,并上升為通用知識(shí)定律;該類(lèi)標(biāo)準(zhǔn)中,經(jīng)典模型包括Benford定律、二八定律黃金法則等;
Statistical?Knowledge?Model,即基于統(tǒng)計(jì)分析的審計(jì)模型。該類(lèi)標(biāo)準(zhǔn)是以“數(shù)據(jù)邏輯驅(qū)動(dòng)”為主的,同時(shí)也涉及一定的“業(yè)務(wù)邏輯”,通過(guò)采集過(guò)往相關(guān)業(yè)務(wù)數(shù)據(jù),綜合運(yùn)用概率論、計(jì)量方法、假設(shè)檢驗(yàn)等統(tǒng)計(jì)分析技術(shù),形成模型化比照標(biāo)準(zhǔn),相關(guān)模型隨輸入數(shù)據(jù)的變化而發(fā)生變化;典型的統(tǒng)計(jì)分析方法包括遷徙分析模型、馬爾可夫模型等;
Smart?Knowledge?Model,即基于智能分析的審計(jì)模型。該類(lèi)標(biāo)準(zhǔn)與“統(tǒng)計(jì)分析知識(shí)模型”相近,但其模型化標(biāo)準(zhǔn)生成方式從以傳統(tǒng)統(tǒng)計(jì)技術(shù)為主,發(fā)展成為以大數(shù)據(jù)挖掘及機(jī)器學(xué)習(xí)、人工智能技術(shù)為主;典型的建模方法包括有監(jiān)督分類(lèi)學(xué)習(xí)、無(wú)監(jiān)督聚類(lèi)學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、深度學(xué)習(xí)、自然語(yǔ)言文本挖掘、社交網(wǎng)絡(luò)圖挖掘、關(guān)聯(lián)規(guī)則挖掘家族等。
Simulation?Knowledge?Model,即基于仿真模擬的審計(jì)模型。該類(lèi)標(biāo)準(zhǔn)是“數(shù)據(jù)邏輯驅(qū)動(dòng)”與“業(yè)務(wù)邏輯驅(qū)動(dòng)”相融合的,可以將其看作為“專(zhuān)家經(jīng)驗(yàn)知識(shí)模型”在大數(shù)據(jù)時(shí)代的拓展和延伸,其面向某些無(wú)法獲取充足過(guò)往數(shù)據(jù)支持智能建模的領(lǐng)域,通過(guò)有效的專(zhuān)家業(yè)務(wù)經(jīng)驗(yàn)應(yīng)用(及形式化驗(yàn)證)構(gòu)建準(zhǔn)確的業(yè)務(wù)流程,并通過(guò)對(duì)業(yè)務(wù)流程中關(guān)鍵節(jié)點(diǎn)進(jìn)行隨機(jī)化數(shù)據(jù)處理,以反復(fù)模擬的方式批量產(chǎn)生近似于真實(shí)的業(yè)務(wù)數(shù)據(jù),并輔以“統(tǒng)計(jì)分析知識(shí)模型”或“智能分析知識(shí)模型”,生成比照標(biāo)準(zhǔn);典型的技術(shù)方法包括壓力測(cè)試、沙盤(pán)推演、多元代理模型與模擬等。
商業(yè)銀行大數(shù)據(jù)審計(jì)應(yīng)用實(shí)踐研究
專(zhuān)家經(jīng)驗(yàn)知識(shí)模型化標(biāo)準(zhǔn)應(yīng)用實(shí)踐
“專(zhuān)家經(jīng)驗(yàn)知識(shí)模型化標(biāo)準(zhǔn)”主要應(yīng)用于“商業(yè)銀行宏觀風(fēng)險(xiǎn)把控”、“以風(fēng)險(xiǎn)為導(dǎo)向的銀行業(yè)務(wù)審計(jì)”等方面。例如,獲取經(jīng)營(yíng)機(jī)構(gòu)各時(shí)間點(diǎn)的業(yè)務(wù)和財(cái)務(wù)數(shù)據(jù),分析其當(dāng)年的業(yè)務(wù)狀況和發(fā)展趨勢(shì),根據(jù)以往經(jīng)驗(yàn),快速增長(zhǎng)點(diǎn)往往會(huì)存在風(fēng)險(xiǎn)管理跟不上業(yè)務(wù)發(fā)展的狀況,如制度不健全、管理手段粗放、重量輕質(zhì)等問(wèn)題,故直接憑業(yè)務(wù)經(jīng)驗(yàn)形成比照規(guī)則以明確審計(jì)重點(diǎn)。具體來(lái)看,某些分行小微貸款余額在2012、2013年大幅攀升,根據(jù)經(jīng)驗(yàn)其中后臺(tái)人員數(shù)量應(yīng)按比例有所提升,然而業(yè)務(wù)數(shù)據(jù)顯示其中后臺(tái)人員數(shù)量保持不變甚至減少,與經(jīng)驗(yàn)標(biāo)準(zhǔn)存有差異,由此判斷該期間發(fā)放的貸款更易隱含風(fēng)險(xiǎn),事實(shí)數(shù)據(jù)表明相關(guān)貸款業(yè)務(wù)在日后出現(xiàn)了風(fēng)險(xiǎn)集中爆發(fā)。
更進(jìn)一步,在以風(fēng)險(xiǎn)為導(dǎo)向的零售業(yè)務(wù)審計(jì)工作中,“預(yù)先提出存在風(fēng)險(xiǎn)隱患的業(yè)務(wù)模式”是該項(xiàng)工作的核心。審計(jì)人員通過(guò)充分利用銀行內(nèi)部數(shù)據(jù)倉(cāng)庫(kù)的現(xiàn)有數(shù)據(jù)資源,設(shè)計(jì)了多種經(jīng)驗(yàn)數(shù)據(jù)模型,如客戶(hù)基本信息、客戶(hù)工商登記信息、資金流水信息、授信評(píng)審信息、臺(tái)賬信息等共計(jì)五大類(lèi)、二十多種經(jīng)驗(yàn)數(shù)據(jù)模型,有效識(shí)別了客戶(hù)異常流水交易、零售貸款資金挪用或流入股市、假批量和假小微、飛單、股東分拆授信、多通道授信、貸款資金回流和員工舞弊等多種業(yè)務(wù)風(fēng)險(xiǎn)。以工商登記信息為例,根據(jù)專(zhuān)家經(jīng)驗(yàn),小微客戶(hù)無(wú)工商登記信息或已全部處于注銷(xiāo)狀態(tài)、小微客戶(hù)投資房地產(chǎn)/小貸公司/擔(dān)保公司/典當(dāng)?shù)雀叨让舾行袠I(yè)、小微客戶(hù)名下?lián)碛羞^(guò)多不同行業(yè)的企業(yè)、小微客戶(hù)名下企業(yè)的注冊(cè)資本不符合小微企業(yè)特性、小微客戶(hù)在多地開(kāi)辦企業(yè)、同一分行多名借款人存在用款主體之外的關(guān)聯(lián)關(guān)系等均可作為業(yè)務(wù)風(fēng)險(xiǎn)線(xiàn)索。
靜態(tài)知識(shí)模型化標(biāo)準(zhǔn)應(yīng)用實(shí)踐
在“靜態(tài)知識(shí)模型化標(biāo)準(zhǔn)”應(yīng)用方面,筆者以Benford定律為例,介紹其原理及使用方法,并依托銀行審計(jì)業(yè)務(wù)實(shí)際,展示其應(yīng)用實(shí)踐情況。
發(fā)現(xiàn)Benford定律
自然界的眾多事物在多種因素影響下隨機(jī)發(fā)生,往往會(huì)呈現(xiàn)某種特定規(guī)律。Benford定律則反映了數(shù)字出現(xiàn)頻率上的一種內(nèi)在規(guī)律,簡(jiǎn)而言之,是指所有自然隨機(jī)變量,只要樣本空間足夠大,每一樣本首位數(shù)字為“1”至“9”各數(shù)字的概率在一定范圍內(nèi)具有穩(wěn)定性。該現(xiàn)象由美國(guó)天文學(xué)家西蒙·紐康伯在1881年首次發(fā)現(xiàn)。他在偶然間發(fā)現(xiàn)圖書(shū)館中對(duì)包含以“1”起首的數(shù)字的前幾頁(yè)較其它頁(yè)破爛,經(jīng)過(guò)對(duì)其他隨機(jī)數(shù)據(jù)的進(jìn)一步分析,他得出如下結(jié)論:以“1”為第一位數(shù)字的隨機(jī)數(shù)比以“2”為第一位數(shù)字的隨機(jī)數(shù)出現(xiàn)的概率要大,而以“2”為第一位數(shù)字的隨機(jī)數(shù)出現(xiàn)的概率則大于以“3”為第一位數(shù)字的隨機(jī)數(shù)出現(xiàn)概率,?以此類(lèi)推。1938年,美國(guó)物理學(xué)家法蘭克·本福特重新發(fā)現(xiàn)了這個(gè)現(xiàn)象,并收集了很多數(shù)據(jù)進(jìn)行分析來(lái)驗(yàn)證這一規(guī)律,他發(fā)現(xiàn)各種完全不相同的數(shù)據(jù),比如人口、物理和化學(xué)常數(shù)、棒球統(tǒng)計(jì)表等數(shù)字均符合這一定律。根據(jù)該定律可以計(jì)算出“1”至“9”各數(shù)字出現(xiàn)的概率,結(jié)果見(jiàn)表1。
Benford定律在銀行業(yè)中的應(yīng)用
Benford定律反映了數(shù)據(jù)中的一種通用知識(shí)規(guī)律,當(dāng)數(shù)字被有意識(shí)地操控以達(dá)到某種目的時(shí),這種客觀規(guī)律將會(huì)被破壞,并出現(xiàn)異常。通過(guò)發(fā)現(xiàn)和分析這種異常,則有可能追蹤舞弊行為,?又由于Benford定律的使用無(wú)需其他先驗(yàn)信息(本文稱(chēng)其為“靜態(tài)知識(shí)模型”),其使用方法簡(jiǎn)單明了,因此多被用于審查數(shù)據(jù)準(zhǔn)確性以及數(shù)據(jù)背后行為的合理性。這兩點(diǎn)正是銀行業(yè)關(guān)注的重點(diǎn),因此Benford定律在銀行業(yè)已有諸多應(yīng)用,如檢查財(cái)務(wù)數(shù)字信息是否真實(shí)、發(fā)現(xiàn)信用卡套現(xiàn)商戶(hù)等。
綜合已有的研究成果發(fā)現(xiàn),數(shù)據(jù)符合以下條件即能夠使用Benford定律來(lái)進(jìn)行數(shù)值分析:(1)數(shù)據(jù)不能是規(guī)律排序的,比如交易流水號(hào)、銀行卡號(hào)等,即數(shù)值不存在間斷或間斷區(qū)間,而是在一個(gè)寬幅范圍內(nèi)連續(xù)變動(dòng),不存在上下限;(2)數(shù)據(jù)不能經(jīng)過(guò)人為修飾,即數(shù)值的形成受多種因素的影響,不能過(guò)度集中也不能完全隨機(jī)。從銀行數(shù)據(jù)的角度看,商戶(hù)交易流水、個(gè)人交易流水的交易金額,甚至各公司的財(cái)務(wù)報(bào)表均基本符合Benford?定律的應(yīng)用條件。換言之,若相關(guān)數(shù)據(jù)違背Benford定律檢驗(yàn)標(biāo)準(zhǔn),則可視為異常信號(hào),需作為疑點(diǎn)數(shù)據(jù)進(jìn)行深入審計(jì)分析。
應(yīng)用案例實(shí)證分析
為識(shí)別國(guó)內(nèi)某商業(yè)銀行某一特定客戶(hù)群體的高風(fēng)險(xiǎn)性資金往來(lái),使用SQL語(yǔ)言從企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)中提取審計(jì)期內(nèi)流水?dāng)?shù)據(jù)268,731條,涉及36,596個(gè)賬戶(hù),進(jìn)行Benford定律分析。在數(shù)據(jù)理解和數(shù)據(jù)準(zhǔn)備階段,忽略流水?dāng)?shù)據(jù)具體金額,只摘取流水發(fā)生金額的首位數(shù)字,若金額為小于1的小數(shù),則首位數(shù)字記為“0”。隨后統(tǒng)計(jì)各賬戶(hù)從“0”至“9”的首位數(shù)字出現(xiàn)次數(shù)占總流水次數(shù)的比例。
在數(shù)據(jù)分析階段,統(tǒng)計(jì)學(xué)中經(jīng)常使用Pearson相關(guān)系數(shù)r來(lái)評(píng)估兩個(gè)變量之間的密切程度。若r大于0,則代表兩個(gè)變量為正相關(guān),且數(shù)值越接近1,正相關(guān)越強(qiáng)。為評(píng)價(jià)每一個(gè)賬戶(hù)的流水與Benford定律的符合程度,本研究使用相關(guān)性系數(shù)予以定量計(jì)算。經(jīng)計(jì)算,64.69%的賬戶(hù)其流水與Benford定律的相關(guān)系數(shù)≥0.8,?呈現(xiàn)強(qiáng)相關(guān)關(guān)系,可見(jiàn)賬戶(hù)的流水基本符合Benford定律。
為縮小疑點(diǎn)數(shù)據(jù)范圍和提高疑點(diǎn)數(shù)據(jù)命中度,本研究重點(diǎn)分析流水次數(shù)≥500的賬戶(hù),共計(jì)964個(gè),然后按相關(guān)系數(shù)r升序排序,關(guān)注排名前十的賬戶(hù)。通過(guò)查詢(xún)交易金額、交易品種、交易對(duì)手、交易對(duì)手所在單位等信息對(duì)這些客戶(hù)進(jìn)行補(bǔ)充信息分析。據(jù)排查,有五個(gè)賬戶(hù)的交易對(duì)手多為客戶(hù)所在單位的內(nèi)部人員,?故認(rèn)為是正常的內(nèi)部資金往來(lái),排除嫌疑;有三個(gè)賬戶(hù)的異常流水多為正常消費(fèi)類(lèi),且金額較小,基本排除嫌疑;發(fā)現(xiàn)兩個(gè)賬戶(hù)的交易對(duì)手多至幾十位,且均非單位內(nèi)部人員,金額多為幾十萬(wàn)至一百萬(wàn)不等,并且流水次數(shù)頻繁,經(jīng)查,這兩個(gè)賬戶(hù)與融資擔(dān)保公司資金往來(lái)頻繁,視為可疑。可見(jiàn),Benford定律能夠從幾十萬(wàn)條數(shù)據(jù)中有效識(shí)別包含認(rèn)為操縱的非自然流水,迅速定位疑點(diǎn)數(shù)據(jù)供后續(xù)人工驗(yàn)證分析,減少了大量人力資源投入。未來(lái)其他相關(guān)應(yīng)用還包括識(shí)別非法商戶(hù)、資金掮客等。
統(tǒng)計(jì)分析知識(shí)模型化標(biāo)準(zhǔn)應(yīng)用實(shí)踐
在“統(tǒng)計(jì)分析知識(shí)模型化標(biāo)準(zhǔn)”應(yīng)用方面,筆者通過(guò)構(gòu)建“不良遷徙分析模型”和“馬爾可夫模型”,來(lái)預(yù)測(cè)某商業(yè)銀行小微金融弱擔(dān)保貸款管控后的風(fēng)險(xiǎn)度(不良率)以及自然風(fēng)險(xiǎn)度,并借這兩個(gè)模型對(duì)該商業(yè)銀行華東區(qū)域各家分行的小微弱擔(dān)保貸款的風(fēng)險(xiǎn)狀況進(jìn)行評(píng)估比較。
應(yīng)用背景
貸款的風(fēng)險(xiǎn)可分兩個(gè)層面來(lái)看:一是貸款的自身質(zhì)量,即客戶(hù)通過(guò)銀行準(zhǔn)入門(mén)檻、排除銀行后續(xù)風(fēng)險(xiǎn)管理手段后,貸款所呈現(xiàn)的自然不良率;二是目前常用的不良率指標(biāo),即銀行通過(guò)自身的風(fēng)險(xiǎn)管理能力以及代償、核銷(xiāo)、打包轉(zhuǎn)讓等一系列措施,對(duì)貸款風(fēng)險(xiǎn)度進(jìn)行管控后的結(jié)果。對(duì)于銀行而言,貸款的自身質(zhì)量很大程度上決定了銀行的信貸質(zhì)量。在小微金融弱擔(dān)保貸款中,?由于銀行對(duì)于小微弱擔(dān)保客戶(hù)的風(fēng)險(xiǎn)控制缺乏有效抓手,因此貸款自身質(zhì)量更是尤為重要了,也就是獲得貸款自然風(fēng)險(xiǎn)度的量化值。另一方面,不良率往往是對(duì)以往數(shù)據(jù)情況的反映,有效預(yù)測(cè)未來(lái)不良率也一直是銀行精細(xì)化管理的訴求。
基于遷徙分析模型的不良預(yù)測(cè)
根據(jù)銀行五級(jí)分類(lèi)政策,擔(dān)保類(lèi)貸款逾期90天以上為不良。以30天為周期,將未逾期貸款的狀態(tài)設(shè)為a、逾期1~30天的狀態(tài)為b、逾期31~60天的狀態(tài)為c、逾期61~90天的狀態(tài)為d、逾期91~120天的狀態(tài)為e,逾期120天以上的狀態(tài)為f。以一家分行為例,用2015年1月至2016年3月的每個(gè)月月末的數(shù)據(jù)計(jì)算出各個(gè)狀態(tài)之間的平均遷徙概率,分別可獲得a->b、b->c、c->d、d->e、e->f的概率,通過(guò)這幾個(gè)概率的乘積即可獲得從各個(gè)狀態(tài)轉(zhuǎn)向不良狀態(tài)的概率,如P(a->e)=?P(a->b)*P?(b->c)*P(c->d)*P(d->e)。再根據(jù)2016年3月末各家分行在各個(gè)狀態(tài)的余額,即可獲知這些余額最終轉(zhuǎn)為不良的金額,從而獲得不良率。最終,通過(guò)為每家分行建立“不良遷徙模型”,獲知各家分行的年末不良金額。此模型類(lèi)似于移動(dòng)平均的預(yù)測(cè)方法,將計(jì)算結(jié)果對(duì)比分行“一戶(hù)一策”排查所得的年末不良金額,模型結(jié)果基本可信。由于此模型使用了每個(gè)月末的余額數(shù)據(jù),這些數(shù)據(jù)是分行風(fēng)險(xiǎn)管理結(jié)果的體現(xiàn),故采取該模型的結(jié)果作為一個(gè)分析維度,即不良率這一定量指標(biāo)的預(yù)測(cè)結(jié)果。
基于馬爾可夫模型的不良預(yù)測(cè)
(1)馬爾可夫過(guò)程簡(jiǎn)介:馬爾可夫過(guò)程旨在描述這樣一類(lèi)隨機(jī)過(guò)程-即在已知過(guò)程現(xiàn)在狀態(tài)的條件下,過(guò)程將來(lái)的狀態(tài)與過(guò)去無(wú)關(guān),而只與當(dāng)前狀態(tài)有關(guān),即“無(wú)后效性”。
(2)模型前提條件:貸款的各個(gè)狀態(tài)之間的遷徙可視作為馬爾可夫過(guò)程,因此可使用該理論計(jì)算狀態(tài)之間的遷徙概率。
(3)減少分行風(fēng)險(xiǎn)管理措施干預(yù)的辦法:為盡量減少分行的風(fēng)險(xiǎn)管理手段對(duì)于貸款狀態(tài)轉(zhuǎn)移的干預(yù),從而獲得更貼近貸款的自然不良率,本模型避開(kāi)季末數(shù)據(jù),而使用某分行2016年1~?2月的小微金融弱擔(dān)保貸款計(jì)算一步轉(zhuǎn)移概率矩陣P。筆者認(rèn)為2016年1~2月的數(shù)據(jù)一方面更能反映審計(jì)期相近的貸款狀況,另一方面在年初時(shí)分行大部分風(fēng)險(xiǎn)管理精力投身于上一年的總結(jié)之中,對(duì)這期間的貸款管控較少。
(4)計(jì)算過(guò)程:因計(jì)算過(guò)程較為復(fù)雜,此處僅作簡(jiǎn)要描述。此模型從某分行2016年1月末的每個(gè)借據(jù)出發(fā),跟蹤其在2月末的狀態(tài),如狀態(tài)a可能仍為狀態(tài)a,也可進(jìn)入狀態(tài)b,或者直接結(jié)清(狀態(tài)g),狀態(tài)b則可能遷移至狀態(tài)a、狀態(tài)b、狀態(tài)c和狀態(tài)g。以此類(lèi)推,構(gòu)建一個(gè)7*7矩陣,通過(guò)矩陣運(yùn)算,最終獲得2016年3月末各個(gè)狀態(tài)的余額數(shù)據(jù)在2016年年末的情況。
通過(guò)以上模型設(shè)計(jì),盡量使這個(gè)模型不考慮結(jié)清貸款的續(xù)貸問(wèn)題、不考慮貸款敞口壓縮措施、也不考慮分行采取催清收、代償、核銷(xiāo)和資產(chǎn)轉(zhuǎn)讓等處理方法,而只是單純的計(jì)算各個(gè)借據(jù)在分行無(wú)風(fēng)險(xiǎn)管理的情況下自然遷徙概率,從而反映貸款自身的風(fēng)險(xiǎn)度。采取這個(gè)模型的結(jié)果作為另一個(gè)分析維度,即貸款自然風(fēng)險(xiǎn)度這一預(yù)測(cè)指標(biāo)。
模型結(jié)果應(yīng)用
以2016年3月末被觀測(cè)銀行華東區(qū)域小微金融弱擔(dān)保貸款余額為基礎(chǔ),經(jīng)“遷徙分析模型”不良預(yù)測(cè),得到預(yù)計(jì)至2016年末的相關(guān)不良余額A,即根據(jù)以往的平均遷徙概率得出的不良情況;經(jīng)“馬爾可夫模型”不良預(yù)測(cè),得到預(yù)計(jì)至2016年末的相關(guān)自然不良余額B,即貸款發(fā)生逾期后不采取任何催清收等管理措施的不良情況。
由“馬爾可夫模型”預(yù)測(cè)的自然不良余額B與由“遷徙分析模型”預(yù)測(cè)的不良余額A之剪刀差,反映了各家分行風(fēng)險(xiǎn)控制的難易程度。針對(duì)存量小微金融弱擔(dān)保授信業(yè)務(wù),華東區(qū)域中南京分行風(fēng)險(xiǎn)控制難度較大,這主要是由于南京分行目前存量小微金融弱擔(dān)保貸款余額偏高所致,其次是杭州、蘇州、寧波、合肥等幾家分行。
智能分析知識(shí)模型化標(biāo)準(zhǔn)應(yīng)用實(shí)踐
在“智能分析知識(shí)模型化標(biāo)準(zhǔn)”應(yīng)用方面,比較典型的應(yīng)用實(shí)踐包括:
違約預(yù)測(cè)模型:這是目前廣泛使用的貸前風(fēng)險(xiǎn)控制模型,通過(guò)納入具有貸后特點(diǎn)的屬性(如客戶(hù)的金融資產(chǎn)變化情況、交易流水中的借方/貸方筆數(shù)和金額、是否持有某些特定產(chǎn)品等),?使用邏輯回歸、樸素貝葉斯、決策樹(shù)、隨機(jī)森林、深度神經(jīng)網(wǎng)絡(luò)等有監(jiān)督分類(lèi)學(xué)習(xí)構(gòu)建違約預(yù)測(cè)模型,形成可與后續(xù)實(shí)際業(yè)務(wù)發(fā)展進(jìn)行比對(duì)的標(biāo)準(zhǔn),可助力于貸后管理及相關(guān)審計(jì)工作。
自然語(yǔ)言文本挖掘模型:筆者將相關(guān)技術(shù)運(yùn)用于2013年“小微金融風(fēng)險(xiǎn)管理”專(zhuān)項(xiàng)審計(jì)項(xiàng)目中,取得了良好實(shí)踐收效。在項(xiàng)目中,大數(shù)據(jù)技術(shù)人員利用中文分詞、詞頻統(tǒng)計(jì)、關(guān)鍵詞識(shí)別、主題提取、半監(jiān)督文本聚類(lèi)等自然語(yǔ)言文本挖掘技術(shù)方法,以小微金融不良責(zé)任認(rèn)定報(bào)告作為對(duì)象,從中快速挖掘、確定每一筆貸款的不良形成原因,并將不良形成原因按主題歸類(lèi),從而形成各類(lèi)不良形成原因的歷史數(shù)據(jù)統(tǒng)計(jì)指標(biāo),作為比對(duì)標(biāo)準(zhǔn)以支持發(fā)現(xiàn)后續(xù)業(yè)務(wù)中的異常情況。該項(xiàng)工作超出人力所及,充分展現(xiàn)了大數(shù)據(jù)智能技術(shù)的在審計(jì)工作中的增強(qiáng)效用。
小結(jié)
以大數(shù)據(jù)技術(shù)助力審計(jì)業(yè)務(wù)發(fā)現(xiàn)疑點(diǎn)數(shù)據(jù),審計(jì)人員可在千萬(wàn)條以上的海量數(shù)據(jù)中迅速發(fā)現(xiàn)風(fēng)險(xiǎn)線(xiàn)索,進(jìn)而采取數(shù)據(jù)詳查、抽調(diào)檔案、訪(fǎng)談客戶(hù)經(jīng)理和評(píng)審人員甚至下戶(hù)檢查等多種審計(jì)手段,從而發(fā)現(xiàn)實(shí)質(zhì)性風(fēng)險(xiǎn)。大數(shù)據(jù)審計(jì)為進(jìn)一步審計(jì)抽樣提供了精確制導(dǎo),再加上其他審計(jì)方法的有效配合,極大地增強(qiáng)了審計(jì)工作的效率和效果。
為將大數(shù)據(jù)審計(jì)的效果從定性認(rèn)識(shí)提升至定量評(píng)價(jià),實(shí)現(xiàn)審計(jì)工作的精細(xì)化管理,本研究開(kāi)展了對(duì)比試驗(yàn):對(duì)被觀測(cè)銀行某分行的零售業(yè)務(wù)審計(jì)采取非現(xiàn)場(chǎng)大數(shù)據(jù)審計(jì)為主、現(xiàn)場(chǎng)檢查為輔的工作方法,發(fā)現(xiàn)在保證審計(jì)質(zhì)量的前提下,人員數(shù)量下降30%、現(xiàn)場(chǎng)檢查時(shí)間壓縮50%、差旅費(fèi)用節(jié)省75%(見(jiàn)表2)。大數(shù)據(jù)審計(jì)節(jié)能增效的作用可見(jiàn)一斑。目前,大數(shù)據(jù)審計(jì)已在被觀測(cè)銀行零售專(zhuān)項(xiàng)審計(jì)中廣泛應(yīng)用于十余家分行的審計(jì)過(guò)程,應(yīng)用效果顯著。
結(jié)語(yǔ)
大數(shù)據(jù)時(shí)代為商業(yè)銀行審計(jì)工作帶來(lái)了新的發(fā)展機(jī)遇,激發(fā)了非現(xiàn)場(chǎng)審計(jì)領(lǐng)域的大數(shù)據(jù)智能化發(fā)展,同時(shí)也帶來(lái)了管理上的新挑戰(zhàn)-若不能構(gòu)建出一套大數(shù)據(jù)審計(jì)應(yīng)用模式體系,則難以對(duì)門(mén)類(lèi)眾多、數(shù)量龐大的大數(shù)據(jù)審計(jì)應(yīng)用進(jìn)行有效的管理、協(xié)調(diào)相關(guān)的資源。本文從衡量審計(jì)對(duì)象在審計(jì)期內(nèi)業(yè)務(wù)數(shù)據(jù)是否異常的模型化標(biāo)準(zhǔn)入手,為大數(shù)據(jù)審計(jì)應(yīng)用提出了“5S”應(yīng)用框架,基于“業(yè)務(wù)邏輯驅(qū)動(dòng)?vs.?數(shù)據(jù)邏輯驅(qū)動(dòng)”、“通用靜態(tài)模型?vs.?專(zhuān)用動(dòng)態(tài)模型”、“經(jīng)典數(shù)理統(tǒng)計(jì)?vs.?數(shù)據(jù)智能仿真”等方面,闡述了相關(guān)模型化標(biāo)準(zhǔn)從專(zhuān)家經(jīng)驗(yàn)(Specialist?Knowledge)向靜態(tài)定律(Static?Knowledge)向統(tǒng)計(jì)分析(Statistical?Knowledge)向智能分析(Smart?Knowledge)再向仿真模擬(Simulation?Knowledge)演化發(fā)展。
通過(guò)以國(guó)內(nèi)某商業(yè)銀行的實(shí)際審計(jì)業(yè)務(wù)為例,展開(kāi)案例研究,本文闡述了前四類(lèi)模型化標(biāo)準(zhǔn)的應(yīng)用實(shí)踐情況,并通過(guò)開(kāi)展對(duì)比組試驗(yàn)反映出大數(shù)據(jù)審計(jì)應(yīng)用在商業(yè)銀行節(jié)能增效方面的顯著效果。在大數(shù)據(jù)挖掘與人工智能技術(shù)發(fā)展日益精進(jìn)的時(shí)代,依靠大數(shù)據(jù)智能模型來(lái)分析和預(yù)測(cè)各事物的發(fā)展趨勢(shì)已是被普遍認(rèn)可的方法,筆者認(rèn)為銀行有必要引入更多、更強(qiáng)的數(shù)據(jù)預(yù)測(cè)模型,與定性方法相輔相成,有利于提升銀行審計(jì)能力以及全面精細(xì)化管理程度。此外,未來(lái)研究還將聚焦探索基于仿真模擬的模型化審計(jì)標(biāo)準(zhǔn)應(yīng)用。
(本文僅代表個(gè)人學(xué)術(shù)觀點(diǎn),不代表供職單位意見(jiàn))
(作者單位:對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)金融科技研究中心、中國(guó)民生銀行)