基于代價敏感學習的財務造假識別研究

2022-03-09 06:35:14宋海濤

財會研究 2022年2期

■/ 張悅宋海濤

一、引言

財務造假是一個長期困擾市場發(fā)展的世界性問題，放眼國內(nèi)外，安然、世通、泰科等商業(yè)巨擘轟然倒塌，藍田股份、銀廣夏等商業(yè)神話陸續(xù)破滅。由于我國證券市場發(fā)展時間相對較短，近幾年財務造假現(xiàn)狀愈發(fā)嚴峻，不斷有上市公司前赴后繼：樂視IPO 造假、瑞幸被渾水公司做空而后退市、康美連續(xù)三年造假，等等。財務造假不僅損害投資者切身利益，還對市場發(fā)展產(chǎn)生無法磨滅的深遠負面影響。然而隨著財務造假的加劇，審計、法務會計、舞弊審查師等專業(yè)人員受時間、精力、成本等限制逐漸無法滿足監(jiān)管需要，以機器學習與深度學習為主的數(shù)據(jù)挖掘技術(shù)為財務造假識別提供了有力的幫助。財務造假識別是一個典型數(shù)據(jù)不平衡問題，同時具有嚴重的代價敏感性，盡管發(fā)生概率相對較小但造成的損失極大。

現(xiàn)實世界的數(shù)據(jù)往往呈現(xiàn)長尾分布，數(shù)據(jù)分布空間存在偏斜，不同類別的數(shù)據(jù)存在數(shù)量級的差異，盡管財務造假公司數(shù)量攀升，但相對于龐大的上市公司基數(shù)仍舊是小樣本，這就是數(shù)據(jù)不平衡（Data imbalance）。另一方面，遵循著“二八定律”，少數(shù)類數(shù)據(jù)往往包含著更重要的信息，在財務造假識別上漏報成本遠遠高于錯報成本，這種誤分類成本的不同引發(fā)了代價敏感性問題（Cost sensitivity）。目前機器學習和深度學習的標準算法研究大多基于類分布平衡或誤分類成本相同假設，即認為數(shù)據(jù)集中的各類樣本無顯著差異，這將導致學習會因偏向數(shù)量多的類別而在財務造假識別的應用上效率低下甚至失效。

本文針對財務造假識別的數(shù)據(jù)不平衡與代價敏感性，首先構(gòu)建代價敏感決策樹作為財務造假識別模型，接著根據(jù)舞弊成因理論選擇特征指標，再以2015年我國上市公司作為研究對象進行對比實驗，以驗證代價敏感學習模型的有效性，并通過對比實驗結(jié)果的分析輸出財務造假識別路徑。

二、文獻綜述

在機器學習與深度學習中，數(shù)據(jù)不平衡和代價敏感性是阻礙分類性能的巨大挑戰(zhàn)，其技術(shù)解決取決于三個因素：數(shù)據(jù)分布、分類器的選擇和性能測量方法，對應著數(shù)據(jù)層、算法層、評估層方法。數(shù)據(jù)層面是在預處理階段對數(shù)據(jù)集進行平衡，主要采用重采樣技術(shù)，包括以SMOTE、Borderline-SMOTE、ADASYN、MWMOTE、DBCSMOTE 為代表的過采樣，及以NearMiss、ENN、CNN、CBO 為代表的欠采樣。算法層面以代價敏感學習為代表，主要對學習模型進行改造及參數(shù)調(diào)整，對誤分類成本進行修正。集成學習將數(shù)據(jù)層與算法層方法結(jié)合，如EasyEnsemble、BalanceCascade。評估層面是一種事后處理，通過評價指標評價學習的有效性。另外，半監(jiān)督學習和自監(jiān)督學習經(jīng)過驗證也能夠有效提高學習表現(xiàn)，通過對無標簽數(shù)據(jù)的利用在數(shù)據(jù)和算法層面實現(xiàn)學習。

代價敏感學習通過引入代價矩陣描述不同類別的誤分類成本來解決不平衡問題，其目標不在于誤報率最小化，而在于誤分類成本最小化，學習途徑包括模型選擇與損失函數(shù)改進。決策樹常被看做是最適合解決樣本不均衡問題的模型，因此學者們展開了對決策樹的代價敏感學習，主要從決策閾值移動、中間節(jié)點分裂標準以及剪枝進行。Domingos（2002）提出MetaCost，根據(jù)貝葉斯風險理論將代價矩陣引入，為后續(xù)研究提供重要基礎。Zouboulidis&Kotsiantis（2012）將集成學習、MetaCost 與代價敏感決策樹相結(jié)合，用于希臘上市公司財務報表造假預測。Sahin et al（2013）提出了一種代價敏感決策樹用于檢測信用卡欺詐，分類效果優(yōu)于其他標準算法。Kim et al（2016）結(jié)合MetaCost 構(gòu)建出多分類代價敏感模型MLogit，識別出92%的故意財務錯報。Moepya et al（2017）在SVM、KNN 和NB的基礎上構(gòu)建代價敏感模型，并在南非上市公司樣本集取得良好效果，隨后又對決策樹與隨機森林模型進行改造，并利用缺失值處理改善財務造假識別模型。Lin et al（2020）提出Focal Loss，通過改造交叉熵損失函數(shù)解決目標檢測中的樣本不平衡問題。從評估指標來看，可以考慮代價信息對標準指標賦予權(quán)重以改進。Sahin et al（2013）提出了Saved Loss Rate 用于衡量分類效果。Hajek&Henriques（2017）利用財務造假損失金額和審計費用度量分類錯誤成本，為錯報率與漏報率賦予不同權(quán)重。Long et al（2020）提出一種均衡準確度為TPR和TNR賦予不同權(quán)重。

針對數(shù)據(jù)不平衡與代價敏感性問題，國外學者從不同角度進行算法研究并應用于欺詐檢測，而國內(nèi)研究主要集中在理論與算法上，相對缺乏對財務造假識別的應用。本文主要從算法層和評估層入手，選取決策樹模型進行代價敏感學習，通過對損失函數(shù)和評價指標進行改進以優(yōu)化財務造假識別模型。

三、模型構(gòu)建

財務造假識別是一個典型的二分類問題，常用的分類算法有邏輯回歸、支持向量機、決策樹、神經(jīng)網(wǎng)絡等，但標準算法受不平衡數(shù)據(jù)集與代價敏感性的影響向多數(shù)類（正常）偏移。由于決策樹作為ifthen規(guī)則集合具有可解釋性強的優(yōu)點，因此選擇對決策樹進行代價敏感學習。

決策樹是基于樹結(jié)構(gòu)進行決策的分類與回歸模型，由一個根結(jié)點、若干中間結(jié)點（特征）和葉結(jié)點（決策結(jié)果）構(gòu)成。決策樹學習主要包括特征選擇、決策樹生成和修剪：特征選擇基于信息增益和基尼系數(shù)最大化原則，剪枝通常是基于整體損失函數(shù)最小化達成。經(jīng)典算法有ID3、C4.5、CART，前兩者只能處理離散變量，而CART算法還可以處理連續(xù)變量。輕型梯度提升樹（LightGBM）是基于決策樹的集成學習算法，在梯度上升決策樹（GBDT）的基礎上，通過直方圖算法和具深度限制的leaf-wise生長策略等改善在訓練速度緩慢、內(nèi)存占用過大及過擬合方面的問題，且自身能夠進行特征選擇、分類特征處理與缺失值處理。

代價敏感決策樹主要通過引入代價矩陣，對損失函數(shù)和評價指標進行修改，從而實現(xiàn)性能優(yōu)化。

（一）代價矩陣

二分類問題的代價矩陣（見表1）涉及4個分類成本，即CTN、CFP、CFN、CTP?？梢哉J為預測正確的情況下不產(chǎn)生誤分類成本，即CTN=CTP=0。誤分類成本比CFP：CFN源于數(shù)據(jù)不平衡性與代價敏感性，其中數(shù)據(jù)不平衡性可以用樣本不平衡度NN：NP衡量，代價敏感性來自上市公司審計費用與財務造假費用比值，即CostA：（CostF+CostA）。兩者之間的關(guān)系通過尋優(yōu)法進行確定。

表1 代價矩陣

（二）損失函數(shù)

代價敏感學習通過引入代價矩陣對損失函數(shù)進行改造，用代價敏感交叉熵函數(shù)（CS_logloss）代替標準交叉熵損失函數(shù)（logloss）：

（三）評價指標

集成學習在迭代過程中，利用代價敏感總損失（CS_costs）進行評價：

四、實驗及結(jié)果分析

（一）樣本選擇與指標構(gòu)建

1.樣本選擇。本文對2010—2020 年我國上市公司展開初步研究，數(shù)據(jù)來源于國泰安經(jīng)濟數(shù)據(jù)庫、中國證監(jiān)會等?；羧A德M·施利特等（2012）將財務報表造假定義為“故意錯報或漏報財務報表內(nèi)容，使得在和其他可獲得信息一并考慮時具有誤導性，影響使用者判斷或決策，以欺騙其他方如利益相關(guān)者和監(jiān)管者”?；诖耍覀儗┌采鲜泄具`規(guī)信息數(shù)據(jù)庫截至2020 年12 月31 日的違規(guī)數(shù)據(jù)進行篩選：選擇違規(guī)類型為虛構(gòu)利潤、虛列資產(chǎn)、虛假記載、推遲披露、重大遺漏、披露不實、欺詐上市、一般會計處理不當?shù)臄?shù)據(jù)，并結(jié)合證監(jiān)會的處罰公告《行政處罰決定》進行準確篩選；剔除金融行業(yè)上市公司、關(guān)鍵數(shù)據(jù)缺失公司、上市前造假公司。

統(tǒng)計發(fā)現(xiàn)（見圖1），2010—2020年的75起財務造假事件，共涉及73家上市公司，且財務造假行為具有連續(xù)性；財務造假的識別具有時滯性。2015年是財務造假高發(fā)年，共有27家上市公司財務舞弊，因此選擇2015年國內(nèi)上市公司作為研究對象。

圖1 2010-2020年財務造假上市公司統(tǒng)計

2.指標構(gòu)建。目前對財務造假成因理論的研究主要包括三角理論、鉆石理論、3C模型、GONE理論、風險因子理論與冰山理論，盡管表現(xiàn)不同但其含義相互聯(lián)通（見圖2）。其中Bologna et al（1993）提出的GONE理論認為，貪婪與需要是舞弊者造假的主觀因素，機會與暴露為舞弊行為創(chuàng)造客觀條件，共同導致舞弊行為得以實現(xiàn)?！柏澙贰狈从澄璞渍叩牡赖滤郊皟r值判斷；“需要”反映舞弊動機，主要來自各類壓力；“機會”主要指在公司內(nèi)部與權(quán)力相關(guān)的因素，由于缺乏監(jiān)督與制約而讓舞弊者有機可乘，包括企業(yè)缺乏內(nèi)部控制、無法正確進行工作質(zhì)量評估、缺乏懲罰措施、信息不對稱、能力不足以及審計制度不健全；“暴露”作為客觀條件中的外部環(huán)境因子，包括舞弊行為被發(fā)現(xiàn)的可能性以及披露后對舞弊者的懲罰性質(zhì)與程度，與“機會”共同促使舞弊行為的發(fā)生。

圖2 財務造假成因理論

結(jié)合財務造假成因理論與財務造假案例的研究，從貪婪、需要、暴露、機會等角度將上市公司特征劃分為財務數(shù)據(jù)與非財務數(shù)據(jù)以進行定性與定量分析（見圖3），包含了說明性信息和特征信息。

圖3 財務造假特征

說明性信息包括上市公司的所處行業(yè)、上市交易所、成立時間、上市時間等；非財務特征信息包含了公司的股本結(jié)構(gòu)、股權(quán)性質(zhì)、內(nèi)部治理以及審計信息；財務特征信息主要從償債能力、經(jīng)營能力、盈利能力、獲現(xiàn)能力、發(fā)展能力、綜合表現(xiàn)、風險水平以及結(jié)構(gòu)分布等，由當年靜態(tài)數(shù)據(jù)和動態(tài)增量數(shù)據(jù)共同構(gòu)成。

（二）實驗與結(jié)果分析

1.實驗過程。首先對數(shù)據(jù)集進行劃分。針對2015 年國內(nèi)上市公司創(chuàng)建樣本集，正常樣本與造假樣本2815：27，以4:1 等比例劃分訓練集與測試集，并保證子集數(shù)據(jù)分布與原數(shù)據(jù)集一致。

基準模型（邏輯回歸與支持向量機）需要進行預處理，包括獨熱編碼、缺失值處理、標準化處理等。由于輕型梯度提升樹內(nèi)嵌相關(guān)功能，因此無需進行其他預處理操作。

訓練過程中利用網(wǎng)格搜索與交叉驗證（Grid-SearchCV）對訓練模型進行參數(shù)優(yōu)化，涉及的主要超參數(shù)包括learning_rate、max_depth、num_leaves等。

2.評估指標。混淆矩陣是評估的基礎，由四個一級指標構(gòu)成（見表2）。

表2 混淆矩陣

根據(jù)混淆矩陣，構(gòu)成單一標準的二級分類評估指標：

由于在標準評價指標的鼓勵下大部分方法識別正常樣本比識別造假更準確，因此，在這類問題上需要明確，查全率（recall）比查準率（precision）更重要，高敏感性（sensitivity）比高特異性（specificity）更重要。F-score能夠同時衡量查全率與查準率間的關(guān)系，而受試者工作特征曲線（ROC）可根據(jù)特征曲線下的面積（AUC）同時衡量TPR和FPR。

3.實驗結(jié)果。根據(jù)尋優(yōu)法發(fā)現(xiàn)，誤分類成本CFP：CFN=1:50 時性能最佳，考慮到數(shù)據(jù)不平衡度與代價敏感性兩者的共同作用有所交叉。

選擇標準邏輯回歸（LR）、支持向量機（SVM）和輕型梯度上升樹（LGBM）作為基準模型，各個模型在測試集的預測結(jié)果如表3所示：

表3 實驗結(jié)果

在標準算法中：三種算法在總體準確度上表現(xiàn)都很出色，能達到95%以上；從綜合表現(xiàn)來看，輕型梯度上升樹明顯優(yōu)于其他兩種算法，在保證正常樣本識別率達到98%的基礎上能夠正確識別40%的造假樣本；但三種方法對于造假樣本的正確識別率都非常低，其中支持向量機的造假查全率甚至為0。實驗結(jié)果驗證了標準算法在不平衡數(shù)據(jù)集上會出現(xiàn)向多數(shù)類的偏移，導致實際應用效率低下。

經(jīng)過代價敏感學習的輕型梯度上升樹（CS_LGBM）在各個方面性能都有所提升，尤其是對于財務造假公司的識別，正確率能夠達到60%，并輸出樹形結(jié)構(gòu)（見上圖4）與特征重要性（見圖5），反映與財務造假風險相關(guān)的關(guān)鍵指標。例如，當上市公司成立年數(shù)為14、17、18、19、27、28、32 時，每股凈資產(chǎn)大于3.44，且資本支出與折舊攤銷比小于等于0.389時，財務造假概率較大。

圖4 決策樹

圖5 特征重要性

4.結(jié)果分析。根據(jù)對比實驗，將LGBM與CS_LGBM的輸出結(jié)果進行可視化對比，發(fā)現(xiàn)兩個模型的異同，并聚焦于代價敏感模型（見圖6），其中節(jié)點大小代表不同特征的重要性。

圖6 CS_LGBM模型特征

通過對代價敏感模型的輸出結(jié)果進行進一步的聚類與分析，發(fā)現(xiàn)財務造假行為的識別可以從財務壓力引起的動機、公司的綜合能力以及可能存在隱患的異常項目三個方面展開（見圖7）。

圖7 財務造假識別路徑

根據(jù)成因理論，壓力與需要是公司財務造假的重要因素，而過高財務杠桿與償債壓力將提高公司的財務造假動機。償債能力可通過流動負債比率、利息保障倍數(shù)、經(jīng)營活動產(chǎn)生現(xiàn)金流金額與流動負債比進行衡量。另外，當負債居高不下的同時存款也很高時，是財務造假的一個重要信號。公司處于不同發(fā)展階段將面臨不同的發(fā)展壓力，因此成立時間也可能是識別財務造假的入手點。

經(jīng)營能力、盈利能力、獲現(xiàn)能力、發(fā)展能力等特征是評估公司綜合能力的重要方面，在一定程度上從現(xiàn)實反映公司財務造假的可能。銷售費用的異常增長是財務風險的重大信號，隱含著盈利問題，以瑞幸和新大地為代表?，F(xiàn)金滿足投資比率偏低表明企業(yè)經(jīng)營活動產(chǎn)生的現(xiàn)金無法支持資本支出、存貨增加以及現(xiàn)金股利發(fā)放，暴露公司經(jīng)營能力的不足。營運資金對流動資產(chǎn)比率衡量資產(chǎn)結(jié)構(gòu)健康程度，綜合收益增長率衡量公司持續(xù)發(fā)展能力，每股凈資產(chǎn)綜合衡量上市公司的內(nèi)在價值，是財務風險的重要衡量指標。

為虛增現(xiàn)金流與利潤，財務造假的一般手段包括虛構(gòu)資產(chǎn)、虛減費用與損失，反映為一些重要項目的異常。固定資產(chǎn)、在建工程等長期資產(chǎn)項目是公司虛增資產(chǎn)的重要手段，例如康美藥業(yè)通過將不滿足會計確認和計量條件工程項目納入報表以達到虛增固定資產(chǎn)的目的，因此過高的固定資產(chǎn)增長率值得警戒。一些公司還會通過對長期資產(chǎn)的費用資本化并對折舊、攤銷、減值的操縱以低估費用與損失，可通過資本支出與折舊攤銷比分析。經(jīng)營現(xiàn)金流凈額利潤比和現(xiàn)金利潤比可對利潤與現(xiàn)金流的來源進行檢測，以防虛增利潤資金。另外，實驗結(jié)果表明，異常的審計支出也是一個關(guān)鍵點。

五、結(jié)論

為應對財務造假識別的數(shù)據(jù)不平衡與代價敏感性問題，研究提出了一種基于代價敏感學習的輕型梯度提升樹模型，通過向損失函數(shù)與評價指標引入代價矩陣實現(xiàn)。理論研究和對比實驗表明：一是代價敏感輕量梯度提升樹比其他標準模型綜合表現(xiàn)更好，能夠在保證總體準確度83%的同時，將造假公司識別率提高到60%；二是對上市公司財務造假的識別可以從“動機+現(xiàn)實+可能”出發(fā)研究財務壓力、公司綜合能力及異常項目三個方面，對財務杠桿、流動負債比率、現(xiàn)金滿足投資比率、營運資金比率、綜合收益增長率、每股凈資產(chǎn)、銷售費用增長率、固定資產(chǎn)增長率、現(xiàn)金流與利潤比等指標展開分析。

雖然如此，但研究仍有不足：一方面，樣本標簽源于證監(jiān)會對財務造假行為的披露，然而由于造假行為的隱秘性及造假披露的時滯性，可能存在部分造假公司隱匿于正常公司中；另一方面，模型對財務造假公司識別的準確率盡管有所提高，但仍未達到較高水平，以神經(jīng)網(wǎng)絡為代表的深度學習分類能力更為出眾，但由于其黑箱模型的本質(zhì)對財務造假識別缺乏解釋性。針對不足，半監(jiān)督學習可以通過少量標簽利用大量無標簽樣本，另外，隨著人工智能步入后深度學習時代，融合認知和推理的雙驅(qū)動可解釋人工智能成為研究熱點，如何用知識增強數(shù)據(jù)也將是未來研究的一個重要方向。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡