【摘 要】 欺詐信息的嵌入導(dǎo)致企業(yè)信用風(fēng)險(xiǎn)出現(xiàn)失真現(xiàn)象,如何辨析欺詐信息、還原企業(yè)信用違約真實(shí)水平是國(guó)內(nèi)外理論與實(shí)務(wù)界研究的熱點(diǎn)。文章以孤立點(diǎn)挖掘理論為視角,綜合分析了引發(fā)企業(yè)信用失真的欺詐信息的辨析技術(shù):非線性濾波技術(shù)、聚類技術(shù)、分類技術(shù)、統(tǒng)計(jì)技術(shù)、信息論技術(shù)、近鄰技術(shù)與混合技術(shù),并基于研究企業(yè)信用失真這一目的,針對(duì)欺詐信息辨析技術(shù)的創(chuàng)新發(fā)展提出了研究方向。
【關(guān)鍵詞】 信用失真; 欺詐信息; 孤立點(diǎn)
一、引言
欺詐信息引發(fā)的企業(yè)信用失真監(jiān)管問題一直是中國(guó)乃至世界的研究關(guān)鍵和難點(diǎn)。國(guó)際上,從2002年美國(guó)安然公司造假與2003年意大利帕瑪拉特的信用降級(jí),到2008年美國(guó)發(fā)生的次貸危機(jī),無不彰顯出欺詐信息所導(dǎo)致的企業(yè)外顯信用失實(shí)的巨大危害性。在中國(guó),企業(yè)內(nèi)部通過偽造欺詐信息來維持企業(yè)“光輝”形象的例子更是不勝枚舉,從“銀廣夏”的神話破滅到藍(lán)田股份的“魚塘里放衛(wèi)星”,再到2010年的四川長(zhǎng)虹“造假門”事件,這些事實(shí)無不發(fā)人深省,警示著欺詐信息引發(fā)的企業(yè)信用失真的潛在危險(xiǎn)。更為關(guān)鍵的是,為應(yīng)對(duì)2008年全球性的金融海嘯,國(guó)家啟動(dòng)了一系列經(jīng)濟(jì)刺激政策,盡管取得了卓有成效的成果,但前期信貸資金的大量投放對(duì)信貸機(jī)構(gòu)的風(fēng)險(xiǎn)監(jiān)控提出了更高要求。后金融危機(jī)時(shí)代,深入分析企業(yè)欺詐信息的類型,創(chuàng)建有效降低企業(yè)信用失真程度的校準(zhǔn)方法,把握企業(yè)的真實(shí)信用違約水平并實(shí)施針對(duì)性的監(jiān)管尤顯迫切。在此背景下,本文以孤立點(diǎn)挖掘理論為視角,綜合分析了引發(fā)企業(yè)信用失真的欺詐信息辨析技術(shù),并針對(duì)欺詐信息辨析技術(shù)的創(chuàng)新發(fā)展提出了研究方向。
二、欺詐信息與企業(yè)信用失真概述
欺詐信息是指企業(yè)從自身利益出發(fā)、由企業(yè)主觀生成,直接導(dǎo)致企業(yè)信用違約水平不能真實(shí)呈現(xiàn)的非真實(shí)信息。企業(yè)信用失真(Credit Distortion)是受通信領(lǐng)域的信號(hào)失真、財(cái)務(wù)領(lǐng)域的會(huì)計(jì)信息失真等概念的啟發(fā)提出的,具體是指由于欺詐信息的嵌入扭曲了企業(yè)的真實(shí)違約水平,造成了企業(yè)信用違約水平失真的現(xiàn)象,欺詐信息的嵌入是導(dǎo)致企業(yè)信用失真的主要原因。
國(guó)內(nèi)外鮮見直接對(duì)企業(yè)信用失真的研究成果,但可供借鑒的參考資料,尤其是關(guān)于信息指標(biāo)造假的文獻(xiàn)相對(duì)豐富,代表性的成果主要有:國(guó)際上,Ching-Chiang Yeh等(2008)利用逐步回歸方法篩選得到了14個(gè)財(cái)務(wù)變量(負(fù)債總額、資產(chǎn)總額、銷貨凈額等)與7個(gè)非財(cái)務(wù)變量(股份盈余偏離差、董監(jiān)事持股比率等)對(duì)欺詐信息指標(biāo)集進(jìn)行了歸納;Subrahmanyam A(2010)以50余個(gè)指標(biāo)變量描述了公司收益率,盡管其原意不是以欺詐信息為宗旨展開的研究,但所形成的指標(biāo)集對(duì)該項(xiàng)目的研究提供了有益的幫助。在我國(guó),趙明鳳(2007)通過對(duì)28個(gè)備選指標(biāo)變量利用T檢驗(yàn)的方法提取了收款/流動(dòng)資產(chǎn)、凈資產(chǎn)比率、資產(chǎn)負(fù)債率、營(yíng)運(yùn)資本率等八個(gè)指標(biāo),構(gòu)建了反映上市公司財(cái)務(wù)欺詐的指標(biāo)集;許楠(2010)通過構(gòu)建會(huì)計(jì)信息可信度的指標(biāo)變量、運(yùn)用Logistic 回歸分析方法建立了會(huì)計(jì)信息真?zhèn)巫R(shí)別模型;黎文靖(2007)從會(huì)計(jì)穩(wěn)健性的角度選取衡量會(huì)計(jì)信息質(zhì)量的指標(biāo),運(yùn)用股票收益模型和盈余持續(xù)性模型考察了深滬證券交易所設(shè)立的誠(chéng)信檔案制度對(duì)上市公司會(huì)計(jì)信息質(zhì)量的改善程度。盡管這些文獻(xiàn)沒有直接以企業(yè)信用失真為出發(fā)點(diǎn)研究欺詐信息,但其依然從不同角度對(duì)欺詐信息作了詮釋,為該項(xiàng)目的展開提供了基礎(chǔ)。由于這些文獻(xiàn)的指標(biāo)集處理過程過于復(fù)雜,且不能反映企業(yè)出于自身利益所采用的信息滯后披露與披露不完整等欺詐行為,為簡(jiǎn)約起見,美國(guó)穆迪KMV公司從公司資產(chǎn)值的角度,通過利用隨機(jī)分析方法構(gòu)建數(shù)學(xué)模型對(duì)企業(yè)信用違約水平加以度量,于是,涌現(xiàn)了許多基于公司資產(chǎn)值或現(xiàn)金流的信用違約問題的研究成果,從理論上實(shí)現(xiàn)了信息滯后披露與披露不完整的信息特征,較為突出的成果主要集中在Duffie David Lando(2001)的研究成果上。他們從公司資產(chǎn)價(jià)值、現(xiàn)金流的角度構(gòu)造的信用違約率將有助于研究企業(yè)信用失真問題。當(dāng)然,這些成果在追求簡(jiǎn)單的同時(shí)也有失偏頗,很難全面地反映真實(shí)的企業(yè)信用違約水平。
由于企業(yè)信用失真是受通信領(lǐng)域的信號(hào)失真、財(cái)務(wù)領(lǐng)域的會(huì)計(jì)信息失真的啟發(fā)得出的,因此,信息失真的很多成果——如對(duì)會(huì)計(jì)信息失真、信號(hào)失真等問題的研究所形成的理論與技術(shù)對(duì)研究企業(yè)信用失真有借鑒作用,為此筆者從會(huì)計(jì)信息失真與信號(hào)失真兩方面對(duì)相關(guān)研究文獻(xiàn)進(jìn)行梳理:一是針對(duì)會(huì)計(jì)信息失真的研究歷來已久,國(guó)際上對(duì)會(huì)計(jì)信息失真的研究成果多集中在定量分析上,在國(guó)內(nèi),這一方面的研究成果多集中在定性分析失真的原因、手段及方法策略上,也有少量成果集中在定量分析上,如吳紹平等(2004)利用亞力山大·沃爾比重方法對(duì)負(fù)債失真率等指標(biāo)進(jìn)行了簡(jiǎn)單的量化與線性加權(quán),提出“會(huì)計(jì)信息失真率”的概念,盡管此成果所用的理論與方法比較簡(jiǎn)單,但為探討企業(yè)信用違約真實(shí)水平提供了有益的借鑒。二是源于對(duì)通信領(lǐng)域的信號(hào)失真問題所形成的理論與技術(shù),將對(duì)研究企業(yè)信用失真提供支撐作用,具有強(qiáng)有力的借鑒作用的研究成果多圍繞信噪比展開,如Agostino Capponi (2009)通過信噪比思想構(gòu)建信噪比指數(shù)開發(fā)的用于貨幣危機(jī)預(yù)警的KLR信號(hào)分析方法。
欺詐信息往往通過附著在載體指標(biāo)上得以呈現(xiàn),引發(fā)企業(yè)信用失真是一個(gè)非線性過程,總的來說,現(xiàn)有文獻(xiàn)缺少以企業(yè)信用失真為反應(yīng)變量,對(duì)欺詐信息的特征與規(guī)律進(jìn)行全面刻畫的研究成果,如何綜合考慮企業(yè)信用失真的誘因、提取與篩選欺詐信息的載體指標(biāo)集并探討其內(nèi)在規(guī)律及演化外顯模式,需做進(jìn)一步探討。
三、欺詐信息辨析的孤立點(diǎn)挖掘技術(shù)
欺詐信息的外顯特征異于常規(guī)信息,具備孤立點(diǎn)的基本特征,在數(shù)據(jù)結(jié)構(gòu)上可劃歸為孤立點(diǎn)(或異常點(diǎn)——Outlier),因此可運(yùn)用孤立點(diǎn)挖掘理論對(duì)欺詐信息加以辨析,特別是近幾年來孤立點(diǎn)挖掘技術(shù)在工程故障檢測(cè)、信用卡欺騙、計(jì)算機(jī)圖像處理、醫(yī)學(xué)檢測(cè)等方面的成功運(yùn)用,為利用孤立點(diǎn)挖掘理論識(shí)別企業(yè)欺詐信息提供了依據(jù)。傳統(tǒng)的孤立點(diǎn)挖掘技術(shù)相當(dāng)豐富,它們?yōu)槠墼p信息的辨析打下了堅(jiān)實(shí)的基礎(chǔ)。用孤立點(diǎn)挖掘技術(shù)對(duì)引發(fā)企業(yè)信用失真的欺詐信息進(jìn)行辨析的關(guān)鍵點(diǎn)主要集中在“輸入數(shù)據(jù)的結(jié)構(gòu)分析”與“挖掘技術(shù)發(fā)展與創(chuàng)建”兩個(gè)方面,下面分兩部分探討其研究進(jìn)展。
(一)基于輸入數(shù)據(jù)結(jié)構(gòu)分析的研究成果
輸入數(shù)據(jù)信息的結(jié)構(gòu)分析是孤立點(diǎn)挖掘的基礎(chǔ),描述企業(yè)信用失真的每一指標(biāo)在賦予時(shí)序特征的同時(shí),指標(biāo)集之間的截面關(guān)聯(lián)結(jié)構(gòu)也不可忽視,因此,下面從時(shí)間與截面兩個(gè)維度對(duì)相關(guān)研究成果加以概括:
1.從時(shí)間維度來看,作為輸入數(shù)據(jù)——欺詐信息的時(shí)序內(nèi)在規(guī)律是研究重點(diǎn),主要集中在時(shí)序數(shù)據(jù)的相似度分析、窗口技術(shù)、馬爾科夫技術(shù)三個(gè)方面。
(1)相似度分析:如何計(jì)算相似度、根據(jù)相似度確定孤立點(diǎn)辨析規(guī)則是該技術(shù)的核心。代表性方法主要有兩種:采用最長(zhǎng)公共子序列標(biāo)準(zhǔn)化長(zhǎng)度方法計(jì)算序列數(shù)據(jù)間的相似度與采用譜核方法計(jì)算相似度。
(2)窗口技術(shù):窗口技術(shù)適用于周期性輸入數(shù)據(jù)背景下的孤立點(diǎn)挖掘問題,通過提取窗口長(zhǎng)度、在一個(gè)或多個(gè)測(cè)試窗口中發(fā)現(xiàn)樣本中的異常點(diǎn),其中異常點(diǎn)判定準(zhǔn)則是其關(guān)鍵,較為成功的判定準(zhǔn)則有t-STIDE技術(shù)。
(3)馬爾科夫技術(shù):馬爾科夫技術(shù)適應(yīng)于具有短期記憶特征的時(shí)序數(shù)據(jù)孤立點(diǎn)挖掘問題,代表性成果有:Sotirios P Chatzis等(2011)把t分布引入隱馬爾科夫模型構(gòu)建了t-隱馬爾科夫模型,利用變分貝葉斯推斷算法對(duì)孤立點(diǎn)進(jìn)行檢測(cè);Dana Ron等(1996)構(gòu)建了固定長(zhǎng)度的馬爾科夫模型等,這些文獻(xiàn)基于不同的領(lǐng)域研究了異常點(diǎn)的識(shí)別問題,其中模型構(gòu)建、模型參數(shù)估計(jì)方法一直是該部分研究的重點(diǎn)。
2.從截面維度來看,截面數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián)規(guī)則的挖掘是孤立點(diǎn)挖掘的關(guān)鍵,代表性成果有:John Grznar(2007)通過利用神經(jīng)網(wǎng)絡(luò)的方法分析了系統(tǒng)組織間的非線性內(nèi)在關(guān)聯(lián)性并對(duì)其孤立點(diǎn)進(jìn)行了識(shí)別;李云等(2008)提出一種基于灰色關(guān)聯(lián)分析的孤立點(diǎn)檢測(cè)算法(OMGRA),通過總評(píng)價(jià)判斷數(shù)挖掘孤立點(diǎn)集,避免人工確定閾值的缺點(diǎn)。
(二)基于孤立點(diǎn)挖掘技術(shù)的研究成果
從孤立點(diǎn)挖掘技術(shù)來看,國(guó)內(nèi)外對(duì)該部分的研究成果相當(dāng)豐富,針對(duì)不同的應(yīng)用領(lǐng)域應(yīng)有不同的適用技術(shù),鑒于方法與文獻(xiàn)的豐富性,這里僅梳理對(duì)研究企業(yè)信用違約真實(shí)水平有借鑒作用的國(guó)內(nèi)外研究成果,具體如下:
1.非線性濾波技術(shù):Agostino Capponi(2009)基于公司信息惡意誤報(bào)且投資者不能觀測(cè)的假定,提出了新的結(jié)構(gòu)化違約模型及“去偽”方法。針對(duì)欺詐信息污染后的資產(chǎn)觀測(cè)值,運(yùn)用提出的非線性濾波技術(shù),以帕瑪拉特公司財(cái)務(wù)欺詐為例進(jìn)行實(shí)證研究,結(jié)果表明由帕瑪拉特公司的會(huì)計(jì)違規(guī)行為而導(dǎo)致的虛假數(shù)據(jù)的“歸真”具有一定的校正作用,但該模型過于簡(jiǎn)單,沒有涉及欺詐信息與企業(yè)信用失真間的量化關(guān)系的深入探討,不過其模型結(jié)構(gòu)及“去偽”方法將對(duì)該項(xiàng)目的欺詐信息剝離有很高的參考價(jià)值。
2.分類技術(shù):E. W. T. Ngai等(2011)以挖掘分類技術(shù)在金融欺詐中的應(yīng)用為研究進(jìn)行了綜述,總結(jié)了近幾年的的研究成果;M. L. Shyu等(2003)根據(jù)主成分分類方法提出一種新的孤立點(diǎn)檢測(cè)方案。
3.聚類技術(shù):C Wang(2009)利用核聚類方法并對(duì)孤立點(diǎn)加以識(shí)別,據(jù)此對(duì)客戶群關(guān)系進(jìn)行歸類;梁斌梅(2009)基于層次聚類的孤立點(diǎn)檢測(cè)方法提出了基于層次聚類的孤立點(diǎn)檢測(cè)(ODHC)方法。
4.統(tǒng)計(jì)技術(shù):Wayne A. Woodward等(2003)以正態(tài)混合概率分布對(duì)孤立點(diǎn)加以檢驗(yàn);C Caroni 等(2004)借助于似然率與自回歸模型檢測(cè)了時(shí)序數(shù)據(jù)的孤立點(diǎn)問題;楊瑞成等(2010)在隨機(jī)跳擴(kuò)散模型的基礎(chǔ)上對(duì)重大信息引起的異常點(diǎn)加以檢測(cè),采用MCMC算法對(duì)模型參數(shù)加以估計(jì),并以人民幣匯率數(shù)據(jù)進(jìn)行實(shí)證分析。
5.信息論技術(shù):信息論技術(shù)主要利用信息熵分析數(shù)據(jù)所呈現(xiàn)的信息內(nèi)容,從距離的角度探測(cè)孤立點(diǎn)的不規(guī)則并加以辨析。
6.近鄰技術(shù):Xiaoqing Weng等(2008)提出一種多變量時(shí)間序列異常樣本的識(shí)別算法,使用k-近鄰方法查找異常點(diǎn);岳峰等(2007)提出了基于反向K近鄰(RKNN)的孤立點(diǎn)檢測(cè)算法(ODRKNN),運(yùn)用每個(gè)數(shù)據(jù)點(diǎn)的反向K近鄰個(gè)數(shù)來衡量該數(shù)據(jù)點(diǎn)的偏離程度,并有效地檢測(cè)出孤立點(diǎn)。
7.混合技術(shù):混合技術(shù)是吸收上述幾種理論與方法構(gòu)建出的組合技術(shù),這是近幾年孤立點(diǎn)挖掘技術(shù)的一個(gè)新方向,代表性成果主要有:Hui Cao等(2010)在近鄰技術(shù)與統(tǒng)計(jì)技術(shù)的基礎(chǔ)上構(gòu)建了基于密度—相似度—近鄰原則的孤立點(diǎn)識(shí)別算法;呂林濤等(2007)針對(duì)國(guó)內(nèi)外金融領(lǐng)域可疑交易的低檢測(cè)率問題,通過對(duì)RBF神經(jīng)網(wǎng)絡(luò)技術(shù)的分析與研究,提出了一種基于APC-III聚類算法和RLS算法的面向反洗錢的RBF神經(jīng)網(wǎng)絡(luò)模型并加以實(shí)現(xiàn)。
盡管這些成果不是以企業(yè)欺詐信息為識(shí)別對(duì)象所建立的孤立點(diǎn)檢測(cè)技術(shù),但是依然對(duì)把握企業(yè)的真實(shí)信用水平起著基礎(chǔ)性的作用,所不同的是,企業(yè)欺詐信息的辨析更為復(fù)雜,它是時(shí)間維度與截面維度的綜合體,在孤立點(diǎn)挖掘技術(shù)設(shè)計(jì)上既要考慮數(shù)據(jù)的時(shí)間變化規(guī)律特征,又要兼顧到截面指標(biāo)集間的關(guān)聯(lián)復(fù)雜性,需要在現(xiàn)有理論的基礎(chǔ)上進(jìn)一步發(fā)展及創(chuàng)建。
四、展望
欺詐信息的嵌入是企業(yè)信用失真的內(nèi)因,從現(xiàn)有國(guó)內(nèi)外相關(guān)研究成果來看,缺少?gòu)墓铝Ⅻc(diǎn)挖掘視角對(duì)欺詐信息的辨析技術(shù),具體來說,概括得到如下核心問題亟需解決:
(一)誘發(fā)企業(yè)信用失真的欺詐信息載體指標(biāo)集的篩選、量化及內(nèi)在規(guī)律提取
欺詐信息通過附著在載體指標(biāo)集上呈現(xiàn)出來,其外顯模式——載體指標(biāo)集的篩選與量化是分析企業(yè)信用失真的前提,其內(nèi)在變化規(guī)律是欺詐信息的辨析依據(jù)。現(xiàn)有文獻(xiàn)缺少以企業(yè)信用失真的成因?yàn)槌霭l(fā)點(diǎn),對(duì)欺詐信息載體指標(biāo)集的篩選、量化及內(nèi)在規(guī)律提取的研究成果,因此,如何構(gòu)建欺詐信息載體指標(biāo)集、刻畫其內(nèi)在變化規(guī)律需進(jìn)一步探討。
(二)基于欺詐信息辨析的孤立點(diǎn)挖掘技術(shù)創(chuàng)建
現(xiàn)有成果缺少基于欺詐信息辨析的孤立點(diǎn)挖掘技術(shù),需在吸收現(xiàn)有孤立點(diǎn)挖掘理論與方法的基礎(chǔ)上,依據(jù)載體指標(biāo)集的內(nèi)在變化規(guī)律與欺詐信息的特點(diǎn),發(fā)展并創(chuàng)建基于欺詐信息辨析的孤立點(diǎn)挖掘技術(shù)。
(三)欺詐信息“剝離”技術(shù)的探尋與發(fā)展
利用孤立點(diǎn)挖掘技術(shù)對(duì)欺詐信息有效識(shí)別之后,如何對(duì)載體指標(biāo)集中所嵌入的欺詐信息進(jìn)行“剝離”成為把握企業(yè)真實(shí)信用違約水平的關(guān)鍵所在,于是,欺詐信息的剝離技術(shù)需進(jìn)一步探索與發(fā)展。
這些共性問題將成為進(jìn)一步研究的熱點(diǎn)?!?/p>
【主要參考文獻(xiàn)】
[1] Ching-Chiang Yeh,Der-Jang Chi,Sin-Jin Lin. A Study for Detecting Enterprise Financial Statement Fraud[J].Asian Journal of Management and Humanity Sciences,2008,3(1-4):15-30.
[2] 趙明鳳.中國(guó)上市公司財(cái)務(wù)欺詐預(yù)警系統(tǒng)研究[J].財(cái)會(huì)研究,2007;11:50-52.
[3] 許楠.基于會(huì)計(jì)信息可信度的上市公司優(yōu)劣甄別研究[J].財(cái)會(huì)通訊,2010(21):61-63.
[4] 黎文靖.會(huì)計(jì)信息披露政府監(jiān)管的經(jīng)濟(jì)后果[J].會(huì)計(jì)研究,2007(8):13-21.
[5] Duffie David Lando. Term Structures of Credit Spreads with Incomplete Accounting Information[J].Econometrica,2001,69(3):633-664.
[6] Agostino Capponi. Credit Risk Modeling with Misreporting and Incomplete Information[J].International Journal of Theoretical and Applied Finance,2009,12(1):83-112.
[7] E W T Ngai,Yong Hu,et al.The application of data mining techniques in financial fraud detectioe[J]. Decision Support Systems,2011,50(3):559-569.
[8] C Caroni,V Karioti. Detecting in innovative outlier in a set of time series[J].Computational Statistics & Data Analysis,2004,46(3):561-570.
[9] 楊瑞成,秦學(xué)志,周穎穎. 基于跳辨識(shí)-MCMC組合算法的人民幣匯率跳擴(kuò)散模型參數(shù)估計(jì)問題[J]. 系統(tǒng)工程理論與實(shí)踐,2010,30(12):2165-2171.
[10] X Weng and J Shen. Detecting outlier samples in multivariate time series dataset[J].Knowledge-Based Systems,2008,21(8):807-812.