国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的企業(yè)內(nèi)部控制重大缺陷預(yù)測(cè)

2022-02-14 09:28:58趙納暉博士生導(dǎo)師
財(cái)會(huì)月刊 2022年3期
關(guān)鍵詞:預(yù)測(cè)特征算法

劉 瑾,趙納暉(博士生導(dǎo)師)

一、引言

內(nèi)部控制的目標(biāo)在于防范和控制風(fēng)險(xiǎn),促進(jìn)企業(yè)實(shí)現(xiàn)發(fā)展戰(zhàn)略。由于企業(yè)無(wú)法預(yù)測(cè)未來(lái)所有風(fēng)險(xiǎn),且受管理層認(rèn)知能力和成本效益原則的限制,內(nèi)部控制總有缺陷。根據(jù)信號(hào)傳遞理論,內(nèi)部控制缺陷,特別是重大缺陷是判斷企業(yè)存在經(jīng)營(yíng)風(fēng)險(xiǎn)的重要信號(hào)[1],披露內(nèi)部控制重大缺陷會(huì)產(chǎn)生負(fù)面效應(yīng)[2-4],因此企業(yè)披露缺陷信息的內(nèi)生動(dòng)力不足[5]。在國(guó)家強(qiáng)制披露要求下,公開(kāi)的內(nèi)部控制信息逐漸成為技術(shù)操作與監(jiān)管規(guī)則之間的博弈產(chǎn)物[6],諸多隱瞞和不充分披露現(xiàn)象頻繁發(fā)生,如長(zhǎng)生生物毒疫苗、獐子島扇貝絕收、雅百特財(cái)務(wù)造假等事件,導(dǎo)致社會(huì)經(jīng)濟(jì)系統(tǒng)中的委托代理機(jī)制、產(chǎn)權(quán)有序流動(dòng)、資源有效配置無(wú)法順利運(yùn)行[7]。內(nèi)部控制重大缺陷預(yù)測(cè)是根據(jù)企業(yè)披露的財(cái)務(wù)或非財(cái)務(wù)數(shù)據(jù)和其他相關(guān)信息,運(yùn)用恰當(dāng)?shù)姆椒?,?duì)可能存在的重大缺陷進(jìn)行識(shí)別和預(yù)警的過(guò)程,其旨在降低企業(yè)與股東、債權(quán)人、投資者及政府監(jiān)管部門間的信息不對(duì)稱,減少利益相關(guān)者為收集真實(shí)信息或?qū)ε缎畔⑦M(jìn)行證偽而付出的交易成本。預(yù)測(cè)研究提供了一種基于控制論的前饋控制方式,通過(guò)整合數(shù)據(jù)挖掘特征信息,參照“以預(yù)期為標(biāo)準(zhǔn)——衡量實(shí)際——比較實(shí)際與預(yù)期——確定偏差——分析偏差原因”的路徑,主動(dòng)識(shí)別內(nèi)部控制重大缺陷,從而指導(dǎo)未來(lái)行動(dòng)[8,9]。

關(guān)于內(nèi)部控制缺陷預(yù)測(cè)的研究主要從缺陷認(rèn)定、缺陷影響因素和預(yù)測(cè)方法三個(gè)方面展開(kāi)。內(nèi)部控制缺陷的認(rèn)定結(jié)果回答了企業(yè)是否存在缺陷以及哪些屬于重大缺陷的問(wèn)題,能反映企業(yè)內(nèi)部控制建設(shè)的執(zhí)行效果。然而,我國(guó)內(nèi)部控制規(guī)范還未對(duì)如何劃分不同等級(jí)的缺陷做出明確說(shuō)明,也未針對(duì)財(cái)務(wù)報(bào)告與非財(cái)務(wù)報(bào)告內(nèi)部控制進(jìn)行合理區(qū)分,政策和實(shí)務(wù)層面普遍存在規(guī)范缺失、概念模糊和重視程度不夠等問(wèn)題。學(xué)者普遍認(rèn)為有財(cái)務(wù)舞弊、重大財(cái)務(wù)重述行為的企業(yè)存在內(nèi)部控制重大缺陷[10],但隨著外部經(jīng)營(yíng)環(huán)境變遷及內(nèi)部組織結(jié)構(gòu)再造,影響內(nèi)部控制缺陷存在的因素從會(huì)計(jì)與審計(jì)領(lǐng)域,涵蓋到組織結(jié)構(gòu)、經(jīng)營(yíng)業(yè)務(wù)等,正向市場(chǎng)化水平、法律環(huán)境、政府管制等宏觀方向深入擴(kuò)展,非財(cái)務(wù)因素的作用日益顯著[11-14],因此構(gòu)建預(yù)測(cè)模型應(yīng)綜合考慮財(cái)務(wù)因素和非財(cái)務(wù)因素。在預(yù)測(cè)方法上,已有研究采用邏輯回歸和判別分析達(dá)到的預(yù)測(cè)準(zhǔn)確率約為70%~80%[15,16],預(yù)測(cè)性能仍有較大進(jìn)步空間。隨著人工智能技術(shù)迅速進(jìn)入大眾視野,重大缺陷預(yù)測(cè)方法從統(tǒng)計(jì)計(jì)量過(guò)渡到機(jī)器學(xué)習(xí)[17,18]?;谥С窒蛄繖C(jī)、BP神經(jīng)網(wǎng)絡(luò)、集成算法等機(jī)器學(xué)習(xí)的預(yù)測(cè)模型從數(shù)據(jù)中學(xué)習(xí)經(jīng)驗(yàn)知識(shí)的能力比傳統(tǒng)計(jì)量模型更強(qiáng),可從大量非線性、高維度、高噪聲的數(shù)據(jù)中提煉有用信息,獲得更好的預(yù)測(cè)效果。

綜合上述分析,本文試圖回答以下問(wèn)題:如何建立適合我國(guó)上市企業(yè)的內(nèi)部控制重大缺陷預(yù)測(cè)指標(biāo)體系;通過(guò)比較不同機(jī)器學(xué)習(xí)算法,基于集成算法的預(yù)測(cè)模型性能是否優(yōu)于已有研究;哪些因素對(duì)預(yù)測(cè)結(jié)果的影響更為突出。本文可能的貢獻(xiàn)在于:一是,從內(nèi)部控制關(guān)鍵要素出發(fā),結(jié)合實(shí)證經(jīng)驗(yàn)證據(jù),從內(nèi)部治理機(jī)制、外部環(huán)境風(fēng)險(xiǎn)、財(cái)務(wù)狀況、監(jiān)管與信息溝通四個(gè)維度構(gòu)建預(yù)測(cè)指標(biāo)體系。二是,應(yīng)用機(jī)器學(xué)習(xí)算法構(gòu)建預(yù)測(cè)模型,通過(guò)對(duì)比邏輯回歸、支持向量機(jī)、決策樹、BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和XGBoost六種模型,尋找預(yù)測(cè)效果最好的模型?,F(xiàn)有文獻(xiàn)大多基于線性回歸方法,解釋能力強(qiáng)但預(yù)測(cè)能力弱,本文展示了機(jī)器學(xué)習(xí)特別是集成學(xué)習(xí)在預(yù)測(cè)性能上的優(yōu)勢(shì),檢驗(yàn)了預(yù)測(cè)指標(biāo)體系的實(shí)用性。三是,通過(guò)特征貢獻(xiàn)度分析進(jìn)一步發(fā)掘預(yù)測(cè)模型的改進(jìn)空間。

二、理論分析

(一)內(nèi)部控制缺陷識(shí)別與認(rèn)定

制度理論認(rèn)為,有必要用權(quán)利與義務(wù)安排或權(quán)威機(jī)構(gòu)來(lái)限定企業(yè)追逐其目標(biāo)的邊界,協(xié)調(diào)不完善的沖突。內(nèi)部控制缺陷的認(rèn)定來(lái)源于被廣泛認(rèn)可的COSO出臺(tái)的《內(nèi)部控制——整合框架》和《企業(yè)風(fēng)險(xiǎn)管理——整合框架》,將控制缺陷定義為會(huì)對(duì)企業(yè)實(shí)現(xiàn)目標(biāo)的能力造成不利影響的已被察覺(jué)的、潛在的或?qū)嶋H的缺點(diǎn),并按照影響程度將缺陷分為重大缺陷、重要缺陷和一般缺陷?;谫Y源有限性和成本效益的考量,判斷內(nèi)部控制缺陷不僅要看控制系統(tǒng)是否存在缺點(diǎn)或不足,還要看這種缺點(diǎn)或不足在多大程度上阻礙了企業(yè)發(fā)展[19],因此從偏離目標(biāo)的可能性和程度來(lái)看,識(shí)別重大缺陷更為迫切。然而,債權(quán)人、投資者及政府監(jiān)管部門等主要通過(guò)企業(yè)公開(kāi)披露的內(nèi)部控制評(píng)價(jià)報(bào)告、內(nèi)部控制審計(jì)報(bào)告、財(cái)務(wù)報(bào)告獲知重大缺陷信息,被動(dòng)地接收認(rèn)定結(jié)果。

綜合而言,判斷企業(yè)是否存在內(nèi)部控制重大缺陷時(shí),除了參考重大缺陷存在跡象,還應(yīng)主動(dòng)從其他公開(kāi)渠道尋找可靠、客觀的認(rèn)定結(jié)果,這有利于后續(xù)的模型構(gòu)建。例如,證監(jiān)會(huì)自2001年起公布的行政處罰公告和市場(chǎng)禁入公告中披露的上市企業(yè)財(cái)務(wù)報(bào)表造假、重大擔(dān)保或重大關(guān)聯(lián)方交易未按規(guī)定披露或故意遺漏、企業(yè)高管非法從事證券交易等行為,可以作為內(nèi)部控制薄弱表現(xiàn)的確鑿認(rèn)定并與其他重大缺陷跡象互補(bǔ)。

(二)內(nèi)部控制缺陷影響因素

借鑒《內(nèi)部控制——整合框架》,《上市公司內(nèi)部控制指引》、《企業(yè)內(nèi)部控制基本規(guī)范》及配套指引、《公開(kāi)發(fā)行證券的公司信息披露編報(bào)規(guī)則第21號(hào)——年度內(nèi)部控制評(píng)價(jià)報(bào)告的一般規(guī)定》等文件的頒布標(biāo)志著我國(guó)內(nèi)部控制規(guī)范體系基本形成。企業(yè)依據(jù)內(nèi)部環(huán)境、風(fēng)險(xiǎn)評(píng)估、控制活動(dòng)、信息和溝通、內(nèi)部監(jiān)督五個(gè)要素構(gòu)建自身內(nèi)部控制體系,涵蓋了發(fā)展戰(zhàn)略、公司治理、組織架構(gòu)、企業(yè)文化、社會(huì)責(zé)任、財(cái)務(wù)活動(dòng)等諸多因素,但內(nèi)容繁瑣的內(nèi)部控制體系仍無(wú)法防止舞弊、腐敗和重大風(fēng)險(xiǎn)的發(fā)生,反而導(dǎo)致實(shí)務(wù)中產(chǎn)生更多的缺陷。因此,構(gòu)建內(nèi)部控制重大缺陷預(yù)測(cè)指標(biāo)體系應(yīng)立足于基本國(guó)情和企業(yè)需求,結(jié)合已有實(shí)證研究,優(yōu)先解決內(nèi)部控制中存在的迫切現(xiàn)實(shí)問(wèn)題[20],而不是無(wú)止境地?cái)U(kuò)充內(nèi)部控制的內(nèi)涵和邊界,將所有相關(guān)影響因素全部納入[21]。

綜合以上分析,從內(nèi)部控制關(guān)鍵要素出發(fā),沿波討源地發(fā)掘缺陷存在的原因,能指導(dǎo)預(yù)測(cè)指標(biāo)體系的構(gòu)建過(guò)程,其中控制環(huán)境是基礎(chǔ),控制活動(dòng)是實(shí)現(xiàn)手段,監(jiān)管是對(duì)控制活動(dòng)的動(dòng)態(tài)反饋,該反饋通過(guò)信息傳遞與溝通來(lái)完成。控制環(huán)境是對(duì)建立、加強(qiáng)或削弱特定政策、程序及其效率產(chǎn)生影響的各種因素的總稱,任何企業(yè)的內(nèi)部控制都存在于一定的控制環(huán)境之中[22],良好的控制環(huán)境能從根源上增強(qiáng)內(nèi)部控制的執(zhí)行效果??刂苹顒?dòng)貫穿整個(gè)組織,遍及各個(gè)層級(jí)、業(yè)務(wù)單位和流程以及技術(shù)環(huán)境,最基本的控制活動(dòng)是交易控制。財(cái)務(wù)狀況在某種程度上反映了重要交易的閉環(huán)流程,從財(cái)務(wù)數(shù)據(jù)的異常變動(dòng)中能發(fā)現(xiàn)缺陷存在的跡象。監(jiān)管過(guò)程能及時(shí)評(píng)價(jià)內(nèi)部控制的有效性,并對(duì)發(fā)現(xiàn)的缺陷加以改進(jìn),是對(duì)控制活動(dòng)的動(dòng)態(tài)反饋,而信息與溝通能確保上述反饋在企業(yè)內(nèi)部、企業(yè)與外部之間進(jìn)行有效溝通。本文從控制環(huán)境、控制活動(dòng)、監(jiān)管與信息溝通三個(gè)方面構(gòu)建內(nèi)部控制重大缺陷預(yù)測(cè)指標(biāo)體系,基于控制環(huán)境的重要性,進(jìn)一步將其分為內(nèi)部治理機(jī)制和外部環(huán)境風(fēng)險(xiǎn)。

(三)基于機(jī)器學(xué)習(xí)的預(yù)測(cè)模型

機(jī)器學(xué)習(xí)已被廣泛應(yīng)用于金融欺詐識(shí)別、信用風(fēng)險(xiǎn)評(píng)估、財(cái)務(wù)困境和財(cái)務(wù)舞弊識(shí)別等方面,為制定管理決策提供了不少助力[23-26],內(nèi)部控制缺陷的預(yù)測(cè)方法也從統(tǒng)計(jì)學(xué)習(xí)過(guò)渡到機(jī)器學(xué)習(xí)。在應(yīng)用機(jī)器學(xué)習(xí)方法之前,相關(guān)研究一般利用計(jì)量模型對(duì)變量進(jìn)行因果分析,這兩類方法在模型可解釋性和預(yù)測(cè)能力上有不同權(quán)衡:計(jì)量模型注重解釋現(xiàn)象并尋找現(xiàn)象背后的規(guī)律,要求闡明模型擬合好壞的原因和變量之間的互動(dòng)關(guān)系,追求較為簡(jiǎn)單的函數(shù)形式和易于解釋的模型估計(jì)結(jié)果;機(jī)器學(xué)習(xí)不拘泥于可解釋性,能從數(shù)據(jù)中學(xué)習(xí)更多經(jīng)驗(yàn)知識(shí),在大量非線性、高維度、高噪聲的數(shù)據(jù)中發(fā)掘有用信息,能較為靈活地選擇函數(shù)形式來(lái)擬合數(shù)據(jù),因此預(yù)測(cè)能力較強(qiáng)。

在主流機(jī)器學(xué)習(xí)算法中,邏輯回歸對(duì)線性關(guān)系的擬合效果較好,適合特征與變量之間線性關(guān)系較強(qiáng)的數(shù)據(jù);支持向量機(jī)是堅(jiān)持?jǐn)?shù)學(xué)原理的小樣本學(xué)習(xí)方法,基于核方法將輸入數(shù)據(jù)映射到一個(gè)高階的向量空間來(lái)解決分類問(wèn)題,對(duì)樣本平衡性的要求較高;決策樹由一系列“分而治之”方式組織的樹狀結(jié)構(gòu)組成,數(shù)據(jù)根據(jù)不同特征被劃分為不同的子集,采用信息增益或基尼系數(shù)作為評(píng)判標(biāo)準(zhǔn);BP神經(jīng)網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),通過(guò)反向傳播不斷調(diào)整整個(gè)網(wǎng)絡(luò)的權(quán)值和閾值,但參數(shù)較多、難以訓(xùn)練,且輸出結(jié)果較難解釋;隨機(jī)森林以隨機(jī)方式構(gòu)建了一個(gè)由很多相互不關(guān)聯(lián)的決策樹組成的森林,利用信息增益或基尼指數(shù)度量以某個(gè)特征進(jìn)行劃分后的數(shù)據(jù)集的純度,以此來(lái)確定劃分特征;XGBoost采用貪心算法來(lái)枚舉所有特征可能的劃分情形,據(jù)此確定最優(yōu)特征集合,最終的預(yù)測(cè)值是每個(gè)基學(xué)習(xí)器預(yù)測(cè)值之和。值得注意的是,沒(méi)有任何算法可以完美地解決所有問(wèn)題,各類機(jī)器學(xué)習(xí)算法有著各自擅長(zhǎng)的數(shù)據(jù)集,預(yù)測(cè)模型需要通過(guò)不斷的實(shí)踐才能達(dá)到最佳。

三、研究設(shè)計(jì)

(一)數(shù)據(jù)來(lái)源與樣本選擇

根據(jù)財(cái)政部和證監(jiān)會(huì)的監(jiān)管規(guī)定,所有主板上市企業(yè)自2012年起著手內(nèi)部控制體系建設(shè),分類分批地披露內(nèi)部控制信息,故本文將樣本時(shí)間范圍劃定為2012~2019年,研究對(duì)象為滬深兩市A股上市企業(yè)。參照我國(guó)內(nèi)部控制制度規(guī)范,基于公開(kāi)數(shù)據(jù)的可獲得性,本文對(duì)內(nèi)部控制重大缺陷的認(rèn)定范圍是:①上市企業(yè)董事、監(jiān)事及高級(jí)管理人員舞弊或違法披露會(huì)計(jì)相關(guān)信息;②內(nèi)部控制評(píng)價(jià)報(bào)告中披露內(nèi)部控制無(wú)效;③內(nèi)部控制審計(jì)報(bào)告出具否定或保留意見(jiàn);④披露重大會(huì)計(jì)差錯(cuò)導(dǎo)致的財(cái)務(wù)重述。根據(jù)迪博內(nèi)部控制與風(fēng)險(xiǎn)管理數(shù)據(jù)庫(kù)、國(guó)泰安經(jīng)濟(jì)金融研究數(shù)據(jù)庫(kù)、萬(wàn)德經(jīng)濟(jì)數(shù)據(jù)庫(kù)和中國(guó)證券監(jiān)督管理委員會(huì)網(wǎng)站信息公開(kāi)欄目中的信息,剔除金融業(yè)上市企業(yè)(其治理結(jié)構(gòu)與財(cái)務(wù)報(bào)告結(jié)構(gòu)異于一般行業(yè)企業(yè))及缺失數(shù)據(jù)后,手工整理得到20966個(gè)樣本。具體而言,2012~2019年的樣本量分別為1975、2107、2306、2445、2582、2977、3210、3364,其中認(rèn)定存在內(nèi)部控制重大缺陷的樣本量分別為24、48、61、55、55、64、114、136。

(二)變量定義

1.內(nèi)部治理機(jī)制維度。借鑒相關(guān)研究成果,內(nèi)部治理機(jī)制可通過(guò)股權(quán)制衡度、機(jī)構(gòu)持股比例、董事會(huì)規(guī)模、獨(dú)立董事占比、管理層權(quán)力、高管薪酬指標(biāo)來(lái)衡量。股權(quán)制衡度過(guò)高可能導(dǎo)致股東之間出現(xiàn)內(nèi)斗,致使企業(yè)決策的執(zhí)行效率下降;風(fēng)險(xiǎn)投資機(jī)構(gòu)經(jīng)常扮演著積極的角色,通過(guò)提供資金與技術(shù)支持、參與董事會(huì)席位等方式對(duì)企業(yè)起到認(rèn)證和監(jiān)督作用,防止內(nèi)部控制重大缺陷的產(chǎn)生;董事會(huì)規(guī)模過(guò)大會(huì)使得協(xié)調(diào)與組織工作更加繁瑣、管理效率低下,阻礙內(nèi)部控制機(jī)制發(fā)揮作用,過(guò)小則可能導(dǎo)致決策過(guò)程易受大股東控制;獨(dú)立董事憑借其專業(yè)素養(yǎng)和從業(yè)經(jīng)驗(yàn),能在“一權(quán)獨(dú)大”或“內(nèi)部人控制”的情況下客觀表達(dá)自身立場(chǎng),監(jiān)督管理層行為并防止內(nèi)部控制失效;兩職合一是違背權(quán)力制衡的典型控制缺陷,管理層權(quán)力這一定序指標(biāo)可通過(guò)兩職兼任情況來(lái)度量;薪酬激勵(lì)能引導(dǎo)管理層制定和執(zhí)行有效的內(nèi)部控制制度,解決代理沖突。具體指標(biāo)的定義見(jiàn)表1。

表1 內(nèi)部治理機(jī)制維度的指標(biāo)

2.外部環(huán)境風(fēng)險(xiǎn)維度。如果不熟悉國(guó)內(nèi)外經(jīng)濟(jì)發(fā)展差異、制度與法律規(guī)則、市場(chǎng)競(jìng)爭(zhēng)與文化等情況,企業(yè)將面臨巨大的系統(tǒng)風(fēng)險(xiǎn)[38],內(nèi)部控制體系的更新速度也無(wú)法在短期內(nèi)邁進(jìn)國(guó)際化進(jìn)程,內(nèi)部控制存在重大缺陷的可能性增加。在行政力量和市場(chǎng)力量作用于國(guó)民經(jīng)濟(jì)的背景下,制度環(huán)境不可避免地受到政府各類動(dòng)機(jī)和行為的影響。在市場(chǎng)化水平較高地區(qū),企業(yè)對(duì)競(jìng)爭(zhēng)壓力更為敏感,也更有動(dòng)力通過(guò)建立和實(shí)施內(nèi)部控制提升財(cái)務(wù)報(bào)告質(zhì)量、提高經(jīng)營(yíng)效率;在市場(chǎng)化水平較低地區(qū),更多的政府干預(yù)行為使得企業(yè)通過(guò)尋求政治關(guān)聯(lián)獲取經(jīng)濟(jì)利益,從而忽視內(nèi)部控制的監(jiān)督作用[39,40]。根據(jù)經(jīng)濟(jì)變遷理論,產(chǎn)品市場(chǎng)競(jìng)爭(zhēng)是提高經(jīng)濟(jì)效率最強(qiáng)大的力量,激烈的競(jìng)爭(zhēng)會(huì)壓縮盈利空間,降低信息不對(duì)稱程度,也在無(wú)形之中強(qiáng)化了內(nèi)部控制的實(shí)施環(huán)境[41,42]。參照Doyle等[43]的研究,如果企業(yè)經(jīng)營(yíng)業(yè)務(wù)涵蓋范圍較廣或子公司數(shù)量較多,不同業(yè)務(wù)之間的產(chǎn)品差異、經(jīng)營(yíng)策略、行業(yè)地位等因素可能導(dǎo)致合并報(bào)表編制難度增大,從而產(chǎn)生內(nèi)部控制缺陷;此外,上市時(shí)間越長(zhǎng)、規(guī)模越大的企業(yè),內(nèi)部控制建設(shè)情況越好。

綜上所述,本文選取國(guó)際化程度、市場(chǎng)化程度、產(chǎn)品市場(chǎng)競(jìng)爭(zhēng)、業(yè)務(wù)復(fù)雜度、上市年限和托賓Q值作為衡量企業(yè)外部環(huán)境風(fēng)險(xiǎn)的指標(biāo),具體指標(biāo)的定義見(jiàn)表2。

表2 外部環(huán)境風(fēng)險(xiǎn)維度的指標(biāo)

3.財(cái)務(wù)狀況維度。內(nèi)部控制最基本的功能是保證資金活動(dòng)與財(cái)務(wù)報(bào)告的真實(shí)性、完整性和可靠性,因此內(nèi)部控制重大缺陷研究離開(kāi)不財(cái)務(wù)活動(dòng)。我國(guó)內(nèi)部控制制度規(guī)范針對(duì)資金與資產(chǎn)管理、采購(gòu)與銷售業(yè)務(wù)、財(cái)務(wù)報(bào)告和預(yù)算等活動(dòng)詳細(xì)闡述了各種控制措施,體現(xiàn)了財(cái)務(wù)狀況在內(nèi)部控制體系建立過(guò)程中的重要性。財(cái)務(wù)特征能反映企業(yè)內(nèi)部控制質(zhì)量,財(cái)務(wù)狀況和盈利能力越差,內(nèi)部控制質(zhì)量越低[43-46];存在應(yīng)收賬款相關(guān)內(nèi)部控制缺陷的企業(yè),其應(yīng)收賬款周轉(zhuǎn)率顯著低于行業(yè)平均水平,存在任何類型內(nèi)部控制缺陷的企業(yè),其總資產(chǎn)收益率與凈資產(chǎn)回報(bào)率均低于行業(yè)平均水平[47]。經(jīng)營(yíng)活動(dòng)、投資活動(dòng)和籌資活動(dòng)是內(nèi)部控制缺陷的高發(fā)地,可選取能反映企業(yè)盈利能力(總資產(chǎn)凈利潤(rùn)率、凈資產(chǎn)收益率和營(yíng)業(yè)凈利率)、營(yíng)運(yùn)能力(應(yīng)收賬款周轉(zhuǎn)率、總資產(chǎn)周轉(zhuǎn)率)、償債能力(速動(dòng)比率、資產(chǎn)負(fù)債率、權(quán)益乘數(shù))、發(fā)展能力(每股凈資產(chǎn)增長(zhǎng)率、凈利潤(rùn)增長(zhǎng)率)的財(cái)務(wù)指標(biāo)來(lái)衡量財(cái)務(wù)狀況[48]。此外,處于財(cái)務(wù)困境之中的企業(yè)可能會(huì)為了盡快擺脫困境而忽略對(duì)內(nèi)部控制的投資與建設(shè),因此本文將Altman破產(chǎn)風(fēng)險(xiǎn)預(yù)測(cè)模型中的Z值和累計(jì)非經(jīng)常性損益也作為衡量企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)的代理變量,財(cái)務(wù)風(fēng)險(xiǎn)越大,企業(yè)越可能存在內(nèi)部控制重大缺陷。具體指標(biāo)的定義見(jiàn)表3。

表3 財(cái)務(wù)狀況維度的指標(biāo)

4.監(jiān)管與信息溝通維度。對(duì)于財(cái)務(wù)狀況差、經(jīng)營(yíng)風(fēng)險(xiǎn)大的企業(yè),審計(jì)人員將投入更多審計(jì)資源并收取更高的風(fēng)險(xiǎn)溢價(jià)費(fèi)用,規(guī)模較小的審計(jì)機(jī)構(gòu)收取的風(fēng)險(xiǎn)溢價(jià)會(huì)高于規(guī)模較大的審計(jì)機(jī)構(gòu)[51]。審計(jì)任期體現(xiàn)了監(jiān)管的連續(xù)性,與內(nèi)部控制缺陷發(fā)生概率顯著正相關(guān)。根據(jù)于忠泊等[52]提出的市場(chǎng)壓力假說(shuō),媒體關(guān)注度較高的企業(yè)的管理層可能會(huì)考慮自身聲譽(yù),從而有更強(qiáng)的動(dòng)機(jī)加強(qiáng)內(nèi)部控制制度的建立和實(shí)施,防止財(cái)務(wù)舞弊丑聞的發(fā)生。媒體監(jiān)督正逐步成為新興市場(chǎng)上有效彌補(bǔ)法制環(huán)境發(fā)展不足的重要手段,新聞曝光引發(fā)諸多關(guān)注,社會(huì)輿論促成企業(yè)整頓,直接快速的媒體發(fā)揮著監(jiān)督代理人的治理作用,在企業(yè)、投資者和政府監(jiān)管部門之間架起信息溝通橋梁[53]。此外,統(tǒng)計(jì)顯示,逐年增加的訴訟次數(shù)和涉案金額對(duì)上市企業(yè)的持續(xù)經(jīng)營(yíng)構(gòu)成重大威脅[54],顯著影響了內(nèi)部控制合規(guī)性目標(biāo)的實(shí)現(xiàn)。上述影響因素雖不是內(nèi)部控制缺陷存在的直接原因,但能從側(cè)面反映企業(yè)內(nèi)部控制質(zhì)量,具體指標(biāo)的定義見(jiàn)表4。

表4 監(jiān)管與信息溝通維度的指標(biāo)

四、模型構(gòu)建與結(jié)果分析

(一)模型構(gòu)建流程

內(nèi)部控制重大缺陷預(yù)測(cè)模型的構(gòu)建流程如圖1所示,經(jīng)過(guò)模型預(yù)處理、模型訓(xùn)練、模型驗(yàn)證與評(píng)價(jià)步驟后,根據(jù)評(píng)價(jià)指標(biāo)選擇最佳模型。本文模型的構(gòu)建過(guò)程均在Python3.7環(huán)境上運(yùn)行。

圖1 內(nèi)部控制重大缺陷預(yù)測(cè)模型的構(gòu)建流程

(二)特征工程

數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)的上限,選擇算法和訓(xùn)練模型的過(guò)程是為了逼近這個(gè)上限。特征攜帶的信息量越大,尋找最佳參數(shù)花費(fèi)的時(shí)間越少,模型復(fù)雜度也越低,因此特征工程在機(jī)器學(xué)習(xí)中的重要性毋庸置疑。本文對(duì)上文四個(gè)維度的29個(gè)特征進(jìn)行了特征處理和特征選擇工作。首先,對(duì)特征進(jìn)行無(wú)量綱化處理,使數(shù)據(jù)間具有可比性;其次,采用非參數(shù)檢驗(yàn)初步探索特征與標(biāo)簽之間的相關(guān)關(guān)系、特征之間的相關(guān)關(guān)系,判斷特征在統(tǒng)計(jì)上是否具有識(shí)別內(nèi)部控制重大缺陷的能力,以減少噪音數(shù)據(jù),提高模型預(yù)測(cè)效率。

卡方檢驗(yàn)可用于判斷離散型特征與標(biāo)簽間的相關(guān)性或獨(dú)立性,卡方值越大,說(shuō)明相關(guān)關(guān)系成立的可能性越大;Mann-Whitney U檢驗(yàn)是秩和檢驗(yàn)方法,用于正態(tài)分布、方差齊性等無(wú)法達(dá)到t檢驗(yàn)要求的情形,可用于判斷標(biāo)簽在某連續(xù)性特征上是否有顯著差異。根據(jù)表5的檢驗(yàn)結(jié)果,除國(guó)際化程度與機(jī)構(gòu)持股比例之外,其他特征均在5%的水平上統(tǒng)計(jì)顯著,表明內(nèi)部控制重大缺陷企業(yè)與非重大缺陷企業(yè)在其余27個(gè)特征上確實(shí)存在差異,故剔除這兩個(gè)指標(biāo)。特征間相關(guān)性系數(shù)越大,表明其共線性程度越高,而進(jìn)行Spearman秩相關(guān)檢驗(yàn)可進(jìn)一步剔除那些共線性程度較高的特征,避免其影響模型預(yù)測(cè)效果。Spearman秩相關(guān)檢驗(yàn)結(jié)果中系數(shù)大于0.5的特征基本為財(cái)務(wù)類指標(biāo)(如表6所示),可能是因?yàn)樨?cái)務(wù)指標(biāo)的數(shù)據(jù)來(lái)源和計(jì)算方式較其他特征而言更具強(qiáng)關(guān)聯(lián)性??紤]到Z-score指標(biāo)在大量實(shí)證中的重要影響以及財(cái)務(wù)指標(biāo)強(qiáng)相關(guān)性帶來(lái)的數(shù)據(jù)噪音,本文又剔除了托賓Q值、總資產(chǎn)凈利潤(rùn)率、速動(dòng)比率、資產(chǎn)負(fù)債率。經(jīng)過(guò)特征工程,本文篩選出23個(gè)特征用于后續(xù)模型構(gòu)建。

表5 Mann-Whitney U檢驗(yàn)和卡方檢驗(yàn)

表6 Spearman相關(guān)性檢驗(yàn)(部分)

(三)模型訓(xùn)練、驗(yàn)證與評(píng)價(jià)

缺陷預(yù)測(cè)實(shí)質(zhì)上是機(jī)器學(xué)習(xí)中的分類問(wèn)題。與深度學(xué)習(xí)相比,機(jī)器學(xué)習(xí)在較小樣本量的面板數(shù)據(jù)集上更有應(yīng)用優(yōu)勢(shì),因其數(shù)據(jù)維度較低且不需對(duì)原始二維數(shù)據(jù)進(jìn)行張量變換。本文選擇邏輯回歸、支持向量機(jī)、決策樹、BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、XGBoost算法構(gòu)建內(nèi)部控制重大缺陷預(yù)測(cè)模型的原因在于:現(xiàn)有研究已使用了線性判別、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)方法[17,18],通過(guò)比較六種機(jī)器學(xué)習(xí)算法,能豐富內(nèi)部控制缺陷預(yù)測(cè)研究的探索實(shí)踐并發(fā)掘預(yù)測(cè)效果更好的模型。考慮到時(shí)間因素,模型訓(xùn)練時(shí)先將樣本分為訓(xùn)練集1(2012~2016年的數(shù)據(jù))、訓(xùn)練集2(2013~2017年的數(shù)據(jù))、訓(xùn)練集3(2014~2018年的數(shù)據(jù))、訓(xùn)練集4(2012~2018年的數(shù)據(jù)),分別對(duì)應(yīng)驗(yàn)證過(guò)程的測(cè)試集1(2017年的數(shù)據(jù))、測(cè)試集2(2018年的數(shù)據(jù))、測(cè)試集3(2019年的數(shù)據(jù))、測(cè)試集4(2019年的數(shù)據(jù)),不同數(shù)據(jù)集應(yīng)用不同算法的機(jī)器學(xué)習(xí)模型,能得到更穩(wěn)健的預(yù)測(cè)結(jié)果(模型訓(xùn)練參數(shù)略)。

預(yù)測(cè)結(jié)果根據(jù)真實(shí)類別與預(yù)測(cè)類別的組合被劃分為真正例(True Positive)、假正例(False Positive)、真反例(True Negative)和假反例(False Negative)四種情況,以混淆矩陣表示,如表7所示。

表7 混淆矩陣

在驗(yàn)證過(guò)程中,輸入測(cè)試數(shù)據(jù)后,模型會(huì)生成某類標(biāo)簽的預(yù)測(cè)概率(如某企業(yè)被預(yù)測(cè)有重大缺陷的概率),將測(cè)試樣本按概率值降序排列,分類過(guò)程就是尋找閾值并將其“截?cái)唷睘閮深惖倪^(guò)程,大于某閾值為一類,否則為另一類。如果閾值較大,則在靠后位置截?cái)啵茏畲蟪潭鹊夭槿?;如果閾值較小,則在靠前位置截?cái)?,能最大程度地查?zhǔn)正例。ROC曲線(Receive Operating Characteristic Curve)和AUC值(Area Under ROC Curve)就是從上述角度出發(fā)衡量模型泛化性能的最佳指標(biāo)。ROC曲線的橫坐標(biāo)FPR(False Positive Rate)代表模型將多數(shù)類判斷錯(cuò)誤的情形,縱坐標(biāo)TPR(True Positive Rate)表示模型捕捉少數(shù)類的能力,能夠衡量模型在盡量捕捉少數(shù)類時(shí)誤判多數(shù)類的情況會(huì)如何變化。ROC曲線圍成的面積即為AUC值,AUC值越大,ROC曲線越接近左上角,預(yù)測(cè)效果越好。

(四)結(jié)果分析

不同算法的預(yù)測(cè)模型在各個(gè)數(shù)據(jù)集上的表現(xiàn)如表8所示,初步表明預(yù)測(cè)指標(biāo)體系的可用性。比較而言,隨機(jī)森林和XGBoost兩種集成模型在不同時(shí)間跨度的數(shù)據(jù)集上的預(yù)測(cè)效果都強(qiáng)于另外四個(gè)個(gè)體學(xué)習(xí)器,且XGBoost模型略優(yōu)于隨機(jī)森林模型,預(yù)測(cè)結(jié)果較為穩(wěn)健,表明相較于個(gè)體學(xué)習(xí)器,以XGBoost為代表的集成模型在企業(yè)內(nèi)部控制重大缺陷預(yù)測(cè)問(wèn)題上具有更好的預(yù)測(cè)性能和應(yīng)用價(jià)值。機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)基本定理是:沒(méi)有算法能完美地解決所有問(wèn)題,每種算法都有擅長(zhǎng)的問(wèn)題領(lǐng)域。上述結(jié)果初步表明,本文建立了適合我國(guó)上市企業(yè)的內(nèi)部控制重大缺陷預(yù)測(cè)指標(biāo)體系,且經(jīng)過(guò)對(duì)比,基于XGBoost算法的集成模型預(yù)測(cè)效果最佳。

表8 模型AUC值對(duì)比結(jié)果

集成學(xué)習(xí)算法優(yōu)于個(gè)體學(xué)習(xí)器的原因可能在于:一是,重大缺陷樣本與非重大缺陷樣本的訓(xùn)練樣例數(shù)量差別較大。本文所選樣本中,重大缺陷樣本的占比基本為3%左右,致使二分類結(jié)果出現(xiàn)較多“假”陽(yáng)性現(xiàn)象,影響了預(yù)測(cè)效果。一般來(lái)說(shuō),訓(xùn)練集的正例越多,測(cè)試集捕捉少數(shù)類樣本的性能越好,邏輯回歸、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)等算法對(duì)數(shù)據(jù)集正反例平衡性的要求更高。二是,特征數(shù)量較多會(huì)降低模型性能。邏輯回歸對(duì)高維數(shù)據(jù)不太友好,BP神經(jīng)網(wǎng)絡(luò)因連接權(quán)重參數(shù)較多且計(jì)算復(fù)雜,容易陷入局部極值。

對(duì)于同屬于集成學(xué)習(xí)算法的XGBoost模型和隨機(jī)森林模型,前者在各數(shù)據(jù)集上的預(yù)測(cè)效果略優(yōu)于后者的原因也值得深入討論。兩者在算法原理上的區(qū)別主要表現(xiàn)在三個(gè)方面:基學(xué)習(xí)器生成規(guī)則,最優(yōu)劃分特征的確定,匯總基學(xué)習(xí)器獲得預(yù)測(cè)值的組合方式。隨機(jī)森林采用自助采樣生成互不關(guān)聯(lián)的基學(xué)習(xí)器(決策樹),每個(gè)基學(xué)習(xí)器對(duì)隨機(jī)選擇的特征子集基于信息增益或基尼指數(shù)進(jìn)行后續(xù)分割,最后所有基學(xué)習(xí)器并行投票決定最終結(jié)果;而XGBoost的基學(xué)習(xí)器為樹模型或線性模型,采用貪心算法來(lái)枚舉所有特征可能的劃分情形以確定最優(yōu)劃分特征,串行地生成一系列基學(xué)習(xí)器,使得前一個(gè)基學(xué)習(xí)器分類錯(cuò)誤的樣本在后續(xù)訓(xùn)練中會(huì)得到更多關(guān)注,把預(yù)測(cè)值與真實(shí)值之差作為目標(biāo)函數(shù)進(jìn)行參數(shù)優(yōu)化和更新,最終預(yù)測(cè)值是基學(xué)習(xí)器預(yù)測(cè)值之和。對(duì)于集成學(xué)習(xí)算法,特征貢獻(xiàn)度能體現(xiàn)模型優(yōu)先選擇哪些特征來(lái)訓(xùn)練數(shù)據(jù)并應(yīng)用于測(cè)試集進(jìn)行預(yù)測(cè),這一指標(biāo)可用于反映上述兩種算法的差異。

如表9所示,平均貢獻(xiàn)度的排序結(jié)果表明,兩種模型中凈資產(chǎn)收益率、營(yíng)業(yè)凈利率、產(chǎn)品市場(chǎng)競(jìng)爭(zhēng)指標(biāo)都對(duì)預(yù)測(cè)結(jié)果的影響較大;XGBoost模型中財(cái)務(wù)特征與非財(cái)務(wù)特征占比較為平衡,而隨機(jī)森林模型中財(cái)務(wù)特征占比較大。因此,XGBoost模型在各數(shù)據(jù)集上的預(yù)測(cè)效果略強(qiáng)于隨機(jī)森林模型的原因可能在于,前者更多地使用非財(cái)務(wù)類指標(biāo)來(lái)訓(xùn)練數(shù)據(jù),因此在未來(lái)研究?jī)?nèi)部控制重大缺陷問(wèn)題時(shí)可繼續(xù)發(fā)掘非財(cái)務(wù)類特征。此外,兩種模型特征貢獻(xiàn)度的合計(jì)值表明,隨機(jī)森林模型在訓(xùn)練數(shù)據(jù)時(shí)沒(méi)能涵蓋到更多的特征,而XGBoost模型對(duì)特征的選擇范圍更廣,訓(xùn)練時(shí)學(xué)到的信息也更多。隨著未來(lái)數(shù)據(jù)量和相關(guān)特征的增加,XGBoost在模型構(gòu)建和訓(xùn)練過(guò)程中存在更大的優(yōu)化空間,值得學(xué)者繼續(xù)研究。通過(guò)比較不同機(jī)器學(xué)習(xí)算法,本文選擇的最佳預(yù)測(cè)模型是基于XGBoost算法的預(yù)測(cè)模型。

表9 特征貢獻(xiàn)度相對(duì)重要性排序(前9位)

五、結(jié)論與啟示

(一)結(jié)論

內(nèi)部控制重大缺陷預(yù)測(cè)模型旨在識(shí)別內(nèi)部控制有嚴(yán)重缺陷的企業(yè),使其能在管理、投資、評(píng)價(jià)和監(jiān)管等決策中得到預(yù)警提示,有針對(duì)性地對(duì)缺陷進(jìn)行糾正和改進(jìn)。進(jìn)一步地,從預(yù)測(cè)指標(biāo)體系出發(fā),尋找企業(yè)可能存在的欠合理的內(nèi)部治理機(jī)制、嚴(yán)重的外部環(huán)境風(fēng)險(xiǎn)、異常的財(cái)務(wù)狀況等,有利于識(shí)別組織內(nèi)部控制缺陷根源、及時(shí)制定解決策略并防止損失擴(kuò)大。本文的主要結(jié)論如下:

1.建立內(nèi)部控制重大缺陷預(yù)測(cè)指標(biāo)體系具有可行性。本文從內(nèi)部治理機(jī)制、外部環(huán)境風(fēng)險(xiǎn)、財(cái)務(wù)狀況、監(jiān)管與信息溝通四個(gè)維度建立了內(nèi)部控制重大缺陷預(yù)測(cè)指標(biāo)體系,且經(jīng)特征工程處理后,篩選出23個(gè)預(yù)測(cè)特征。不同時(shí)間跨度、不同算法基礎(chǔ)上的預(yù)測(cè)模型的AUC值基本都在0.7以上。

2.集成模型在不平衡、高維度、相關(guān)關(guān)系不明確的數(shù)據(jù)集上的預(yù)測(cè)效果較為穩(wěn)健,預(yù)測(cè)性能整體強(qiáng)于個(gè)體學(xué)習(xí)器。針對(duì)數(shù)據(jù)集的不平衡特性,后續(xù)研究可以從更多正式或非正式數(shù)據(jù)來(lái)源增加正例(存在內(nèi)部控制重大缺陷)樣本和信息含量。除本文認(rèn)定的證監(jiān)會(huì)行政處罰公告和市場(chǎng)禁入公告內(nèi)容外,應(yīng)繼續(xù)發(fā)掘可靠的認(rèn)定證據(jù),如審計(jì)署公告、中央及地方政府公開(kāi)披露的信息、民眾實(shí)名舉報(bào)等,甚至利用大數(shù)據(jù)爬蟲軟件匯總經(jīng)過(guò)證實(shí)的上市企業(yè)負(fù)面新聞。

3.XGBoost模型略優(yōu)于隨機(jī)森林模型。由于算法原理不同,XGBoost模型能夠?qū)W習(xí)到更多的特征信息,特征的選擇范圍更廣。此外,特征貢獻(xiàn)度排序表明,XGBoost模型能抓取更多的非財(cái)務(wù)特征,隨著未來(lái)數(shù)據(jù)量和相關(guān)特征的增加,XGBoost在模型構(gòu)建和訓(xùn)練過(guò)程中存在更大的優(yōu)化空間。

(二)啟示

扎根于我國(guó)企業(yè)內(nèi)部控制建設(shè)現(xiàn)狀,著眼于利益相關(guān)者的現(xiàn)實(shí)需求,本文的研究啟示在于:

1.從企業(yè)自身視角來(lái)看。我國(guó)資本市場(chǎng)的基本特征仍然是“新興加轉(zhuǎn)軌”,市場(chǎng)機(jī)制不夠完善、市場(chǎng)運(yùn)行效率不高,整體發(fā)展水平仍然處于初級(jí)階段。國(guó)家出臺(tái)關(guān)于公司治理、風(fēng)險(xiǎn)管理、內(nèi)部控制的監(jiān)管要求以保障資本市場(chǎng)的有效運(yùn)行,但企業(yè)在制定和執(zhí)行上述規(guī)則時(shí)可能出現(xiàn)概念混淆的情況,從而導(dǎo)致內(nèi)部控制措施缺乏針對(duì)性。內(nèi)部控制重大缺陷預(yù)測(cè)模型為企業(yè)提供了主動(dòng)正視問(wèn)題的途徑,避免企業(yè)對(duì)政策無(wú)所適從、控制成本劇增等情況。

2.從債權(quán)人、投資者視角來(lái)看。由于信息不對(duì)稱程度較高,債權(quán)人、投資者等利益相關(guān)者在資本市場(chǎng)中處于弱勢(shì)地位,損失事件頻繁發(fā)生令其非常關(guān)心如何獲取高質(zhì)量的相關(guān)信息。內(nèi)部控制重大缺陷預(yù)測(cè)模型為利益相關(guān)者提供了一種判別方式,能在企業(yè)信息公布之前通過(guò)模型整合已有信息進(jìn)行預(yù)判,在公布之后對(duì)比偏差來(lái)識(shí)別可能存在的投資風(fēng)險(xiǎn),以指導(dǎo)未來(lái)決策行為。

3.從政府監(jiān)管視角來(lái)看。我國(guó)在建立與完善社會(huì)主義市場(chǎng)經(jīng)濟(jì)體制的過(guò)程中,政府監(jiān)管存在監(jiān)管依據(jù)不足、多頭監(jiān)管普遍、監(jiān)管方式傳統(tǒng)等問(wèn)題,而內(nèi)部控制重大缺陷預(yù)測(cè)模型通過(guò)運(yùn)用現(xiàn)代科技手段促進(jìn)政府監(jiān)管的精準(zhǔn)化和智能化,推動(dòng)了監(jiān)管方式創(chuàng)新。

猜你喜歡
預(yù)測(cè)特征算法
無(wú)可預(yù)測(cè)
黃河之聲(2022年10期)2022-09-27 13:59:46
選修2-2期中考試預(yù)測(cè)卷(A卷)
選修2-2期中考試預(yù)測(cè)卷(B卷)
如何表達(dá)“特征”
基于MapReduce的改進(jìn)Eclat算法
Travellng thg World Full—time for Rree
不忠誠(chéng)的四個(gè)特征
進(jìn)位加法的兩種算法
抓住特征巧觀察
不必預(yù)測(cè)未來(lái),只需把握現(xiàn)在
确山县| 吉木萨尔县| 定州市| 喀喇沁旗| 梅河口市| 辉南县| 孝义市| 渑池县| 佛学| 衡东县| 江口县| 东山县| 宽甸| 乌审旗| 衡山县| 邵阳县| 仁怀市| 独山县| 班玛县| 应用必备| 喀什市| 八宿县| 浦县| 永修县| 涞水县| 玛沁县| 綦江县| 武夷山市| 迁西县| 耒阳市| 赣州市| 宜川县| 翁牛特旗| 天门市| 新龙县| 新巴尔虎右旗| 嘉义市| 永嘉县| 涟水县| 平湖市| 长海县|