李仕瑾
【摘要】傳統(tǒng)的財務風險識別主要依賴對財務報表的分析和判斷,但財務報表可能存在偽裝、欺詐等問題,這將導致分析結果存在偏差。本文基于機器學習算法,構建了以企業(yè)財務評價指標和非財務評價指標為維度的財務風險識別體系,并對這兩個維度所采用的預測模型進行了初步分析。
【關鍵詞】大數(shù)據(jù)背景;機器學習;財務風險識別
【基金項目】江西省教育廳科學技術研究項目“大數(shù)據(jù)背景下基于機器學習的企業(yè)財務風險識別研究”(GJJ2205225);江西省高等學校教學改革研究重點課題“基于CDIO理念的大數(shù)據(jù)與會計專業(yè)課程體系優(yōu)化與實踐”(JXJG-22-53-2);江西省教育科學“十四五”規(guī)劃年度課題“崗課賽證融通背景下高職商科專業(yè)教學質(zhì)量學生滿意度實證研究”(22GZQN62);江西交通職業(yè)技術學院教改課題“基于CDIO理念的“一異二型三化”會計專業(yè)課程教學體系改革研究(2022JG16)”。
一、引言
2015年,國務院印發(fā)了《促進大數(shù)據(jù)發(fā)展行動綱要》,明確了大數(shù)據(jù)的主要特征。同年,黨的十八屆中央委員會第五次全體會議將大數(shù)據(jù)戰(zhàn)略上升至國家戰(zhàn)略層面,提出了要實施“國家大數(shù)據(jù)戰(zhàn)略”。2021年,工業(yè)和信息化部在《“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃》中明確了新的歷史時期大數(shù)據(jù)及大數(shù)據(jù)相關產(chǎn)業(yè)的發(fā)展目標。目前,大數(shù)據(jù)及大數(shù)據(jù)技術已廣泛的應用到行業(yè)的方方面面,助力經(jīng)濟社會發(fā)展。
隨著經(jīng)濟全球化發(fā)展及我國經(jīng)濟體制改革的深入,企業(yè)需要面臨更加復雜的市場環(huán)境。當前,中美貿(mào)易摩擦、匯率變動、物價變化等市場外部環(huán)境越來越復雜,這給企業(yè)的經(jīng)營增加了許多不可控因素。如果企業(yè)的外部市場或政策出現(xiàn)異常變動,企業(yè)的內(nèi)部投資和融資決策出現(xiàn)問題,將會導致企業(yè)出現(xiàn)財務風險。上市公司作為市場經(jīng)濟的重要組成部分,其財務狀況和風險對投資者、股東、經(jīng)理人員和其他利益相關者都密切相關。
傳統(tǒng)的財務風險識別主要依賴對財務報表的分析和判斷。但財務報表可能存在偽裝、欺詐等問題,這將導致分析結果存在偏差。因此,基于數(shù)據(jù)挖掘技術對上市公司的各類數(shù)據(jù)進行分析,在海量的財務數(shù)據(jù)中發(fā)現(xiàn)潛在的風險因素,提前預測財務分險,對上市公司、投資者、股東及證券監(jiān)管部門均具有重要意義。
二、國內(nèi)外研究現(xiàn)狀
國外關于財務風險的研究始于上世紀30年代,到目前已有90多年的歷史。縱觀相關學者的研究成果,主要聚焦在了財務風險預警模型上。經(jīng)文獻梳理,研究成果從最初的單一變量預警模型發(fā)展到多變量風險預警模型,基于人工智能的預警方法也在不斷完善與發(fā)展。Fiztpatrick(1932)提出了最早的單元風險預警模型,選取了債務保障率、資產(chǎn)收益率、資產(chǎn)負債率、資金安全率、安全邊際率等單一財務變量作為預警變量;Altman(1968)突破單一變量風險識別方法的局限,首次提出了Z-Score多元判別分析模型;Martin(1977)打破財務指標數(shù)據(jù)必須服從正態(tài)分布的假設,首次引入了多元邏輯(Logit)回歸模型;Odom等(1990),首次將神經(jīng)網(wǎng)絡理論應用于財務風險預警研究。進入21世紀以后,隨著計算機技術術的發(fā)展,財務風險預警模型的構建也在不斷創(chuàng)新。VanGestel(2003)建立了LS-SVM模型識別財務危機;Zieba等(2016)將梯度提升決策樹應用于破產(chǎn)預測;Halteh&Kumar等(2018)將決策樹、隨機梯度增強和隨機森林應用于101家伊斯蘭上市銀行組成的數(shù)據(jù)集的金融困境預測。
相較于國外,國內(nèi)關于財務風險預警的研究起步較晚。吳世農(nóng)等(1986)最早開始國內(nèi)的財務風險預警研究;陳靜(1999)通過27家被ST和正常公司的財務數(shù)據(jù)開展了單變量分析和多元判定,開創(chuàng)了我國學者對上市公司進行財務風險識別預警的先河;關欣等(2016)將邏輯回歸模型及BP神經(jīng)網(wǎng)絡模型應于財務預警模的實證分析;王玉冬等(2018)采用粒子群算法進行了改進,建立PSO-BP和FOA-BP神經(jīng)網(wǎng)絡模型;楊貴軍等(2022)利用Benford律和Myer指數(shù),構造了BM-BP神經(jīng)網(wǎng)絡財務風險預警模型。
結合國內(nèi)外的研究現(xiàn)狀,關于財務風險預警,經(jīng)歷了簡單的單元預警模型、多元判別模型、邏輯回歸模型向復雜的神經(jīng)網(wǎng)絡模型、支持向量機模型和其他混合模型發(fā)展歷程,相關文獻的研究結果證明了機器學習算法在財務風險預警領域的適切性。
三、傳統(tǒng)的財務風險識別指標體系
早期的研究中,受數(shù)據(jù)獲取渠道及計算機技術等方面的條件制約,難于獲取海量的公司財務數(shù)據(jù),也難以實現(xiàn)對大規(guī)模數(shù)據(jù)的分析處理。因此,在傳統(tǒng)的財務風險識別過程,一般選取與企業(yè)財務信息相關的盈利能力、償債能力、營運能力和發(fā)展能力等方面的指標進行模型構建,采用的模型主要有邏輯回歸模型、BP神經(jīng)網(wǎng)絡模型、粒子群算法改進的神經(jīng)網(wǎng)絡模型等。從目前的發(fā)展狀況來看,包含傳統(tǒng)財務指標體系的賬務風險識別模型的構建已相對完善。
四、大數(shù)據(jù)背景下財務風險識別指標體系構建
隨著云存儲、區(qū)塊鏈、計算機等技術的飛速發(fā)展,海量數(shù)據(jù)的存儲、管理和應用變成了可能。大數(shù)據(jù)及大數(shù)據(jù)處理相關技術的應用,拓寬了投資者獲取企業(yè)財務信息渠道,也使快速、準確地收集、整理和分析財務數(shù)據(jù)成為了可能。云計算、大型計算機服務器的算力指數(shù)級增加,這使得對大規(guī)模數(shù)據(jù)的分析與處理成為了可能。
企業(yè)的財務風險與企業(yè)的財務評價指標和非財務評價指標相關。傳統(tǒng)的財務風險識別只考慮企業(yè)的財務評價指標,但對上市公司而言,社會網(wǎng)絡輿情數(shù)據(jù)、股權結構、董事會結構、管理成本、審計意見等非財務評價指標也與企業(yè)的正常經(jīng)營息息相關。非財務評價指標一般為文本型數(shù)據(jù),具有難于量化的特點,而機器學習算法對文本、圖像都具有強大的處理能力。因此,應用機器學習算法,結合企業(yè)的非財務指標對風險識別模型進行改進,可以取得更好的風險識別效果。有鑒于此,筆者對傳統(tǒng)的財務風險識別模型進行改進,采用財務評價指標和非財務指標兩個維度構建大數(shù)據(jù)背景下的財務風險識別模型。具體構建中,財務評價指標主要選取盈利能力、償債能力、營運能力、發(fā)展能力、現(xiàn)金流量等幾個代表參數(shù);非財務評價指標主要選取社會網(wǎng)絡輿情數(shù)據(jù)、股權結構、董事會結構、管理成本、管理層穩(wěn)定性、審計意見等參數(shù)。按照指標屬性、指標維度及具體的指標選取值,模型結構如圖1所示。
五、財務評價指標及非財務評價預測模型選擇
大數(shù)據(jù)背景下財務風險識別指標體系由企業(yè)的財務評價指標和非財務評價指標兩部分組成。在風險模型構建時,財務評價指標采用的是財務報表中以數(shù)值形式出現(xiàn)的反應盈利能力、償債能力、營運能力、發(fā)展能力及現(xiàn)金流量數(shù)據(jù);非財務評價指標采用的是反映企業(yè)的股權結構、董事會結構、客理成本、管理層穩(wěn)定性、審計意見及與企業(yè)相關的網(wǎng)絡輿情數(shù)據(jù),這類數(shù)據(jù)在企業(yè)年報中,經(jīng)常以文本的形式出現(xiàn)。針對以上兩種不同的數(shù)據(jù)類開型,在模型構建的過程中,需要采用不能的預測模型進行數(shù)據(jù)處理。
決策樹模型、隨機森林模型、梯度提升決策樹模型等以樹模型為基礎的預測模型對數(shù)值型數(shù)據(jù)具有強大的處理能力,可以很好的解決分類和回歸問題。因此,在財務風險的預測過程中,對于公司財務報表中的數(shù)值型數(shù)據(jù),可以采用決策樹模型進行預測。利用對照組和實驗組數(shù)據(jù),結合Bagging以及Boosting提升算法,可以模擬現(xiàn)實中人類決策行為,通過優(yōu)化決策樹,相當于提高了財務分析人員的決策能力,使模型對公司是否存在風險的判讀更加科學、準確。
機器學習中的卷積神經(jīng)網(wǎng)絡和循環(huán)神經(jīng)網(wǎng)絡可以很好的處理文本型數(shù)據(jù)。因此在財務風險預測過程中,對于非財務評價指標等文本型數(shù)據(jù),采用神經(jīng)網(wǎng)絡中的詞袋(Bag of Words)模型進行,通過對非財務評價指標的分析,對比正常公司的年報文本和存在財務風險公司的年報文本,深度挖掘文本型數(shù)據(jù)下隱藏的規(guī)律,進而判斷公司是否面臨財務風險。
六、結束語
結合數(shù)值型數(shù)據(jù),可以構建以財務報表為基礎,決策樹為主要算法的風險預測模型;結合文本型數(shù)據(jù),可以構建以上市公司年度報告文本為基礎,深度神經(jīng)網(wǎng)絡為算法的風險預測模型。綜合上市公司的財務報表數(shù)據(jù)及年報文本數(shù)據(jù),將兩種模型進行集成學習,便可以獲得一個同時接收財務報表數(shù)據(jù)和文本數(shù)據(jù)的財務風險預測模型。
········參考文獻·····················
[1]王賀敏,劉明瑋.大數(shù)據(jù)在財務風險識別與管控中的應用探析[J].中國注冊會計師,2022,(10):107-112.
[2]吳世農(nóng),黃世忠.企業(yè)破產(chǎn)的分析指標和預測模型[J].中國經(jīng)濟問題,1987.6(6):20-28.
[3]陳靜.上市公司財務惡化預測的實證分析[J].會計研究,1999,4(9):31-38.
[4]關欣,王征.基于Logistic回歸模型和BP神經(jīng)網(wǎng)絡的財務預警模型比較[J].統(tǒng)計與決策,2016,17(49):179-181.
[5]楊貴軍,杜飛,賈曉磊.基于首末位質(zhì)量因子的BP神經(jīng)網(wǎng)絡財務風險預警模型[J].統(tǒng)計與決策,2022,38(3):166-171.
(作者單位:江西交通職業(yè)技術學院運輸管理學院)