康亮河 林雨蔚 朱莉莉 王雲(yún)慧 袁敏
摘要:企業(yè)是市場(chǎng)的重要參與主體之一,而財(cái)務(wù)是各個(gè)企業(yè)的重要運(yùn)營(yíng)支撐,在新冠肺炎疫情所帶來的壓力下,市場(chǎng)風(fēng)險(xiǎn)逐漸擴(kuò)大,隨時(shí)出現(xiàn)的財(cái)務(wù)困境成為企業(yè)所面臨的最大挑戰(zhàn)。該研究選取2020年157家被特別處理的上市公司(Special Treatment, ST) 和157家非ST上市公司的19個(gè)指標(biāo)為研究對(duì)象,對(duì)公司的財(cái)務(wù)狀況進(jìn)行預(yù)測(cè)和分析構(gòu)建了Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。實(shí)驗(yàn)結(jié)果表明: RBF、BP及SVM模型的準(zhǔn)確率具體數(shù)值為14.28%、9.52%、7.93%,而Elamn模型預(yù)測(cè)的分類準(zhǔn)確率是85.71%,說明研究提出的Elman預(yù)測(cè)模型在財(cái)務(wù)困境的預(yù)測(cè)中具有較強(qiáng)的預(yù)測(cè)能力,可以為企業(yè)機(jī)構(gòu)做出正確的決策提供指導(dǎo)意義。
關(guān)鍵詞:Elamn神經(jīng)網(wǎng)絡(luò);均值插補(bǔ)法;PCA算法;財(cái)務(wù)困境
中圖分類號(hào):TP391.1 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2022)31-0011-03
1 引言
財(cái)務(wù)困境是指公司在經(jīng)營(yíng)過程中財(cái)務(wù)狀況嚴(yán)重惡化、債務(wù)違約甚至面臨破產(chǎn)風(fēng)險(xiǎn)的狀況[1]。隨著經(jīng)濟(jì)生活國(guó)際化發(fā)展,中小企業(yè)在推動(dòng)我國(guó)經(jīng)濟(jì)增長(zhǎng)和社會(huì)進(jìn)步中發(fā)揮著愈來愈重要的作用,但自2020年以來,新冠肺炎疫情下的中小企業(yè)在經(jīng)營(yíng)狀況遠(yuǎn)不如前,停工停業(yè),物流受限,原料成本上升供應(yīng)不足等種種原因?qū)е绿潛p運(yùn)營(yíng)[2],因此,尋找合適的財(cái)務(wù)困境預(yù)警模型,使公司能夠及時(shí)應(yīng)對(duì)或者規(guī)避可能發(fā)生的財(cái)務(wù)風(fēng)險(xiǎn),對(duì)企業(yè)自身、公司股東及利益相關(guān)者具有重要意義。
2008年6月以來,國(guó)際金融危機(jī)對(duì)市場(chǎng)的巨大沖擊使得人們愈發(fā)重視財(cái)務(wù)困境。Altman[3]提出構(gòu)建Z-Score模型,利用多項(xiàng)指標(biāo)來分析和預(yù)測(cè)企業(yè)的財(cái)務(wù)狀況;1980年開始,隨著機(jī)器學(xué)習(xí)的快速發(fā)展,決策樹、隨機(jī)森林及神經(jīng)網(wǎng)絡(luò)在財(cái)務(wù)困境預(yù)警領(lǐng)域得到了廣泛的使用,李曉靜[4]等人不僅邏輯回歸模型在財(cái)務(wù)困境預(yù)測(cè)研究領(lǐng)域中的實(shí)際應(yīng)用,同時(shí)利用Logistic模型對(duì)我國(guó)上市公司財(cái)務(wù)報(bào)表進(jìn)行了分類和預(yù)測(cè),據(jù)此取得了良好的預(yù)測(cè);張春華[5]等人根據(jù)t-1年與t-2年的面板數(shù)據(jù),構(gòu)建了SVM多分類模型,將企業(yè)劃分為財(cái)務(wù)健康公司、財(cái)務(wù)亞健康公司和財(cái)務(wù)困境公司三類;西鳳茹[6]等人以制造業(yè)上市公司為研究對(duì)象,構(gòu)建了基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò),并與logistic、PCA及BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行了對(duì)比,發(fā)現(xiàn)優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確率明顯提高。
2 主要算法介紹
2.1 均值插補(bǔ)法
對(duì)于缺失值最簡(jiǎn)單的處理方法便是刪除,如果直接刪除將會(huì)影響分析結(jié)果或者建模的準(zhǔn)確率,所以對(duì)于特定的數(shù)據(jù)一般不直接刪除,可采用插補(bǔ)法進(jìn)行填補(bǔ),其中均值插補(bǔ)法是最常用且插補(bǔ)精度較高的一種插補(bǔ)算法。均值插補(bǔ)是利用樣本數(shù)據(jù)平均值或眾數(shù)替換數(shù)據(jù)變量中的所有缺失值(NA) ,從而在含有缺失值的數(shù)據(jù)上集中形成一組完整的數(shù)據(jù)[7],均值插補(bǔ)的插補(bǔ)值的計(jì)算公式為:
[y=i=1nβiyini] ? ? ?(1)
其中,[βi]為是否回答的描述符號(hào)表示,[βi=1]表示“是”,[βi=0]表示“否”,[ni]是個(gè)數(shù)。
2.2 PCA算法
PCA即主成分分析是常用的特征屬性分析、數(shù)據(jù)降維方法,PCA 算法利用數(shù)據(jù)的相關(guān)性,從線性相關(guān)到線性無關(guān),從高維數(shù)據(jù)降到低維數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)降維的同時(shí)剔除數(shù)據(jù)相關(guān)性,稱低維數(shù)據(jù)變量為主成分[8]。通過主成分分析算法對(duì)指標(biāo)變量進(jìn)一步地提取,篩選出重要財(cái)務(wù)指標(biāo)作為建模屬性,完成數(shù)據(jù)預(yù)處理階段的工作,并為后續(xù)模型的建立提供可靠的數(shù)據(jù)集。本文利用 PCA 算法旨在選出比原始財(cái)務(wù)指標(biāo)個(gè)數(shù)少,且能解釋和代替原始財(cái)務(wù)指標(biāo)的主成分,對(duì)原始財(cái)務(wù)指標(biāo)進(jìn)行替代作為建模特征。主成分分析的計(jì)算步驟如下:
1) 設(shè)原始變量[x1],[x2]…,[xp]的n次數(shù)據(jù)矩陣[X]為:
[X=x11x12...x1px21x22...x2p........xn1xn2...xnp] ? ? ? ?(2)
2) 將該矩陣按列中心標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化的矩陣定義為[rij]:
[rij=k=1nxki-xixkj-xjk=1nxki-xi2k=1nxkj-xj2] ? ?(3)
其中[rij]=[rji],[rii]=1,r為實(shí)對(duì)稱矩陣。
3) R為相關(guān)系數(shù)矩陣,[R=(rij)p*p],求出R的特征方程[detR-λE=0]的特征根[λ1≥λ2≥λp>0](特征根越大說明該指標(biāo)越重要)。
4) 確定主成分個(gè)數(shù)m,累計(jì)方差貢獻(xiàn)率[?]依據(jù)實(shí)際情況而定,一般情況下(≥80%或≥85%) 取值80%。
[i=1mλii=1pλi≥?] ? ?(i=1,2,…,p) ? ?(4)
5) 計(jì)算[m]各相應(yīng)的單位特征向量:
[β1=β11β21..βp1, β2=β12β22..βp2,... β3=β1mβ2m..βpm] ? ?(5)
6) 計(jì)算主成分,上市公司的綜合值(特征值大于1為標(biāo)準(zhǔn)提取主成分),并對(duì)其進(jìn)行降序排列:
[Zi=β1iX1+β2iX2+...+βpiXp] ? ? ? (6)
2.3 Elman神經(jīng)網(wǎng)絡(luò)
Elman 神經(jīng)網(wǎng)絡(luò)屬于動(dòng)態(tài)遞歸神經(jīng)網(wǎng)絡(luò),通過存儲(chǔ)內(nèi)部狀態(tài)使其具備映射動(dòng)態(tài)特征功能,系統(tǒng)因此具有適應(yīng)時(shí)變的特性,增強(qiáng)了網(wǎng)絡(luò)的全局穩(wěn)定性,Elman神經(jīng)網(wǎng)絡(luò)為4層結(jié)構(gòu),包括輸入層、隱含層、承接層和輸出層,其中承接層可以自動(dòng)保存隱含層中的狀態(tài)信息,所以網(wǎng)絡(luò)層處理動(dòng)態(tài)消息能力相對(duì)較為優(yōu)越[9]。Elman 神經(jīng)網(wǎng)絡(luò)的輸入層、隱含層和輸出層表示形式分別如下式中:
[xit=xipmt=Ppmpm=ivi,mxit+mp?mtyjt=mvm,jpmt] ? ? ? ?(7)
[t]時(shí)刻第 [i] 個(gè)神經(jīng)元的輸出值為[xit],第 [m] 個(gè)神經(jīng)元的輸出值是[pmt];[P] 為激活函數(shù);輸入層第 [i]個(gè)元的輸入值為 [xi],第 [m]個(gè)神經(jīng)元輸入值是[pm] ;[vi,m] 為輸入層到隱含層的權(quán)值;[p?mt]為承接層輸出值;輸出層第 [j]個(gè)神經(jīng)元的輸出值為[yjt];[vm,j]為隱含層到輸出層的權(quán)值。
Elman神經(jīng)網(wǎng)絡(luò)主要包括輸入層、承接層及隱含層[10],其具體工作流程如下圖1所示:
Step1:將Elamn網(wǎng)絡(luò)的初始權(quán)值編為若干個(gè)二進(jìn)制編碼,每個(gè)個(gè)體均為一個(gè)二進(jìn)制串;
Step2:信號(hào)傳輸作用;
Step3:使用線性或非線性函數(shù),達(dá)到動(dòng)態(tài)建模的目的;
Step4:承接層又稱上下文層或狀態(tài)層,用于記憶隱含層單元前一時(shí)間步的輸出值,可以看作是一步延時(shí)算子;
Step5:輸出隱含層數(shù)據(jù),與承接層做好自連;
Step6:依據(jù)規(guī)范的方框圖計(jì)算誤差函數(shù)傳遞;
Step7:根據(jù)之前的計(jì)算,更新更為準(zhǔn)確的權(quán)值。
3 實(shí)驗(yàn)結(jié)果及討論
3.1 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理
本文獲取了2020年全部A股4524家上市公司的123項(xiàng)財(cái)務(wù)數(shù)據(jù),若2018與2019年財(cái)務(wù)凈利潤(rùn)均小于0,則該上市公司2020將被年將被判定為ST公司,該ST公司用類別“1”表示,否則,判定為非ST公司,用類別“-1”表示。本文通過散點(diǎn)圖去除異常數(shù)據(jù),并利用均值插補(bǔ)法對(duì)缺失的統(tǒng)計(jì)結(jié)果進(jìn)行插補(bǔ),通過PCA算法,按累計(jì)貢獻(xiàn)率90%篩出19個(gè)重要指標(biāo),最后選擇157家ST公司與157家非ST公司的19個(gè)指標(biāo)組成樣本數(shù)據(jù)集作為本文的研究對(duì)象。
本文采用分類準(zhǔn)確率、第I類錯(cuò)誤率及第Ⅱ類錯(cuò)誤率指標(biāo)來評(píng)估分類模型[11],對(duì)其定義如下:
[Accuracy=TP+TNTP+TN+FP+FN×100%] ? (8)
[Type Ⅰ error=FPFP+TN×100%] ? ?(9)
[Type Ⅱ error=FNTP+FN×100%] ? ?(10)
其中,TP、TN、FP及FN分別表示真正例、真負(fù)例、假正例及假負(fù)例,即表示正常公司被正確分類的數(shù)量、ST被正確分類的數(shù)量、ST公司被分為正常公司的數(shù)量及正常公司被分為ST公司的數(shù)量。
3.2 參數(shù)設(shè)計(jì)
在Elman算法中,利用激活函數(shù)[tansig(x)=2/(1+exp(-2x))-1] 計(jì)算隱藏層 ,[purelin(x)=x]計(jì)算輸出層,隱藏層個(gè)數(shù)用經(jīng)驗(yàn)公式 [m=n+l+?]計(jì)算,其中用 [n]、[l]、[?] 分別表示輸入層個(gè)數(shù)、輸出層個(gè)數(shù)和[1~10] 之間的常數(shù),經(jīng)測(cè)試,預(yù)測(cè)誤差最小時(shí) [m=21],最大訓(xùn)練次數(shù)為100,誤差目標(biāo)為0.0001,學(xué)習(xí)率為0.1。
3.3 實(shí)驗(yàn)結(jié)果及討論
1) 預(yù)測(cè)結(jié)果
本課題采用314家A股上市公司作為研究對(duì)象,以251家公司的財(cái)務(wù)數(shù)據(jù)為訓(xùn)練集,以剩余63家公司作為測(cè)試集。Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型以通過PCA算法所獲得的19個(gè)指標(biāo)數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù)構(gòu)建,對(duì)預(yù)測(cè)結(jié)果進(jìn)行統(tǒng)計(jì)分析,得到結(jié)果如圖2所示。
圖2表示,在被選擇用來預(yù)測(cè)的63家公司中有33家公司因財(cái)務(wù)困境而被特殊處理變?yōu)镾T股,剩余30家公司顯示財(cái)務(wù)正常,在Elman預(yù)測(cè)模型對(duì)63家公司財(cái)務(wù)狀況進(jìn)行預(yù)測(cè)的研究結(jié)果中,30家公司面臨財(cái)務(wù)困境,財(cái)務(wù)正常的公司有33家,其中Elman預(yù)測(cè)正確了54家公司的財(cái)務(wù)狀況與實(shí)際數(shù)據(jù)對(duì)比分析得出,Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的預(yù)測(cè)準(zhǔn)確率為85.71%。
2) 預(yù)測(cè)結(jié)果分析
為進(jìn)一步分析Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,本文將 SVM、BP和 RBF神經(jīng)網(wǎng)絡(luò)算法模型的各項(xiàng)指標(biāo)值進(jìn)行了比較。各模型的預(yù)測(cè)結(jié)果如表1所示。
從上表中可以看出,采用Elman算法進(jìn)行建模預(yù)測(cè)的63個(gè)結(jié)果值中,共有54家公司分類正確,有6家ST公司被分為了正常公司,有3家正常公司被分為了ST公司,即第Ⅰ類誤差數(shù)量是4,第Ⅱ類誤差數(shù)量是3;依次分析得:RBF模型預(yù)測(cè)結(jié)果中,有45家公司分類正確,第Ⅰ類誤差數(shù)量為3,第Ⅱ類誤差數(shù)量為15;BP模型預(yù)測(cè)結(jié)果中,48家公司分類正確,第Ⅰ類誤差數(shù)量為8,第Ⅱ類誤差數(shù)量為7;SVM模型預(yù)測(cè)結(jié)果中,有49家公司分類正確,第Ⅰ類誤差數(shù)量為7,第Ⅱ類誤差數(shù)量為7。
從以上的分析對(duì)比中可得出:Elman算法在財(cái)務(wù)困境的預(yù)測(cè)中,準(zhǔn)確率最高,第Ⅰ類及第Ⅱ類錯(cuò)誤數(shù)最少,因此,本文所構(gòu)建的Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型對(duì)公司應(yīng)對(duì)或規(guī)避財(cái)務(wù)風(fēng)險(xiǎn)更具有合理性和可靠性。
3) 預(yù)測(cè)誤差分析
筆者對(duì)各模型分別進(jìn)行了10次運(yùn)算,并對(duì)預(yù)測(cè)結(jié)果取均值,計(jì)算出Elman算法與各對(duì)比算法的準(zhǔn)確率、第Ⅰ類及第Ⅱ類錯(cuò)誤率,結(jié)果如表2所示。
經(jīng)過計(jì)算Elman算法的準(zhǔn)確率85.71%,第Ⅰ類錯(cuò)誤率為9.68%,第Ⅱ類錯(cuò)誤率為16.67%;RBF算法準(zhǔn)確率、第Ⅰ類及第Ⅱ類錯(cuò)誤率分別為71.43%、14.29%、35.71%;BP算法準(zhǔn)確率、第Ⅰ類及第Ⅱ類錯(cuò)誤率分別為76.19%、22.86%、25%;SVM算法準(zhǔn)確率、第Ⅰ類及第Ⅱ類錯(cuò)誤率分別為77.78%、27.78%、26.92%。
對(duì)比分析可得,Elamn算法的各項(xiàng)指標(biāo)都明顯優(yōu)于其他模型且優(yōu)勢(shì)顯著,最終從中選擇最優(yōu)算法Elamn算法預(yù)測(cè)模型,可有效地發(fā)現(xiàn)并預(yù)警企業(yè)的財(cái)務(wù)問題,盡早地甄別問題、解決問題。
4 結(jié)論
本文以2020年A股上市公司的財(cái)務(wù)數(shù)據(jù)為研究對(duì)象,通過散點(diǎn)圖及均值插補(bǔ)法對(duì)數(shù)據(jù)集中的異常值及缺失值進(jìn)行處理,利用PCA算法篩選出重要屬性以降低屬性集的復(fù)雜度,構(gòu)建Elman神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,對(duì)公司的財(cái)務(wù)狀況進(jìn)行預(yù)測(cè)和分析,以251家上市公司的財(cái)務(wù)數(shù)據(jù)為訓(xùn)練集,通過RBF、BP、SVM等多個(gè)預(yù)測(cè)模型對(duì)63家公司的財(cái)務(wù)狀況進(jìn)行了測(cè)試對(duì)比與分析,進(jìn)一步證明了該模型的可靠性和有效性,于是得出最終結(jié)論:基于PCA算法的Elman神經(jīng)網(wǎng)絡(luò)模型對(duì)公司的財(cái)務(wù)困境預(yù)測(cè)具有較高的準(zhǔn)確率,可作為企業(yè)應(yīng)對(duì)或規(guī)避風(fēng)險(xiǎn)的有效方法。
參考文獻(xiàn):
[1] 陳輝遠(yuǎn),姜慜喆,馮家興.基于集成算法的上市公司財(cái)務(wù)困境預(yù)警模型[J].武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版),2022,44(3):468-477.
[2] 梁創(chuàng)維.基于財(cái)務(wù)狀況多分類的財(cái)務(wù)困境預(yù)警研究[J].現(xiàn)代商業(yè),2021(30):169-171.
[3] Altman E I.Financial ratios,discriminant analysis and the prediction of corporate bankruptcy[J].The Journal of Finance,1968,23(4):589-609.
[4] 李曉靜,聶廣禮,曾婧.Logistic方法在財(cái)務(wù)困境預(yù)測(cè)中的應(yīng)用[J].中國(guó)管理信息化,2009,12(15):124-126.
[5] 張春華,盧永艷.基于SVM多分類模型的上市公司財(cái)務(wù)困境預(yù)測(cè)[J].中國(guó)管理信息化,2014,17(4):2-5.
[6] 西鳳茹,時(shí)文超.基于遺傳算法和神經(jīng)網(wǎng)絡(luò)的上市公司財(cái)務(wù)困境預(yù)測(cè)[J].遼寧科技大學(xué)學(xué)報(bào),2013,36(2):166-171.
[7] 周青,張青松.基于Elman神經(jīng)網(wǎng)絡(luò)的客流量預(yù)測(cè)方法應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2022,40(8):19-21.
[8] 郝婧,劉強(qiáng).基于改進(jìn)ELman神經(jīng)網(wǎng)絡(luò)的臺(tái)風(fēng)風(fēng)暴潮損失測(cè)度[J].中國(guó)海洋大學(xué)學(xué)報(bào)(自然科學(xué)版),2022,52(8):71-76.
[9] 徐鴻艷,孫云山,秦琦琳,等.缺失數(shù)據(jù)插補(bǔ)方法性能比較分析[J].軟件工程,2021,24(11):11-14,10.
[10] 高楠,劉晶,鄭培.基于PCA-Elman-PSO算法的動(dòng)力電池低溫充電優(yōu)化[J].汽車文摘,2022(1):24-30.
[11] 朱昶勝,田慧星,馮文芳.基于Adaboost算法結(jié)合DEGWO-SVM的財(cái)務(wù)困境預(yù)測(cè)[J].蘭州理工大學(xué)學(xué)報(bào),2021,47(6):100-107.
【通聯(lián)編輯:李雅琪】
收稿日期:2022-04-11
基金項(xiàng)目:甘肅省農(nóng)業(yè)大學(xué)盛彤笙科技創(chuàng)新基金(GSAU-STS-2021-15) 2022年甘肅農(nóng)業(yè)大學(xué)研究生教育研究項(xiàng)目(2020-19) ;甘肅農(nóng)業(yè)大學(xué)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(項(xiàng)目編號(hào):202216041)
作者簡(jiǎn)介:康亮河(1987—) ,女,甘肅會(huì)寧人,助教,研究方向?yàn)槿斯ぶ悄芩惴?;林雨蔚,本科生,研究方向?yàn)閿?shù)據(jù)科學(xué)與數(shù)據(jù)管理。