摘 要:以我國的互聯(lián)網(wǎng)金融上市公司為研究樣本,在目前國內(nèi)外對于企業(yè)財務風險預警研究的基礎上,結合互聯(lián)網(wǎng)金融公司的特點,利用SMOTE算法并與隨機森林相結合,建立互聯(lián)網(wǎng)金融公司的財務風險預警模型。研究表明,隨機森林預警模型有著穩(wěn)定的識別精度和較好的預測性能,因此具有廣泛的實踐價值。
關鍵詞:SMOTE算法;隨機森林;財務風險預警
中圖分類號:F832? ? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2020)33-0079-02
引言
近些年來,隨著網(wǎng)絡的蓬勃發(fā)展,現(xiàn)代社會已經(jīng)變成一個信息社會。相對于傳統(tǒng)的企業(yè),中國的互聯(lián)網(wǎng)金融企業(yè)以其迅速、靈活以及個性化的特點迅速發(fā)展。但一方面,互聯(lián)網(wǎng)金融企業(yè)在面對風險時,處理風險的時間也大大縮短。另一方面,互聯(lián)網(wǎng)金融公司發(fā)展時間較短,相關部門的監(jiān)管機制也不夠完善,公司出現(xiàn)財務風險會對整個互聯(lián)網(wǎng)金融行業(yè)造成嚴重的不良影響,有的甚至可能對整個社會造成不利影響。因此,相關監(jiān)管部門應該對企業(yè)進行評級,對于有財務風險的企業(yè)加強監(jiān)管,以減少上述問題的出現(xiàn)。
本文首先運用SMOTE算法對原始數(shù)據(jù)進行平衡處理,然后通過隨機森林算法進行財務風險預警模型的建立。試驗結果表明,本文的方法可以有效解決ST公司樣本過少所導致的數(shù)據(jù)不平衡問題,從而使互聯(lián)網(wǎng)金融公司存在的財務風險能夠被及時預警,尤其是在對ST公司的風險預警上。本文旨在使預警模型可以為更多的企業(yè)服務,也為監(jiān)管部門提供有效的參考數(shù)據(jù)。
一、互聯(lián)網(wǎng)金融公司財務風險預警模型的構建
1.模型構建。原始數(shù)據(jù)集的平衡程度對隨機森林模型的預測準確度具有較大的影響,而SMOTE算法能夠?qū)υ紨?shù)據(jù)集進行平衡,從而提高隨機森林的分類精準度。因此,將SMOTE算法與隨機森林相結合可以充分發(fā)揮兩者的優(yōu)勢,達到更準確的預測效果。故本文擬利用SMOTE-隨機森林模型對互聯(lián)網(wǎng)金融公司的財務風險狀況進行預測研究,具體的財務風險預警過程(如圖1所示)。
2.樣本選取及數(shù)據(jù)處理。本文選取包含3家ST公司和60家正常經(jīng)營的共計63家互聯(lián)網(wǎng)金融上市公司作為研究對象,以63家互聯(lián)網(wǎng)金融公司2017—2019年每個季度的財務數(shù)據(jù)作為研究樣本,經(jīng)刪除部分缺失值后,共得到752組數(shù)據(jù),其中ST公司32組,正常公司720組。ST公司是指,因公司連續(xù)兩年虧損而被證交所特別處理的公司,可以視為有較高的財務風險(銳思數(shù)據(jù)庫)。
3.預警指標的選擇。本文在選取財務指標時,首先參考了趙囡等人的研究,在該論文中的18個指標已經(jīng)通過顯著性檢驗;然后考慮楊淑娥和王樂平選取的23個財務指標;最后,結合隨機森林自身的算法特性。本文最終采用七大類共計27個財務指標作為研究變量,這27個財務指標分別體現(xiàn)了互聯(lián)網(wǎng)金融公司的每股指標、營運能力、盈利能力、償債能力、現(xiàn)金流量、資本結構和成長能力,可以充分反映互聯(lián)網(wǎng)金融公司的財務狀況。
4.數(shù)據(jù)的平衡處理。因為預警指標中3家ST公司的數(shù)據(jù),60家正常公司的數(shù)據(jù),是比較嚴重的不平衡數(shù)據(jù),為了解決非平衡數(shù)據(jù)對隨機森林模型的影響,本文用SMOTE算法對不平衡數(shù)據(jù)進行平衡處理,之后再應用隨機森林進行分類,具體的流程(如圖2所示)。
平衡前,訓練集含有500組正常公司的數(shù)據(jù),20組ST公司的數(shù)據(jù),測試集含有220組正常公司的數(shù)據(jù),12組ST公司的數(shù)據(jù)。經(jīng)SMOTE算法平衡數(shù)據(jù)以后,新的訓練集含有270組正常公司的數(shù)據(jù),200組ST公司的數(shù)據(jù),比例接近1∶1。
二、實證研究
1.變量重要性分析。分別采用平均準確率的減少和平均不純度的減少方法,對變量進行重要性分析。結果發(fā)現(xiàn),銷售凈利率,每股凈資產(chǎn)以及凈資產(chǎn)增長率在兩種重要性分析中均為前三,且重要性程度較高。因此對于企業(yè)來說,應該著重關注這三個財務指標,使其準確體現(xiàn)公司的財務狀況。
2.預測結果分析。圖1和圖2分別為基于SMOTE-隨機森林預警模型和數(shù)據(jù)平衡處理流程,通過對測試樣本進行100次預測,選取平均值作為最終的預測結果。我們列出了實際值和模型預測值之間的混淆矩陣。從下表中我們可以看出,未經(jīng)平衡處理的數(shù)據(jù)構建的隨機森林模型,總體預測準確率達到95.27%,對ST公司的預測準確率卻只有46.17%,而經(jīng)SMOTE算法平衡后的數(shù)據(jù)構建的隨機森林模型,對ST公司的預測準確率就高達76.41%,總體準確率為97.35%。從預測結果來看,此預測模型作為互聯(lián)網(wǎng)金融公司的財務風險預警模型,是一個比較理想的財務風險預警模型,有著較好的穩(wěn)定性和實踐價值。
三、結論與建議
通過用SMOTE-隨機森林建立的互聯(lián)網(wǎng)金融公司財務風險預警模型,可以得出以下結論與建議。第一,通過參考本文建立的財務風險預警模型,監(jiān)管部門以及投資者可以將互聯(lián)網(wǎng)金融公司財務風險的狀況作為參考,然后進行選擇,以此減少一些財務損失;銀行也可以有選擇性地進行放貸。第二,政府相關監(jiān)管部門應該加強監(jiān)管和信息披露機制,完善相關的法律法規(guī)。例如,要求公司公布公司的股東和經(jīng)營狀況等信息,這些信息不涉及企業(yè)的機密,同時也可以為后期進行財務風險預警提供數(shù)據(jù)支持和依據(jù)。
參考文獻:
[1]? 趙囡,趙哲耘.基于PCA-BPNN的互聯(lián)網(wǎng)公司信用風險預警模型[J].上海經(jīng)濟,2018,(3):97-107.
[2]? 楊淑娥,王樂平.基于BP神經(jīng)網(wǎng)絡和面板數(shù)據(jù)的上市公司財務危機預警[J].系統(tǒng)工程理論與實踐,2007,(2):61-67.
[3]? Leo Breiman.Random Forests[J].Machine Learning,2001,(1).
[4]? James A.Ohlson.Financial ratios and the probabilistic prediction of bankruptcy[J].Journal of Accountancy,1980.
[5]? Gordy M.B.A comparative anatomy of credit risk models[J].Journal of Banking and Finance,(24):119-149.
[6]? Leshno Moshe,Spector Yishay.Neural network prediction analysis the bankruptcy case[J].Neurocomputing,1996,(2):125-147.
[7]? 蔡立新,李嘉歡.大數(shù)據(jù)時代企業(yè)財務風險預警機制與路徑探究[J].財會月刊,2018,(15):38-43.
[8]? 于煥杰,杜子芳.基于隨機森林的企業(yè)監(jiān)管方法研究[J].管理世界,2017,(9):180-181.
[9]? 吳悠悠.我國互聯(lián)網(wǎng)金融:問題、前景和建議[J].管理世界,2015,(4):170-171.
[責任編輯 文 峰]
收稿日期:2020-04-09
作者簡介:李玉占(1969-),男,河南南陽人,科長,從事市場營銷研究。