徐 征,劉遵雄
(1.華東交通大學(xué)電氣學(xué)院,江西,南昌 330013;2.華東交通大學(xué)信息工程學(xué)院,江西,南昌 330013)
上市公司財(cái)務(wù)預(yù)警的T邏輯回歸模型
*徐征1,劉遵雄2
(1.華東交通大學(xué)電氣學(xué)院,江西,南昌330013;2.華東交通大學(xué)信息工程學(xué)院,江西,南昌330013)
針對(duì)經(jīng)典的邏輯回歸模型易受到樣本類別噪聲干擾的問題,采用T邏輯回歸算法中的非凸損失函數(shù)以彌補(bǔ)這一不足。對(duì)T邏輯回歸模型及求解算法進(jìn)行了分析,建立T邏輯回歸財(cái)務(wù)預(yù)警模型,并結(jié)合滬深上市公司財(cái)務(wù)數(shù)據(jù)開展實(shí)證分析,結(jié)果表明T邏輯回歸模型具有較好的分類效果和魯棒性。
財(cái)務(wù)危機(jī)預(yù)警;正則化技術(shù);T-邏輯回歸;過擬合;非凸損失函數(shù)
隨著我國證券市場的迅速發(fā)展,上市公司的質(zhì)量會(huì)影響資本市場的健康發(fā)展。財(cái)務(wù)危機(jī)預(yù)警可以提前揭示風(fēng)險(xiǎn),以便采取有效措施,防范和化解危機(jī)[1-3]。上市公司財(cái)務(wù)預(yù)警是通過研究和分析財(cái)務(wù)狀況指標(biāo)反映上市公司財(cái)務(wù)經(jīng)營的相關(guān)數(shù)據(jù),構(gòu)建金融危機(jī)預(yù)警模型。由于財(cái)務(wù)預(yù)警指標(biāo)變量多、相關(guān)性大,不利于建模分析,所以通常需要進(jìn)行變量選擇,然后對(duì)獨(dú)立變量選擇模型進(jìn)行訓(xùn)練,利用統(tǒng)計(jì)學(xué)習(xí)的稀疏矩陣建模,并對(duì)上市公司的財(cái)務(wù)預(yù)警進(jìn)行分析,從而提高模型的解釋和預(yù)測精度。
經(jīng)典的邏輯回歸對(duì)變量的分布沒有要求并且預(yù)報(bào)精度高、解釋能力強(qiáng)[4],但是與多元線性回歸模型一樣存在過擬合的問題,需要通過統(tǒng)計(jì)學(xué)習(xí)理論中的正則化技術(shù)來解決[5]。優(yōu)化凸性函數(shù)能保證正則化風(fēng)險(xiǎn)最小化問題收斂到全局最優(yōu),但是凸損失函數(shù)的學(xué)習(xí)算法對(duì)噪音不具備魯棒性,因此需要引入非凸損失函數(shù)來彌補(bǔ)凸損失函數(shù)的不足。
本文將t指數(shù)族中的學(xué)生分布引入邏輯回歸,對(duì)應(yīng)的正則化風(fēng)險(xiǎn)最小化問題的損失函數(shù)具有非凸性。但是這也導(dǎo)致了正則化優(yōu)化的風(fēng)險(xiǎn)[6]。因此將目標(biāo)函數(shù)對(duì)數(shù)化,采用凸多乘積規(guī)劃,對(duì)目標(biāo)跟隨函數(shù)最小化求解參數(shù)。T邏輯回歸能較好處理類別噪音,具有優(yōu)越的性能。
T邏輯回歸規(guī)定p( y x,θ)服從條件t指數(shù)族[9]分布,
其中1<t <2。
學(xué)生分布[10-12]可以看作t指數(shù)族分布中相對(duì)于正態(tài)分布先驗(yàn)的形式,一維學(xué)生分布定義為:
其中Γ(·)為伽馬函數(shù),v>1,其均值為有限值。選擇t使之滿足-(v +1)/2= 1/(1-t ),令
則有:
假定θ先驗(yàn)概率服從學(xué)生分布,則
當(dāng)用學(xué)生t指數(shù)先驗(yàn),logp(θ)-不再是凸的,但這也導(dǎo)致存在優(yōu)化正則化風(fēng)險(xiǎn)挑戰(zhàn)。由于t對(duì)數(shù)函數(shù)logt相對(duì)于log,是一個(gè)單調(diào)遞增函數(shù),因此可以利用logt函數(shù)。
其中,p(Y/X)相對(duì)θ獨(dú)立。利用式(2)、(3)和式(7),并令:
可以進(jìn)一步得到:
根據(jù)凸多乘積規(guī)劃[14]有:
其中,zn(θ)是正凸函數(shù)。設(shè)定dm N=+,對(duì)問題(11)的優(yōu)化解可通過求解下列參數(shù)問題來獲得:
其中,ξn為每個(gè)樣本xn的權(quán)重。求解(12)式的具體算法在文獻(xiàn)[14]中提出,但是計(jì)算的成本隨著N的指數(shù)倍增加。因此可以分別將θ和ξ作為變量做最小化分析,用坐標(biāo)下降法來求解。
2.1以ξ為變量求解分析
由于目標(biāo)函數(shù)對(duì)ξ而言是線性的,在可行區(qū)域是凸的,所以(12)式可以用凸優(yōu)化問題的方法求解。
引入非負(fù)拉格朗日乘數(shù)γ≥0,(13)式可以寫成
相對(duì)于ξn'的導(dǎo)數(shù)如下:
而(14)式中的ξn是每項(xiàng)zn(θ)的權(quán)。以上分析表明相對(duì)所有的n都是常數(shù)。如果(θ)變得非常大,nξ的影響就會(huì)減少。因此大損失點(diǎn)存在權(quán)重上限,這說明這個(gè)算法對(duì)異常值的魯棒性非常好。
2.2以θ為變量求解分析
令ξ>0,求解最佳θ。這一步和回歸分析一樣,但是每一成員都有一個(gè)權(quán)ξ,有:
這是一個(gè)標(biāo)準(zhǔn)的無約束的凸優(yōu)化問題,它可以被任何現(xiàn)成的求解器求解,采用L-BFGS高斯-牛頓方法。這樣需要求解梯度
其中,en表示d維向量包含一個(gè)在n階坐標(biāo),別的地方都是零(即n階單位矢量)。(y|x;)θ qt是的escort分布:
3.1模型樣本及財(cái)務(wù)指標(biāo)的選擇
首選選取滬深股市A股上市公司,要求規(guī)模相當(dāng)且上市五年左右。從2005-2007年選取了51家ST公司,并按照大約1:1的比例選取了相同時(shí)間段的且上市以來從未被ST的51家正常公司,其中2005年共32家、2006年共28家、2007年共42家。
參考國內(nèi)外相關(guān)資料[5-8],根據(jù)盈利能力、債務(wù)能力、成長能力、營運(yùn)能力、現(xiàn)金流量和資本結(jié)構(gòu),共選擇了26個(gè)變量。自變量為Y,表示該公司是否會(huì)出現(xiàn)財(cái)務(wù)危機(jī),如果為ST公司則表示出現(xiàn)了財(cái)務(wù)危機(jī),用0表示;如果沒有出現(xiàn)財(cái)務(wù)危機(jī),則為非ST公司,用1表示。
由于有些財(cái)務(wù)指標(biāo)沒有顯著差異,因此需要對(duì)樣本數(shù)據(jù)進(jìn)行顯著性檢驗(yàn)。本文采用SPSS對(duì)樣本進(jìn)行單樣本K-S檢驗(yàn),判斷是否服從正態(tài)分布。通過分析,發(fā)現(xiàn)大多數(shù)指標(biāo)不服從正態(tài)分布。于是,采用非參數(shù)檢驗(yàn)。非參數(shù)檢驗(yàn)方法很多,有Mann-Whitney U檢驗(yàn)、Kolmogorov-Smirnov Z檢驗(yàn)、Moses極限反應(yīng)和Wald-Wolfowitz 游程檢驗(yàn)[16]。這里選用最常見的Mann-Whitney U檢驗(yàn)。利用SPSS軟件分析,將不能通過Mann-Whitney U檢驗(yàn)的指標(biāo)剔除,將剩下指標(biāo)組成新的樣本數(shù)據(jù)。
3.2模型實(shí)證分析結(jié)果
實(shí)驗(yàn)平臺(tái)為 MATLAB7.1。利用最終保留下來的 16 個(gè)財(cái)務(wù)預(yù)警指標(biāo)數(shù)據(jù)作為模型的輸入,訓(xùn)練樣本與測試樣本的比為 2:1,訓(xùn)練樣本共 68 家,測試樣本 34 家。根據(jù)文獻(xiàn)[6]可知非凸函數(shù)不容易受初值的影響,因此初值的選擇可以有一定的隨意性,選經(jīng)過MATLAB仿真,沒有加噪聲的訓(xùn)練樣本與測試樣本的誤差數(shù)據(jù)如表1,加入10%噪聲后的仿真數(shù)據(jù)如表2。
表1 噪聲為0,仿真誤差表Table 1 The error of the simulation when noise equals zero
由表1可知,在噪聲為0的時(shí)候,用正則化模型和T邏輯回歸模型的訓(xùn)練樣本的正確率都非常高,但是對(duì)測試樣本而言,T-logstic模型的正確率要高于正則化邏輯回歸模型3~5個(gè)百分點(diǎn)。可見T邏輯回歸模型具有較好的預(yù)見性。
表2 噪聲為10%,仿真誤差表Table 2 The error of the simulation when noise equals 10%
加入10%的噪聲后,整體的正確性都有所下降。L1正則化模型的訓(xùn)練樣本的正確率由97.06%下降到91.18%,L2正則化模型的訓(xùn)練樣本的正確率由97.06%下降到89.71%,而T邏輯回歸模型的正確率下降與t的選擇有關(guān),但總體下降幅度不大,僅下降了0~3個(gè)百分點(diǎn),特別是在t =1.8的時(shí)候,正確率沒有受到噪聲的干擾。測試樣本的波動(dòng)相對(duì)而言更大,L1正則化模型的訓(xùn)練樣本的正確率由82.35%下降到76.46%,L2正則化模型的訓(xùn)練樣本的正確率由85.29%下降到73.53%,T邏輯回歸模型的訓(xùn)練樣本的正確率也有所下降,但是幅度也不大,都維持在85%以上。
加入噪聲至30%,訓(xùn)練樣本與測試樣本的誤差變化趨勢見圖1,通過對(duì)比可以觀察到T邏輯回歸模型對(duì)噪聲的干擾有較強(qiáng)的魯棒性。雖然L1,L2正則化模型和T邏輯回歸模型都隨著噪聲干擾的增加,誤差率會(huì)提高,但是T邏輯回歸的誤差率要遠(yuǎn)低于正則化模型。隨著噪聲干擾的增加,測試樣本的誤差率增加幅度降低,T邏輯回歸的誤差率與t的取值相關(guān)性降低。
圖1 噪聲干擾下的訓(xùn)練樣本(a圖)與測試樣本(b圖)的誤差變化Fig.1 The error rates of the training samples (a) and the testing samples (b) when noise equals 30%
本文將t指數(shù)族中的學(xué)生分布引入邏輯回歸,建立了上市公司的財(cái)務(wù)預(yù)警模型。經(jīng)過仿真,將T邏輯回歸模型與L1和L2正則化邏輯回歸模型比較,證實(shí)該模型具有較好的預(yù)測功能,并有較強(qiáng)的抗噪聲能力。在以后的進(jìn)一步研究中,將考慮深入討論T邏輯回歸與初值選擇的相關(guān)性,以及t的選擇對(duì)T邏輯回歸模型精度的影響。
[1] 陳艷,張海君.上市公司財(cái)務(wù)預(yù)警模型的研究[J].財(cái)經(jīng)問題研究,2007,(6):92-96.
[2] 許珂,盧海.基于Logistic回歸模型的房地產(chǎn)上市公司財(cái)務(wù)危機(jī)預(yù)警研究[J].常州工學(xué)院學(xué)報(bào),2012(4):61-66.
[3] 吳冬梅,朱俊,莊新田,等.基于支持向量機(jī)的財(cái)務(wù)危機(jī)預(yù)警模型[J].東北大學(xué)學(xué)報(bào):自然科學(xué)版,2010,31(4): 601-604.
[4] 劉遵雄,黃志強(qiáng),孫清,等.SCAD懲罰邏輯回歸的財(cái)務(wù)預(yù)警模型[J].統(tǒng)計(jì)與信息論壇,2012,27(12):21-26.
[5] 劉遵雄,鄭淑娟,秦賓,等.L1正則化Logistic回歸在財(cái)務(wù)預(yù)警中的應(yīng)用[J].經(jīng)濟(jì)數(shù)學(xué),2012,29(2):106-110.
[6] Ding N, Vishwanathan S V N.t-Logistic regression[C].Advances in Neural Information Processing Systems,2008:294.
[7] Buscema M, Breda M, Lodwick W.Training with Input Selection and Testing (TWIST) Algorithm: A Significant Advance in Pattern Recognition Performance of Machine Learning[J].Journal of Intelligent Learning Systems and Applications, 2013, 5: 29-38.
[8] Hastie T, Tibshirani R, Friedman J, et al.The elements of statistical learning: data mining, inference and prediction[J].The Mathematical Intelligencer, 2005,27(2): 83-85.
[9] De Souza A M C, Tsallis C.Student's t-and r-distributions: Unified derivation from an entropic variational principle[J].Physica A: Statistical Mechanics and its Applications, 1997, 236(1): 52-57.
[10] Naudts J.Generalized thermostatistics based on deformed exponential and logarithmic functions[J].Physica A: Statistical Mechanics and its Applications, 2004, 340(1): 32-40.
[11] Naudts J.Generalized thermostatistics and mean-field theory[J].Physica A: Statistical Mechanics and its Applications, 2004, 332: 279-300.
[12] Naudts J.The q-exponential family in statistical physics[J].Central European Journal of Physics, 2009,7(3): 405-413.
[13] Dawson R.Wittgenstein on pure and applied mathematics[J].Synthese, 2014, 191(17): 4131-4148.
[14] Kuno T, Yajima Y, Konno H.An outer approximation method for minimizing the product of several convex functions on a convex set[J].Journal of Global optimization, 1993, 3(3): 325-335.
[15] Zhou W J, Chen X L.On the convergence of a modified regularized Newton method for convex optimization with singular solutions[J].Journal of Computational and Applied Mathematics, 2013, 239: 179-188.
[16] 張文彤.世界優(yōu)秀統(tǒng)計(jì)工具SPSS 11統(tǒng)計(jì)分析教程高級(jí)篇[M].北京:北京希望電子出版社,2002:S91-92.
FINANCIAL EARLY-WARNING MODEL OF LISTED COMPANIES USING T-LOGISTIC REGRESSION
*XU Zheng1, LIU Zun-xiong2
(1.School of Electrical and Electronic Engineering; 2.School of Information Engineering, East China Jiaotong University, Nanchang, Jiangxi 330013, China)
The classic logistic regression has the risk of over fitting.It can be solved by the regularization technique of the statistical learning theory.Optimization of convex loss function can ensure that the regularized risk minimization problem converges to the global optimum, but learning algorithm of convex loss function is susceptible to noise.Then T-logistic regression was proposed to amend, introducing T distribution into logistic regression.The non-convex loss function is made up for the deficiency of convex loss functions.Due to the non-convex loss function difficulty to solve, we will be logarithmic the objective function, and convex multiplicative programming is used to solver parameters.Through empirical study, it is found that T-logistic regression model has a good predictability and is tolerant to label noise.
financial early-warning model; regularization technique; financial T-logistic regression; over fitting;non-convex loss function
TP311.13
ADOI:10.3969/j.issn.1674-8085.2015.02.002
1674-8085(2015)02-0006-05
2014-11-17;修改日期:2015-01-20
國家自然科學(xué)基金項(xiàng)目(61065003);教育部人文社會(huì)科學(xué)研究項(xiàng)目(13YJC630192);華東交通大學(xué)校立科研課題(09DQ04)作者簡介:*徐征(1978-),女,湖北隨州人,講師,碩士,主要從事數(shù)理統(tǒng)計(jì)和非線性系統(tǒng)分析與建模研究(E-mail:187391733@qq.com);劉遵雄(1965-),男,江西南昌人,教授,博士,主要從事機(jī)器學(xué)習(xí)和金融統(tǒng)計(jì)時(shí)序分析研究(E-mail: 153010729@qq.com).