阮素梅 周澤林
(安徽財經大學1.金融學院 2.安徽經濟社會發(fā)展研究院, 安徽 蚌埠 233000)
P2P網絡借貸能夠緩解資金供求雙方的矛盾,然而貸款人信息的高度不對稱性加大了貸款違約風險。大數據環(huán)境下,建立合理、準確的信用評估體系,有助于信貸機構對貸款人的信用評測,能夠為控制違約發(fā)生的誘導因素提供決策參考,對于實現網絡借貸平臺平穩(wěn)運行等具有重要意義。
經典的信用評估模型主要使用統(tǒng)計分析方法,例如Z-Score模型(Altman,1968)、ZETA模型(Altman et al.,1977)和Logit模型(Laitinen,1999)。這三種信用評估模型的核心理念在于建立信用水平及其影響因素之間的聯(lián)系,進而實現信用狀態(tài)的準確評估。這類方法發(fā)展時間較長,技術相對成熟,應用范圍也最為廣泛,前兩種主要使用線性模型設計,第三種使用非線性的Logistic轉換。吳世農等(2001)應用剖面分析和單變量分析,選定6個財務指標,應用Fisher判定分析、多元線性回歸分析和Logit回歸分析三種方法分別建立三種預測財務困境模型。Davis et al. (2008)與寧澤逵等(2016)主張Logit回歸是全球早期預警系統(tǒng)和信號識別的最適當方法。韓立巖等(2010)運用主成分分析與Logit回歸結合,建立國內外中小上市公司財務危機判別模型。王君萍等(2015)以我國能源上市企業(yè)為研究對象,進行指標選取和運用Logit回歸構建預警模型。董曉林等(2017)基于二元選擇Logit模型,研究城鄉(xiāng)家庭金融資產選擇問題。
為改進經典信用評估方法的模型誤設缺陷以及對非線性處理能力的不足,機器學習領域的方法(主要有神經網絡、支持向量機)被引入信用評估領域。在使用神經網絡進行信用評估研究方面,代表性的文獻有Desai et al. (1996)、王春峰等(1999)、Baesens et al. (2003)、Abdou et al.(2008)、Angelini et al.(2008)等。在使用支持向量機進行信用評估研究方面,代表性的文獻有Baesens et al. (2003)、李建平等(2004)、Bellotti et al. (2009)、Yu et al. (2011)、余樂安(2012)、陳為民等(2012)、Harris(2013)、Xiao et al.(2017)等。實證研究表明基于機器學習方法的信用評估效果要優(yōu)于其他方法,陳詩一(2008)、劉玉敏等(2016)、Hajek et al. (2017)等均發(fā)現向量機方法的預測準確度比Logit模型有明顯改進,但并不總是最優(yōu)。
信用評估實踐的發(fā)展,積累了更多的影響因素,形成了高維數據(或稱高維變量),需要從冗余變量中甄別出特征變量。以逐步回歸為代表的子集變量選擇法,需要進行多次重復計算操作,當數據變量眾多時,該方法往往就不適用了(Breiman,1995;孫燕,2012)。Tibshirani(1996)提出的LASSO(Least Absolute Shrinkage and Selection Operator)回歸,不僅能夠進行變量選擇,而且能夠同時得到高維數據均值回歸模型估計結果。有研究將高維數據回歸分析方法引入信用評估領域,Perederiy(2009)、Koopman et al. (2011)、Amendola et al. (2012)、方匡南等(2014)分別使用LASSO方法進行高維變量選擇與特征提取,建立信用評估模型。
自2012年以來,我國互聯(lián)網金融蓬勃發(fā)展,對于小微企業(yè)融資具有重要意義(安寶洋,2014;Xu,2017)。皮天雷等(2014)、BenSa?da et al.(2017)、Zhang et al.(2017)等認為,P2P網絡借貸作為互聯(lián)網金融創(chuàng)新的典型代表,能夠顯著提高資金配置效率。在P2P市場中,日常用戶活躍度高、交易量大,產生了大量的信用數據,具有典型大樣本與高維特征,為信用評估模型開發(fā)帶來了機遇與挑戰(zhàn)(Serrano-Cinca et al.,2016;Blasco et al.,2017)??梢哉f,在信用評估領域,機器學習方法在模型的預測準確度方面已表現得很優(yōu)越,并得到較高的認可度,但其缺點在于大多數模型采用復雜的非線性作用機制,既難以識別關鍵風險因子,也不便于管理者直觀理解其經濟含義。經典信用評估模型(如Logit模型)可能在預測精度方面不如機器學習模型,但可以清晰地表達各因子對信用狀態(tài)的(轉換后)線性影響與邊際貢獻,既能夠進行風險預測,又有助于進行風險控制(蔣翠俠 等,2017)。因此,可以在經典信用評估模型基礎上,進一步考慮模型的變量選擇能力,提高其預測精度,解決P2P借貸中違約識別與預測這兩個關鍵問題。
為此,本文將L1懲罰Logit模型應用于P2P網絡借貸信用違約分析,一方面通過LASSO的變量選擇功能,從眾多影響因素中篩選出關鍵因素;另一方面,通過Logit模型,分析P2P網絡借貸信用違約行為。利用拍拍貸的信用數據,實證檢驗了L1懲罰Logit模型效果,發(fā)現其能夠很好地適應拍拍貸信用數據特征,揭示拍拍貸市場中信用行為與規(guī)律。本文的數值模擬結果與實證結果都表明:L1懲罰Logit模型具有很好的變量選擇與預測功能,能夠得到比其他模型(支持向量機模型、普通Logit模型)更好的預測效果,可以準確預測信用違約風險;而且能夠識別信用違約的關鍵影響因素,細致地刻畫各關鍵影響因素對違約概率帶來的影響,可以為風險控制提供決策依據。
在LASSO方法中,由于使用了絕對值懲罰(也稱L1懲罰),能夠實現變量選擇。LASSO方法既可以和線性回歸相結合,用于解決連續(xù)型變量的預測問題;也可以和Logit回歸相結合,用于解決離散變量的分類問題。為此,可以將LASSO思想與Logit模型相結合,建立L1懲罰Logit模型,并將其應用于信用違約分析。
1.模型表示與估計
設第i個樣本觀測記為(x1i,x2i,…,xki,yi),其中:xi=(x1i,x2i,…,xki)為由解釋變量組成的設計矩陣;yi為可觀測的二元響應變量,取值為1或0,分別表示違約與非違約兩種信用狀態(tài)。標準的二元選擇模型:
(1)
其中:i=1,…,n;y*i為不可觀測的潛變量;εi為隨機擾動項;β為k×1維待估計參數向量,可以通過下式求解:
(2)
(3)
將LASSO變量選擇思想融入二元選擇分位數回歸,即在式(2)中增加L1懲罰函數,得到:
(4)
其中:λ||β||1即為懲罰函數;||β||
1為β的向量1-范數;λ≥0為懲罰參數,取值越大,懲罰力度越大,取值越小,懲罰力度越小。模型的參數估計,可以采取Efron et al. (2004)提出的LARS算法。
2.懲罰參數選擇
L1懲罰Logit模型的變量選擇,關鍵在于懲罰參數λ的選取,常用方法有Bootstrap、交叉驗證(Cross Validation,CV)等,本文采用10-折交叉驗證(CV)方法確定懲罰參數λ的值,其具體算法如下:
(5)
(6)
1.混淆矩陣
在兩分類問題中,預測結果存在四種情形,詳見表 1所示的混淆矩陣。通過混淆矩陣,能夠容易得出一個模型的正確率為(a+c)/(a+b+c+d),第Ⅰ類錯誤率b/(a+b)和第Ⅱ類錯誤率d/(d+c),從而合理地評價模型效果。
表1 混淆矩陣
2.ROC曲線與AUC值
ROC曲線是根據截斷值的變化而繪制出的一條曲線,每一個截斷值對應于曲線上的一個點,其縱坐標為真陽性率(TPR),橫坐標為假陽性率(FPR)。對于不同的分類模型,性能優(yōu)者ROC曲線更接近左上角。在ROC曲線基礎上,由ROC曲線下方區(qū)域的面積,得到AUC(Area Under ROC Curve)值,定義如下:
(7)
其中,TPR(FPR)表示擊中率是誤報率的一個函數,實際上就是ROC曲線?,F實中,隨機分類器所得AUC=0.5;完美分類器所得AUC=0.1;一般的分類器的AUC值介于0.5到1之間。AUC值越接近于1,說明診斷效果越好:AUC值在0.5~0.7時,有較低準確性;在0.7~0.9時,有一定準確性;在0.9以上時,有較高準確性。此外,AUC<0.5不符合真實情況,在實際中極少出現。
為檢驗L1懲罰Logit模型的變量選擇能力與預測效果,進行Monte Carlo模擬。參考Tibshirani(1996)的“Example 4”,設計40個解釋變量且任意兩個解釋變量xj與xk之間的相關系數為ρ|j-k|;回歸系數β=(0,0,…,0,2,2,…,2,0,0,…,0,2,2,…,2)′,即連續(xù)10個0、連續(xù)10個2,反映解釋變量對響應變量的影響程度。在式(1)基礎上,設計響應變量生成機制,將式(1)改寫為:
(8)
其中:εi~iidN(0,1),i=1,2,…,N。解釋變量X=(x1,x2,…,x40)′來自一個多元標準正態(tài)分布,取ρ=0.5,代表中等相關程度;σ=15,表示信號噪音比約為9.0。
實驗中,設置樣本量N=200,隨機地取其中的100個樣本用于模型估計,余下的100個樣本用于模型預測。重復上述過程B=500次,變量選擇結果見表2;記錄下AUC、正確率和運行時間三個指標的均值與及標準差,結果見表3。實驗的硬件配置為雙處理器 Inter Xeon E5-2630L(六核,2.1GMHz)和 32GB 內存;軟件配置為64位R 3.4.2。
由表2可知:無論是支持向量機模型還是普通Logit模型,都沒有變量選擇功能,始終選中沒有貢獻的變量x1,x2,…,x10與x21,x22,…,x30。L1懲罰Logit模型很好地實現了變量選擇,不但能夠將存在顯著作用的變量x11,x12,…,x20與x31,x32,…,x40全部選中,而且能夠將沒有貢獻的變量x1,x2,…,x10與x21,x22,…,x30進行刪除,錯誤率僅為0.2%、…、0.4%與0.2%等,不超過0.4%。因此,L1懲罰Logit模型具有很好的變量選擇能力。此外,就運行時間而言,普通Logit模型平均耗時最短,運行速度最快;其次為L1懲罰Logit模型;支持向量機模型則耗時較多。
表2 變量選擇結果與運行時間
注:在變量選擇結果中,數值大小表示在500次重復中變量被選中的次數;在運行時間結果中,均值表示500次重復中平均運行時間,標準差為運行時間標準差大小;普通Logit模型無需設置參數,L1懲罰Logit模型與支持向量機模型通過交叉驗證選取了最優(yōu)超參數(L1懲罰Logit模型中的懲罰參數和支持向量機模型中的核函數參數)。
表3 模型預測結果
由表3可知:就標準差大小而言,各模型都取得了穩(wěn)定的預測結果。就均值而言,從正確率指標來看,L1懲罰Logit模型和支持向量機模型均取得了較好的結果,都優(yōu)于普通Logit模型。從AUC指標來看,其均值水平都低于正確率指標,表明AUC指標是一個更為嚴苛的評價指標。實驗結果表明,L1懲罰Logit模型的AUC均值明顯優(yōu)于普通Logit模型和支持向量機模型,表現出更為強大的預測能力。
綜合表2和表3的結果,可以得到:L1懲罰Logit模型不但具有很好的變量選擇能力,而且能夠得到比較理想的預測效果。
本文的實證研究數據來源于科賽網(http://www.kesci.com)提供的拍拍貸公開脫敏數據,樣本區(qū)間為2010年2月—2015年6月。原始數據中部分變量的數據缺失比例很高,這里刪除了缺失比例超過10%的變量。經過數據清洗(刪除缺失數據、數據匹配等),得到有效樣本量9913。表 4列出了所有14個變量,其中:賬戶狀態(tài)(status)為響應變量,取值為結清(212)、正常(246)、逾期(9455),占比分別為2.14%、2.48%和95.38%;其余13個變量為解釋變量。
表4 變量說明
這里,通過比例型立聯(lián)表分析,初步查看貸款狀態(tài)與教育程度、性別、婚姻狀態(tài)之間的關系。
表5 貸款狀態(tài)與教育的立聯(lián)表分析
注:這里對原始數據的教育程度進行相應的歸并,得到五個等級的教育水平:研究生、大學本科、大學??啤⒅袑W、小學及以下。
由表5可以看出,教育程度越高,結清比例越高,逾期比例越低;反之,則反是。如“小學及以下”信貸客戶,其結清比例僅為1.96%(比“研究生”低近6個百分點),更多處于逾期狀態(tài),為96.27%(比“研究生”高近5個百分點),這意味著學歷越高會越傾向于結清貸款??ǚ綑z驗結果(χ-squared=174.88,p-value=0.0004)表明,教育與貸款狀態(tài)之間存在顯著的關聯(lián)關系。
表6 貸款狀態(tài)與性別的立聯(lián)表分析
由表6可以看出,與男性相比,女性結清比例要高出1.5個百分點,逾期比例要低近2個百分點,表明女性客戶更傾向于結清貸款。卡方檢驗結果(χ-squared=21.283,p-value=0.0009)表明,性別與貸款狀態(tài)之間存在顯著的關聯(lián)關系。
由表7可以看出,在已婚狀態(tài)下,結清比例最高,逾期比例最低;在喪偶狀態(tài)下,結清比例較低(比已婚狀態(tài)低近6個百分點),而逾期比例較高(比已婚狀態(tài)高7個百分點以上),意味著婚姻狀況越穩(wěn)定越傾向于結清貸款??ǚ綑z驗結果(χ-squared=308.98,p-value=0.0005)表明,婚姻狀態(tài)與貸款狀態(tài)之間存在顯著的關聯(lián)關系。
表7 貸款狀態(tài)與婚姻狀況的立聯(lián)表分析
1.變量選擇與模型估計
首先,為了適應兩分類討論,本文將“逾期”視為違約,將“結清” 、“正?!币暈榉沁`約。
圖1 交叉驗證與選擇過程
注:這里對原始數據的職業(yè)變量進行相應的歸并,得到三個等級的職業(yè)水平:國家機關、黨群組織、企業(yè)、事業(yè)單位負責人,專業(yè)技術人員及其他。
其次,通過交叉驗證,對L1懲罰Logit模型參數進行選擇,結果見圖 1所示。根據Tibshirani(1996)的建議:在模型偏差相差不大的基礎上,盡量獲得相對比較重要的變量,使壓縮程度最大,即獲得的變量數目盡量少。為此,本文選取圖 1中右側虛線對應的值,得到模型解釋變量系數有5個不為0,詳見表 8。這樣,管理者可以將主要精力集中到這5個變量上來,防范信用違約風險,極大地減少了從全部13個變量出發(fā)實施監(jiān)管方案帶來的管理成本。
最后,估計L1懲罰Logit模型選中變量的系數,詳見表8。在存在顯著影響的5個變量中,包含性別、學歷與婚姻狀態(tài)三個變量,與立聯(lián)表所得結果一致。另外,在這5個變量中,性別、學歷、婚姻狀況、職業(yè)等對信用違約存在反向影響,而授信額度對信用違約存在正向影響。事實上,這一結果有較強的作用機理。例如學歷越高,其還款能力越強,且還款意愿越強烈,最終違約可能性降低,因此呈現反向作用;授信額度越高,可能導致按時足額還款困難,最終違約可能性提高,因此存在正向影響。
2.模型性能比較
為了評價L1懲罰Logit模型的性能,將其與Logit模型、支持向量機模型(SVM)進行比較。利用上文描述的標準數據集,從中隨機抽取75%數據作為訓練集,剩下的25%作為測試集,分別使用上述模型與方法運行100次,記錄下正確率、第Ⅰ類錯誤率、第Ⅱ類錯誤率、AUC值,進而統(tǒng)計出100次中其對應的均值與及標準差,結果見表 9。
表9 信用評價結果比較
由表 9可知,無論從模型的正確率,還是第Ⅰ類錯誤率或者第Ⅱ類錯誤率來考量,L1懲罰Logit模型的結果都是最優(yōu)的,其次為支持向量機模型,最后為普通Logit模型。與其他兩個模型相比,L1懲罰Logit模型具有更高的正確率和更低的錯誤率,特別是將Ⅰ類錯誤率降低近66%。不僅如此,L1懲罰Logit模型所得結果的標準差更小,意味著該模型具有更好的穩(wěn)健性。當然,由于本文的數據集是一個典型的非平衡分類,正確率往往難以奏效,需要進一步觀察其AUC值。AUC的評價結果表明,L1懲罰Logit模型的性能最優(yōu),比普通Logit模型提升13.87%,比支持向量機模型提升16.02%。究其原因,可能在于:L1懲罰Logit模型通過變量選擇功能,將一些干擾變量的系數壓縮為0,避免了一些冗余信息的干擾,提升了模型的預測性能。
綜合來看,L1懲罰Logit模型在處理高維、非均衡數據時,表現出很好的效果:第一,選擇出重要變量,對于控制信用違約發(fā)生具有重要決策參考意義;第二,能夠得到更好的分類預測結果,提高了AUC等性能。
3.違約概率預測
鑒于L1懲罰Logit模型的優(yōu)良表現,進一步使用其進行違約概率預測。在L1懲罰Logit模型篩選出的五個關鍵影響因素中,性別、學歷、婚姻狀況、職業(yè)等為分類變量,授信額度為連續(xù)變量(經過了自然對數變換)。為此,考慮如下四種類型的變量組合:(1)性別+授信額度;(2)學歷+授信額度;(3)婚姻狀況+授信額度;(4)職業(yè)+授信額度。在每一組合中,性別、學歷、婚姻狀況、職業(yè)等分類變量取各自的離散值,授信額度的取值按照從低到高依次等間隔選取500個,將其取值結果代入L1懲罰Logit模型中,可以預測出信用違約概率變動情況,分別見圖2~圖5。
由圖2~圖5可知,授信額度是違約的重要影響因素,且隨著授信額度的增加,違約發(fā)生概率在不斷增加,這與表8授信額度回歸系數為正的結果一致。在圖2中,男性的違約概率曲線始終位于女性的上方,表明在相同的授信額度情況下男性違約概率要大于女性,這與表8中性別回歸系數為負以及表6中立聯(lián)表分析結果一致。圖3清晰地顯示了不同學歷在違約概率上的差異,可以發(fā)現:學歷水平越高,違約可能性越低;反之,則反是。不過,違約概率在學歷水平上的差異將被授信額度所替代,例如在授信額度達到12(原始值為162754)之后,不同學歷群體的違約概率近乎相同。圖4所得結果與圖3類似,違約概率預測結果表明,婚姻狀態(tài)越穩(wěn)定,違約可能性越低,并且這一差距也被授信額度所替代。圖5的表現與圖2類似,國家機關等單位負責人、專業(yè)技術人員及其他三類群體在違約表現上存在著顯著差異,其違約可能性依次遞增,并且這一差異沒有被授信額度所取代。這一結果意味著,無論在多高的授信額度下,國家機關等單位負責人的違約概率都是最低的,比專業(yè)技術人員和其他人員分別低約3%和7%。
圖2基于性別+授信額度的違約概率預測
圖3基于學歷+授信額度的違約概率預測
圖4基于婚姻狀況+授信額度的違約概率預測
圖5基于職業(yè)+授信額度的違約概率預測
金融理論與實踐的迅速發(fā)展,積累了越來越多的金融大數據,表現出非均衡、非線性、高維等典型特征,為實現準確的信用評價帶來了機遇與挑戰(zhàn)。本文以P2P網絡借貸為對象,研究其信用違約行為??紤]到P2P網絡借貸中信用數據特征,本文將L1懲罰Logit模型應用于信用違約識別與預測,取得了一些實證結果,總結如下:
第一,L1懲罰Logit模型具有很好的變量選擇功能與預測能力。通過Monte Carlo數值模擬,將L1懲罰Logit模型與普通Logit模型、支持向量機模型進行了對比。數值結果表明:在變量選擇方面,L1懲罰Logit模型變量選擇錯誤率僅為0.2%~0.4%,而普通Logit模型與支持向量機模型則不具備變量選擇功能;在模型預測方面,L1懲罰Logit模型獲得了更高的正確率和AUC值,預測能力更強;在運行時間方面,L1懲罰Logit模型稍遜于普通Logit模型,但優(yōu)于支持向量機模型。
第二,L1懲罰Logit模型的變量選擇功能和回歸系數估計,克服了支持向量機等智能模型黑箱操作的弊端,增強了模型的解釋性。通過變量選擇功能識別出影響信用違約的關鍵指標,依據模型估計變量系數的正負來抑制或是促進相應信用特征以完成對風險的有效控制。例如學歷的回歸系數為負,意味著學歷越高,信用違約可能性越低。從而可以通過提高學歷(信貸對象為高學歷者)的方式,降低P2P網絡借貸信用違約風險。
第三,L1懲罰Logit模型提升了普通Logit模型的分類性能,能夠得到更加準確、穩(wěn)健的分類預測結果。本文的實證結果表明,L1懲罰Logit模型不僅能夠顯著地提升預測準確性(比普通Logit模型提升13.87%,比支持向量機模型提升16.02%),而且能夠顯著地降低第Ⅰ類錯誤率與第II類錯誤率,特別是將Ⅰ類錯誤率降低近66%,控制在6.4%的極佳水平。
第四,L1懲罰Logit模型能夠細致分析關鍵影響因素對違約概率造成的影響。本文考慮了性別+授信額度、學歷+授信額度、婚姻狀況+授信額度、職業(yè)+授信額度等四種類型的變量組合,研究其對違約概率帶來的影響,既有助于理解信用違約行為及其發(fā)展規(guī)律,預測信用違約的發(fā)生;也可以實現情景模擬,制訂相應政策組合,控制信用違約的發(fā)生。
總之,L1懲罰Logit模型不但具有很好的預測能力,提升了經典信用評估模型的性能,而且具有很好的解釋能力,改進了大多數機器學習模型復雜非線性作用機制難以直觀理解的不足。一方面,L1懲罰Logit模型通過變量選擇功能,可以有效地識別影響信用違約的關鍵因素,降低了管理者的監(jiān)管成本;另一方面,L1懲罰Logit模型通過概率預測,既能夠從總體上實現對信用違約狀態(tài)的準確預測,又能夠細致分析關鍵影響因素對違約概率造成的影響,有助于預測和控制信用違約的發(fā)生。
安寶洋. 2014. 互聯(lián)網金融下科技型小微企業(yè)的融資創(chuàng)新[J]. 財經科學(10):1-8.
陳詩一. 2008. 德國公司違約概率預測及其對我國信用風險管理的啟示[J]. 金融研究(8):53-71.
陳為民,張小勇,馬超群. 2012. 基于數據挖掘的持卡人信用風險管理研究[J]. 財經理論與實踐(5):36-40.
董曉林,于文平,朱敏杰. 2017. 不同信息渠道下城鄉(xiāng)家庭金融市場參與及資產選擇行為研究[J]. 財貿研究(4):33-42.
方匡南,章貴軍,張惠穎. 2014. 基于Lasso-Logistic模型的個人信用風險預警方法[J]. 數量經濟技術經濟研究(2):125-136.
韓立巖,李蕾. 2010. 中小上市公司財務危機判別模型研究[J]. 數量經濟技術經濟研究(8):102-115.
蔣翠俠,黃韻華,許啟發(fā). 2017. 基于Lasso二元選擇分位數回歸的上市公司信用評估[J]. 系統(tǒng)工程(2):16-24.
李建平,徐偉宣,劉京禮,等. 2004. 消費者信用評估中支持向量機方法研究[J]. 系統(tǒng)工程(10):35-39.
劉玉敏,劉莉,任廣乾. 2016. 基于非財務指標的上市公司財務預警研究[J]. 商業(yè)研究(10):87-92.
寧澤逵,寧攸涼. 2016. 區(qū)位、非農就業(yè)對中國家庭農業(yè)代際傳承的影響:基于陜西留守農民的調查[J]. 財貿研究(2):75-84.
皮天雷,趙鐵. 2014. 互聯(lián)網金融:邏輯、比較與機制[J]. 中國經濟問題(4): 98-108.
孫燕. 2012. 隨機效應Logit計量模型的自適應Lasso變量選擇方法研究:基于Gauss-Hermite積分的EM算法[J]. 數量經濟技術經濟研究(12):147-157.
王春峰,萬海暉. 1999. 基于神經網絡技術的商業(yè)銀行信用風險評估[J]. 系統(tǒng)工程理論與實踐(9):24-32.
王君萍,白瓊瓊. 2015. 我國能源上市企業(yè)財務危機預警研究[J]. 經濟問題(1):109-113.
吳世農,盧賢義. 2001. 我國上市公司財務困境的預測模型研究[J]. 經濟研究(6):46-55.
余樂安. 2012. 基于最小二乘近似支持向量回歸模型的電子商務信用風險預警[J]. 系統(tǒng)工程理論與實踐(3):508-514.
ABDOU H, POINTON J, El-MASRY A. 2008. Neural nets versus conventional techniques in credit scoring in Egyptian banking [J]. Expert Systems with Applications, 35(3):1275-1292.
ALTMAN E I. 1968. Financial ratios, discriminant analysis and the prediction of corporate bankruptcy [J]. The Journal of Finance, 23(4):589-609.
ALTMAN E I, HALDEMAN R G, NARAYANAN P. 1977. ZETATM analysis:a new model to identify bankruptcy risk of corporations [J]. Journal of Banking and Finance, 1(1):29-54.
AMENDOLA A, RESTAINO M, SENSINI L. 2012. Dynamic statistical models for corporate failure prediction in Italy [J]. Journal of Modern Accounting and Auditing, 8(8):1214-1224.
ANGELINI E, DI TOLLO G, ROLI A. 2008. A neural network approach for credit risk evaluation [J]. The Quarterly Review of Economics and Finance, 48(4):733-755.
BAESENS B, SETIONO R, MUES C, et al. 2003. Using neural network rule extraction and decision tables for credit-risk evaluation [J]. Management Science, 49(3):312-329.
BELLOTTI T, CROOK J. 2009. Support vector machines for credit scoring and discovery of significant features [J]. Expert Systems with Applications, 36(2):3302-3308.
BENSA?DA A. 2017. Herding effect on idiosyncratic volatility in US industries [J]. Finance Research Letters, 23:121-132.
BLASCO N, CORREDOR P, FERRERUELA S. 2017. Can agents sensitive to cultural, organizational and environmental issues avoid herding [J]. Finance Research Letters, 22:114-121.
BREIMAN L. 1995. Better subset regression using the nonnegative garrote [J]. Technometrics, 37(4):373-384.
DAVIS E P, KARIM D. 2008. Comparing early warning systems for banking crises [J]. Journal of Financial Stability, 4(2):89-120.
DESAI V S, CROOK J N, OVERSTREET G A, Jr. 1996. A comparison of neural networks and linear scoring models in the credit union environment [J]. European Journal of Operational Research, 95(1):24-37.
EFRON B, HASTIE T, JOHNSTONE I, et al. 2004. Least angle regression [J]. Annals of Statistics, 32(2):407-499.
HAJEK P, HENRIQUES R. 2017. Mining corporate annual reports for intelligent detection of financial statement fraud-a comparative study of machine learning methods [J]. Knowledge-Based Systems, 128:139-152.
HARRIS T. 2013. Quantitative credit risk assessment using support vector machines: broad versus narrow default definitions [J]. Expert Systems with Applications, 40(11):4404-4413.
KOOPMAN S J, LUCAS A, SCHWAAB B. 2011. Modeling frailty-correlated defaults using many macroeconomic covariates [J]. Journal of Econometrics, 162(2):312-325.
LAITINEN E K. 1999. Predicting a corporate credit analyst′s risk estimate by logistic and linear models [J]. International Review of Financial Analysis, 8(2):97-121.
SERRANO-CINCA C, GUTIERREZ-NIETO B. 2016. The use of profit scoring as an alternative to credit scoring systems in peer-to-peer (P2P) lending [J]. Decision Support Systems, 89:113-122.
TIBSHIRANI R. 1996. Regression shrinkage and selection via the lasso [J]. Journal of the Royal Statistical Society: Series B, 58(1):267-288.
XIAO J, CAO H, JIANG X, et al. 2017. GMDH-based semi-supervised feature selection for customer classification [J]. Knowledge-Based Systems, 132(Supplement C):236-248.
XU J. 2017. China′s internet finance: a critical review [J]. China & World Economy, 25(4):78-92.
YU L, YAO X, WANG S, et al. 2011. Credit risk evaluation using a weighted least squares SVM classifier with design of experiment for parameter selection [J]. Expert Systems with Applications, 38(12):15392-15399.
ZHANG Z, HUNG K, CHANG T. 2017. P2P Loans and bank loans, the chicken and the egg, what causes what? Further evidence from a bootstrap panel granger causality test [J]. Applied Economics Letters, 24(19):1358-1362.