馬曉君 宋嫣琦 張萌
〔 DOI〕 10.19653/j.cnki.dbcjdxxb.2020.04.007
〔引用格式〕 ?馬曉君,宋嫣琦,張萌.生物啟發(fā)優(yōu)化算法與上市公司信用評級——基于ABC-SVM的實證研究[J].東北財經(jīng)大學學報,2020,(4):57-65.
〔摘要〕在國際評級機構經(jīng)濟背景與我國市場經(jīng)濟不相契合的前提下,為完善我國上市公司信用評級方法體系,本文通過完善指標選取、數(shù)據(jù)處理與算法優(yōu)化三個方面,選取銳思數(shù)據(jù)庫我國上市公司的評級數(shù)據(jù)、財務數(shù)據(jù)與相關非財務數(shù)據(jù),采用“數(shù)據(jù)分割”方式,創(chuàng)新性地將人工蜂群算法優(yōu)化支持向量機(ABC-SVM)應用于我國上市公司信用評級中。結果表明:通過將整體數(shù)據(jù)集分割為升級數(shù)據(jù)集和降級數(shù)據(jù)集,評級準確率分別提高了3.78%和3.37%;同時,較傳統(tǒng)支持向量機與其他兩種生物啟發(fā)算法(粒子群算法、遺傳算法)優(yōu)化下的支持向量機,ABC-SVM算法的評級效果最好,評級準確率顯著提高了5%—7%。本文為我國上市公司信用評級提供了方法思路,豐富了企業(yè)信用評級指標體系,為建立層次更全面的企業(yè)信用數(shù)據(jù)庫、提高我國上市公司信用評級準確率提供技術支持,并為我國爭取國際評級話語權提供理論依據(jù)。
〔關鍵詞〕人工蜂群優(yōu)化算法;支持向量機;數(shù)據(jù)分割;信用評級;上市公司
中圖分類號:F832.51 ?文獻標識碼:A ?文章編號:1008-4096(2020)04-0057-09
一、問題的提出
在市場交易中,信用風險是企業(yè)始終面臨的重要風險之一,如何全面評估企業(yè)的信用狀況并衡量損益、降低損失,進而形成有效的風險管理對企業(yè)的持續(xù)發(fā)展具有重要影響。目前,信用評級是國際上衡量公司信用風險的主要手段。從國際信用評級市場看,穆迪投資者服務公司(Moody's Investors Service)、標準普爾(S&P)和惠譽國際(Fitch)管理著國際主要的信用評級業(yè)務,在國際評級市場處于壟斷地位,對于國際金融市場和經(jīng)濟領域具有重要的影響力和話語權,并對國際經(jīng)濟環(huán)境發(fā)揮著風向標的作用。而就我國信用評級市場而言,具備一定業(yè)務規(guī)模及影響力的評級機構較少,市場影響力及國際業(yè)務開展與國際機構還有較大差距。同時,我國正值“一帶一路”建設時期,經(jīng)濟對外開放程度不斷深化、國際貿(mào)易往來不斷加深、企業(yè)交易投資不斷增加,全面評估交易對象的信用狀況、提高我國信用評級準確率是合理防范金融風險、維護我國經(jīng)濟市場穩(wěn)定、促進我國經(jīng)濟高質量發(fā)展的關鍵。因此,支持和引導我國信用評級機構在“一帶一路”倡議實施中發(fā)揮更大作用,是培育和扶持我國評級機構大力開展國際化業(yè)務、擴大其評級應用范圍的重要契機,是推動我國評級機構國際化的重要時機。依托上述經(jīng)濟背景,本文以我國上市公司為研究對象,從數(shù)據(jù)處理、指標構建與方法創(chuàng)新三方面充分研究我國上市公司信用評級,為提高我國上市公司信用評級準確率、更為我國爭取國際評級話語權提供堅實的技術支持。
企業(yè)的信用評級是相關評估機構根據(jù)企業(yè)規(guī)模、企業(yè)素質、企業(yè)經(jīng)營管理狀況以及企業(yè)財務狀況與償債能力等指標,依照一定的規(guī)則對企業(yè)信用、經(jīng)營管理水平、市場競爭力、違約概率、發(fā)展前景、流動性、資金實力、履約能力等方面進行相關等級的劃分。國外對于信用評級的研究起步較早,穆迪投資者服務公司的創(chuàng)始人John[1]在《鐵路投資分析》一書中發(fā)表了債券資信評級的概念,使資信評級首次進入證券市場。Ashcraft等[2]通過對MBS次級和高評級產(chǎn)品的研究,發(fā)現(xiàn)信用評級對投資者有重要影響。國內(nèi)信用評級源于1987年,為規(guī)范企業(yè)債券的發(fā)行,中國人民銀行開始組建信用評級機構。2005年后,隨著債券市場的發(fā)展,我國信用評級行業(yè)開始加速發(fā)展。陳元燮和陳欣[3]認為建立信用評級可以激勵企業(yè)增強市場意識和信用意識,提高經(jīng)濟效益和償債能力,提高投資透明度,保證我國市場健康發(fā)展。
信用評級作為一個完整的評價體系,包含指標、等級和標準、方法和模型等部分,其中信用評級的指標和方法是整個體系的核心內(nèi)容,也是影響評級體系的關鍵部分。在信用評級指標的構建及選取方面,國際評級機構一般依據(jù)美國金融機構統(tǒng)一評級制度,主要包括資金充足率、資產(chǎn)質量、管理水平、盈利能力及流動性五個基本項目。標普與穆迪的評級體系還包括資產(chǎn)質量每股收益、流動比率及凈資產(chǎn)收益率等財務指標[4-5]。眾多學者依據(jù)企業(yè)的發(fā)展變革與國際經(jīng)濟形勢變化,就信用評級指標的構建展開研究,以提高信用評級體系的全面性,從而提高信用評級準確性。Jones等[6]建立了包含傳統(tǒng)金融技術、市場、公司治理、宏觀經(jīng)濟在內(nèi)的國際新穎信用評級指標體系。Huang和Shen[7]利用盈利能力、償債能力、宏觀環(huán)境等指標評價企業(yè)信用評級。就我國而言,眾多學者結合我國經(jīng)濟背景與企業(yè)發(fā)展情況,在構建信用評級指標體系方面做出貢獻,如霍海濤[8]在盈利能力、償債能力、經(jīng)營發(fā)展能力等方面選取10個財務指標,同時在企業(yè)科技價值、企業(yè)基本素質、企業(yè)創(chuàng)新力等方面選取9個非財務指標以構建信用評級體系。衣柏衡等[9]基于信號信息、借款及擔保信息等18個指標構建信用評估體系。
信用評級方法主要分為定性分析與定量分析,定性分析是由專業(yè)評估人員深入調查企業(yè)內(nèi)部及外部的經(jīng)營環(huán)境,對評價參考標準的各項指標進行判斷分析;定量分析主要以企業(yè)財務報表的實際經(jīng)營數(shù)據(jù)通過數(shù)學模型來測定信用風險。在定量分析方面,信用評級模型的主要目的在于提高分類準確性,傳統(tǒng)信用評級方法主要包含多元判別分析[10-11]、Logistic模型[12]、決策樹[13]等基礎分類方法。隨著信息技術和互聯(lián)網(wǎng)的高速發(fā)展,企業(yè)數(shù)據(jù)及信息的獲取更加便捷,數(shù)據(jù)的更新與數(shù)據(jù)量的增長不斷加快,傳統(tǒng)信用評級方法已無法滿足高速的市場變化。以機器學習為代表的人工智能技術利用計算機持續(xù)學習,并能夠有效利用信息,從海量數(shù)據(jù)中獲取隱藏、有效的信息與知識的能力,已成為現(xiàn)代信用評級方法創(chuàng)新的重要驅動力,吸引國內(nèi)外學者將其引入信用評級方法體系。目前,神經(jīng)網(wǎng)絡、支持向量機等機器學習方法結構復雜、分類效果較為突出、可解釋性較強,在信用評級方法實踐中得到一定應用,并在信用評級方法體系中占據(jù)核心地位。Saunders等[14]運用經(jīng)濟計量技術、模擬技術以及神經(jīng)網(wǎng)絡、專家系統(tǒng)等對信用風險進行量化研究。Oreski等[15]運用混合遺傳算法的神經(jīng)網(wǎng)絡模型反映信用違約風險的顯著特征。Mohammadi和Zangeneh[16]運用6種BP學習算法構建MLP神經(jīng)網(wǎng)絡以評估信貸風險。肖斌卿等[17]運用模糊神經(jīng)網(wǎng)絡展開小微企業(yè)信用評級研究。方匡南等[18]運用網(wǎng)格結構Logistic模型對企業(yè)信用風險預警進行研究。龐素琳等[19]基于風險環(huán)境構建企業(yè)多層交叉信用評分模型,研究企業(yè)、行業(yè)和地域交叉的信用評級問題。
支持向量機(SVM)作為機器學習的前沿方法之一,以其在非線性和高維模式識別問題中特有的優(yōu)勢,在很大程度上克服了“維數(shù)災難”和“過擬合”等問題,能夠有效提高模型的分類效率和分類準確率,在國際信用評級研究中得到廣泛應用。Chen和Ying[20]提出基于支持向量機的信用評級自動分類模型,結果表明SVM分類模型的性能優(yōu)于BP模型。Chan[21]使用網(wǎng)格搜索技術與5倍交叉驗證尋找支持向量機RBF核函數(shù)的最優(yōu)參數(shù)值,并認為SVM優(yōu)于多判別分析(MDA)、三層全連接反向傳播神經(jīng)網(wǎng)絡(BPN)的性能。Chen和Li?[22]提出具有單調性約束的支持向量機模型,該方法在糾正數(shù)據(jù)收集過程中的單調性損失方面具有良好性能。Maldonado等[23]提出了一種基于線性支持向量機的分類器構造,并在業(yè)務目標方面具有一定優(yōu)勢。Hao等[24]優(yōu)化了支持向量機(SVMs)中的Mahalanobis距離誘導核,并在信用評級的應用方面認為其提出的內(nèi)核優(yōu)于其他經(jīng)典機器學習方法的性能。Huang等[25]認為支持向量機精度與反向神經(jīng)網(wǎng)絡相當,并能夠幫助用戶更好了解信用評級流程。
綜上所述,信用評級研究的核心在于指標的選取和方法的構建。在指標選取方面,應在參照國際標準的基礎上,充分考慮我國經(jīng)濟背景與上市公司發(fā)展狀況,選擇合適指標以更好完善我國上市公司的信用評級。在方法構建方面,支持向量機作為二元分類算法,支持線性分類與非線性分類,有效提高模型的分類效率及準確率,在信用評級的研究中具有較強的適用性,但在我國信用評級方面的應用較少。因此,本文的貢獻在于:首先,在前人研究基礎上,充分考慮我國上市公司企業(yè)特點選取相關財務比率指標,同時考慮企業(yè)拋售、發(fā)行股票等一系列因素,加入成交量,收盤價等非財務比率指標,以豐富企業(yè)信用評級指標體系。其次,將生物啟發(fā)算法——人工蜂群算法優(yōu)化支持向量機(ABC-SVM)應用于我國上市公司信用評級領域,充分發(fā)揮其智能性、并行性和魯棒性的特點,實現(xiàn)參數(shù)選擇與特征選擇的同時優(yōu)化,豐富我國信用評級方法體系。最后,創(chuàng)新性地將數(shù)據(jù)集分割成升級數(shù)據(jù)集和降級數(shù)據(jù)集,實現(xiàn)在有限數(shù)據(jù)量的情況下,對數(shù)據(jù)進行全面使用,為數(shù)據(jù)集的分割提供了新思路。
二、理論概述
(一)支持向量機(SVM)
在解決非線性及高維模式識別問題中,Cortes和Vapnik于1995年首先提出支持向量機(Support Vector Machines,SVM),并能夠將其推廣應用到函數(shù)擬合等其他機器學習問題中。SVM作為傳統(tǒng)機器學習中一種通用的前饋網(wǎng)絡類型,將低維空間向量映射到高維空間,通過核函數(shù)得到高維空間中的分類函數(shù)。
當存在線性不可分時,需要將原始數(shù)據(jù)從原始空間映射到高維空間,使其在高維特征空間中線性可分。令(x)為映射后的特征向量,在特征空間中劃分超平面的模型為:
(1)
映射后的數(shù)據(jù)滿足:
(2)
轉化為對偶問題:
(3)
在高維空間中計算 較困難,故引入核函數(shù):
(4)
則問題轉化為:
(5)
此時,在特征空間中劃分超平面的模型通過引入拉格朗日乘子化簡為:
(6)
(二)人工蜂群算法(ABC)
人工蜂群(Artificial Bee Colony,ABC)算法是由蜂群行為啟發(fā)的算法,并廣泛應用于多種類型的數(shù)值優(yōu)化問題。該算法仿照各個蜜蜂在搜索空間中尋找合適食物來源的行動來搜索全局最優(yōu)解。因此,ABC算法不需要了解問題的特殊信息,只需要比較優(yōu)劣,通過每個人工蜂個體的局部尋優(yōu)行為,最終在群體中突顯全局最優(yōu)解,并且具有較快的收斂速度。
ABC通過模擬蜜蜂采蜜的過程將人工蜂分為三種角色:采蜜蜂、觀察蜂和偵察蜂。采蜜蜂利用初始食物源信息尋找新的食物源,并與觀察蜂分享新食物源信息;觀察蜂通過觀察采蜜蜂的行為來決定合適的食物源;偵察蜂通過隨機選擇來尋找新的食物來源。ABC作為一種優(yōu)化方法,食物源代表一種解決方案,食物源的花蜜量即是該解決方案的適應度。ABC算法開始時,隨機產(chǎn)生SN個初始解。采蜜蜂首先對相應的解的鄰域進行一次搜索,若搜索到的解的適應度優(yōu)于原來的解的適應度,便會放棄原來的解,從而替換為新的解。采蜜蜂完成這一搜索替換階段后會將這一信息傳達至觀察蜂,觀察蜂根據(jù)獲得的信息評估適應度,然后選擇具有最優(yōu)適應度的最佳食物源。在選定食物源后,觀察蜂會重復采蜜蜂的工作,進行鄰域搜索,并保留最優(yōu)解。當采蜜蜂和觀察蜂搜索完整個空間后,若食物源的適應度在給定的范圍內(nèi)沒有提高,便會丟棄該食物源,相應的采蜜蜂將轉變?yōu)閭刹旆洌匦滤阉餍碌目赡艿氖澄镌?。因此,人工蜂群算法主要由以下四個階段組成:
(1)初始化階段:該階段會產(chǎn)生所有可能食物源的初始種群,整個種群的所有食物源是為了最小化目標函數(shù)并實現(xiàn)優(yōu)化。初始化階段的公式為:
(7)
其中,為的下限,為的上限;。
(2)采蜜蜂階段:該階段是初始化后重復尋找新的食物源和最優(yōu)解決方案的階段。采蜜蜂會在食物源鄰域搜索新的食物源,這樣食物源的范圍擴大,發(fā)現(xiàn)新的食物源后,評估適應度,尋找新的食物源的公式為:
(8)
其中,為隨機選擇的食物源,是取值范圍為(-1,1)的數(shù)字,當找到新的源后,適應度函數(shù)為:
(9)
其中,為目標函數(shù)的值。
(3)觀察蜂階段:觀察蜂屬于非采蜜蜂,在觀察蜂工作前,采蜜蜂將與觀察蜂進行食物源的信息交流,食物源越豐富,觀察蜂選擇的概率越大,則被選擇的概率為:
(10)
當觀察蜂根據(jù)概率選擇食物源后,鄰域的食物源由式(7)決定,以計算其適應度。
(4)偵察蜂階段:偵察蜂屬于非采蜜蜂,將隨機選擇食物來源,當適應度無法再提高時會放棄該食物源;同時采蜜蜂將會轉化為偵察蜂,以開始尋找新的食物源。
(三)人工蜂群優(yōu)化支持向量機(ABC-SVM)
通過人工蜂群算法(ABC)優(yōu)化支持向量機(SVM)模型,使SVM的參數(shù)達到最優(yōu),其參數(shù)尋優(yōu)的范圍即蜜蜂搜索食物源的范圍,蜂群搜索到的最優(yōu)食物源即SVM達到最優(yōu)的懲罰參數(shù)?和核寬度系數(shù)。
人工蜂群優(yōu)化支持向量機的具體步驟如下:
步驟1:初始化階段,設置參數(shù)。參數(shù)包括最大的迭代次數(shù)T、食物源(初始解)的數(shù)量NP、初始解。同時,使用10折交叉驗證計算適應度值,以評估適應度值。
步驟2:采蜜蜂階段,評估適應度值后,比較其優(yōu)劣,若的適應度值并非優(yōu)于的適應度值,則按照式(8)更新食物源的位置。
步驟3:觀察蜂階段,計算新食物源的適應度值,比較適應度值,從而最優(yōu)適應度值的位置即為全局最優(yōu)解。
步驟4:判斷是否達到偵察蜂階段,若適應度值無法繼續(xù)提高,則按照式(7)產(chǎn)生新的解,直至滿足停止條件,輸出此時的最優(yōu)解。
步驟5:將人工蜂群尋找的最優(yōu)參數(shù),代入支持向量機中,訓練測試集,得出分類結果。
三、數(shù)據(jù)處理與特征選擇
本文以我國上市公司為研究對象,探究人工蜂群優(yōu)化的支持向量機在我國上市公司信用評級的應用,原始數(shù)據(jù)樣本為銳思數(shù)據(jù)庫中1?217家中國上市公司自2010—2018年的19 867條評級數(shù)據(jù)和43 812條財務數(shù)據(jù)與非財務數(shù)據(jù)。
(一)數(shù)據(jù)處理
本文按照以下步驟對數(shù)據(jù)進行去污處理,以保證數(shù)據(jù)的準確性:剔除評級數(shù)據(jù)中帶有“pi”、“sf”的樣本;當同一公司在同一季度有多條評級數(shù)據(jù)時,只保留一條數(shù)據(jù);當同一公司由兩家以上評級機構進行評級時,選擇先進行評級的數(shù)據(jù);當同一公司在同一季度由相同評級機構進行評級時,選擇先進行評級的數(shù)據(jù)。為保證數(shù)據(jù)的完整性,數(shù)據(jù)選擇在滬深兩市掛牌上市公司,并進行同一季度財務數(shù)據(jù)的匹配,從而得到864家上市公司共5 485條樣本數(shù)據(jù)。
中國人民銀行為規(guī)范信用評級工作,于2006年發(fā)布了《信用評級要素、標識及含義》,將信用評級分為三等九級,即AAA、AA、A、BBB、BB、B、CCC、CC、C,同時用“+”和“-”對等級進行微調,由于中國企業(yè)信用評級的特殊性,多數(shù)企業(yè)信用評級都在A以上,因此本文對信用等級進行重新分類,將評級在AA-以上(包括AA)的企業(yè)用1類表示,將評級在AA-以下的企業(yè)用0類表示。
根據(jù)評級變更情況,數(shù)據(jù)集劃分為升級數(shù)據(jù)集和降級數(shù)據(jù)集,即將每個公司的評級數(shù)據(jù)與上個季度的評級結果進行比較,若信用評級上升或者不變則劃分為升級數(shù)據(jù)集,反之則劃分為降級數(shù)據(jù)集。數(shù)據(jù)分割后的數(shù)據(jù)集基本情況如表1所示。
(二)特征選擇
首先,參考Huang和Shan[7]、霍海濤[8]等的研究成果,在充分考慮我國市場經(jīng)濟環(huán)境與我國上市公司企業(yè)特點的基礎上,選擇能夠反映公司盈利能力、營運能力、償債能力、發(fā)展能力等15個財務指標;同時,考慮到評級下調至較低的級別,可能會導致企業(yè)拋售的情況[26],故將成交量、收盤價、凈利潤作為非財務指標引入模型。其次,考慮到我國上市公司的資本構成與國際上市公司的差異,故將資產(chǎn)負債率、股東權益比率、權益乘數(shù)作為資本結構指標引入模型。最后,本文選取的所有指標如表2所示。
特征選定后,對數(shù)據(jù)進行同量綱標準化處理;然后對3個數(shù)據(jù)集(整體數(shù)據(jù)集,升級數(shù)據(jù)集,降級數(shù)據(jù)集)分別運用主成分分析進行指標篩選,選擇因子載荷大于0.5且公共性大于0.8的變量作為進入模型的變量。本文選擇如下指標投入模型:
(1)整體數(shù)據(jù)集選擇凈資產(chǎn)收益率、銷售凈利率、營業(yè)利潤/營業(yè)總收入、營業(yè)利潤率、存貨周轉率、應收賬款周轉率、股東權益/負債合計、利息保障倍數(shù)、資產(chǎn)負債率、股東權益比率、權益乘數(shù)、凈利潤/營業(yè)總收入、凈利潤/利潤總額13個指標,特征選擇結果表明盈利能力、營運能力、償債能力、發(fā)展能力、資本結構指標對整體數(shù)據(jù)集的分類較為重要。
(2)升級數(shù)據(jù)集選擇凈資產(chǎn)收益率、銷售凈利率、營業(yè)利潤/營業(yè)總收入、營業(yè)利潤率、存貨周轉率、應收賬款周轉率、每股收益、股東權益/負債合計、利息保障倍數(shù)、資產(chǎn)負債率、股東權益比率、凈利潤/營業(yè)總收入、凈利潤/利潤總額13個指標,結果表明盈利能力、營運能力、每股指標、償債能力、發(fā)展能力、資本結構指標對升級數(shù)據(jù)集分類較為重要。
(3)降級數(shù)據(jù)集選擇凈資產(chǎn)收益率、資產(chǎn)凈利率、銷售凈利率、營業(yè)利潤/營業(yè)總收入、營業(yè)利潤率、存貨周轉率、應收賬款周轉率、總資產(chǎn)周轉率、每股收益、股東權益/負債合計、利息保障倍數(shù)、資產(chǎn)負債率、股東權益比率、權益乘數(shù)、凈利潤/營業(yè)總收入、凈利潤/利潤總額16個指標,結果表明盈利能力、營運能力、每股指標、償債能力,發(fā)展能力、資本結構指標對降級數(shù)據(jù)集分類較為重要。
四、實證分析
本文以銳思數(shù)據(jù)庫中1 217家我國上市公司2010—2018年的19 867條評級數(shù)據(jù)和43 812條財務數(shù)據(jù)為原始數(shù)據(jù)樣本,研究ABC-SVM算法對我國上市公司的信用評級效果,并通過另外兩種生物啟發(fā)算法——遺傳算法(GA)和粒子群算法(PSO)優(yōu)化傳統(tǒng)支持向量機模型,以驗證ABC-SVM算法模型的性能及探究生物啟發(fā)算法對我國上市公司信用評級準確率的作用及影響。
(一)算法設置與結果
在建模之前,首先對財務比率數(shù)據(jù)和非財務比率數(shù)據(jù)進行標準化處理,以8∶2的比例將各個數(shù)據(jù)集分為訓練集和測試集。在參數(shù)設置上,人工蜂群算法的最大循環(huán)次數(shù)等于迭代次數(shù),且均設置為200,初始種群數(shù)設置為20,采蜜蜂和觀察蜂數(shù)設置為10,偵察蜂數(shù)設置為1。同時,采用徑向基函數(shù)作為支持向量機的核函數(shù)進行建模,并用十折交叉驗證進行參數(shù)選擇和最優(yōu)結果驗證。四種模型結果對比如表3所示。
由表3結果可知,對于整體數(shù)據(jù)集而言,四種算法的準確度從高到低依次為:ABC-SVM、PSO-SVM、GA-SVM、SVM。對于升級數(shù)據(jù)集而言,四種算法的準確度從高到低依次為:ABC-SVM、GA-SVM、PSO-SVM、SVM。對于降級數(shù)據(jù)集而言,四種算法的準確度從高到低依次為:ABC-SVM、GA-SVM、PSO-SVM、SVM。實證分析結果表明,通過生物啟發(fā)算法對支持向量機模型進行參數(shù)調優(yōu),使上市公司信用評級準確率有效提高了5%—10%,同時,ABC算法對模型的優(yōu)化效果最為明顯,準確率提升效果最為顯著。此外,將數(shù)據(jù)集劃分為升級數(shù)據(jù)集與降級數(shù)據(jù)集后,信用評級準確率有效提高了3%—5%,說明合理的數(shù)據(jù)分割能夠在一定程度上影響信用評級準確率,并提高模型效果。
為確保模型的準確性,防止模型出現(xiàn)過擬合等問題,本文將運用算法適應度檢驗與K-S檢驗,對三種優(yōu)化模型進行進一步檢驗并比較各模型的性能優(yōu)勢。
(二)算法適應度檢驗
適應度是對算法優(yōu)勢程度的度量,可用于區(qū)分算法的優(yōu)劣。隨迭代次數(shù)的增加,三種優(yōu)化算法在整體數(shù)據(jù)測試集的適應度變化如圖1所示,其中X軸表示迭代次數(shù),Y軸表示適應度值,兩條曲線分別代表最佳適應度值和平均適應度值。
終止代數(shù)=200;種群數(shù)量pop=20;
Best c=7.168;g=819.140
終止代數(shù)=200;種群數(shù)量pop=20;
Best c=2.814;g=1 000
如圖1—圖3所示,在基于整體數(shù)據(jù)集的優(yōu)化過程中,ABC優(yōu)化算法迭代至170次時收斂,PSO優(yōu)化算法在進行200次迭代時還未收斂,適應度值可能在70.550左右持續(xù)波動,GA優(yōu)化算法在迭代至80次時開始收斂。當?shù)潦諗繒r,ABC優(yōu)化算法的適應度值達到77.167%,相比于PSO算法的70.634%和GA優(yōu)化算法的70.632%,算法適應度高出7%左右,原因在于ABC算法在優(yōu)化的過程中可以改善粒子的搜索能力,從而使得SVM的參數(shù)達到最優(yōu),并有效避免陷入局部最優(yōu)解的問題。因此,從整體的優(yōu)化效果上看,ABC算法優(yōu)于PSO算法和GA算法。
據(jù)表4所示,ABC-SVM算法在3個數(shù)據(jù)集上的算法適應度最高,較GA-SVM與PSO-SVM而言,算法適應度提升了約4%—7%。說明,ABC算法的優(yōu)化效果優(yōu)于PSO算法和GA算法,分類結果較好,并在一定程度上能夠解決PSO算法和GA算法容易陷入局部最優(yōu)解的問題。同時,升級數(shù)據(jù)集與降級數(shù)據(jù)的算法適應度均高于整體數(shù)據(jù)集,說明有效的數(shù)據(jù)分割增強了算法的優(yōu)化效果,并顯著提高了模型的性能。
(三)K-S檢驗
本文運用K-S檢驗對原始信用評級等級分布和預測信用評級等級分布進行檢驗,以考察兩者是否具有顯著性差異,從而檢驗模型是否能夠對上市公司信用評級進行有效預測。K-S檢驗基于累計分布函數(shù),是檢驗兩個分布是否相同的重要指標。該指標根據(jù)壞樣本估計值的經(jīng)驗分布與好樣本估計值的經(jīng)驗分布有顯著差異,同時,差異表現(xiàn)為更多壞樣本集中于低分區(qū)且更多好樣本集中于高分區(qū)的特征來說明模型具備有效的區(qū)分能力,通常K-S值在一定的范圍內(nèi)越大越好,計算公式如下:
(11)
其中,TPR為累計壞樣本占比,F(xiàn)PR為累計好樣本占比。
ABC-SVM、PSO-SVM、GA-SVM三種算法分別在整體、升級、降級三個數(shù)據(jù)集上的K-S值如表5所示。
ABC-SVM算法的K-S檢驗圖如圖4所示,其中X軸為閾值,Y軸為累計壞樣本占比曲線(TPR)和累計好樣本占比曲線(FPR)。ABC-SVM模型在三個數(shù)據(jù)集上的KS值均在0.6至0.75之間,說明相較于PSO-SVM模型、GA-SVM模型,ABC-SVM模型具有較好的預測準確性。
五、結論與建議
(一)結論
本文選取銳思數(shù)據(jù)庫中我國1 217家上市公司2010—2018年的信用評級數(shù)據(jù)、財務比率數(shù)據(jù)和非財務比率數(shù)據(jù),運用“數(shù)據(jù)分割”思想,將整體數(shù)據(jù)集分割為升級數(shù)據(jù)集與降級數(shù)據(jù)集,并運用生物啟發(fā)算法-人工蜂群優(yōu)化支持向量機模型(ABC-SVM),探究生物啟發(fā)優(yōu)化算法對上市公司信用評級準確率的應用效果。
第一,在指標選取過程中充分考慮我國市場經(jīng)濟環(huán)境與上市公司特點,選取財務指標并加入相關非財務指標。結果表明,成交量、收盤價、凈利潤等非財務指標與上市公司信用評級具有顯著相關性,對預測上市公司信用評級有顯著影響。
第二,將投入模型的數(shù)據(jù)集樣本進行數(shù)據(jù)分割,實現(xiàn)了有限數(shù)據(jù)樣本的全面使用與信息挖掘。根據(jù)實證分析結果,分割后的升級數(shù)據(jù)集與降級數(shù)據(jù)集的評級準確率獲得顯著提高,說明有效的數(shù)據(jù)分割能夠顯著提高上市公司信用評級準確率。
第三,根據(jù)實證分析結果發(fā)現(xiàn),生物啟發(fā)優(yōu)化算法能夠有效提高上市公司信用評級準確率,同時,ABC算法的優(yōu)化性能最為顯著,有效提高上市公司信用評級準確率達5%—10%。
(二)建議
結合研究成果與我國企業(yè)信用評級發(fā)展狀況,為推進我國信用評級市場發(fā)展,提出以下建議:
第一,建立層次更全面、共享度更高的信用數(shù)據(jù)庫。一方面,我國應提高企業(yè)信用數(shù)據(jù)庫的共享度,為金融機構進行風險評估提供便利,為企業(yè)與政府快捷、有效地了解評級市場變化提供平臺。另一方面,根據(jù)企業(yè)評級等級變化、不同類型的企業(yè)特點等構建層次更全面的企業(yè)信用數(shù)據(jù)庫,方便政府、企業(yè)、金融機構、個人實時掌握企業(yè)信用等級變化,及時調整規(guī)劃以應對風險。
第二,引入前沿機器學習算法豐富我國信用評級方法體系。人工智能作為新一輪技術革命及產(chǎn)業(yè)變革的重要驅動力,機器學習作為實現(xiàn)人工智能的重要途徑,是利用計算機技術模擬或實現(xiàn)人類學習活動的科學,能夠有效利用信息,并從海量數(shù)據(jù)中獲取隱藏、有效的信息與知識,為信用評級提供方法上的創(chuàng)新動力。有效利用機器學習技術的優(yōu)勢,并將其引入信用評級方法體系,對提高企業(yè)信用評級能力、提高信用評級準確率等具有重要的應用價值。
第三,積極培育我國的國際化評級機構。應客觀分析我國信用評級水平與國際間的差距,合理借鑒并勇于發(fā)聲,牢牢把握“一帶一路”建設的契機,促進我國信用評級機構走出去,支持和引導我國信用評級機構開展國際業(yè)務、擴大評級應用范圍。促進評級市場資源整合,建設具有國際影響力的國內(nèi)評級機構,發(fā)揮行業(yè)引領作用,積極爭取國際話語權。
參考文獻:
[1] John,M. The Recovery From the Depression[J]. Annals of the American Academy of Political & Social Science, 1909, 34(3):146-153.
[2] Ashcraft,A.B., Goldsmith-Pinkham,P., Vickery,J.I.MBS Ratings and the Mortgage Credit Boom[J]. Social Science Electronic Publishing,2010-89s(449):1-59.
[3] 陳元燮,陳欣.建立我國企業(yè)債券信用評級制度問題研究[J].財經(jīng)研究,1999,45(8):49-53.
[4] Standard & Poors. China Top 50 Banks[R]. Standard & Poors, 2007, 6.
[5] Moodys Investors Service. Global Credit Research [R]. Moodys Investors Service, 2005, 6.
[6] Jones,S., John,S.D., Wilson,R. An Empirical Evaluation of the Performance of Binary Classifiers in the Prediction of Credit Ratings Changes[J]. Journal of Banking & Finance, 2015,56:72-85.
[7] Huang,Y.L.Shen,C.H. Cross-Country Variations in Capital Structure Adjustment—The Credit Ratings[J]. International Review of Economics & Finance,2015,39:277-294.
[8] 霍海濤. 高技術中小企業(yè)信用風險評價指標體系及其評價方法[J]. 北京理工大學學報(社會科學版),2012,(1):60-65.
[9] 衣柏衡,朱建軍,李杰. 基于改進SMOTE的小額貸款公司客戶信用風險非均衡SVM分類[J]. 中國管理科學,2016,(3):24-30.
[10] Durand D. Risk Elements in Consumer Installment Financing[D]. National Bureau of Economic Research, 1941. 83-91.
[11] Altman,E.Financial Ratios,Discriminant Analysis and the Prediction of Corporate Bankruptcy[J]. The Journal of Finance, 1968, 23(4): 589-609.
[12] Wiginton,J.C. A Note on the Comparison of Logit and Discriminant Models of Consumer Credit Behavior[J]. Journal of Financial and Quantitative Analysis, 1980, 15(3): 757-770.
[13] Makowski,P. Credit Scoring Branches Out[J]. Credit World, 1985, 75(1): 30-37.
[14] Saunders,A., Allen,L, et al. Credit Risk Measurement in and out of the Financial Crisis : New Approaches to Value at Risk and Other Paradigms, Third Edition[J]. Journal of Supportive Oncology, 2011, 6(3):116-7.
[15] Oreski,S., Oreski,D., Oreski,G. Hybrid System with Genetic Algorithm and Artificial Neural Networks and Its Application to Retail Credit Risk Assessment[J]. Expert Systems with Applications, 2012, 39(16):112-134.
[16] Mohammadi,N., Zangeneh,M.Customer Credit Risk Assessment Using Artificial Neural Networks[J], 2016, 45(7):146-168.
[17] 肖斌卿,柏巍,姚瑤,等.基于LS-SVM的小微企業(yè)信用評估研究[J].審計與經(jīng)濟研究,2016,(6):102-111.
[18] 方匡南,范新妍,馬雙鴿.基于網(wǎng)絡結構Logistic模型的企業(yè)信用風險預警[J].統(tǒng)計研究,2016,(4):50-55.
[19] 龐素琳,何毅舟,汪壽陽,等.基于風險環(huán)境的企業(yè)多層交叉信用評分模型與應用[J].管理科學學報,2017,(10):57-69.
[20] Chen,W.H.,Ying,S.J. A Study of Taiwans?Sssuer Credit Rating Systems Using Support Vector Machines[J]. Expert Systems with Applications,2006,32(4): 427-435.
[21] Chan,L.Y.Application of Support Vector Machines to Corporate Credit Rating Prediction[J]. Expert Systems with Applications, 2007,46(7):67-74.
[22] Chen,C.C., Li,S.T. Credit Rating with A Monotonicity-Constrained Support Vector Machine Model[J]. Expert Systems with Applications, 2014,76(11): 7235-7247.
[23] Maldonado,S., Bravo,C., López,J., et al. Integrated Framework for Profit-Based Feature Selection and SVM Classification in Credit Scoring[J]. Decision Support Systems,2017,12(104): 113-121.
[24] Hao,J., Ching,W.K., Ka,F(xiàn)., et al. Stationary Mahalanobis Kernel SVM for Credit Risk Evaluation[J]. Applied Soft Computing, 2018,45(71): 407-417.
[25] Huang,Z., Chen,H.C.,Jung, H.C.,et al. Credit Rating Analysis with Support Vector Machines and Neural Networks: A Market Comparative Study[J]. Decision Support Systems. 2004,37(4): 543-558.
[26] Avramov,C., Chordia,T. , Jostova,G. , et al. Credit Ratings and the Cross-Section of Stock Returns[J]. Journal of Financial Markets, 2009,56 (12): 469-499.
Bio-Inspired Optimization Algorithm and Credit Rating of ListedCompanies:An Empirical Study Based on ABC-SVM
MA Xiao-jun,SONG Yan-qi,ZHANG Meng
(School of Statistics,Dongbei University of Finance and Economics,Dalian 116025,China)
Abstract:In order to improve the credit rating system of listed companies in China, this paper selects the rating data, financial data and relevant non-financial data of listed companies from RESETIS database and innovatively applies the artificial swarm algorithm optimization support vector machine (ABC-SVM) to the credit rating of listed companies in China by improving the three aspects of indicator selection, data processing and algorithm optimization.The results show that after segmenting the overall data set into an upgraded data set and a downgraded data set,the rating accuracy rate increased by 3.78% and 3.37%,respectively.At the same time,compared with the traditional support vector machine and other two kinds of biological heuristic algorithm(particle swarm algorithm,genetic algorithm),the ABC-SVM algorithm has the best rating effect,and the rating accuracy rate is significantly improved by 5%-7%.This paper provides a new method for the credit rating of listed companies in China,enriches the enterprise credit rating index system,and provides a theoretical basis for the establishment of a more comprehensive enterprise credit database and provides a theoretical basis for Chinese enterprises to strive for the right to international rating discourse.
Key words:artificial bee colony optimization algorithm;support vector machine;data segmentation;credit rating;listed company
(責任編輯:李明齊)