林 宇, 黃 迅, 淳偉德, 黃登仕
(1. 成都理工大學(xué)商學(xué)院, 成都 610059; 2. 西南交通大學(xué)經(jīng)濟(jì)管理學(xué)院, 成都 610031)
基于ODR-ADASYN-SVM的極端金融風(fēng)險(xiǎn)預(yù)警研究①
林宇1, 黃迅1, 淳偉德1, 黃登仕2
(1. 成都理工大學(xué)商學(xué)院, 成都 610059; 2. 西南交通大學(xué)經(jīng)濟(jì)管理學(xué)院, 成都 610031)
摘要:針對(duì)合成少數(shù)類過采樣(synthetic minority over-sampling technique, SMOTE)方法在提升支持向量機(jī)(support vector machine, SVM)的非均衡樣本學(xué)習(xí)能力中出現(xiàn)的過擬合(over fitting),引入自適應(yīng)合成抽樣方法(adaptive synthetic sampling approach, ADASYN)和逐級(jí)優(yōu)化遞減欠采樣方法(optimization of decreasing reduction, ODR)分別克服SMOTE在生成新樣本中的盲目性和在處理對(duì)象上的局限性,進(jìn)而與SVM相結(jié)合,構(gòu)造出改進(jìn)SVM,即ODR-ADASYN-SVM模型來預(yù)測中國極端金融風(fēng)險(xiǎn);最后運(yùn)用T檢驗(yàn)對(duì)各模型預(yù)測精度的差異性進(jìn)行顯著性檢驗(yàn)以及對(duì)各模型的預(yù)測穩(wěn)定性進(jìn)行評(píng)價(jià).實(shí)證結(jié)果表明, ODR-ADASYN-SVM模型不僅能夠顯著地提升SVM的非均衡樣本學(xué)習(xí)能力,同時(shí)也能夠有效地克服SMOTE的過擬合,從而展示出優(yōu)越的極端金融風(fēng)險(xiǎn)預(yù)測性能.
關(guān)鍵詞:ODR; ADASYN; 支持向量機(jī); 極端金融風(fēng)險(xiǎn); 預(yù)警模型
0引言
近年來爆發(fā)的次貸危機(jī)、歐債危機(jī)等金融風(fēng)險(xiǎn)危機(jī)事件,不僅給各國經(jīng)濟(jì)帶來了沉重打擊,也使金融風(fēng)險(xiǎn)預(yù)警面臨著更為嚴(yán)峻的挑戰(zhàn).因此,建立科學(xué)的風(fēng)險(xiǎn)預(yù)警模型,準(zhǔn)確地識(shí)別并有效地防范和控制風(fēng)險(xiǎn),以維護(hù)金融經(jīng)濟(jì)安全,促進(jìn)經(jīng)濟(jì)社會(huì)和諧穩(wěn)定,既是新形勢下金融經(jīng)濟(jì)管理部門面臨的重要任務(wù),也是學(xué)術(shù)界關(guān)注的熱點(diǎn)問題.
然而,無論是對(duì)金融經(jīng)濟(jì)管理部門還是對(duì)投資者來說,都更關(guān)注金融市場極端下滑(extreme downside)所引發(fā)的極端金融風(fēng)險(xiǎn)(extremely financial risk)[1].這是因?yàn)椋瑯O端金融風(fēng)險(xiǎn)盡管發(fā)生概率極小,但一旦發(fā)生,就不僅會(huì)給投資者帶來巨大損失,或是滅頂之災(zāi),甚至還可能引起社會(huì)動(dòng)蕩、政權(quán)解體等嚴(yán)重后果.因此,探討極端金融風(fēng)險(xiǎn)的有效預(yù)警方法具有至關(guān)重要的現(xiàn)實(shí)意義.
在這里需要指出的是,自從1997年東南亞金融危機(jī)發(fā)生以來,極端金融風(fēng)險(xiǎn)預(yù)警就一直都是學(xué)術(shù)界關(guān)注的焦點(diǎn)與熱點(diǎn).學(xué)者們已運(yùn)用概率比(probit)回歸、橫截面回歸(STV)、信號(hào)法(KLR模型)、邏輯(Logit)回歸、神經(jīng)網(wǎng)絡(luò)(neural network, NN)等模型對(duì)金融風(fēng)險(xiǎn)危機(jī)預(yù)警展開了研究[2-6],雖然在預(yù)測極端金融風(fēng)險(xiǎn)上都取得了較好的效果,但卻存在前提條件過于苛刻、過學(xué)習(xí)、欠學(xué)習(xí)以及局部極小等問題[7].而SVM[8]運(yùn)用計(jì)算機(jī)智能技術(shù)自動(dòng)確定模型結(jié)構(gòu),不僅能有效克服上述模型所存在的問題,而且也具有優(yōu)越的智能學(xué)習(xí)與智能預(yù)測能力,因而被廣泛運(yùn)用于風(fēng)險(xiǎn)預(yù)警中且取得了良好的研究效果[9].然而,SVM的良好預(yù)測性能卻需要依賴數(shù)量相同的不同類別樣本進(jìn)行學(xué)習(xí)才能獲得,事實(shí)上,現(xiàn)實(shí)生活中大量存在的樣本卻往往屬于非均衡的[10],如金融市場中的極端與非極端金融危機(jī)事件所分別代表的少數(shù)和多數(shù)類樣本就正好構(gòu)成一類典型的非均衡樣本.如果仍然運(yùn)用SVM對(duì)這樣一類非均衡樣本進(jìn)行學(xué)習(xí),就很可能會(huì)造成SVM的分類超平面(separating hyperplane)向極端金融危機(jī)事件所代表的少數(shù)類樣本偏移,從而導(dǎo)致該類樣本被大量錯(cuò)分,最終降低SVM的預(yù)測性能[11].由此可見,非均衡樣本使得SVM學(xué)習(xí)面臨嚴(yán)峻的挑戰(zhàn),因而就必須改進(jìn)SVM模型,以提升SVM的非均衡樣本學(xué)習(xí)能力.
盡管學(xué)者們已研究出多種方法,尤其是研究出SMOTE方法[12]來提升分類模型的非均衡樣本學(xué)習(xí)能力.但在SMOTE方法中,每個(gè)少數(shù)類樣本都盲目地生成相同數(shù)量的人造樣本,卻忽略了其鄰近樣本的分布特點(diǎn),因而容易造成少數(shù)類樣本的相互重疊.同時(shí),SMOTE也僅僅處理少數(shù)類樣本,無法實(shí)現(xiàn)對(duì)多數(shù)類樣本的處理.因此,SMOTE方法在生成少數(shù)類樣本中的盲目性以及在處理對(duì)象上的局限性,使得分類模型不僅容易錯(cuò)分少數(shù)類樣本,而且也無法有效刪除多數(shù)類樣本中的噪聲信息,從而出現(xiàn)不能準(zhǔn)確預(yù)測少數(shù)類樣本的過擬合問題[13].而ADASYN[14]卻是專門針對(duì)SMOTE的盲目性而設(shè)計(jì)的解決方法,它利用少數(shù)類樣本的密度分布來計(jì)算少數(shù)類樣本生成的數(shù)量,使學(xué)習(xí)困難的少數(shù)類樣本生成更多的人造樣本,以增強(qiáng)分類模型的學(xué)習(xí)能力.同時(shí),ODR[15]利用K最鄰近規(guī)則(K-nearest neighbor,KNN)來計(jì)算多數(shù)類樣本對(duì)鄰近樣本的影響程度,進(jìn)而依次刪除對(duì)分類模型的學(xué)習(xí)能力有負(fù)面影響或者影響不大的多數(shù)類樣本,以實(shí)現(xiàn)對(duì)多數(shù)類樣本有目的的篩選,從而有效克服SMOTE在處理對(duì)象上存在的局限性.由此可見,將ADASYN和ODR相結(jié)合,既能有效地克服SMOTE在生成少數(shù)類樣本中的盲目性,又能有效地克服SMOTE在處理對(duì)象上的局限性,因而在提升非均衡樣本學(xué)習(xí)能力上具有十分顯著的優(yōu)勢.但令人遺憾的是,就本文所掌握的文獻(xiàn)而言,尚未發(fā)現(xiàn)有學(xué)者將ADASYN與ODR相結(jié)合以提升分類模型的非均衡樣本學(xué)習(xí)能力.
值得注意的是,中國金融市場成立時(shí)間較短,缺乏應(yīng)對(duì)金融風(fēng)險(xiǎn)危機(jī)的成熟經(jīng)驗(yàn),在極端金融風(fēng)險(xiǎn)的控制與防范上還存在諸多薄弱性[16-17];與此同時(shí),隨著經(jīng)濟(jì)全球化的深入發(fā)展,中國金融市場與國外金融市場的聯(lián)系日益密切,因而極易受到國外極端金融風(fēng)險(xiǎn)的傳染與沖擊,從而承受著更為艱巨的風(fēng)險(xiǎn)考驗(yàn),面臨著更為嚴(yán)峻的風(fēng)險(xiǎn)挑戰(zhàn)[18-19].那么,能否將ODR、ADASYN與SVM相結(jié)合,構(gòu)建出適合中國金融市場的極端金融風(fēng)險(xiǎn)預(yù)警方法?如果能,那么在極端金融風(fēng)險(xiǎn)的預(yù)測上,構(gòu)建的預(yù)警模型又是否較SVM、SMOTE-SVM、ODR-SVM以及ADASYN-SVM預(yù)警模型具有更為明顯的優(yōu)勢呢?
基于以上分析,本文以滬深300指數(shù)(China securities index 300, CSI300)為研究對(duì)象,既引入ADASYN來克服SMOTE在生成新樣本中的盲目性.又針對(duì)SMOTE在處理對(duì)象上的局限性,引入ODR來刪除非極端金融風(fēng)險(xiǎn)樣本中的噪聲信息;并與SVM相結(jié)合,提出改進(jìn)SVM,即ODR-ADASYN-SVM預(yù)警模型來預(yù)測中國極端金融風(fēng)險(xiǎn).進(jìn)而運(yùn)用性能評(píng)估指標(biāo)對(duì)SVM、SMOTE-SVM、ODR-SVM、ADASYN-SVM以及ODR-ADASYN-SVM模型的預(yù)測精度進(jìn)行評(píng)估,并運(yùn)用T檢驗(yàn)對(duì)各模型預(yù)測精度的差異性進(jìn)行顯著性檢驗(yàn)并對(duì)各模型的預(yù)測穩(wěn)定性進(jìn)行評(píng)價(jià),以充分展示出ODR-ADASYN-SVM模型在預(yù)測性能上的顯著優(yōu)越性,從而為金融經(jīng)濟(jì)管理部門及時(shí)控制與防范極端金融風(fēng)險(xiǎn)以及投資者制定合理的投資策略提供良好的決策借鑒.
目前,國內(nèi)外已有部分學(xué)者運(yùn)用SVM對(duì)金融市場風(fēng)險(xiǎn)預(yù)警展開了研究.Ahn等[20]以韓國金融市場為研究對(duì)象,建立了SVM金融市場風(fēng)險(xiǎn)預(yù)警系統(tǒng);Groth和Muntermann[21]又以文本信息為研究對(duì)象,運(yùn)用支持向量機(jī)(SVM)、神經(jīng)網(wǎng)絡(luò)(NN)、貝葉斯(Bayes)等方法,探索了金融市場風(fēng)險(xiǎn)危機(jī)管理;徐國祥和楊振建[22]將主成分分析方法(principle component analysis, PCA)、遺傳算法(genetic algorithm, GA)和SVM相結(jié)合,構(gòu)建了PCA-GA-SVM預(yù)警模型,并對(duì)滬深300指數(shù)和大盤股走勢進(jìn)行了預(yù)測研究;李云飛和惠曉峰[23]運(yùn)用SVM建立了股票投資價(jià)值分類模型,并與BP和RBF神經(jīng)網(wǎng)絡(luò)的預(yù)測性能進(jìn)行了比較.
與本文所掌握的研究文獻(xiàn)相比,本文的差異性顯而易見.1)尚未發(fā)現(xiàn)有文獻(xiàn)集成ODR和ADASYN來克服SMOTE所存在的過擬合,尤其是沒有發(fā)現(xiàn)有文獻(xiàn)將SVM與該技術(shù)相結(jié)合,對(duì)中國新興金融市場(本文用CSI300作為中國新興金融市場的代表)的極端金融風(fēng)險(xiǎn)展開預(yù)警研究;2)除運(yùn)用常用指標(biāo)來評(píng)價(jià)非均衡樣本分類模型的性能之外,本文尤其是運(yùn)用T檢驗(yàn)對(duì)模型預(yù)測精度的差異性進(jìn)行顯著性檢驗(yàn),以及對(duì)各模型的預(yù)測穩(wěn)定性進(jìn)行評(píng)價(jià);3)在提取能夠顯著刻畫中國新興金融市場極端金融風(fēng)險(xiǎn)的特征指標(biāo)上,不僅運(yùn)用統(tǒng)計(jì)假設(shè)檢驗(yàn)和逐步判別分析法來提取市場內(nèi)部特征指標(biāo),還運(yùn)用Copula方法專門對(duì)市場外部特征指標(biāo)進(jìn)行了提取,從而使得提取出的特征指標(biāo)能夠更為全面而顯著地刻畫中國新興金融市場的極端金融風(fēng)險(xiǎn).
1研究方法
1.1極端金融風(fēng)險(xiǎn)SVM預(yù)警方法
y(i)=sgn(f(x))
(1)
式中sgn(f(x))是符號(hào)函數(shù);f(x)是以特征指標(biāo)變量為自變量的決策函數(shù).當(dāng)金融市場處于極端金融風(fēng)險(xiǎn)狀態(tài)時(shí),y(i)=sgn(f(x))=+1;否則,就為-1.
運(yùn)用SVM方法在訓(xùn)練集上尋找最優(yōu)分類函數(shù)(即式(1)代表的極端金融風(fēng)險(xiǎn)預(yù)警模型),就需要將尋找最優(yōu)分類函數(shù)轉(zhuǎn)化為求解以下最優(yōu)問題
(2)
(3)
為了求解上述最優(yōu)問題,就要利用拉格朗日乘子(Lagrangemultiplier)法將上述最優(yōu)問題轉(zhuǎn)化為對(duì)偶(dual)問題
(4)
(5)
0≤αj≤C,j=1,2,…,m
(6)
于是,通過求解上述對(duì)偶問題,就得到以下最優(yōu)分類函數(shù)f(x)=sgn(w*x+b*)
(7)
其中
(8)
至此,極端金融風(fēng)險(xiǎn)預(yù)警的SVM方法就已構(gòu)建完畢.然而,正如前文所分析的那樣,由極端與非極端金融風(fēng)險(xiǎn)樣本所構(gòu)成的非均衡訓(xùn)練樣本會(huì)大大削弱SVM的學(xué)習(xí)能力,最終降低SVM對(duì)極端金融風(fēng)險(xiǎn)樣本預(yù)測的精度.因此,下文將重點(diǎn)探討能夠提升SVM的非均衡樣本學(xué)習(xí)能力的有效方法,以降低數(shù)據(jù)的過度偏斜對(duì)SVM預(yù)測極端金融風(fēng)險(xiǎn)樣本所造成的影響.1.2提升SVM預(yù)測性能的ODR-ADASYN方法
為克服SMOTE在生成新樣本中的盲目性以及在處理對(duì)象上的局限性,本文運(yùn)用ODR和ADASYN方法來改進(jìn)SMOTE,以提升SVM的極端金融風(fēng)險(xiǎn)預(yù)測性能.
假定訓(xùn)練樣本集為S,其中非極端金融風(fēng)險(xiǎn)樣本集為Smaj,極端金融風(fēng)險(xiǎn)樣本集為Smin,x屬于Smaj中的樣本.定義樣本x的關(guān)聯(lián)集是指Smaj中除x以外的其他非極端金融風(fēng)險(xiǎn)樣本的K個(gè)最鄰近樣本中包含x的樣本集,簡稱為關(guān)聯(lián)集x.則ODR-ADASYN的計(jì)算機(jī)實(shí)驗(yàn)步驟如下:
步驟1根據(jù)式(9),計(jì)算出需要?jiǎng)h除的非極端金融風(fēng)險(xiǎn)樣本數(shù)量Num
(9)
其中α∈[0,1],表示刪除指定的非極端金融風(fēng)險(xiǎn)樣本后期望得到的樣本非均衡水平,若α=1,則表示刪除指定的非極端金融風(fēng)險(xiǎn)樣本后,兩類樣本數(shù)量達(dá)到完全均衡;
步驟2計(jì)算出非極端金融風(fēng)險(xiǎn)樣本集中每個(gè)樣本的關(guān)聯(lián)集;
步驟3就樣本x而言,運(yùn)用KNN算法對(duì)關(guān)聯(lián)集x中的所有樣本進(jìn)行分類,能夠被正確分類的個(gè)數(shù)記錄為withx;
步驟4從關(guān)聯(lián)集x包含的所有樣本的最鄰近樣本中將樣本x刪除,并將第K+1個(gè)最鄰近樣本加入,再運(yùn)用KNN算法對(duì)關(guān)聯(lián)集x中的所有樣本進(jìn)行分類,能夠被正確分類的個(gè)數(shù)記錄為withoutx;
步驟5根據(jù)式(10),計(jì)算withx與withoutx的差值diffdiff=withx-withoutx
(10)
并通過下式判斷diff與0的大小關(guān)系來定義樣本x的屬性
(11)
其中N代表噪聲樣本,B代表邊界樣本,S代表安全樣本;
步驟6根據(jù)步驟3至步驟5,定義出Smaj中除樣本x外的其余每個(gè)非極端金融風(fēng)險(xiǎn)樣本的屬性;
步驟7根據(jù)步驟6定義出的樣本屬性,保留Smaj中的邊界樣本且刪除噪聲樣本,并針對(duì)安全樣本作下一步處理;
(12)
(13)
從式(13)可知,當(dāng)合成數(shù)量為Numnew的人造極端金融風(fēng)險(xiǎn)樣本后,兩類樣本數(shù)量就達(dá)到了完全均衡;
步驟10對(duì)每一個(gè)極端金融風(fēng)險(xiǎn)樣本xi而言,從所有樣本中找出其K個(gè)最鄰近樣本,并根據(jù)下式計(jì)算出最鄰近樣本中非極端金融風(fēng)險(xiǎn)樣本的占比ri
(14)
其中Δi∈[0,1],指K個(gè)最鄰近樣本中屬于非極端金融風(fēng)險(xiǎn)樣本的個(gè)數(shù);
(15)
(16)
步驟12計(jì)算出每一個(gè)極端金融風(fēng)險(xiǎn)樣本需要合成的人造樣本個(gè)數(shù)gi
(17)
步驟13對(duì)每一個(gè)極端金融風(fēng)險(xiǎn)樣本xi而言,都運(yùn)用SMOTE方法合成gi個(gè)極端金融風(fēng)險(xiǎn)樣本,此時(shí)兩類樣本數(shù)量達(dá)到一致.
需要說明的是,步驟1至步驟8是ODR的實(shí)驗(yàn)步驟,步驟9至步驟13是ADASYN的實(shí)驗(yàn)步驟.于是,就能夠基于上述ODR-ADASYN的實(shí)驗(yàn)步驟平衡非均衡的訓(xùn)練樣本,進(jìn)而運(yùn)用SVM對(duì)得到的均衡訓(xùn)練樣本進(jìn)行訓(xùn)練,最后再基于測試樣本對(duì)通過訓(xùn)練得到的SVM模型進(jìn)行性能測試與評(píng)價(jià).
1.3極端金融風(fēng)險(xiǎn)預(yù)警模型的性能評(píng)估指標(biāo)
基于均衡樣本構(gòu)建預(yù)警模型時(shí),通常以分類準(zhǔn)確率為評(píng)估指標(biāo)來評(píng)價(jià)模型性能.然而,當(dāng)樣本非均衡時(shí),該指標(biāo)僅能刻畫模型的整體預(yù)測性能,卻無法有效地評(píng)估模型對(duì)于極端金融風(fēng)險(xiǎn)樣本的預(yù)測性能[27].基于此,本文運(yùn)用目前針對(duì)非均衡樣本分類的常用評(píng)估指標(biāo)——幾何平均正確率Gmean、少數(shù)類的Fmeasure和AUC(area under ROC curve)值,對(duì)本文所提出的極端金融風(fēng)險(xiǎn)預(yù)警模型進(jìn)行性能評(píng)估(以下用G和F分別代替Gmean和Fmeasure).3種評(píng)估指標(biāo)的構(gòu)建過程如下:
表1 二分類數(shù)據(jù)集的混淆矩陣
根據(jù)混淆矩陣并通過下面3個(gè)式子就可以得到靈敏度SE、特異度SP和極端金融風(fēng)險(xiǎn)樣本查準(zhǔn)率P3類基本指標(biāo)
(18)
(19)
(20)
于是,再根據(jù)上述3類基本指標(biāo)并通過下面兩式就得到幾何平均正確率G以及少數(shù)類的F
(21)
(22)
其中幾何平均正確率G綜合考察了模型對(duì)于兩類樣本的預(yù)測性能,若G較大,則說明模型預(yù)測兩類樣本的精度都較高,反之亦然;而少數(shù)類樣本的F主要考察了模型對(duì)極端金融風(fēng)險(xiǎn)樣本的預(yù)測性能,若F較大,就說明模型預(yù)測極端金融風(fēng)險(xiǎn)樣本的性能較優(yōu)越,反之亦然.此外,AUC代表受試者工作特征曲線(receiver operating characteristic, ROC)下方的面積.面積越大,說明模型對(duì)兩類樣本的綜合預(yù)測性能越優(yōu)異.
2實(shí)證結(jié)果與分析
2.1樣本選擇
本文選取滬深300指數(shù)(CSI300)2005-04-08~2012-12-31的樣本作為研究對(duì)象.需要說明的是,之所以選擇CSI300進(jìn)行研究,原因在于CSI300包含了滬深股市60%左右的市值,被視為反映滬深兩市整體走勢的“晴雨表”,具有良好的市場代表性[22,28-29],而之所以選擇從CSI300創(chuàng)建以來至2012年末這段時(shí)間為研究區(qū)間,是因?yàn)闇罟墒性谶@段時(shí)間內(nèi)經(jīng)歷了暴漲暴跌的全過程,從而使滬深股市整體走勢的預(yù)測結(jié)果具有更強(qiáng)的說服力.
2.2狀態(tài)指標(biāo)變量的確定
要確定出所選每個(gè)樣本的狀態(tài)指標(biāo)變量,即確定出所選的每個(gè)樣本究竟屬于極端金融風(fēng)險(xiǎn)樣本還是非極端金融風(fēng)險(xiǎn)樣本,關(guān)鍵在于選擇極端金融風(fēng)險(xiǎn)門檻值.只有選擇出門檻值,才能以該門檻值為標(biāo)準(zhǔn),將超過門檻值的樣本認(rèn)定為極端金融風(fēng)險(xiǎn)樣本,未超過門檻值的樣本認(rèn)定為非極端金融風(fēng)險(xiǎn)樣本,以確定出所有樣本的狀態(tài)指標(biāo)變量,從而才能進(jìn)一步開展預(yù)警模型的構(gòu)建工作.
需要指出的是,目前還沒有確定門檻值的最優(yōu)數(shù)學(xué)理論模型.Hill[30]嘗試運(yùn)用Hill圖法來確定門檻值;Stelios和Dimitris[31]則運(yùn)用了超額均值函數(shù)(mean excess function, MEF)圖法來確定門檻值;而Neftci[32]把1.65σ當(dāng)作門檻值,超過1.65σ的值被作為極端金融風(fēng)險(xiǎn)樣本;另外,DuMouchel[33]選擇了10%左右的數(shù)據(jù)作為極端金融風(fēng)險(xiǎn)樣本進(jìn)行研究,取得了較好的研究效果.因此,本文選取占總體樣本9%的收益率最低的樣本作為極端金融風(fēng)險(xiǎn)樣本,即極值尾部.由于根據(jù)極值理論(extreme value theory, EVT),對(duì)于充分高的門檻值,超過門檻值的樣本都近似服從廣義帕累托分布(generalized Pareto distribution, GPD)簇,用下式表示
(23)
其中k表示超過門檻值的極端金融風(fēng)險(xiǎn)樣本的個(gè)數(shù);Fk(x)為極值分布函數(shù);Gξ,β(x)為GPD簇分布函數(shù).因此,本文還對(duì)這些極值尾部樣本用準(zhǔn)極大似然估計(jì)方法(quasi maximum likelihood estimation, QMLE)估計(jì)GPD簇分布函數(shù)的參數(shù)得到尾部GPD分布曲線與經(jīng)驗(yàn)分布的擬合效果圖(見圖1).從圖1可以直觀地看出,GPD與經(jīng)驗(yàn)分布具有較好的擬合效果,說明設(shè)定的極端金融風(fēng)險(xiǎn)樣本門檻值是科學(xué)合理的.此時(shí),極端與非極端金融風(fēng)險(xiǎn)樣本的非均衡比例達(dá)到1∶10.
圖1 CSI 300標(biāo)準(zhǔn)收益尾部經(jīng)驗(yàn)分布與GPD分布擬合效果圖
2.3特征指標(biāo)變量的選擇與提取
金融風(fēng)險(xiǎn)管理的目標(biāo)在于建立有效的風(fēng)險(xiǎn)預(yù)警系統(tǒng).而風(fēng)險(xiǎn)預(yù)警的重點(diǎn)又在于準(zhǔn)確地提取出誘發(fā)金融市場爆發(fā)極端風(fēng)險(xiǎn)的特征指標(biāo).但極端風(fēng)險(xiǎn)的爆發(fā),不僅是市場自身風(fēng)險(xiǎn)的累積,也有外部極端風(fēng)險(xiǎn)危機(jī)的傳導(dǎo)作用.因此,本文通過借鑒相關(guān)文獻(xiàn)[22,34]選擇出由8項(xiàng)股指基本指標(biāo)構(gòu)成的內(nèi)部特征指標(biāo).同時(shí),由于相關(guān)文獻(xiàn)[35-36]將具有代表性的國際金融市場作為了中國金融市場的外部風(fēng)險(xiǎn)危機(jī)因素,又考慮到收益率是反映市場綜合信息的重要指標(biāo),因此,本文將8個(gè)具有代表性的國際金融市場的股指日收益率作為了外部特征指標(biāo)(見表2).
表2 極端金融風(fēng)險(xiǎn)預(yù)警模型的特征指標(biāo)
注:樣本的特征指標(biāo)數(shù)據(jù)來源于雅虎財(cái)經(jīng)(http://finance.yahoo.com).
然而,最終用于預(yù)警的指標(biāo)不僅是可以量化的,而且還需要存在顯著差異,這樣才可以起到預(yù)警效果.同時(shí),宋新平和丁永生[26]也指出,預(yù)警是個(gè)多指標(biāo)的復(fù)雜系統(tǒng),提取合適的特征指標(biāo)可以有效地提升模型的性能.因此,為了從上述指標(biāo)中進(jìn)一步提取出能夠顯著刻畫中國新興金融市場極端風(fēng)險(xiǎn)的市場內(nèi)外部特征指標(biāo),本文還將對(duì)表2中的國外股市指標(biāo)和基本指標(biāo)分別作如下處理.
一方面,為了提取出對(duì)中國極端風(fēng)險(xiǎn)的爆發(fā)具有顯著傳導(dǎo)作用的外部特征指標(biāo),本文運(yùn)用Clayton Copula對(duì)CSI 300日收益率和表2中的前8項(xiàng)國外股指日收益率的下尾相關(guān)性進(jìn)行分析.這是因?yàn)橄挛蚕嚓P(guān)性能夠反映兩個(gè)市場同時(shí)暴跌的概率,這正好能夠刻畫外部極端金融風(fēng)險(xiǎn)對(duì)中國極端金融風(fēng)險(xiǎn)的影響程度[37].而Clayton Copula又恰好是專門刻畫下尾相關(guān)性的Copula模型.由此,計(jì)算出CSI 300與各國外股指間的下尾相依系數(shù)(見表3).
表3 CSI 300與其余收益率之間的下尾相依系
從表3可以看出,CSI 300與HSI、KOSPI和TWII的下尾相依系數(shù)大于0.1,與Nikkei 225和FTSE 100的下尾相依系數(shù)小于0.1,而與美國股市3大指數(shù)(GSPC,NASDAQ和DJIA)的下尾相依系數(shù)幾乎為0.從而說明,CSI300與HSI、KOSPI和TWII的下尾相關(guān)性較高,與Nikkei 225和FTSE 100的下尾相關(guān)性較低,而與美國股市3大指數(shù)(GSPC,NASDAQ和DJIA)幾乎不存在下尾相關(guān)性.基于此,本文選擇與CSI 300下尾相關(guān)性較高的HSI、KOSPI和TWII的日收益率作為最終的外部特征指標(biāo).
另外,為了檢驗(yàn)上述提出的Clayton Copula模型是否充分描述了CSI 300與國外股指之間的下尾相依關(guān)系,本文還將進(jìn)行卡方檢驗(yàn),結(jié)果見表4.從表4可見,在5%的顯著性水平下,各卡方檢驗(yàn)值都通過了擬合優(yōu)度檢驗(yàn),由此證明CSI 300與國外股指存在的相依結(jié)構(gòu)科學(xué)合理.另外,由于CSI300與HSI、KOSPI和TWII在2005-04-08~2012-12-31這段區(qū)間內(nèi)的樣本不匹配而出現(xiàn)缺失數(shù)據(jù),因此,針對(duì)這些缺失數(shù)據(jù),本文的處理方式是假如某個(gè)市場因節(jié)假日而沒有進(jìn)行交易,則其余市場的當(dāng)日樣本數(shù)據(jù)就被刪除.最終選擇出1 767個(gè)樣本進(jìn)行研究.
另一方面,為提取出能夠顯著區(qū)分風(fēng)險(xiǎn)狀態(tài)的內(nèi)部特征指標(biāo),本文還借鑒相關(guān)文獻(xiàn)[26, 38]提出的統(tǒng)計(jì)假設(shè)檢驗(yàn)方法和逐步判別分析法對(duì)表1中后8項(xiàng)基本指標(biāo)進(jìn)行提取.首先對(duì)這8項(xiàng)基本指標(biāo)進(jìn)行正態(tài)性檢驗(yàn),進(jìn)而對(duì)符合與不符合正態(tài)分布的基本指標(biāo)分別做單樣本T檢驗(yàn)和K-S檢驗(yàn),從中提取出若干基本指標(biāo);然后,運(yùn)用逐步判別分析法進(jìn)一步提取基本指標(biāo);最終將這8項(xiàng)基本指標(biāo)約簡為開盤價(jià)、收盤價(jià)、成交量和成交額這4項(xiàng)基本指標(biāo).并與通過Clayton Copula提取出的HSI、KOSPI和TWII日收益率這3項(xiàng)國外股市指標(biāo)共同構(gòu)成最終的能夠顯著刻畫中國新興金融市場極端金融風(fēng)險(xiǎn)的市場內(nèi)外部特征指標(biāo).
表4 卡方檢驗(yàn)統(tǒng)計(jì)量
2.4最優(yōu)ODR-ADASYN-SVM預(yù)警模型的確立
在將SVM的核函數(shù)設(shè)為RBF核函數(shù)、懲罰參數(shù)C設(shè)為0.5、核函數(shù)參數(shù)γ設(shè)為0.5的基礎(chǔ)上,本文采用10折交叉驗(yàn)證法(cross validation, CV)對(duì)ODR與ADASYN的最鄰近參數(shù)K以及ODR中的參數(shù)α進(jìn)行討論,從而選擇出性能最優(yōu)的ODR-ADASYN-SVM模型.需要強(qiáng)調(diào)的是,之所以將懲罰參數(shù)C值與核函數(shù)參數(shù)γ值都設(shè)為0.5,是因?yàn)楸疚慕?jīng)過反復(fù)實(shí)驗(yàn),最后確定模型在這兩個(gè)值上的預(yù)測效果最為理想.本文主要使用Matlab 2011b進(jìn)行編程分析.實(shí)驗(yàn)結(jié)果如圖2和圖3所示.
圖2不同最鄰近參數(shù)K下,參數(shù)α對(duì)模型預(yù)測精度的影響
Fig.2 Influence of parameter alpha on prediction accuracy in different nearest neighborK
圖3 不同參數(shù)α下,最鄰近參數(shù)K對(duì)模型預(yù)測精度的影響
從圖2可以看出,不論K取何值,隨著參數(shù)α的增大,特別是當(dāng)α>0.7時(shí),模型的F和G值都同時(shí)呈現(xiàn)出明顯的下降趨勢,但當(dāng)α≤0.7時(shí),模型的F和G值卻無明顯的波動(dòng).此外,當(dāng)α>0.8時(shí),模型的AUC值同樣也下降明顯,但當(dāng)α≤0.8時(shí),模型的AUC值卻無明顯波動(dòng).由此說明,盡管ODR能夠有效地刪除非極端金融風(fēng)險(xiǎn)樣本的噪聲信息,但過大的α?xí)沟肙DR過多地刪除有效的非極端金融風(fēng)險(xiǎn)樣本,最終降低模型的預(yù)測精度.
而從圖3可以看出,在絕大部分的α值下,隨著K的增大,模型的G、F和AUC值都無明顯波動(dòng),從而說明K對(duì)模型的預(yù)測精度影響不大.分析原因,主要在于當(dāng)樣本的非均衡水平較高時(shí),極端金融風(fēng)險(xiǎn)樣本的數(shù)量十分稀少,這使得每個(gè)樣本的K個(gè)最鄰近樣本中屬于極端金融風(fēng)險(xiǎn)類的樣本較少且數(shù)量較為固定,并不會(huì)隨著K的增大而增加,從而使得模型的預(yù)測精度較為穩(wěn)定.
基于上述分析,本文認(rèn)為,選擇合適的α,對(duì)于構(gòu)建精度最優(yōu)的ODR-ADASYN-SVM預(yù)警模型起著至關(guān)重要的作用.因而,再次分析圖2和圖3可知,較其余絕大部分α下的ODR-ADASYN-SVM,α為0.1下的ODR-ADASYN-SVM具有最高的預(yù)測精度,特別是α為0.1、K為5下ODR-ADASYN-SVM模型的AUC值達(dá)到0.703 1,G值達(dá)到0.680 4,F(xiàn)值達(dá)到0.279 3,相比其他α與K值下的ODR-ADASYN-SVM模型,其預(yù)測精度最為優(yōu)異.
2.5最優(yōu)ODR-ADASYN-SVM模型與其余模型的預(yù)測性能對(duì)比評(píng)估
盡管通過上述實(shí)驗(yàn),本文選擇出最優(yōu)的ODR-ADASYN-SVM預(yù)警模型,然而,該模型是否有效地提升了SVM的非均衡樣本學(xué)習(xí)能力并成功地克服了SMOTE的過擬合,這是本文接下來需要繼續(xù)深入探討的內(nèi)容.
在將SVM的核函數(shù)設(shè)為RBF核函數(shù)、懲罰參數(shù)C設(shè)為0.5、核函數(shù)參數(shù)γ設(shè)為0.5、最鄰近參數(shù)K設(shè)為5、ODR-ADASYN-SVM中ODR的參數(shù)α設(shè)為0.1、ODR-SVM中ODR的參數(shù)α設(shè)為1的基礎(chǔ)上,本文仍然采用10折交叉驗(yàn)證法對(duì)SVM、SMOTE-SVM、ODR-SVM、ADASYN-SVM和ODR-ADASYN-SVM模型的預(yù)測性能進(jìn)行對(duì)比研究.實(shí)驗(yàn)結(jié)果如表5所示.
表5 模型預(yù)測精度的對(duì)比結(jié)果
注:產(chǎn)生NAN的原因在于SVM將CSI300的所有極端金融
從表5可以看出,SVM模型的預(yù)測性能最不理想,尤其是它的G值為0而F值為NAN的實(shí)證結(jié)果充分說明SVM模型將所有的極端金融風(fēng)險(xiǎn)樣本都錯(cuò)誤地判定為非極端金融風(fēng)險(xiǎn)樣本,由此證明SVM模型無法有效地預(yù)測極端金融風(fēng)險(xiǎn).從表5還可以看出,ODR-ADASYN-SVM模型在G、F值上都高于SMOTE-SVM、ODR-SVM和ADASYN-SVM模型,而在AUC值上略低于SMOTE-SVM和ADASYN-SVM模型,該結(jié)果能夠說明,從預(yù)測精度的角度,ODR-ADASYN-SVM模型的預(yù)測性能明顯優(yōu)于ODR-SVM模型且略優(yōu)于SMOTE-SVM和ADASYN-SVM模型.
然而,僅根據(jù)各評(píng)估指標(biāo)值就判斷模型的性能還缺少類似于統(tǒng)計(jì)學(xué)檢驗(yàn)所具有的科學(xué)性與客觀性.因此,本文還將對(duì)預(yù)測結(jié)果進(jìn)行配對(duì)樣本T檢驗(yàn),從而檢驗(yàn)出各模型的預(yù)測性能差異是否顯著.檢驗(yàn)結(jié)果如表6所示.
表6 模型預(yù)測性能的配對(duì)樣本T檢驗(yàn)結(jié)果
注:***表示p<0.01,**表示p<0.05, 加粗值表示p>0.1.
從表6可以看出,SVM與其余模型在G、F和AUC值上的絕大部分配對(duì)樣本T檢驗(yàn)統(tǒng)計(jì)量在1%的顯著水平下拒絕零假設(shè)(nullhypothesis),即SVM與其余模型的預(yù)測性能差異顯著.由此表明,基于預(yù)測精度的角度,SVM模型的預(yù)測性能顯著低于其余模型,從而證明了SMOTE、ODR、ADASYN以及ODR與ADASYN相結(jié)合的ODR-ADASYN能夠提升SVM的非均衡樣本學(xué)習(xí)能力.此外,從表6還可以看出,ODR-SVM與SMOTE-SVM、ADASYN-SVM、ODR-ADASYN-SVM模型的預(yù)測性能也存在顯著差異,表明ODR-SVM模型的預(yù)測性能顯著低于SMOTE-SVM、ADASYN-SVM和ODR-ADASYN-SVM模型的預(yù)測性能,由此可見,僅僅運(yùn)用ODR來刪除非極端金融風(fēng)險(xiǎn)樣本中的噪聲信息,以克服SMOTE在處理對(duì)象上存在的局限性,而不結(jié)合ADASYN來克服SMOTE在生成極端金融風(fēng)險(xiǎn)樣本中的盲目性,并不能十分有效地提升SVM模型的預(yù)測性能.令人遺憾的是,從表6中無法觀察到ODR-ADASYN-SVM模型與SMOTE-SVM、ADASYN-SVM模型的預(yù)測性能存在顯著差異,因而也就無法充分證明ODR與ADASYN相結(jié)合在克服SMOTE的過擬合問題上具有顯著優(yōu)勢.基于此,本文還將從預(yù)測穩(wěn)定性的角度來繼續(xù)探討ODR-ADASYN-SVM模型較SMOTE-SVM和ADASYN-SVM模型的顯著優(yōu)越性.
為了對(duì)比ODR-ADASYN-SVM模型與SMOTE-SVM、ADASYN-SVM模型的預(yù)測穩(wěn)定性,本文在設(shè)置與上述實(shí)驗(yàn)相同參數(shù)的基礎(chǔ)上,通過修改極端金融風(fēng)險(xiǎn)樣本的門檻值,將極端金融風(fēng)險(xiǎn)樣本與非極端金融風(fēng)險(xiǎn)樣本的比例分別設(shè)置為1∶5、1∶10、1∶15、1∶20、1∶25、1∶30、1∶35、1∶40、1∶45、1∶50這10個(gè)水平,進(jìn)而對(duì)這10個(gè)水平下3類模型的預(yù)測精度變化情況進(jìn)行分析,從而判定3類模型的預(yù)測穩(wěn)定性,并最終挖掘出3類模型在預(yù)測性能上的顯著差異.實(shí)驗(yàn)結(jié)果如圖4和表7所示.
從圖4可以看出,在各種非均衡比例下,ADASYN-SVM的G和AUC值幾乎都高于SMOTE-SVM,并且ADASYN-SVM的波動(dòng)幅度也小于SMOTE-SVM,而從表7也可以看出,不同非均衡比例下,ADASYN-SVM的G和AUC值的均值都大于SMOTE-SVM,并且ADASYN-SVM的G和AUC值的標(biāo)準(zhǔn)差也明顯小于SMOTE-SVM,證明ADASYN-SVM的波動(dòng)幅度明顯小于SMOTE-SVM,從而說明在不同的非均衡比例下,ADASYN-SVM模型對(duì)兩類樣本共同預(yù)測的穩(wěn)定性明顯優(yōu)于SMOTE-SVM模型.
更為重要是,圖4還展示出ODR-ADASYN-SVM的G和AUC值幾乎都高于ADASYN-SVM和SMOTE-SVM,并且ODR-ADASYN-SVM的波動(dòng)幅度也最小,同時(shí),從表7也可以看出,ODR-ADASYN-SVM的G和AUC值的均值都大于ADASYN-SVM和SMOTE-SVM,并且ODR-ADASYN-SVM的G和AUC值的標(biāo)準(zhǔn)差都低于0.05,明顯小于ADASYN-SVM和SMOTE-SVM,表明ODR-ADASYN-SVM的波動(dòng)幅度明顯小于ADASYN-SVM和SMOTE-SVM,從而說明在不同的非均衡比例下,ODR-ADASYN-SVM模型在對(duì)兩類樣本的共同預(yù)測上具有最優(yōu)的穩(wěn)定性.
圖4 不同非均衡比例下ODR-ADASYN-SVM、ADASYN-SVM和SMOTE-SVM的G、F和AUC值比較
注:不帶括號(hào)外的值表示均值,帶括號(hào)的值表示標(biāo)準(zhǔn)差.
然而,從圖4卻無法看出3類模型的F值在不同非均衡比例下的大小差異,也看不出各模型F值的波動(dòng)幅度的差異.盡管通過表7能夠看出在不同非均衡比例下,ODR-ADASYN-SVM的F值的均值大于ADASYN-SVM和SMOTE-SVM,ADASYN-SVM的F值的均值大于SMOTE-SVM,以及ODR-ADASYN-SVM的F值的標(biāo)準(zhǔn)差小于ADASYN-SVM和SMOTE-SVM,ADASYN-SVM的F值的標(biāo)準(zhǔn)差小于SMOTE-SVM,但大小差異都很不明顯,因而無法判定3類模型在極端金融風(fēng)險(xiǎn)預(yù)測上穩(wěn)定性的顯著差異,也就更加無法展現(xiàn)3類模型的極端金融風(fēng)險(xiǎn)預(yù)測性能的顯著差異.為了展現(xiàn)出3類模型的極端金融風(fēng)險(xiǎn)預(yù)測性能的顯著差異性,本文還將對(duì)在不同非均衡比例下3類模型的F值進(jìn)行獨(dú)立樣本T檢驗(yàn).實(shí)驗(yàn)結(jié)果見表8.
表8 不同非均衡比例下3類模型F值的獨(dú)立樣本T檢驗(yàn)結(jié)果
注:未加括號(hào)的值表示ODR-ADASYN-SVM的p值, 加下劃線的值表示ADASYN-SVM的p值, 而加有括號(hào)的值表示SMOTE-SVM的p值, *表示p<0.1,**表示p<0.05,***表示p<0.01, 加粗值表示p>0.1.
分析表8可知,ODR-ADASYN-SVM模型加粗的p值達(dá)到9個(gè),帶“***”的p值只有28個(gè);ADASYN-SVM模型加粗的p值有8個(gè),帶“***”的p值有29個(gè);而SMOTE-SVM模型加粗的p值只有6個(gè),帶“***”的p值卻達(dá)到31個(gè),說明在10%的顯著水平下,ODR-ADASYN-SVM模型的F值在所有非均衡比例下接受零假設(shè)9次,ADASYN-SVM模型接受8次,SMOTE-SVM模型僅接受6次,而在1%的顯著水平下,ODR-ADASYN-SVM模型的F值在所有非均衡比例下拒絕零假設(shè)僅28次,ADASYN-SVM拒絕29次,SMOTE-SVM模型卻拒絕31次,從這個(gè)角度來說,ODR-ADASYN-SVM模型在各非均衡比例下的預(yù)測精度差異最不顯著,其次是ADASYN-SVM模型,而最為顯著的是SMOTE-SVM模型,從而說明,在不同的非均衡比例下,ODR-ADASYN-SVM模型對(duì)于極端金融風(fēng)險(xiǎn)樣本預(yù)測的穩(wěn)定性優(yōu)于SMOTE-SVM模型和ADASYN-SVM模型,而ADASYN-SVM模型又優(yōu)于SMOTE-SVM模型.
基于圖4、表7與表8的分析,本文認(rèn)為,盡管從預(yù)測精度分析,ODR-ADASYN-SVM的預(yù)測性能并不顯著優(yōu)于SMOTE-SVM和ADASYN-SVM,但從預(yù)測穩(wěn)定性分析,ODR-ADASYN-SVM的預(yù)測性能顯著優(yōu)于SMOTE-SVM和ADASYN-SVM,而ADASYN-SVM卻又顯著優(yōu)于SMOTE-SVM,從而證明了ADASYN能夠有效地克服SMOTE在生成極端金融風(fēng)險(xiǎn)樣本中的盲目性,但僅僅運(yùn)用ADASYN并不能最為有效地提升SVM模型的預(yù)測性能,只有將ODR與ADASYN相結(jié)合來克服SMOTE存在的過擬合,才能促使SVM模型的性能提升達(dá)到最為優(yōu)異的效果.
綜上所述,參數(shù)K對(duì)ODR-ADASYN-SVM模型的預(yù)測性能影響不大,而參數(shù)α卻對(duì)ODR-ADASYN-SVM模型的預(yù)測性能有著較大的影響.因此,通過對(duì)參數(shù)α的調(diào)整,就能夠得到最優(yōu)的ODR-ADASYN-SVM預(yù)警模型.并且無論是從預(yù)測精度分析,該模型的預(yù)測性能顯著優(yōu)于SVM和ODR-SVM模型,還是從預(yù)測穩(wěn)定性分析,該模型也顯著優(yōu)于SMOTE-SVM和ADASYN-SVM模型,從而充分證明了將ODR與ADASYN相結(jié)合不僅能夠提升SVM的非均衡樣本學(xué)習(xí)能力,而且比單獨(dú)運(yùn)用ODR和ADASYN來克服SMOTE的過擬合能夠取得更加優(yōu)異的效果.從上述分析可知,由ODR、ADASYN和SVM結(jié)合成ODR-ADASYN-SVM模型,能夠較好地預(yù)測中國極端金融風(fēng)險(xiǎn),從而為金融經(jīng)濟(jì)管理部門和投資者應(yīng)對(duì)與防范極端金融風(fēng)險(xiǎn)提供了有效的操作工具.
3結(jié)束語
本文以CSI300指數(shù)為研究對(duì)象,運(yùn)用EVT理論確定出極端與非極端金融風(fēng)險(xiǎn)樣本,并運(yùn)用統(tǒng)計(jì)假設(shè)檢驗(yàn)和逐步判別分析法提取市場內(nèi)部特征指標(biāo)以及運(yùn)用ClaytonCopula方法提取市場外部特征指標(biāo),進(jìn)而引入ADASYN來克服SMOTE在生成新樣本中的盲目性;針對(duì)SMOTE在處理對(duì)象上的局限性,還引入ODR來刪除非極端金融風(fēng)險(xiǎn)樣本中的噪聲信息;并與SVM相結(jié)合,構(gòu)造了改進(jìn)SVM,即ODR-ADASYN-SVM模型,并對(duì)該模型的最鄰近參數(shù)K和ODR的參數(shù)α進(jìn)行討論,進(jìn)而運(yùn)用最優(yōu)的ODR-ADASYN-SVM模型來預(yù)測中國極端金融風(fēng)險(xiǎn),然后再運(yùn)用性能評(píng)估指標(biāo)對(duì)SVM、SMOTE-SVM、ODR-SVM、ADASYN-SVM以及ODR-ADASYN-SVM模型的預(yù)測精度進(jìn)行評(píng)估,并最終運(yùn)用T檢驗(yàn)對(duì)各模型預(yù)測精度的差異性進(jìn)行顯著性檢驗(yàn)以及對(duì)各模型的預(yù)測穩(wěn)定性進(jìn)行評(píng)價(jià).實(shí)證結(jié)果表明,無論是從預(yù)測精度分析,ODR-ADASYN-SVM模型的預(yù)測性能顯著優(yōu)于SVM和ODR-SVM模型,還是從預(yù)測穩(wěn)定性分析,ODR-ADASYN-SVM模型也顯著優(yōu)于SMOTE-SVM和ADASYN-SVM模型,從而說明ODR-ADASYN方法能夠成功地克服SMOTE的過擬合,并有效地提升SVM的非均衡樣本學(xué)習(xí)能力,同時(shí),ODR-ADASYN-SVM預(yù)警模型在中國極端金融風(fēng)險(xiǎn)預(yù)測上具有最為優(yōu)越的預(yù)測性能.
本文的研究能夠?yàn)榻鹑诮?jīng)濟(jì)管理部門和投資者應(yīng)對(duì)與防范極端金融風(fēng)險(xiǎn)提供可操作性的應(yīng)用工具與方法.對(duì)于金融經(jīng)濟(jì)管理部門而言,能夠運(yùn)用ODR-ADASYN-SVM模型對(duì)未來一段時(shí)間內(nèi)的金融市場極端風(fēng)險(xiǎn)進(jìn)行準(zhǔn)確預(yù)測,及時(shí)制定并實(shí)施應(yīng)對(duì)金融風(fēng)險(xiǎn)危機(jī)的相關(guān)宏觀經(jīng)濟(jì)政策,從而構(gòu)建金融市場極端風(fēng)險(xiǎn)危機(jī)的“防火墻”,積極地化解與防范金融風(fēng)險(xiǎn)危機(jī),以維護(hù)金融市場穩(wěn)定,促進(jìn)經(jīng)濟(jì)持續(xù)健康發(fā)展;對(duì)于投資者而言,能夠運(yùn)用ODR-ADASYN-SVM模型提前捕獲金融市場風(fēng)險(xiǎn)危機(jī)信號(hào),進(jìn)而即時(shí)調(diào)整金融資產(chǎn)投資策略,以優(yōu)化金融資產(chǎn)投資組合,從而更為有效地管理金融資產(chǎn),保證金融資產(chǎn)的保值甚至增值.
本文提出的風(fēng)險(xiǎn)預(yù)警方法,雖然豐富了市場主體對(duì)極端金融風(fēng)險(xiǎn)預(yù)警的研究手段,但仍需要指出的是,金融市場樣本除存在極端與非極端兩種分類狀態(tài)外,也存在多分類狀態(tài),運(yùn)用本文提出的風(fēng)險(xiǎn)預(yù)警模型將無法進(jìn)行多分類研究.因此,如何改進(jìn)SVM方法,并結(jié)合非均衡樣本處理方法進(jìn)行多分類狀態(tài)下的極端金融風(fēng)險(xiǎn)預(yù)警研究,將是下一步的主要研究方向.
參 考 文 獻(xiàn):
[1]魏宇. 股票市場的極值風(fēng)險(xiǎn)測度及后驗(yàn)分析研究[J]. 管理科學(xué)學(xué)報(bào), 2008, 11(1): 78-88.
WeiYu.EVTriskmeasuresanditsbacktestinginstockmarkets[J].JournalofManagementSciencesinChina, 2008, 11(1): 78-88. (inChinese)
[2]FrankelJA,RoseAK.Currencycrashesinemergingmarkets:Anempiricaltreatment[J].JournalofInternationalEconomics, 1996, 41(3/4): 351-366.
[3]SachsJ,TornellA,VelascoA.Financialcrisesinemergingmarkets:Thelessonsfrom1995[J].BrookingsPapersonEconomicActivity, 1996, 27(1): 147-215.
[4]KaminskyG,LizondoS,ReinhartCM.LeadingIndicatorsofCurrencyCrises[R].IMFStaffPaper, 1998, 45(1): 1-48.
[5]陳守東, 楊瑩, 馬輝. 中國金融風(fēng)險(xiǎn)預(yù)警研究[J]. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究, 2006, (7): 36-48.
ChenShoudong,YangYing,MaHui.Thestudyofearly-warningonChinesefinancialrisk[J].TheJournalofQuantitative&TechnicalEconomics, 2006, (7): 36-48. (inChinese)
[6]KimTY,OhKJ,SohnI,etal.Usefulnessofartificialneuralnetworksforearlywarningsystemofeconomiccrisis[J].ExpertSystemswithApplications, 2004, 26(4): 583-590.
[7]周敏, 王新宇. 基于模糊優(yōu)選和神經(jīng)網(wǎng)絡(luò)的企業(yè)財(cái)務(wù)危機(jī)預(yù)警[J]. 管理科學(xué)學(xué)報(bào), 2002, 5(3): 86-90.
ZhouMin,WangXinyu.Pre-warningsystemsofenterprisefinancialcrisisbasedonfuzzyselectionandartificialneuralnetworks[J].JournalofManagementSciencesinChina, 2002, 5(3): 86-90. (inChinese)
[8]VapnikVN.TheNatureofStatisticalLearningTheory[M].NewYork:Springer-Verlag, 1995.
[9]LiH,SunJ.Forecastingbusinessfailure:Theuseofnearest-neighboursupportvectorsandcorrectingimbalancedsamples-evidencefromtheChinesehotelindustry[J].TourismManagement, 2012, 33(3): 622-634.
[10]MarateaA,PetrosinoA,MarioM.AdjustedF-measureandkernelscalingforimbalanceddatalearning[J].InformationSciences, 2014, 257(1): 331-341.
[11]SundarkumarGG,RaviV.Anovelhybridundersamplingmethodforminingunbalanceddatasetsinbankingandinsurance[J].EngineeringApplicationsofArtificialIntelligence, 2015, 37(1): 368-377.
[12]ChawlaN,BowyerK,HallL,etal.SMOTE:Syntheticminorityover-samplingtechnique[J].JournalofArtificialIntelligenceResearch, 2002, (16): 321-357.
[13]WangBX,JapkowiczN.Imbalanceddatasetlearningwithsyntheticsamples[C]//Proc.IRISMachineLearningWorkshop, 2004: 1-25.
[14]HeH,BaiY,GarciaEA,etal.ADASYN:Adaptivesyntheticsamplingapproachforimbalancedlearning[C]//Proc.Int’lJ.Conf.NeuralNetworks, 2008: 1322-1328.
[15]陶新民, 童智靖, 劉玉, 等. 基于ODR和BSMOTE結(jié)合的不均衡數(shù)據(jù)SVM分類算法[J]. 控制與決策, 2011, 26(10): 1535-1541.
TaoXinmin,TongZhijing,LiuYu,etal.SVMclassifierforunbalanceddatabasedoncombinationofODRandBSMOTE[J].ControlandDecision, 2011, 26(10): 1535-1541. (inChinese)
[16]戴文華, 夏峰. 關(guān)于中國證券市場20年發(fā)展的基本分析與思考[J]. 證券市場導(dǎo)報(bào), 2014, (1): 4-11.
DaiWenhua,XiaFeng.Thebasicanalysisandreflectionsonthe20yearsofdevelopmentofthesecuritiesmarket[J].SecuritiesMarketHerald, 2014, (1): 4-11. (inChinese)
[17]黃金波, 李仲飛, 姚海洋. 基于CVaR核估計(jì)量的風(fēng)險(xiǎn)管理[J]. 管理科學(xué)學(xué)報(bào), 2014, 17(3): 49-59.
HuangJinbo,LiZhongfei,YaoHaiyang.RiskmanagementbasedontheCVaRkernelestimator[J].JournalofManagementSciencesinChina, 2014, 17(3): 49-59. (inChinese)
[18]熊熊, 張珂, 周欣. 國際市場對(duì)我國股票市場系統(tǒng)性風(fēng)險(xiǎn)的影響分析[J]. 證券市場導(dǎo)報(bào), 2015, (1): 54-58.
XiongXiong,ZhangKe,ZhouXin.AnalysisofimpactofinternationalmarketonChinastockmarketsystemicrisk[J].SecuritiesMarketHerald, 2015, (1): 54-58. (inChinese)
[19]吳勇民, 紀(jì)玉山, 呂永剛. 技術(shù)進(jìn)步與金融結(jié)構(gòu)的協(xié)同演化研究——來自中國經(jīng)驗(yàn)證據(jù)[J]. 現(xiàn)代財(cái)經(jīng)(天津財(cái)經(jīng)大學(xué)學(xué)報(bào)), 2014, (7): 33-44.
WuYongmin,JiYushan,LüYonggang.Studyontheco-evolutionoftechnologicalprogressandfinancialstructure:TheempiricalevidencefromChina[J].ModernFinanceandEconomics(JournalofTianjinUniversityofFinanceandEconomics), 2014, (7): 33-44. (inChinese)
[20]AhnJJ,OhKJ,KimDH.Usefulnessofsupportvectormachinetodevelopanearlywarningsystemforfinancialcrisis[J].ExpertSystemswithApplications, 2011, 38(4): 2966-2973.
[21]GrothSS,MuntermannJ.Anintradaymarketriskmanagementapproachbasedontextualanalysis[J].DecisionSupportSystems, 2011, 50(4): 680-691.
[22]徐國祥, 楊振建.PCA-GA-SVM模型的構(gòu)建及應(yīng)用研究——滬深300指數(shù)預(yù)測精度實(shí)證分析[J]. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究, 2011, (2): 135-147.
XuGuoxiang,YangZhenjian.ResearchforconstructionandapplicationofPCA-GA-SVMmodel[J].TheJournalofQuantitative&TechnicalEconomics, 2011, (2): 135-147. (inChinese)
[23]李云飛, 惠曉峰. 基于支持向量機(jī)的股票投資價(jià)值分類模型研究[J]. 中國軟科學(xué), 2008, (1): 135-140.
LiYunfei,HuiXiaofeng.TheclassificationmodelforstockinvestmentvaluebasedonSVM[J].ChinaSoftScienceMagazine, 2008, (1): 135-140. (inChinese)
[24]FarquadMAH,IndranilB.Preprocessingunbalanceddatausingsupportvectormachine[J].DecisionSupportSystems, 2012, 53(1): 226-233.
[25]HuangZ,ChenHC,HsuCJ,etal.Creditratinganalysiswithsupportvectormachinesandneuralnetworks:Amarketcomparativestudy[J].DecisionSupportSystems, 2004, 37 (4): 543-558.
[26]宋新平, 丁永生. 基于最優(yōu)支持向量機(jī)模型的經(jīng)營失敗預(yù)警研究[J]. 管理科學(xué), 2008, 21(1): 115-121.
SongXinping,DingYongsheng.Studyonbusinessfailurepredictionbasedonanoptimizedsupportvectormachinemodel[J].JournalofManagementSciences, 2008, 21(1): 115-121. (inChinese)
[27]鄒鵬, 李一軍, 郝媛媛. 基于代價(jià)敏感性學(xué)習(xí)的客戶價(jià)值細(xì)分[J]. 管理科學(xué)學(xué)報(bào), 2009, 12(1): 48-56.
ZouPeng,LiYijun,HaoYuanyuan.Customervaluesegmentationbasedoncost-sensitivelearning[J].JournalofManagementSciencesinChina, 2009, 12(1): 48-56. (inChinese)
[28]魏宇, 賴曉東, 余江. 滬深300股指期貨日內(nèi)避險(xiǎn)模型及效率研究[J]. 管理科學(xué)學(xué)報(bào), 2013, 16(3): 29-40.
WeiYu,LaiXiaodong,YuJiang.Intra-dayhedgingmodelsandhedgingeffectivenessofCSI300indexfutures[J].JournalofManagementSciencesinChina, 2013, 16(3): 29-40. (inChinese)
[29]陳瑩, 武志偉, 王楊. 滬深300指數(shù)衍生證券的多市場交易與價(jià)格發(fā)現(xiàn)[J]. 管理科學(xué)學(xué)報(bào), 2014, 17(12): 75-84.
ChenYing,WuZhiwei,WangYang.Multi-markettradingofHS300indexderivativesandpricediscoveryofstockmarketindex[J].JournalofManagementSciencesinChina, 2014, 17(12): 75-84. (inChinese)
[30]HillBM.Asimplegeneralapproachtoinferenceaboutthetailofadistribution[J].TheAnnalsofStatistics, 1975, 3(5): 1163-1174.
[31]SteliosDB,DimitrisAG.EstimationofValue-at-Riskbyextremevalueandconventionalmethods:Acomparativeevaluationoftheirpredictiveperformance[J].Int.Fin.Markets,Inst.andMoney, 2005, 15 (3): 209-228.
[32]NeftciS.Valueatriskcalculations,extremeeventsandtailestimation[J].TheJournalofDerivations, 2000(Spring), 7(3): 23-37.
[33]DuMouchelWH.Estimatingthestableindexαinordertomeasuretailthickness:Acritique[J].AnnalsofStatistics, 1983, 11(4): 1019-1031.
[34]KimotoT,AsakawaK.Stockmarketpredictionsystemwithmodularneuralnetworks[C]//Proc.Int’lJ.Conf.NeuralNetwork, 1990: 1-6.
[35]葉五一, 繆柏其. 基于Copula變點(diǎn)檢測的美國次級(jí)債金融危機(jī)傳染分析[J]. 中國管理科學(xué), 2009, 17(3): 1-7.
YeWuyi,MiaoBaiqi.Analysisofsub-primeloancrisiscontagionbasedonchangepointtestingmethodofCopula[J].ChineseJournalofManagementScience, 2009, 17(3): 1-7. (inChinese)
[36]王永巧, 劉詩文. 基于時(shí)變Copula的金融開放與風(fēng)險(xiǎn)傳染[J]. 系統(tǒng)工程理論與實(shí)踐, 2011, 31(4): 778-784.
WangYongqiao,LiuShiwen.Financialmarketopennessandriskcontagion:Atime-varyingCopulaapproach[J].SystemsEngineering-Theory&Practice, 2011, 31(4): 778-784. (inChinese)
[37]葉五一, 韋偉, 繆柏其. 基于非參數(shù)時(shí)變Copula模型的美國次貸危機(jī)傳染分析[J]. 管理科學(xué)學(xué)報(bào), 2014, 17(11): 151-158.
YeWuyi,WeiWei,MiaoBaiqi.Analysisofsub-primeloancrisiscontagionbasedonnon-parametrictime-varyingCopula[J].JournalofManagementSciencesinChina, 2014, 17(11): 151-158. (inChinese)
[38]宋新平, 丁永生, 曾月明. 基于遺傳算法的同步優(yōu)化方法在財(cái)務(wù)困境預(yù)警中的應(yīng)用[J]. 預(yù)測, 2009, 28(1): 48-55.
SongXinping,DingYongsheng,ZengYueming.ApplicationofaGA-basedsimultaneousoptimizationmethodinfinancialcrisisprediction[J].Forecasting, 2009, 28(1): 48-55. (inChinese)
EarlywarningforextremelyfinancialrisksbasedonODR-ADASYN-SVM
LIN Yu1, HUANG Xun1, CHUN Wei-de1, HUANG Deng-shi2
1.BusinessSchool,ChengduUniversityofTechnology,Chengdu610059,China;2.SchoolofEconomicsandManagement,SouthwestJiaotongUniversity,Chengdu610031,China
Abstract:Synthetic minority over-sampling technique (SMOTE)has the problem of over fitting in improving the imbalanced samples’ learning ability of support vector machine (SVM). In this paper, adaptive synthetic sampling approach (ADASYN) and optimization of decreasing reduction approach (ODR) are assembled into an ODR-ADASYN to overcome the blindness in generating new samples and the limitations in processing the object. Combining SVM with ODR-ADASYN, an improved SVM, named ODR-ADASYN-SVM, is put forward to predict extremely financial risks; T-test is also applied to the significance test of the difference of the prediction accuracy of all models and to the evaluation of the prediction stability of all models. The result illustrates that the ODR-ADASYN-SVM can not only significantly improve the imbalanced samples’ learning ability of SVM, but also overcome the problem of over fitting for SMOTE effectively.Hence, the ODR-ADASYN-SVM has a superior ability to predict extremely financial risks.
Key words:ODR; ADASYN; SVM; extremely financial risk; early warning model
收稿日期:①2013-06-07;
修訂日期:2015-07-13.
基金項(xiàng)目:國家自然科學(xué)基金資助項(xiàng)目(71171025); 國家社會(huì)科學(xué)基金資助項(xiàng)目(12BGL024); 四川省軟科學(xué)研究計(jì)劃資助項(xiàng)目(2014ZR0093); 成都理工大學(xué)“金融與投資”優(yōu)秀創(chuàng)新團(tuán)隊(duì)計(jì)劃資助項(xiàng)目(KYTD201303).
作者簡介:林宇(1973—), 男, 四川儀隴人, 博士, 教授. Email:linyuphd@126.com
中圖分類號(hào):F832.5
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1007-9807(2016)05-0087-15