趙福壯
摘要:本文在分析了國(guó)內(nèi)外關(guān)于信譽(yù)評(píng)價(jià)的研究現(xiàn)狀后,結(jié)合我國(guó)企業(yè)發(fā)展的情況,創(chuàng)造性地提出了基于決策分類樹與ASVM的混合企業(yè)信譽(yù)度評(píng)價(jià)模型。較好地滿足了預(yù)先設(shè)定的要求為我國(guó)企業(yè)信譽(yù)度評(píng)價(jià)領(lǐng)域增添了一種新的方法。該模型既解決了決策分類樹在面對(duì)連續(xù)屬性的缺陷和多分類時(shí)出錯(cuò)概率增加的問(wèn)題,又解決了ASVM無(wú)法進(jìn)行多分類的問(wèn)題?;旌闲抛u(yù)度評(píng)價(jià)模型中以ASVM作為決策分類樹中分支節(jié)點(diǎn)的判別模型。并且通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)組合核函數(shù)的ASVM模型相對(duì)于RBF核函數(shù)的ASVM模型在信譽(yù)危機(jī)判別應(yīng)用中準(zhǔn)確率有一定的提升。最終的混合信譽(yù)度評(píng)價(jià)模型采用了組合核函數(shù)的ASVM模型作為分支節(jié)點(diǎn)的判別模型。經(jīng)過(guò)最終的實(shí)驗(yàn)對(duì)比發(fā)現(xiàn),該模型在解決企業(yè)信譽(yù)多分類問(wèn)題中具有較高的準(zhǔn)確率,具有較高的實(shí)用性
關(guān)鍵詞:信譽(yù)度評(píng)價(jià)指標(biāo);決策分類樹;自適應(yīng)支持向量機(jī);組合核函數(shù);混合模型
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)08-0253-05
Abstract: After analyzing the present situation of the domestic and international credit evaluation research field,and combined with the situation of our country's enterprise development, A hybrid enterprise reputation evaluation model based on decision classification tree and ASVM is proposed.This model meets the requirements of the pre and adds a new credit model for our country. Which not only solves the problem of the increase of the error probability of the decision tree in the face of the defect of the continuous attributes,but also resolves the problem that ASVM cant make a multi classification.In mixed reputation evaluation model,ASVM with combination kernel function is more accurate compared to ASVM with RBF kernel function.So the new the mixed credit evaluation model has a high practicability.
Key words:Index of credit evaluation decision tree ASVM Combined kernel
信用評(píng)價(jià)是在市場(chǎng)經(jīng)濟(jì)環(huán)境下針對(duì)企業(yè)、債券發(fā)行單位、金融機(jī)構(gòu)等市場(chǎng)參者未來(lái)按期償還債務(wù)的能力及償還債務(wù)的程度進(jìn)行綜合評(píng)價(jià)的業(yè)務(wù)行為。在市場(chǎng)經(jīng)濟(jì)的大環(huán)境下,信用評(píng)級(jí)起到十分重要的作用。它有利于降低交易風(fēng)險(xiǎn)成本,全面展示企業(yè)或債務(wù)發(fā)行單位的信用風(fēng)險(xiǎn);有利于降低社會(huì)信息獲取成本,能夠協(xié)助政府部門進(jìn)行市場(chǎng)監(jiān)管,防范預(yù)測(cè)金融風(fēng)險(xiǎn),同時(shí)也是經(jīng)濟(jì)全球化發(fā)展的必然要求。為了進(jìn)一步發(fā)展經(jīng)濟(jì),使中國(guó)走向世界,習(xí)近平總書記提出了一代一路建設(shè),并在十三五規(guī)劃中大力提倡中國(guó)創(chuàng)造2025計(jì)劃,從中國(guó)制造轉(zhuǎn)向中國(guó)創(chuàng)造。企業(yè)走出去作為國(guó)家的名片,其信譽(yù)形象的好壞,更是直接影響著一個(gè)國(guó)家的總體形象。因此我國(guó)政府相關(guān)部門也開始重視并加快了信用制度的建設(shè)。我國(guó)企業(yè)征信管理中心借鑒國(guó)際先進(jìn)的征信理念、科學(xué)的征信機(jī)制、時(shí)時(shí)海量信用信息等優(yōu)勢(shì),建立了涵蓋各級(jí)政府職能部門、社會(huì)團(tuán)體、行業(yè)協(xié)作、媒體、金融機(jī)構(gòu)以及廣大消費(fèi)者評(píng)價(jià)意見的信用評(píng)級(jí)標(biāo)準(zhǔn),對(duì)企業(yè)進(jìn)行信譽(yù)度評(píng)價(jià),建立企業(yè)信譽(yù)檔案,規(guī)范企業(yè)發(fā)展。
然而就實(shí)際情況來(lái)看,我國(guó)征信體系相對(duì)于西方發(fā)達(dá)國(guó)家而言起步較晚。西方征信體系已有上百年的歷史,并且有很多相關(guān)領(lǐng)域?qū)W者或機(jī)構(gòu)根據(jù)自己國(guó)家企業(yè)的不同情況進(jìn)行了針對(duì)性研究??傮w而言,我國(guó)信用評(píng)級(jí)機(jī)構(gòu)整體來(lái)說(shuō)表現(xiàn)為以下特點(diǎn)[1]:
1)評(píng)級(jí)機(jī)構(gòu)總量大、規(guī)模小、實(shí)力相對(duì)較弱。
2)信用評(píng)級(jí)機(jī)構(gòu)的專業(yè)性不夠強(qiáng)。
3)市場(chǎng)上信用評(píng)級(jí)機(jī)構(gòu)對(duì)企業(yè)的信譽(yù)評(píng)級(jí)結(jié)果表現(xiàn)出可信度低,利用率低,對(duì)社會(huì)影響較小特點(diǎn)。
4)企業(yè)對(duì)信用記錄的重視程度還不夠,存在造假現(xiàn)象。
由以上四點(diǎn)可以看出一個(gè)好的信譽(yù)評(píng)價(jià)機(jī)構(gòu)必須本著公平,公正的原則對(duì)受評(píng)企業(yè)進(jìn)行信譽(yù)評(píng)價(jià)。只有真實(shí)反映出企業(yè)的信譽(yù)狀況,才能取得公眾的信任,并為各方所接受。當(dāng)然準(zhǔn)確反映企業(yè)信譽(yù)狀況是以一套科學(xué)的企業(yè)信譽(yù)評(píng)價(jià)體為前提的。信譽(yù)評(píng)價(jià)領(lǐng)域的相關(guān)研究人員對(duì)此也做了大量研究。就目前來(lái)看,一個(gè)良好的信譽(yù)評(píng)價(jià)體系需要做一下兩方面的工作[3]:1)評(píng)價(jià)指標(biāo)體系的選取問(wèn)題;2)信譽(yù)評(píng)價(jià)模型的構(gòu)建問(wèn)題。
1信譽(yù)評(píng)價(jià)指標(biāo)的體系的選取
在分析了國(guó)內(nèi)外企業(yè)信譽(yù)度評(píng)級(jí)因素的內(nèi)容和特點(diǎn),結(jié)合中國(guó)上市企業(yè)的特征,綜合評(píng)估我國(guó)上市企業(yè)信用等級(jí),本文將評(píng)級(jí)因素劃分為 企業(yè)文化、盈利能力、償債能力、經(jīng)營(yíng)能力、資本構(gòu)成、行業(yè)前景共6個(gè)大類一級(jí)因素,每一類因素又包含有若干個(gè)二級(jí)因素[4]。具體如表1所示。
上述初始擬定的評(píng)價(jià)指標(biāo)是通過(guò)查閱大量文獻(xiàn),進(jìn)行全面分析,以詳盡和完備的原則建立而成的,其中包含了財(cái)務(wù)指標(biāo)和非財(cái)務(wù)指標(biāo)兩大類[2]。從信譽(yù)度評(píng)價(jià)的本質(zhì)來(lái)講,評(píng)價(jià)者只需要找到較為關(guān)鍵的指標(biāo)即可對(duì)企業(yè)進(jìn)行信譽(yù)評(píng)價(jià),從而也降低了評(píng)價(jià)成本。如果評(píng)價(jià)指標(biāo)體系過(guò)大,會(huì)相應(yīng)稀釋影響企業(yè)信譽(yù)對(duì)應(yīng)指標(biāo)的關(guān)鍵因素的影響力,此外還會(huì)大大增加信譽(yù)評(píng)價(jià)模型的復(fù)雜性程度。因此需要對(duì)上述指標(biāo)體系進(jìn)行一定的篩選,剔除影響因子相對(duì)較小的指標(biāo)。在維護(hù)評(píng)價(jià)指標(biāo)體系全面性的前提下,降低評(píng)價(jià)模型的復(fù)雜程度。
本文采用專家意見法來(lái)確定企業(yè)信譽(yù)評(píng)價(jià)的指標(biāo)體系,剔除一些影響力較小的指標(biāo)。我們知道金融領(lǐng)域的專家,經(jīng)過(guò)多年的實(shí)踐研究,對(duì)企業(yè)信譽(yù)風(fēng)險(xiǎn)評(píng)價(jià)有著較為深刻的認(rèn)知。他們可以利用專業(yè)知識(shí),工作經(jīng)驗(yàn),從評(píng)價(jià)指標(biāo)的實(shí)際意義來(lái)考慮其在企業(yè)信譽(yù)評(píng)價(jià)中的重要性。
通過(guò)根據(jù)專家的打分統(tǒng)計(jì)對(duì)信譽(yù)評(píng)價(jià)指標(biāo)進(jìn)行排序,剔除得分較低的幾個(gè)指標(biāo)。專家們的統(tǒng)一判斷,行業(yè)前景權(quán)重較弱,對(duì)公司的信譽(yù)級(jí)別影響較小,因此對(duì)其中的產(chǎn)品銷售前景、行業(yè)整體發(fā)展前景和國(guó)家政策支持三個(gè)指標(biāo)進(jìn)行剔除。雖然剔除了行業(yè)前景中的三個(gè)指標(biāo),但剩余評(píng)價(jià)指標(biāo)集合與實(shí)際的關(guān)鍵指標(biāo)集合整體還是保持一致的。根據(jù)前人的研究可知,企業(yè)遭受信用危機(jī),影響信譽(yù)度的關(guān)鍵因素主要為企業(yè)的流動(dòng)比率、資產(chǎn)周轉(zhuǎn)率、利潤(rùn)率,并且這幾個(gè)指標(biāo)專家統(tǒng)一給出的分值都比較高,剩余的評(píng)價(jià)指標(biāo)集合相對(duì)全面地覆蓋了影響企業(yè)信譽(yù)的指標(biāo)集。最終建立包含X1-X15共15個(gè)變量的信譽(yù)評(píng)價(jià)指標(biāo)體系。
2決策判別樹在信譽(yù)判別中應(yīng)用優(yōu)缺點(diǎn)分析
決策樹是一種人們?yōu)榱藢?duì)某件事情進(jìn)行決策而進(jìn)行的一系列判斷過(guò)程的樹形圖,由決策節(jié)點(diǎn)、分支和葉子三個(gè)部分組成。基本思想是利用訓(xùn)練數(shù)據(jù)集自動(dòng)的構(gòu)造決策樹,然后根據(jù)建立的決策樹對(duì)任意實(shí)例進(jìn)行判定,它往往向人們展示的是各因素之間的交互作用。
決策樹與其他分類算法相比存在的缺陷是當(dāng)類別很多時(shí),它的分類錯(cuò)誤率就可能增大。而且對(duì)于連續(xù)的屬性字段比較困難做出準(zhǔn)確的預(yù)測(cè)。判別節(jié)點(diǎn)通常是根據(jù)一個(gè)屬性來(lái)進(jìn)行分類的。上述缺點(diǎn),判別樹在企業(yè)信譽(yù)判別中也是存在的。
1)企業(yè)信譽(yù)級(jí)別判別屬于多分類問(wèn)題,企業(yè)信譽(yù)級(jí)別通常分為多個(gè)層次,面對(duì)這種情況,判別樹錯(cuò)分的幾率將會(huì)大大增加。信譽(yù)危機(jī)判別或貸款決策中通常是二分類問(wèn)題,即企業(yè)是否出現(xiàn)危機(jī)或是否給申請(qǐng)貸款對(duì)象貸款,運(yùn)用判別樹則比較合適。
2)企業(yè)信譽(yù)度判別指標(biāo)體系中,占很大一部分指標(biāo)比例都是連續(xù)的字段。判別樹在面對(duì)連續(xù)屬性時(shí),往往也表現(xiàn)出其中的不足,很難做出準(zhǔn)確的預(yù)測(cè),解決的方法通常是數(shù)據(jù)預(yù)處理期間對(duì)數(shù)據(jù)進(jìn)行分段處理。
3)判別樹在判別分類時(shí)屬于以此遞進(jìn)的過(guò)程,每個(gè)判別節(jié)點(diǎn)只用一個(gè)基本屬性字段進(jìn)行最大限度分類。然而在現(xiàn)實(shí)分類情況中不一定存在這種遞進(jìn)式的分類關(guān)系。
需要綜合所有指標(biāo)才能進(jìn)行分類。在企業(yè)信譽(yù)多等級(jí)評(píng)價(jià)時(shí)也會(huì)出現(xiàn)這種情況。
通過(guò)以上決策樹在企業(yè)信譽(yù)度評(píng)價(jià)中的應(yīng)用缺陷總結(jié),能否找到一種新的判別模型用作判別樹中分支節(jié)點(diǎn)的判別模型,消除上述3點(diǎn)的不利影響有待研究。
3ASVM在信譽(yù)判別中的應(yīng)用及優(yōu)缺點(diǎn)分析
3.1 ASVM原理介紹[5][6]
首先引入分類錯(cuò)誤率、決策損失函數(shù)、樣本偏斜度的概念并進(jìn)行說(shuō)明:
1)分類錯(cuò)誤率
在公式(7)中,[λ]作為平衡因子來(lái)平衡決策損失最小化和分類間隔最大化目標(biāo)。此外在模型中加入了決策損失函數(shù)來(lái)同步?jīng)Q策評(píng)價(jià)與學(xué)習(xí)過(guò)程,使得學(xué)習(xí)過(guò)程與風(fēng)險(xiǎn)偏好一致。[mj]用來(lái)反應(yīng)樣本的偏斜程度,使模型對(duì)樣本偏斜度有自適應(yīng)能力,[Cj]分類錯(cuò)誤代價(jià)反應(yīng)了決策者的風(fēng)險(xiǎn)偏好,決策者通過(guò)這一參數(shù)的調(diào)節(jié),對(duì)分類器結(jié)構(gòu)進(jìn)行干預(yù),使模型具有交互能力。此外[mj],[Cj]還具有調(diào)整最優(yōu)分類超平面的作用。上述自適應(yīng)支持向量機(jī)自動(dòng)的賦予了兩類分類錯(cuò)誤不同的懲罰參數(shù)值,某類的分類錯(cuò)誤比率越大或該類的樣本總數(shù)越小,對(duì)應(yīng)的懲罰參數(shù)越大。分類器將向著該分類錯(cuò)誤的方向變化。不同的偏斜情況和分類錯(cuò)誤對(duì)應(yīng)著不同的分類器,使得分類器具備了動(dòng)態(tài)特征。因此,該模型具有數(shù)據(jù)不平衡特性和決策風(fēng)險(xiǎn)偏好適應(yīng)性,稱之為自適應(yīng)支持向量機(jī)模型。
關(guān)于自適應(yīng)支持向量機(jī)的求解中,由于該模型在分類方法中加入了分類錯(cuò)誤最小化目標(biāo)函數(shù),可以看出(7)問(wèn)題為NP完全問(wèn)題。通過(guò)凸規(guī)劃方法和二次規(guī)劃方法是無(wú)法求解的。在上述模型中,采用的是樣本點(diǎn)到分類邊界距離的(0-1)階梯函數(shù)來(lái)判斷產(chǎn)生分類錯(cuò)誤與否。由于階梯函數(shù)的不可導(dǎo)性??刹捎霉剑?)。
3.2核函數(shù)的選擇問(wèn)題
核函數(shù)的選擇對(duì)SVM的性能起到至關(guān)重要的作用,尋找一個(gè)適合的核函數(shù)是SVM算法的核心,但是截至目前,相關(guān)研究領(lǐng)域還沒(méi)有給出合適的理論依據(jù)去選擇優(yōu)質(zhì)的核函數(shù)。
目前學(xué)術(shù)界把支持向量機(jī)的核函數(shù)分為兩類:全局性的核函數(shù)和局部性的核函數(shù)??梢酝ㄟ^(guò)在matlab中運(yùn)用方陣核函數(shù)曲線了解對(duì)應(yīng)的核函數(shù)是局部的還是全局的。局部核函數(shù)僅對(duì)測(cè)試點(diǎn)附近的小范圍數(shù)據(jù)有影響,而全局核函數(shù)能提取樣本全局特征,插值能力比較弱。對(duì)測(cè)試點(diǎn)近距離數(shù)據(jù)和遠(yuǎn)距離數(shù)據(jù)都有一定影響。
經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證采用高斯核函數(shù)的ASVM模型較普通SVM模型在準(zhǔn)確率上有一定的提升。但考慮到企業(yè)信譽(yù)度評(píng)價(jià)樣本集的廣泛性,及樣本記錄屬性的多樣性,本文提出采用組合核函數(shù)的ASVM模型進(jìn)行信譽(yù)風(fēng)險(xiǎn)評(píng)估與預(yù)測(cè)。通過(guò)分析全局核函數(shù)和局部核函數(shù)的優(yōu)缺點(diǎn)以及核函數(shù)的性質(zhì),構(gòu)造組合核函數(shù)如公式(10)
3.3實(shí)驗(yàn)對(duì)比分析
為保證實(shí)驗(yàn)的可對(duì)比性,本文實(shí)驗(yàn)參數(shù)設(shè)置與陳思鳳、Lin等人的設(shè)置是一致的。實(shí)驗(yàn)數(shù)據(jù)采用機(jī)器學(xué)習(xí)網(wǎng)站UCI提供的澳大利亞信用支持Statlog(Australian)Data 數(shù)據(jù)集和德國(guó)Statlog(German)Data數(shù)據(jù)。其中澳大利亞信用數(shù)據(jù)集,總共包含690條數(shù)據(jù),記錄中包含14條屬性。Y=1的記錄包含307條記錄,Y=-1的記錄包含383條。分別占比44.5%和55.5%。德國(guó)信用數(shù)據(jù)總共包含1000條記錄,記錄中包含20條屬性,一類記錄包含474條,二類記錄包含526條,分表分別占比47.4%和52.6%。
陳思風(fēng)的實(shí)驗(yàn)表明運(yùn)用粒子群優(yōu)化參數(shù)的自適應(yīng)支持向量機(jī)能獲得更適合的SVM參數(shù)。本文對(duì)RBF核函數(shù)的ASVM和采用(10)式的組合核函數(shù)的ASVM分別在上述兩個(gè)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)對(duì)比。由于只考慮樣本不平衡的情況,不考慮決策損失問(wèn)題,所以此實(shí)驗(yàn)的分類錯(cuò)誤代價(jià)[C1=C2],下表給出了兩種核函數(shù)的實(shí)驗(yàn)結(jié)果的準(zhǔn)確率。
由表2可以看出,采用粒子群算法進(jìn)行參數(shù)選擇的ASVM在上述兩個(gè)數(shù)據(jù)集樣本偏斜的情況下都達(dá)到了較高的分類準(zhǔn)確率。采用組合核函數(shù)的ASVM與采用RBF高斯核函數(shù)的ASVM相比,在準(zhǔn)確率上有相應(yīng)的提高。主要原因在于RBF核函數(shù)屬于局部核函數(shù),而新提出的組合核函數(shù)考慮到了信譽(yù)風(fēng)險(xiǎn)預(yù)測(cè)樣本集的廣泛性與樣本記錄中屬性的多樣性,結(jié)合了局部核函數(shù)與全局核函數(shù)的優(yōu)缺點(diǎn)。所以組合核函數(shù)ASVM更適合用來(lái)進(jìn)行信譽(yù)評(píng)級(jí)。
4 混合企業(yè)信譽(yù)度評(píng)價(jià)模型
本文采用國(guó)際通用標(biāo)準(zhǔn),將信用評(píng)估等級(jí)劃分為AAA、AA、A、BBB、BB、B、CCC、CC、C、D四等10級(jí)。其中A類信用等級(jí)又分為AAA、AA、A三類檔次,分別代表AAA級(jí)優(yōu)秀信用企業(yè)、AA級(jí)優(yōu)良信用企業(yè)和A級(jí)良好信用企業(yè);B類信用等級(jí)同樣劃分為BBB、BB、B三類檔次,信譽(yù)分?jǐn)?shù)逐級(jí)遞減,代表一般信譽(yù)企業(yè);C類信譽(yù)等級(jí)包含CCC、CC、C三類檔次,代表信譽(yù)較差企業(yè);D類信譽(yù)不再進(jìn)行細(xì)分,直接代表信譽(yù)極差企業(yè)。
4.1建立信譽(yù)判樹
在二叉判定樹中,成功的二分查找出走一條從根節(jié)點(diǎn)到被查找到節(jié)點(diǎn)的路徑。不成功的查找則走了一條從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的路徑。本文提出的信譽(yù)決策分類樹不滿足上述規(guī)則。利用建好的信譽(yù)決策分類樹模型進(jìn)行企業(yè)信譽(yù)判定時(shí),走的必須從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的一條路徑,不會(huì)出現(xiàn)中途結(jié)束的情況。圖1給出一個(gè)簡(jiǎn)單的四分類混合信譽(yù)度評(píng)價(jià)模型樹。
樹中的每一個(gè)判別節(jié)點(diǎn)都的判別模型為本文第三部分提到的組合核函數(shù)ASVM。
各個(gè)判別節(jié)點(diǎn)判別模型的訓(xùn)練過(guò)程具體如下:
1)選定支持向量機(jī)的訓(xùn)練集合[Vn],[n]代表有[n]條記錄即:[X1,X2,X3...Xn],集合中每個(gè)等級(jí)信譽(yù)度的企業(yè)都要包含一定的量。這樣訓(xùn)練出來(lái)的超平面才更具代表性。[Xi=(xi1,xi2,xi3...Xim,y)],每條記錄有m個(gè)變量。[y]代表該條記錄在某一個(gè)判定節(jié)點(diǎn)上的值,[y=1-1]。標(biāo)簽劃分根據(jù)判別節(jié)點(diǎn)的左右孩子節(jié)點(diǎn)進(jìn)行劃分。父節(jié)點(diǎn)集合[Sf]與左右孩子集合[Sl,Sr]滿足關(guān)系[Sf=Sl?Sr,Sl?Sr=Φ]。在某一個(gè)節(jié)點(diǎn)上進(jìn)行模型訓(xùn)練時(shí),需要對(duì)樣本標(biāo)簽[y]進(jìn)行賦值。[Sf]中樣本分配到左分支集合[Sl]時(shí)該樣本標(biāo)簽[y=-1],否則樣本被分配到右分支孩子節(jié)點(diǎn)集合[Sr],該樣本標(biāo)簽為[y=1]。標(biāo)簽賦值確定之后即可運(yùn)用支持向量機(jī)方法進(jìn)行訓(xùn)練,并用測(cè)試集進(jìn)行測(cè)試。如果樣本數(shù)量不充足可采用交叉驗(yàn)證法對(duì)訓(xùn)練出的模型進(jìn)行測(cè)試驗(yàn)證。
2)根據(jù)(1)中的說(shuō)明,初始訓(xùn)練集[Vn],從根節(jié)點(diǎn)開始依據(jù)左右分支劃分的集合給記錄中的y進(jìn)行賦值,左分支集合y=-1,屬于又分支的集合y=1。
3)利用訓(xùn)練集合進(jìn)行訓(xùn)練得到[F(x)=i=1mwiφi(x)+b=wTφi(x)+b=0]一個(gè)超平面,記錄該判定節(jié)點(diǎn)的ASVM模型Model,對(duì)模型進(jìn)行測(cè)試驗(yàn)證。
4)根據(jù)(3)中分割的兩個(gè)子集合,遞歸繼續(xù)重復(fù)(2)(3)兩步驟,直到樣本記錄落在葉子節(jié)點(diǎn)集合里結(jié)束。訓(xùn)練出全部判別節(jié)點(diǎn)的判別模型,混合企業(yè)信譽(yù)判別模型建立完成,產(chǎn)生一個(gè)二叉信譽(yù)決策分類樹。
按照此方式建立了四等十級(jí)混合企業(yè)信譽(yù)度評(píng)價(jià)判別樹模型如圖2所示。
圖2中包含9個(gè)圓節(jié)點(diǎn)和10個(gè)方形節(jié)點(diǎn)。9個(gè)圓型判別節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)都對(duì)應(yīng)一個(gè)判ASVM決策模型。10個(gè)方形節(jié)點(diǎn),即10個(gè)細(xì)分信譽(yù)級(jí)別。每個(gè)圓形節(jié)點(diǎn)中包含了相應(yīng)的集合,意思是,從根節(jié)點(diǎn)開始到達(dá)該節(jié)點(diǎn)經(jīng)過(guò)多次二分類ASVM判別剩下的集合。樣本企業(yè)所屬級(jí)別就包含在該集合里。直到從根節(jié)點(diǎn)到方形節(jié)點(diǎn),一條路徑走完,樣本企業(yè)落到具體的信譽(yù)級(jí)別下結(jié)束。不再采用根據(jù)信譽(yù)評(píng)價(jià)因素進(jìn)行綜合打分的方式來(lái)評(píng)定企業(yè)信譽(yù)級(jí)別。
4.2實(shí)驗(yàn)對(duì)比分析
本文數(shù)據(jù)主要來(lái)自于國(guó)泰君安官方網(wǎng)站上提供的上市企業(yè)2014年度相關(guān)數(shù)據(jù)。根據(jù)第1節(jié)中本文建立的信譽(yù)評(píng)價(jià)指標(biāo)體系進(jìn)行數(shù)據(jù)規(guī)整和預(yù)處理。把預(yù)處理后的數(shù)據(jù)作為模型的輸入,最后把第3節(jié)中的組合核函數(shù)ASVM和RBF核函數(shù)ASVM分別作為4.1節(jié)企業(yè)信譽(yù)決策分類樹中判別節(jié)點(diǎn)的判別模型進(jìn)行訓(xùn)練實(shí)驗(yàn)。并對(duì)兩種混合信譽(yù)度判別模型的結(jié)果進(jìn)行了對(duì)比。結(jié)果如表3所示。
由表3可以看出本文提出的組合核函數(shù)ASVM模型與陳思風(fēng)提出的RBF核函數(shù)ASVM模型相比,建立的企業(yè)信譽(yù)度判別模型分類正確率上有一定的提高。且兩種混合信譽(yù)度評(píng)價(jià)模型都在企業(yè)信譽(yù)預(yù)測(cè)時(shí)都具有較高的準(zhǔn)確率,有很高的實(shí)用價(jià)值。在運(yùn)用時(shí),可以根據(jù)具體場(chǎng)景的要求選擇不同的SVM作為混合模型中信譽(yù)決策分類樹分支節(jié)點(diǎn)的判別模型。且本文作者還進(jìn)行了相關(guān)實(shí)驗(yàn)發(fā)現(xiàn)在調(diào)解ASVM中的錯(cuò)誤分類代價(jià)[Cj]時(shí),能很好的調(diào)節(jié)模型,使得結(jié)果向決策者的偏好方向移動(dòng)。通過(guò)這種方式可以達(dá)到混合信譽(yù)度評(píng)價(jià)模型
5結(jié)束語(yǔ)
通常前人的研究都是對(duì)影響企業(yè)信用的指標(biāo)進(jìn)行分別打分,再加權(quán)求和,根據(jù)最后得分來(lái)給企業(yè)評(píng)分[7]?;蛘咄ㄟ^(guò)建模對(duì)企業(yè)進(jìn)行分類判斷企業(yè)是否存在風(fēng)險(xiǎn),但只能進(jìn)行二分類。本文創(chuàng)造性的提出采用決策分類樹與ASVM結(jié)合的方法構(gòu)造出混合企業(yè)信譽(yù)評(píng)級(jí)模型,較好的滿足了預(yù)先設(shè)定的要求,為我國(guó)企業(yè)信譽(yù)度評(píng)價(jià)建立了一種新的方法。具體主要做了一下幾方面的工作:
1)企業(yè)信譽(yù)評(píng)價(jià)變量的選取。為了保證評(píng)級(jí)指標(biāo)選取的全面、準(zhǔn)確性,本文列出18個(gè)因素變量,通過(guò)專家權(quán)重打分,最終選擇15個(gè)指標(biāo)作為信譽(yù)評(píng)級(jí)的輸入變量。
2)首先決策分類樹的優(yōu)缺點(diǎn)分析,以及在信譽(yù)判別領(lǐng)域中的應(yīng)用研究,并提出疑問(wèn)。
3)ASVM在信譽(yù)判別中的應(yīng)用及優(yōu)缺點(diǎn)分析
4)基于決策分類樹和ASVM的混合企業(yè)信譽(yù)評(píng)級(jí)模型。該信譽(yù)評(píng)級(jí)模型不采用打分法對(duì)企業(yè)信譽(yù)進(jìn)行評(píng)級(jí),而是根據(jù)企業(yè)樣本數(shù)據(jù)特征進(jìn)行評(píng)級(jí)。經(jīng)過(guò)實(shí)驗(yàn)發(fā)現(xiàn)該混合信譽(yù)評(píng)級(jí)模型具有較高的準(zhǔn)確率。并解決了決策分類樹在面對(duì)連續(xù)屬性和多分類問(wèn)題中的不足。同樣避免了SVM在多分類問(wèn)題上的缺陷。
當(dāng)然該模型還存在有待改進(jìn)的地方。例如:企業(yè)樣本數(shù)據(jù)是一個(gè)動(dòng)態(tài)產(chǎn)生的過(guò)程,本文的企業(yè)信譽(yù)判別采用數(shù)據(jù)為上市企業(yè)年度數(shù)據(jù)。缺乏動(dòng)態(tài)預(yù)測(cè)。更全面的方法是根據(jù)企業(yè)的多階段歷史數(shù)據(jù)進(jìn)行信譽(yù)預(yù)測(cè)。例如按時(shí)間順序,獲取企業(yè)每一季度的相關(guān)數(shù)據(jù),根據(jù)數(shù)據(jù)的動(dòng)態(tài)變化趨勢(shì)對(duì)企業(yè)信譽(yù)進(jìn)行預(yù)測(cè),將會(huì)更加科學(xué)全面。作者也會(huì)在后面的工作中進(jìn)行相關(guān)研究。
參考文獻(xiàn):
[1] 諸小麗,梁柱.企業(yè)信用等級(jí)綜合評(píng)判評(píng)分體系[J].中國(guó)科技信息,2005(23):293.
[2] 喬薇.中小企業(yè)信用評(píng)級(jí)模型及其應(yīng)用[D].河南大學(xué),2008.
[3] 詹世鴻.信用風(fēng)險(xiǎn)模型及信用評(píng)級(jí)綜述[D].吉林大學(xué),2007.
[4] 李萬(wàn)慶,張立寧,孟文清. 企業(yè)信用的綜合評(píng)價(jià)[J]. 統(tǒng)計(jì)與決策,2005,11:23-24.
[5] 丁子春.基于支持向量機(jī)的多領(lǐng)域自適應(yīng)分類方法研究[D].武漢理工大學(xué),2009.
[6] 陳思鳳.基于ASVM的創(chuàng)業(yè)板上市企業(yè)風(fēng)險(xiǎn)評(píng)估研究[D].合肥工業(yè)大學(xué),2012.
[7] Leonard K J. A fraud alert model for credit cards during the authorization process[J]. IMA Journal of Mathematics Applied in Business and Industry.19934(5):57-62