孫廷輝 朱瑞龍
摘要:針對(duì)財(cái)務(wù)管理中的數(shù)據(jù)量問(wèn)題,提出使用監(jiān)督性支持向量機(jī)(SVM)算法解決財(cái)務(wù)數(shù)據(jù)分類問(wèn)題。首先,將財(cái)務(wù)數(shù)據(jù)按照不同的年份,不同的部門進(jìn)行預(yù)處理,并將其標(biāo)簽化;其次,按照一定比例選擇訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù),將訓(xùn)練數(shù)據(jù)輸入到SVM中進(jìn)行分類器的訓(xùn)練;最后利用最優(yōu)分類器完成財(cái)務(wù)數(shù)據(jù)分類。實(shí)驗(yàn)結(jié)果表明:所提出的算法在財(cái)務(wù)管理中有較高的應(yīng)用價(jià)值。
關(guān)鍵詞:財(cái)務(wù)管理;數(shù)據(jù)分類;支持向量機(jī)
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)04-0760-02
1 支持向量機(jī)
支持向量機(jī)[1-4]已經(jīng)發(fā)展成為一個(gè)標(biāo)準(zhǔn)的分類模型,它尋找數(shù)據(jù)中的最大間隔超平面,作為分類平面對(duì)于小樣本以及高維的數(shù)據(jù)具有良好的分類效果。
標(biāo)準(zhǔn)的SVM算法的原始問(wèn)題可以歸結(jié)為如下的一個(gè)二次規(guī)劃的問(wèn)題:
其中,[ξi≥0,i=1,…l],[xi∈Rn]為支持向量機(jī)的輸入指標(biāo)向量,[yi∈{-1,1}]為[xi]所屬類別,[i=1,…l]。[K(xi,xj)]為核函數(shù),它對(duì)應(yīng)某特征空間Z中的內(nèi)積,即[K(xi,xj)=
支持向量機(jī)的訓(xùn)練是求解它的對(duì)偶問(wèn)題,其問(wèn)題描述如下:
其中:矩陣Q是半正定的,
設(shè)[a=(a1,a2,…al)T],[ai]是不等式約束,如下所示:
公式(5)是對(duì)應(yīng)Lagrange乘子。
2 財(cái)務(wù)管理的數(shù)據(jù)處理
在復(fù)雜的財(cái)務(wù)管理[5]中,往往涉及到數(shù)據(jù)量過(guò)大的問(wèn)題,不同部門之間的數(shù)據(jù)往往是非常龐大的,隨著時(shí)間的不同,數(shù)據(jù)也會(huì)相應(yīng)的增加,我們使用SVM算法,可以將不同部門之間的財(cái)務(wù)數(shù)據(jù)進(jìn)行有效地分類,這樣更加有助于財(cái)務(wù)數(shù)據(jù)管理,且能實(shí)現(xiàn)自動(dòng)地?cái)?shù)據(jù)更新分類。
設(shè)某公司有[A1~An]個(gè)部門,[X1~Xn]分別對(duì)應(yīng)這個(gè)部門的財(cái)務(wù)數(shù)據(jù)矩陣,我們隨機(jī)抽取每個(gè)部門的30%的財(cái)務(wù)數(shù)據(jù),再將這些數(shù)據(jù)按照1:9的比例進(jìn)行[n]次隨機(jī)分配,即27%的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),3%的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù),以年為單位,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)劃分,且利用SVM算法對(duì)其進(jìn)行分類的訓(xùn)練,其步驟分以下4步:
Step1:針對(duì)各部門的財(cái)務(wù)數(shù)據(jù)矩陣進(jìn)行標(biāo)簽,設(shè)定數(shù)據(jù)的屬性,隨機(jī)抽取訓(xùn)練數(shù)據(jù)。
Step2:按照不同的年份對(duì)這些數(shù)據(jù)進(jìn)行整理,利用數(shù)據(jù)屬性對(duì)每個(gè)部門的財(cái)務(wù)數(shù)據(jù)進(jìn)行對(duì)應(yīng)的向量化。
Step3:將向量化后的數(shù)據(jù)輸入到SVM算法中進(jìn)行數(shù)據(jù)分類器的訓(xùn)練。
Step4:重復(fù)Step1~Step3,得到多個(gè)數(shù)據(jù)分類器。
按照以上步驟,可以得到不同部門的多個(gè)財(cái)務(wù)數(shù)據(jù)分類器,我們需選擇一個(gè)最優(yōu)分類器,利用十字十乘交叉驗(yàn)證法,對(duì)分類器進(jìn)行重復(fù)最優(yōu)選取,其步驟如下所示:
Step1:設(shè)[1~n]代表所得到的財(cái)務(wù)數(shù)據(jù)分類器,將[n]次隨機(jī)分配后的訓(xùn)練數(shù)據(jù)輸入到這[n]個(gè)分類器中,設(shè)定初始值[i=1]。
Step2:設(shè)[xn]代表待分類的數(shù)據(jù)個(gè)數(shù),[xit]代表第[i]個(gè)分類器正確分類個(gè)數(shù),則第[i]個(gè)分類器分類準(zhǔn)確率可表示為
Step3:[i=i+1],重復(fù)Step2,if [i=n-1],則停止。
Step4:將所得到的準(zhǔn)確率進(jìn)行比較,可得如下表達(dá)式
按照以上流程,我們可以得到最優(yōu)的數(shù)據(jù)分類器,我們將剩余的70%的數(shù)據(jù)輸入到所得到的最優(yōu)數(shù)據(jù)分類器中即可完成數(shù)據(jù)分類,這樣可以有效地對(duì)財(cái)務(wù)數(shù)據(jù)進(jìn)行分類處理。
3 結(jié)束語(yǔ)
本文針對(duì)財(cái)務(wù)數(shù)據(jù)量較大問(wèn)題,提出使用SVM算法對(duì)其進(jìn)行分類,這種采用機(jī)器學(xué)習(xí)領(lǐng)域的監(jiān)督性分類方法實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)歸檔,有助于工作人員對(duì)財(cái)務(wù)數(shù)據(jù)進(jìn)行有效地管理和調(diào)取,實(shí)驗(yàn)結(jié)果表明:該文所研究的方法在實(shí)際應(yīng)用中有較強(qiáng)的應(yīng)用性和可行性,使用多元化,智能的數(shù)據(jù)分類方法在財(cái)務(wù)管理中有較強(qiáng)的實(shí)用價(jià)值。
參考文獻(xiàn):
[1] 馬杰,蔡延光.基于改進(jìn)SVM方法的車牌識(shí)別研究[J].現(xiàn)代計(jì)算機(jī),2012,16(14):72-75.
[2] 張妤,王文劍,康向平.一種回歸SVM選擇性集成方法[J].計(jì)算機(jī)科學(xué),2008,35(4):178-180.
[3] 任彧,顧成成.基于HOG特征和SVM的手勢(shì)識(shí)別[J].科技通報(bào),2011,27(2):211-214.
[4] 胡仕玲,顧爽,陳啟軍.基于HOG的物體分類方法[J].華中科技大學(xué)學(xué)報(bào),2011,11(2):124-126.
[5] 王化成,張偉華,佟巖.廣義財(cái)務(wù)管理理論結(jié)構(gòu)研究——以財(cái)務(wù)管理環(huán)境為起點(diǎn)的研究框架回顧與拓展[J].科學(xué)決策,2011,6(1):1-32.