潘文超
(中國科技大學(xué) 企業(yè)管理系,臺灣 臺北 104)
近年來,優(yōu)化問題處理已經(jīng)逐漸受到重視,例如物流業(yè)的最短路線問題[1]或是交通運(yùn)輸業(yè)的排班問題[2]等,都必須經(jīng)由優(yōu)化算法來加以處理。到目前為止,經(jīng)常被用來處理優(yōu)化問題的算法包括了遺傳算法[3]與粒子群算法[4]。然而,這些算法的共同缺點(diǎn)就是計(jì)算過程復(fù)雜且初學(xué)者不容易了解。
有鑒于此,本文不同于以往學(xué)者,而是采用一種全新的果蠅優(yōu)化算法(Fruit Fly Optimization Algorithm,簡稱FOA)。這種優(yōu)化算法具有計(jì)算過程簡單,容易將它的觀念轉(zhuǎn)換為程序代碼而且非常容易理解等優(yōu)點(diǎn)。本文首先嘗試以求得函數(shù)極大值的方式,測試此優(yōu)化算法的功能;然后,進(jìn)一步的按照財(cái)務(wù)五力中的活動(dòng)力、安定力與收益力搜集臺灣2008、2009年企業(yè)財(cái)務(wù)比率資料,根據(jù)活動(dòng)力、安定力與收益力進(jìn)行灰關(guān)聯(lián)分析,再將二者的分析結(jié)果,按照灰關(guān)聯(lián)度進(jìn)行排序,以了解各企業(yè)的經(jīng)營績效排名,并且以二分法的方式分為績效好與壞二類,然后以財(cái)務(wù)比率作為自變量(X),以績效好壞作為因變量(Y),再采用三種數(shù)據(jù)探勘技術(shù),包括果蠅優(yōu)化算法優(yōu)化廣義回歸神經(jīng)網(wǎng)絡(luò)(Fruit Fly Optimization Algorithm optimized General Regression Neural Network,簡稱 FOAGRNN)、一般廣義回歸神經(jīng)網(wǎng)絡(luò)(General Regression Neural Network,簡稱 GRNN)與多元回歸模型(Multiple Regression,簡稱 MR),進(jìn)行企業(yè)經(jīng)營績效偵測模型的建構(gòu),以供研究人員參考。
本文主要的結(jié)構(gòu)是:第一節(jié)介紹研究動(dòng)機(jī)與目的,第二節(jié)介紹果蠅優(yōu)化算法與探討以求解極大值為范例,第三節(jié)介紹所使用的樣本數(shù)據(jù)與實(shí)際案例分析,第四節(jié)提出研究結(jié)論與建議。
果蠅優(yōu)化算法是由筆者提出[5,6],一種基于果蠅覓食行為推演出的尋求全局優(yōu)化的新方法。果蠅本身在感官知覺上優(yōu)于其他物種,尤其是在嗅覺與視覺上。果蠅的嗅覺器官能很好地搜集飄浮在空氣中的各種氣味,然后飛近食物位置后亦可使用敏銳的視覺發(fā)現(xiàn)食物與同伴聚集的位置,并且往該方向飛去。
依照果蠅搜尋食物的特性,將其歸納為幾個(gè)必要的步驟與程序范例,以提供讀者參考。如圖1。
圖1 果蠅群體迭代搜索食物示意圖
1.隨機(jī)初始果蠅群體位置(Fly Group)。
Init X_axis;Init Y_axis.
2.賦與果蠅個(gè)體(Fly1,F(xiàn)ly2,F(xiàn)ly3)利用嗅覺搜尋食物之隨機(jī)方向與距離。
Xi= X_axis + Random Value.
Yi= Y_axis + Random Value.
3.由于無法得知食物位置,因此先估計(jì)與原點(diǎn)之距離(Dist),再計(jì)算味道濃度判定值(S),此值為距離之倒數(shù)。
4.味道濃度判定值(S)代入味道濃度判定函數(shù)(或稱為Fitness function)以求出該果蠅個(gè)體位置的味道濃度(Smelli)。
Smelli=Function(Si).
5.找出此果蠅群體中的味道濃度最高的果蠅(求極大值,例如Fly2)。
[bestSmell bestIndex] = max(Smell).
6.保留最佳味道濃度值與x、y坐標(biāo),此時(shí)果蠅群體利用視覺向該位置(Fly2)飛去,形成新的群聚位置。
Smellbest = bestSmell.
X_axis = X(bestIndex).
Y_axis = Y(bestIndex).
7.進(jìn)入果蠅迭代尋優(yōu),重復(fù)執(zhí)行步驟2-5,并判斷味道濃度是否優(yōu)于前一迭代味道濃度,若是則執(zhí)行步驟6。[注]其完整程序代碼,可以參考網(wǎng)址:http://www.oitecshop.byethost16.com/FOA.html,2011-11-07.
本文嘗試以FOA求得極大值,其函數(shù)為Y=3-X2,此極大值的解答為3。隨機(jī)初始化果蠅群體位置區(qū)間為[0,10],迭代的果蠅搜尋食物的隨機(jī)飛行方向與距離區(qū)間為[-1,1]。經(jīng)由100次迭代搜尋最大值后,程序執(zhí)行結(jié)果逐漸逼近該函數(shù)極值之解答。圖2為迭代搜尋函數(shù)極值的解所繪制的曲線圖,由圖中可發(fā)現(xiàn)該曲線逐漸逼近函數(shù)極大值3,而該群果蠅之坐標(biāo)為(80.329 6,74.335 1)。
圖2 迭代搜尋函數(shù)極值曲線圖
本文自臺灣情報(bào)贏家數(shù)據(jù)庫搜集2008年及2009年1 000家上市上柜公司財(cái)務(wù)比率數(shù)據(jù)作為自變量。這些財(cái)務(wù)比率資料是依據(jù)財(cái)務(wù)五力中的活動(dòng)力 (應(yīng)收賬款周轉(zhuǎn)率X1,資產(chǎn)周轉(zhuǎn)率X2,股東權(quán)益周轉(zhuǎn)率X3),安定力 (流動(dòng)比率X4,速動(dòng)比率X5,負(fù)債比率X6) 和收益力(毛利率X7,營業(yè)利益率X8,純益率X9)等三力所搜集,這些財(cái)務(wù)比率的敘述統(tǒng)計(jì)值,如表1所示。
表1 臺灣1 000家公司的財(cái)務(wù)比率敘述統(tǒng)計(jì)值
本文采用Tong的方法使用財(cái)務(wù)比率作為評價(jià)因子[7],然后利用Deng教授提出的灰關(guān)聯(lián)分析并且使用Wenetal.教授所開發(fā)的灰關(guān)聯(lián)分析 Matlab 工具箱去分析1 000家企業(yè)的灰關(guān)聯(lián)度值并進(jìn)行排名[8,9]。此外,本文選擇負(fù)債比率最小值,其余比率最大值做標(biāo)準(zhǔn)序列。根據(jù)灰關(guān)聯(lián)的定義,灰關(guān)聯(lián)度是二條序列之間的相關(guān)程度。不同的比較序列與標(biāo)準(zhǔn)序列會產(chǎn)生相應(yīng)的灰關(guān)聯(lián)度再將其排序?yàn)榛谊P(guān)聯(lián)序。越高的灰關(guān)聯(lián)度值代表其企業(yè)的經(jīng)營績效越佳。因此,選取前500名企業(yè)經(jīng)營績效佳的上市上柜公司(以0表示) 和后500名企業(yè)經(jīng)營績效不佳的上市上柜公司(以1表示)作為因變量(Y)。本文采用MATLAB7.0 軟件進(jìn)行灰關(guān)聯(lián)分析,而圖3中各序列分別代表一家臺灣上市上柜公司;一條序列中共有9個(gè)節(jié)點(diǎn),分別代表9種形態(tài)的財(cái)務(wù)比率,用星號線連接稱為標(biāo)準(zhǔn)序列(Standard sequence),其余的線稱為比較序列(Inspected sequence)。若比較序列越接近標(biāo)準(zhǔn)序列,代表該企業(yè)的經(jīng)營績效越好。研究發(fā)現(xiàn),在2008年的企業(yè)中經(jīng)營績效前3名的企業(yè)分別是關(guān)貿(mào)(6 183)、 思源(2 473)和景岳(3 164),而經(jīng)營績效后3名的企業(yè)分別是美嘉電(4 415)、得捷(5 204)和隴華(2 424);在2009年的企業(yè)中經(jīng)營績效前3名的企業(yè)分別是關(guān)貿(mào)(6 183)、大冢(3 570)和通泰(5 487),而經(jīng)營績效后3名的企業(yè)分別是茂德(5 387)、佳鼎(5 318)和建臺(1 107)。本文將財(cái)務(wù)比率自變量與因變量作為樣本數(shù)據(jù)共有1 000筆,并且將此1 000筆數(shù)據(jù)區(qū)分為5小組,然后以4小組數(shù)據(jù)進(jìn)行模型建構(gòu),1小組數(shù)據(jù)進(jìn)行模型測試的方式作交叉驗(yàn)證(Cross-testing),以驗(yàn)證企業(yè)經(jīng)營績效偵測模型的穩(wěn)定性。
本文將1 000筆樣本數(shù)據(jù)進(jìn)行正規(guī)化,使樣本介于0到1之間,然后細(xì)分為5小組,以4小組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)建構(gòu)模型,1小組數(shù)據(jù)作為測試數(shù)據(jù)測試模型穩(wěn)定性的方式進(jìn)行交互驗(yàn)證。將三種模型的輸出結(jié)果定義為小于或等于0.5歸類為0(也就是經(jīng)營績效佳),大于0.5歸類為1(也就是經(jīng)營績效不佳)。首先利用前4小組訓(xùn)練數(shù)據(jù)分別建構(gòu)FOAGRNN、一般GRNN與傳統(tǒng)多元回歸等三種模型,有關(guān)GRNN的理論,讀者可參考Specht教授的相關(guān)著作[10,11]。在FOAGRNN模型方面,本文采用GRNN matlab 工具箱并自行撰寫MATLAB程序,設(shè)計(jì)FOA動(dòng)態(tài)搜尋最佳GRNN的Spread參數(shù)值,建構(gòu)FOAGRNN模型。GRNN的Spread參數(shù)初始值設(shè)定在[0.001,1]之間,網(wǎng)絡(luò)輸入層神經(jīng)元為9個(gè)、輸出神經(jīng)元為1個(gè)。
圖3 灰關(guān)聯(lián)分析之線性序列圖
在FOA初始參數(shù)的設(shè)定方面,隨機(jī)初始化果蠅群體位置區(qū)間為[0,100],迭代之果蠅搜尋食物的隨機(jī)飛行方向與距離區(qū)間為[-10,10],果蠅種群規(guī)模大小為20只,迭代(iterative)次數(shù)為100。FOA優(yōu)化GRNN的做法是先計(jì)算出果蠅個(gè)體位置與原點(diǎn)坐標(biāo)(0,0)之間的距離并計(jì)算倒數(shù),以求出味道濃度判定值(S),再將它代入GRNN的參數(shù)Spread內(nèi),輸入訓(xùn)練數(shù)據(jù)得出網(wǎng)絡(luò)輸出值,再與目標(biāo)值計(jì)算出RMSE(或稱為Fitness),此值越小越好,保留最好的味道濃度判定值(S)作為GRNN之Spread值,依此方法進(jìn)行迭代搜尋。透過果蠅的嗅覺隨機(jī)覓食,再透過視覺而聚群在香味最濃的位置,可將GRNN的Spread參數(shù)值調(diào)整到最佳值,使網(wǎng)絡(luò)輸出值與目標(biāo)值兩者之間的RMSE調(diào)整到最小。此外,一般GRNN之Spread值則采用默認(rèn)值1進(jìn)行建模,最后再以SPSS進(jìn)行多元回歸模型的建構(gòu)。
圖4上方2個(gè)圖形分別代表2008及2009年第1小組訓(xùn)練資料,以FOA迭代優(yōu)化GRNN的Spread值,產(chǎn)生的輸出值與目標(biāo)值之間的RMSE。經(jīng)過100次迭代演化后,2008年在第19代開始收斂,坐標(biāo)為(35.442 6,27.266 0),Spread值及RMSE值分別為[0.012 3,0.006 5];2009年在第17代開始收斂,坐標(biāo)為(33.668 3,22.550 2),Spread值及RMSE值分別為[0.012 6,0.011 5]。然而,圖4下方2個(gè)圖形分別代表2008及2009年樣本數(shù)據(jù)以4小組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)建構(gòu)模型,1小組數(shù)據(jù)作為測試數(shù)據(jù),進(jìn)行交互驗(yàn)證FOAGRNN、一般GRNN與傳統(tǒng)多元回歸等三種模型產(chǎn)生之結(jié)果數(shù)據(jù),將它們繪制而成ROC曲線圖。Bradley指出參考線與曲線下的面積愈大[12],代表該模型分類能力愈準(zhǔn)確。由圖4中可以明顯看出,F(xiàn)OAGRNN模型的曲線下的面積(AUC)最大,因此分類能力最好。再由表2觀察ROC曲線分析之輸出結(jié)果,其中敏感度(Sensitivity,Sen)是指預(yù)測結(jié)果為1(亦即經(jīng)營績效不佳)的個(gè)數(shù)占實(shí)際值為1的個(gè)數(shù)的百分比,明確度(Specificity,Spe)是指預(yù)測結(jié)果為0(亦即經(jīng)營績效佳)的個(gè)數(shù)占實(shí)際值為0的個(gè)數(shù)的百分比,而Hand教授指出吉尼系數(shù)(Gini Index) 等于 2倍的AUC減1[13]。由于這些指標(biāo)值皆愈大愈好,表2中2008年的FOAGRNN模型的明確度為0.928、敏感度為0.906、曲線下的面積為0.917與吉尼系數(shù)為0.834,而2009年的FOAGRNN模型的明確度為0.904、敏感度為0.886、曲線下的面積為0.895與吉尼系數(shù)為0.790,皆高于一般GRNN與傳統(tǒng)多元回歸模型,因此FOAGRNN模型有很好的分類預(yù)測能力。
圖4 FOAGRNN搜尋優(yōu)化參數(shù)之迭代RMSE趨勢及分類預(yù)測結(jié)果之ROC曲線圖
ModelSenSpeAucGini2008FOAGRNN0.9280.9060.9170.834GRNN0.8120.8020.8070.614MR0.8020.6200.7110.4222009FOAGRNN0.9040.8860.8950.790GRNN0.8180.7840.8010.602MR0.8160.6720.7440.488
在本文中,不同于傳統(tǒng)財(cái)務(wù)預(yù)警模型的建構(gòu)方法,以二分法的方式區(qū)分為企業(yè)經(jīng)營績效佳與企業(yè)經(jīng)營績效差二類,同時(shí)結(jié)合財(cái)務(wù)比率作為樣本數(shù)據(jù)進(jìn)行三種企業(yè)經(jīng)營績效偵測模型建構(gòu),包括了果蠅優(yōu)化算法優(yōu)化廣義回歸神經(jīng)網(wǎng)絡(luò)、一般廣義回歸神經(jīng)網(wǎng)絡(luò)與多元回歸模型,研究結(jié)果如下。
1.經(jīng)由果蠅優(yōu)化算法迭代動(dòng)態(tài)調(diào)整廣義回歸神經(jīng)網(wǎng)絡(luò)的spread參數(shù)值之后,RMSE收斂值可以降低,分類預(yù)測能力可以明顯提升。
2.經(jīng)由果蠅優(yōu)化算法調(diào)整廣義回歸神經(jīng)網(wǎng)絡(luò)其分類預(yù)測能力與穩(wěn)定性,明顯優(yōu)于一般廣義回歸神經(jīng)網(wǎng)絡(luò)和多元回歸模型。
此外,提出一種新的FOA,并實(shí)際應(yīng)用于求解極大值。經(jīng)測試結(jié)果發(fā)現(xiàn),F(xiàn)OA皆能順利求出解答,此算法不僅具備了簡單易懂的特色,更容易將它撰寫成程序代碼,并且程序代碼相較于遺傳算法[14]和粒子群優(yōu)化算法[15],不會太過冗長,容易拿來處理各種優(yōu)化問題。
參考文獻(xiàn):
[1] Hart,P E,Nilsson,N J and Raphael,B.A formal basis for the heuristic determination of minimum cost paths[J]. IEEE Transactions on Systems Science and Cybernetics SSC4,1968(2):100-107.
[2] Friedman,M.A mathematical programming model for optimal scheduling for buses depature under deterministic condition[J].Transportation Research,1976,10(2):83-90.
[3] Gupta,Y P,Gupta,M C,Kumar,A and Sundram,C.A genetic algorithm-based approach to cell composition and layout design problems[J].Int.Journal of Production Research,1996,34(2):447-482.
[4] Yan,S Y,Lee W T and Shih,Y L.A path-based analogous particle swarm optimization algorithm for minimum cost network flow problems with concave arc costs[J].Transportation Planning Journal,2007,36(3):393-424.
[5] Pan,W T.A new evolutionary computation approach:Fruit Fly Optimization Algorithm[C].2011 Conference of Digital Technology and innovation Management Taipei,2011.
[6] Pan,W T.A new fruit fly optimization algorithm:Taking the financial distress model as an example[J].Knowledge-Based Systems,In Press,2011.
[7] Tong,L L and Shih,B C.Predict the financial crisis by using grey relation analysis,neural network,and case-based reasoning[J].Chinese.Manage Rev,2011,4(2):25-37.
[8] Deng,J.The control problems of grey system[J].System & Control Letters,1982(5):288-294.
[9] Wen,K L,Chang Chien S K.,Yeah C K,Wang,C W and Lin H S.Apply matlab in grey system theory[M].Chuan Hwa Book Co.Ltd,Taiwan,2006.
[10] Specht,D.F.Probabilistic neural networks and the polynomial adaline as complementary techniques for classification[J].IEEE Trans.on Neural Networks,1990,1(1):111-121.
[11] Specht,D F.A general regression neural network[J].IEEE Tras.Neural Networks,1991,2(6):568-576.
[12] Bradley,A P.The use of the area under the ROC curve in the evaluation of machine learning algorithms[J].Pattern Recognit,1997,30(7):1145-1159.
[13] Hand,D J and Till,R J.A simple generalisation of the area under the ROC curve to multiple class classification problems[J].Mach Learn,2001,45(2):171-186.
[14] Holland,J.Adaptation in natural and artificial systems[M].MIT Press,Cambridge,1992.
[15] Eberhart,R C and Kennedy J.new optimizer using particle swarm theory[C].Proc,Sixth International Symposium on Nagoya,Japan,1995:39-43.