李興國,張莉莉
(燕山大學(xué) a.高等教育發(fā)展研究中心;b.監(jiān)察審計(jì)處,河北 秦皇島 066004)
?
“降維”技術(shù)在多變量綜合評價中的應(yīng)用
——基于TOPSIS和GRA的實(shí)證檢驗(yàn)
李興國a,張莉莉b
(燕山大學(xué) a.高等教育發(fā)展研究中心;b.監(jiān)察審計(jì)處,河北 秦皇島 066004)
“降維”是多元統(tǒng)計(jì)分析中對具有相關(guān)性和重疊性信息原始變量進(jìn)行簡化的一種方法,降維后的抽象變量能夠保留眾多原始變量的主要信息。通過將降維的思想擴(kuò)展到多變量綜合評價技術(shù),選取2012年河北省各城市代表性經(jīng)濟(jì)指標(biāo)數(shù)據(jù),對降維前后的TOPSIS和GRA方法排序結(jié)果進(jìn)行實(shí)證檢驗(yàn)。結(jié)果表明:降維后的TOPSIS法與降維前的排序結(jié)果在0.01水平上顯著相關(guān),且相關(guān)系數(shù)高達(dá)0.9以上;降維后的GRA法與降維前的排序結(jié)果完全一致。表明降維方法在多變量綜合評價與決策中具有良好的應(yīng)用前景。
降維;多變量評價;因子分析;TOPSIS;GRA
多變量經(jīng)濟(jì)綜合評價處理的是多變量問題,由于變量較多,增加了分析問題的復(fù)雜性。但在實(shí)際問題中,變量之間可能存在一定的相關(guān)性。因此,多變量中可能存在信息的重疊。人們自然希望通過克服相關(guān)性和重疊性,用較少的變量代替原來較多的變量,而這種替代可以反映原來多個變量的大部分信息,這即是一種“降維”的思想。因子分析(factor analysis)是一種降維、簡化數(shù)據(jù)的技術(shù)[1]。這種降維的思想是否可擴(kuò)展與應(yīng)用到其他多變量綜合評價方法之中,在保證決策效果的基礎(chǔ)上,使分析計(jì)算的工作量得到簡化?本文將通過因子分析降維得到的公因子應(yīng)用到TOPSIS和GRA決策中,以解答上述疑問。
關(guān)于多元統(tǒng)計(jì)分析方法在多變量綜合評價中應(yīng)用的相關(guān)研究成果目前還較為缺乏,筆者只找到寥寥數(shù)篇文獻(xiàn),研究思路主要集中在三個方面:一是主成分方法與TOPSIS法相結(jié)合,如邵景波、李柏洲、周曉莉在應(yīng)用主成分分析法求得主成分決策陣的基礎(chǔ)上,運(yùn)用 TOPSIS 法進(jìn)一步將低維系統(tǒng)降為一維系統(tǒng),進(jìn)而構(gòu)造出加權(quán)主成分TOPSIS價值函數(shù)模型,并利用該模型對中國和俄羅斯的科技潛力進(jìn)行了評價和比較分析[2];二是主成分方法與灰色關(guān)聯(lián)分析相結(jié)合,如趙文英首先運(yùn)用主成分分析計(jì)算黑龍江省13個地級市(區(qū))11項(xiàng)原始指標(biāo)的主成分得分,然后通過計(jì)算主成分得分與理想數(shù)據(jù)列樣本主成分得分的灰色關(guān)聯(lián)度,對各地區(qū)的城鎮(zhèn)化水平進(jìn)行排序和綜合評價[3],童營營、金哲植利用主成分和灰色關(guān)聯(lián)度相結(jié)合的方法,選取評價農(nóng)民生活水平的指標(biāo)因素,構(gòu)建農(nóng)民生活水平的指標(biāo)體系,對8個省份的農(nóng)民生活水平進(jìn)行分析和排序[4];三是因子分析與灰色關(guān)聯(lián)分析相結(jié)合,如劉宗鑫、王廣杰、王群首先利用因子分析法得出四川省21個市(州)可持續(xù)發(fā)展能力綜合得分,繼而以綜合得分為母序列,以各項(xiàng)統(tǒng)計(jì)指標(biāo)數(shù)據(jù)作為子序列,計(jì)算二者的灰色關(guān)聯(lián)度,進(jìn)而得出各項(xiàng)評價指標(biāo)重要度的排序結(jié)果[5]。
以上研究雖然在將多元統(tǒng)計(jì)分析方法應(yīng)用于多變量綜合評價方面作了一些初步的探索,但尚不系統(tǒng)和深入,尤其是在具體應(yīng)用中,多是先利用主成分分析或因子分析得出評價對象主成分或主因子得分,而后再將評價得分運(yùn)用到TOPSIS或灰色關(guān)聯(lián)分析,沒有體現(xiàn)出“降維”的優(yōu)點(diǎn)。本文將彌補(bǔ)現(xiàn)有研究的不足,再將因子分析和TOPSIS、GRA的融合應(yīng)用方面作進(jìn)一步探索和嘗試。
(一)基于主因子的TOPSIS方法
1.基本思想
TOPSIS法是C.L.Hwang和K.Yoon于1981年提出的一種適用于根據(jù)多項(xiàng)指標(biāo)對多個研究對象進(jìn)行比較評價的統(tǒng)計(jì)方法[6]?;谥饕蜃拥腡OPSIS法的思路是首先運(yùn)用因子分析降維,將多維空間轉(zhuǎn)化為低維空間,繼而應(yīng)用TOPSIS方法進(jìn)行評價。
2.基本步驟
(1)收集原始數(shù)據(jù)。假設(shè)待評價對象為n個,使用的評價指標(biāo)為p個,這組數(shù)據(jù)就構(gòu)成了一個n×p矩陣。
(2)因子分析。根據(jù)原始數(shù)據(jù)矩陣,計(jì)算原始變量的相關(guān)系數(shù)矩陣,進(jìn)行因子分析適用性檢驗(yàn),得出因子載荷陣的特征根和方差貢獻(xiàn)率,然后進(jìn)行因子旋轉(zhuǎn)和命名,得出m個(m
(3)指標(biāo)同趨勢化處理。評價指標(biāo)中有的是正指標(biāo),有的是逆指標(biāo),評價時要求都具有相同的趨勢,一般把逆指標(biāo)轉(zhuǎn)化為正指標(biāo),轉(zhuǎn)化方法可以采用倒數(shù)法(即1/x),多適用于絕對數(shù)指標(biāo);差值法(即1-x),多適用于相對數(shù)指標(biāo)。
(5)根據(jù)標(biāo)準(zhǔn)化矩陣Znm,確定指標(biāo)的正理想值和負(fù)理想值。
(6)采用歐幾里得距離公式,計(jì)算各評價對象指標(biāo)值與正理想解和負(fù)理想解的距離:
其中ωj為第j個評價指標(biāo)的權(quán)重,如果各指標(biāo)權(quán)重相等,ωj=1。
(7)計(jì)算各評價對象指標(biāo)值與理想值之間的相對接近程度:
按接近度大小對評價對象的優(yōu)劣進(jìn)行排序。0≤Ci≤1,Ci越大表明評價對象越接近正理想解,越遠(yuǎn)離負(fù)理想解;Ci越小表明評價對象越接近負(fù)理想解,越遠(yuǎn)離正理想解。所以,Ci越接近1,則相應(yīng)的評價對象就越應(yīng)該排在前面。
(二)基于主因子的GRA
1.基本思想
灰色系統(tǒng)是鄧聚龍教授在20世紀(jì)80年代初提出的適用于解決“少數(shù)據(jù)、貧信息”不確定性問題的一種評價方法[7]。灰色關(guān)聯(lián)分析是根據(jù)序列曲線幾何形狀的相似程度來判斷不同序列之間的聯(lián)系是否緊密,曲線幾何形狀越接近,相應(yīng)序列之間的關(guān)聯(lián)度就越大,反之就越小[8]?;谥饕蜃拥腉RA法的思路是首先運(yùn)用因子分析降維,將多維空間轉(zhuǎn)化為低維空間,繼而應(yīng)用GRA方法進(jìn)行綜合評價。
2.基本步驟
(1)因子分析。假設(shè)有n個評價對象,每個評價對象有p個評價指標(biāo)。首先應(yīng)用因子分析降維,得出m個主因子得分,將原始的n×p矩陣降為n×m矩陣,然后對降維后的n×m矩陣進(jìn)行灰色關(guān)聯(lián)分析。
(2)確定參考評價指標(biāo)(參考數(shù)據(jù)列):
{X0}={x0(1),x0(2),…x0(n)}
從上述數(shù)列選最優(yōu),或者選標(biāo)準(zhǔn)值。
(3)計(jì)算各評價對象指標(biāo)與參考指標(biāo)間的關(guān)聯(lián)系數(shù):
(k=1,2…,n;i=1.2,…,m)
α為分辨系數(shù),0≤α≤1,一般取α=0.5。
(4)灰色關(guān)聯(lián)系數(shù)矩陣:
(5)計(jì)算灰色絕對關(guān)聯(lián)度:
(一) 研究對象
本研究選取2012年河北省各地級城市的地區(qū)生產(chǎn)總值X1(億元)、人均可支配收入X2(元)、固定資產(chǎn)投資額X3(億元)、財(cái)政支出額X4(億元)、消費(fèi)品零售總額X5(億元)、全年接待游客總?cè)舜蝀6(萬人)、旅游業(yè)總收入X7(億元)等七個經(jīng)濟(jì)指標(biāo),并采集了原始數(shù)據(jù)。
(二) 因子分析過程
1.因子分析適用性檢驗(yàn)。主要通過KMO檢驗(yàn)和巴特利特球度檢驗(yàn)來驗(yàn)證。KMO值為0.708,Bartlett檢驗(yàn)結(jié)果的相伴概率為0.000,變量共同度多數(shù)在0.9以上,表明原始數(shù)據(jù)信息存在較大的相關(guān)性,適合進(jìn)行因子分析。
2.公共因子特征值和方差貢獻(xiàn)率。第一公因子的貢獻(xiàn)率為49.132%,第二公因子的貢獻(xiàn)率為40.155%,前兩個公共因子的累計(jì)方差貢獻(xiàn)率達(dá)到89%以上。
說明提取前兩個公因子時,已提取了原始變量的絕大部分信息。因此,本文提取前兩個主因子,并得到因子載荷矩陣。
3.因子旋轉(zhuǎn)。為使各個因子的意義更加清晰,運(yùn)用最大方差旋轉(zhuǎn)法對因子載荷矩陣進(jìn)行旋轉(zhuǎn),使各變量在某單個因子上有較高載荷,在其他因子上只有小到中等載荷。
第一主因子F1在X1~ X5上有較大的載荷,這4項(xiàng)指標(biāo)反映的是城市經(jīng)濟(jì)基礎(chǔ)對旅游業(yè)的支撐作用,可命名為“經(jīng)濟(jì)支撐因子”。
第二主因子F2在X6、X7上有較大的載荷,這2項(xiàng)指標(biāo)反映的是旅游業(yè)產(chǎn)出情況,可命名為“旅游產(chǎn)出因子”。
4.以公共因子的方差貢獻(xiàn)率進(jìn)行加權(quán),得到綜合得分函數(shù),進(jìn)而計(jì)算出各城市得分及排序結(jié)果,見表1所示。
(三)TOPSIS分析
1.初始TOPSIS分析。按照上文所述方法,應(yīng)用Excel編輯公式對表1中的數(shù)據(jù)進(jìn)行TOPSIS分析,得到河北省各城市排序結(jié)果如表2所示。
表1 因子得分排序結(jié)果
表2 初始TOPSIS分析排序結(jié)果
2.降維TOPSIS分析。將上文因子分析所得的兩個公共主因子F1和F2作為評價對象的新評價指標(biāo)。如此,評價指標(biāo)由原來的7個減少為2個,評價矩陣由原來的11×7階簡化為11×2階,計(jì)算的工作量也大為減少。對新的評價數(shù)據(jù)矩陣進(jìn)行TOPSIS分析,得到各城市排序結(jié)果如表3所示。
3.兩種方法結(jié)果比較。對比表2和表3中的排序結(jié)果,發(fā)現(xiàn)前4個城市:石家莊、唐山、保定和邯鄲的排序相同,分列第1~4名;最后兩個城市邢臺和衡水排序也一致。排序不同的是位于中間的5個城市。從相對位置來看,秦皇島、滄州、承德和張家口等四市排序一致。排序結(jié)果最大的差異是廊坊,初始TOPSIS法將其排在第9名,降維后的TOPSIS法將其排為第5名。對兩種排序結(jié)果進(jìn)行Kendall和Spearman秩相關(guān)分析,發(fā)現(xiàn)兩者在0.01的水平上顯著相關(guān),且相關(guān)系數(shù)高達(dá)0.9以上。
表3 降維后TOPSIS分析排序結(jié)果
續(xù)表3
(四)GRA分析
1.初始的GRA分析。按照上文所述方法,應(yīng)用Excel對表1中的數(shù)據(jù)進(jìn)行灰色關(guān)聯(lián)分析,得到河北省各城市排序結(jié)果如表4所示。
2.降維GRA分析。將上文因子分析所得的兩個公共主因子F1和F2作為評價對象的新評價指標(biāo)。對簡化后的11×2階矩陣進(jìn)行灰色關(guān)聯(lián)分析,得到各城市排序結(jié)果如表5所示??梢?,降維后GRA排序結(jié)果與未降維的GRA排序完全一致,但計(jì)算工作量卻大為減少。
表4 初始GRA排序結(jié)果
表5 降維后GRA排序結(jié)果
(五)降維前后排序結(jié)果相關(guān)分析
1.對TOPSIS法而言,降維后的TOPSIS法排序結(jié)果與未降維的TOPSIS排序結(jié)果在0.01的水平上顯著相關(guān),Spearman秩相關(guān)系數(shù)高達(dá)0.909。從與因子分析、灰色關(guān)聯(lián)分析排序結(jié)果的比較來看,降維后的TOPSIS法與其他兩種方法評價結(jié)果相關(guān)性更高。從降維前后排序差別最大的樣本“廊坊”來看,未降維的TOPSIS法將其排在第9名,降維后的TOPSIS法將其排在第5名,因子分析、降維前后的GRA方法均將廊坊排在第6名??梢姡稻S后的TOPSIS法由于克服了原始評價指標(biāo)間相關(guān)性造成的評價信息重復(fù)問題而有效改進(jìn)了評價結(jié)果。
2.對GRA方法,降維前后的GRA方法對11個評價對象的排序結(jié)果完全一致,但是降維后的計(jì)算工作量卻大為減少??梢?,降維方法在灰色關(guān)聯(lián)分析中同樣具有良好的應(yīng)用前景。
表6 多變量綜合評價方法排序相關(guān)性分析
本文以TOPSIS和GRA方法為例,通過實(shí)證分析,驗(yàn)證了“降維”作為多元統(tǒng)計(jì)分析中的一種方法,在保證決策結(jié)果基本一致的情況下,可極大地簡化計(jì)算工作量,從而在多變量綜合評價與決策領(lǐng)域具有廣闊的應(yīng)用空間。探索降維方法是否可以擴(kuò)展到更多綜合評價方法及降維對評價過程的影響機(jī)理,將是下一步研究的方向。
[1]朱建平,殷瑞飛.SPSS在統(tǒng)計(jì)分析中的應(yīng)用[M].北京:清華大學(xué)出版社,2007.
[2]邵景波,李柏洲,周曉莉.基于加權(quán)主成分 TOPSIS價值函數(shù)模型的中俄科技潛力比較[J].中國軟科學(xué),2008(9):132-139.
[3]趙文英.基于主成分——灰色關(guān)聯(lián)度的黑龍江省城鎮(zhèn)化水平綜合評價[J].數(shù)學(xué)的實(shí)踐與認(rèn)識, 2014(6):43-50.
[4]童營營,金哲植.基于主成分——灰色關(guān)聯(lián)度的農(nóng)民生活水平評價[J].安徽農(nóng)業(yè)科學(xué), 2015(3):328-330.
[5]劉宗鑫,王廣杰,王群,等.基于因子分析和灰色關(guān)聯(lián)度分析的區(qū)域可持續(xù)發(fā)展能力建設(shè)研究[J].安徽農(nóng)業(yè)科學(xué),2015(1):376-380.
[6]劉輝,陳以增.一種基于模糊TOPSIS的采購商綜合評價模型[J].統(tǒng)計(jì)與決策,2014(16):46-48.
[7]錢吳永,李曉鐘,王育紅.灰色關(guān)聯(lián)動態(tài)多指標(biāo)評價模型及其應(yīng)用[J].統(tǒng)計(jì)與決策,2014(24):7-10.
[8]洪曉枝,馮鶴林.灰色關(guān)聯(lián)度量化模型的改進(jìn)[J].統(tǒng)計(jì)與決策,2014(9):80-83.
(責(zé)任編輯 朱春花)
Application of "Dimensionality Reduction" Technique in Multivariate Analysis Evaluation: An Empirical Test Based on TOPSIS and GRA
LI Xing-guoa,ZHANG Li-lib
(a.Higher Education Development Research Center of Yanshan Universiey; b.The Superrision of the Quditing Office of Yanshan University,Qinhuangdao 066004, Hebei, China)
"Dimension reduction" is a method in multivariate statistical analysis to simplify the original variable of correlation and overlaps information.Abstract variables getting in dimension reduction can retain the main information of original variables.In this paper, we expand the idea of dimension reduction to multi-objective comprehensive evaluation technology,selection of typical economic index data from city in Hebei Province in 2012,carried on the empirical test before and after the dimension reduction of TOPSIS and the GRA method sorting result.The results showed that the reduction of TOPSIS method and dimension reduction before sorting result in significant correlation at the 0.01 level,and the correlation coefficient is as high as 0.9.The reduced GRA method is completely consistent with the prior sorting result which proves that the dimensionality reduction method has a good application prospect in multivariable comprehensive evaluation and decision.
dimension reduction;multivariate comprehensive evaluation;factor analysis;TOPSIS;GRA
2016-07-22
2015年河北省文化藝術(shù)科學(xué)規(guī)劃項(xiàng)目“河北省文化產(chǎn)業(yè)競爭力提升動力機(jī)理與實(shí)現(xiàn)路徑研究”(HBWY2015-Y-F007)
李興國(1981- ),男,河北邢臺人,燕山大學(xué)高等教育發(fā)展研究中心助理研究員,經(jīng)濟(jì)管理學(xué)院博士研究生,主要從事管理科學(xué)與工程研究;張莉莉(1982- ),女,河北秦皇島人,燕山大學(xué)監(jiān)察審計(jì)處助理研究員,碩士,主要從事高校行政管理研究。
F207
A
1674-3571(2016)06-0047-05