李晴 陳鵬宇
摘? 要:為了研究指標無量綱化方法對熵權法評價結(jié)果的影響,以期刊學術影響力評價為例,采用熵權TOPSIS法,對比分析了標準化和均值化兩種方法對評價結(jié)果的影響。結(jié)果顯示,兩種方法所得熵權和評價結(jié)果均存在一定差異。其中,均值化方法可以保持原始數(shù)據(jù)的差異信息,評價結(jié)果更符合實際,更利于有效區(qū)分評價對象。標準化方法改變了原始數(shù)據(jù)的差異信息,有可能導致評價結(jié)果偏離實際。因此,該文建議在使用熵權法時,采用均值化方法處理原始數(shù)據(jù)。
關鍵詞:無量綱化方法? 熵權? 期刊? 學術影響力
中圖分類號:G304? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1672-3791(2019)03(a)-0184-03
在多指標綜合評價中,指標權重的確定是一項重要的工作。權重的確定方法很多,一般可分為主觀賦權法、客觀賦權法和組合賦權法3類。熵權法是目前常用的一種客觀賦權法,其根據(jù)樣本數(shù)據(jù)信息確定指標權重,避免了主觀性傾向的影響。熵權法以信息熵評價某項指標在不同評價對象中的差異程度[1],若某項指標的數(shù)據(jù)變幅很大,說明該指標提供的信息量大,相應的信息熵小,賦予的權重大;反之亦然。若某項指標的數(shù)據(jù)全部相等,說明該指標對評價對象無法提供區(qū)別信息,相應的信息熵最大,權重為零。
在多指標綜合評價中,評價指標的量綱往往不同,在計算熵權前,需要對指標進行無量綱化處理。研究發(fā)現(xiàn)無量綱化方法對數(shù)據(jù)的差異信息存在影響[2-3]。標準化會消除各指標變異程度上的差異,均值化則可以保留各指標變異程度的信息[2]。由于熵權與數(shù)據(jù)的差異信息密切關系,因此有必要分析指標無量綱化方法對熵權的影響,以選擇合適的方法。為此,該文以期刊學術影響力評價為例,結(jié)合TOPSIS法,研究標準化和均值化兩種指標無量綱化方法對熵權以及評價結(jié)果的影響,并提出相應的建議。
1? 研究方法
1.1 熵權TOPSIS法
熵權法常常與TOPSIS法結(jié)合用于評價與決策[4-5]。該文同樣采用熵權TOPSIS法作為評價方法。當然,這里TOPSIS法僅作為一個算例,也可以與其他評價方法相結(jié)合。熵權TOPSIS法的基本步驟如下。
(1)假設有m個評價對象;n個評價指標,建立評價指標矩陣R={rij},其中rij為第i個評價對象的第j個評價指標值。
(2)對評價指標矩陣R進行無量綱化處理,將其轉(zhuǎn)化為無量綱矩陣R′={r′ij},其中rij為第i個評價對象的第j個評價指標的無量綱化值。
(3) 計算評價指標的信息熵。計算公式如下:
1.3 變異系數(shù)
為了對比標準化和均值化兩種方法對熵權以及評價結(jié)果的影響,需要對數(shù)據(jù)的差異程度進行衡量。該文采用變異系數(shù)作為衡量數(shù)據(jù)差異程度的參考依據(jù),計算公式如下:
標準差雖然能衡量數(shù)據(jù)的離散程度,但是如果數(shù)據(jù)量綱不同的情況下,不適合進行比較。若除以平均值,則可以消除數(shù)量級和量綱的影響。
2? 實證研究——以期刊學術影響力評價為例
期刊評價是一項復雜的工作,一般需要考慮多個指標才能盡可能全面評價期刊質(zhì)量的優(yōu)劣。期刊的引用情況反映了該期刊在學術交流中的地位和作用,是期刊學術影響力的重要體現(xiàn)。選擇與期刊引用相關的計量指標,包括總被引頻次、影響因子、即年指標、他引率、引用刊數(shù)、學科影響指標、學科擴散指標作為評價指標[6]。以7種管理科學期刊為例,數(shù)據(jù)來源于《2012年版中國科技期刊引證報告》(擴刊版),具體如表1所示。
各指標均為正向指標,分別對表1中的數(shù)據(jù)進行標準化和均值化處理,計算處理前后各指標的變異系數(shù),如表2所示。從表2中可以看出,標準化處理后,各指標的變異系數(shù)均發(fā)生了改變,都表現(xiàn)為增大。這說明標準化處理放大了數(shù)據(jù)的差異信息,以他引率指標為例,未處理前的變異系數(shù)僅為0.013,從表1中也可以看出,各期刊的他引率比較接近,在0.93~0.98之間,說明數(shù)據(jù)差異程度較小。但是標準化處理后,變異系數(shù)增大到了0.564,數(shù)據(jù)的差異信息被放大。均值化處理后,各指標的變異系數(shù)與處理前保持一致,說明均值化不會改變數(shù)據(jù)的差異信息。
按熵權的計算步驟,計算各指標的信息熵和熵權如表3所示。對比標準化和均值化的計算結(jié)果可知,標準化后各指標的信息熵值均低于均值化的結(jié)果。這與表2中標準化對數(shù)據(jù)差異信息的放大是對應的。差異信息越強,信息熵值越小。相應的,熵權計算結(jié)果也存在較大差異。以他引率指標為例,標準化對應的信息熵為0.89757,熵權為0.06223,均值化對應的信息熵幾乎為1,熵權幾乎為0,這與表2中的變異系數(shù)也是對應的。均值化對應的變異系數(shù)為0.013,接近于0,所以對應的信息熵值接近于1。標準化對應的變異系數(shù)為0.564,所以對應的信息熵值更小。
為了進一步對比兩種方法的合理性,還需對比最終的評價結(jié)果。按熵權TOPSIS法的計算步驟,計算各期刊的綜合評價值及排序,結(jié)果如表4所示。從表4中可以看出,各期刊綜合評價值存在一定差異,但排序基本一致,僅數(shù)理統(tǒng)計與管理和研究與發(fā)展管理兩種期刊的排序不一致。
根據(jù)表1的數(shù)據(jù)對比兩種期刊,數(shù)理統(tǒng)計與管理有4個指標值相對更大,其中引用刊數(shù)和學科擴散指標大0.73倍,即年指標大0.41倍,總被引頻次稍大。其余3個指標相對更小,其中影響因子小0.35倍,另外2個指標稍小。單從這些數(shù)據(jù)來看,數(shù)理統(tǒng)計與管理的排序應大于研究與發(fā)展管理,即均值化對應的排序結(jié)果更符合實際。
客觀賦權的一個重要目的在于有效區(qū)分評價對象[7],以利于排序和決策。因此,計算表4中綜合評價值的標準差、平均值和變異系數(shù)如表5所示。從表5中可以看出,均值化方法對應的標準差和變異系數(shù)均大于標準化方法,說明均值化處理后,綜合評價值的差異程度更利于有效區(qū)分評價對象。
綜上所述,均值化方法可以保持原始數(shù)據(jù)的差異信息,評價結(jié)果更符合實際,更利于有效區(qū)分評價對象。標準化方法改變了原始數(shù)據(jù)的差異信息,有可能導致評價結(jié)果偏離實際。因此,該文建議采用均值化方法處理原始數(shù)據(jù)。
3? 結(jié)論
為了研究指標無量綱化方法對熵權法評價結(jié)果的影響,該文以期刊學術影響力評價為例,采用熵權TOPSIS法,對比分析了標準化和均值化兩種方法對評價結(jié)果的影響。所得結(jié)論如下。
(1)均值化方法可以保持原始數(shù)據(jù)的差異信息,而標準化方法改變了原始數(shù)據(jù)的差異信息,這是導致兩種方法熵權計算結(jié)果存在差異的主要原因。
(2)由于熵權計算結(jié)果不一致,均值化和標準化方法的評價結(jié)果存在差異,以均值化方法的評價結(jié)果更符合實際。標準化方法由于改變了原始數(shù)據(jù)的差異信息,有可能導致評價結(jié)果偏離實際。
(3)該文實例中,均值化方法對應的標準差和變異系數(shù)均大于標準化方法,說明均值化方法更利于有效區(qū)分評價對象。建議在使用熵權法時,采用均值化方法處理原始數(shù)據(jù)。
參考文獻
[1] 俞立平,武夷山.學術期刊客觀賦權評價新方法——指標難度賦權法[J].現(xiàn)代圖書情報技術,2011(4):64-70.
[2] 葉宗裕.關于多指標綜合評價中指標正向化和無量綱化方法的選擇[J].浙江統(tǒng)計,2003(4):24-25.
[3] 張衛(wèi)華,趙銘軍.指標無量綱化方法對綜合評價結(jié)果可靠性的影響及其實證分析[J].統(tǒng)計與信息論壇,2005,20(3):33-36.
[4] 李艷,張巧良,王正軍.熵權TOPSIS法在垃圾滲濾液處理方案優(yōu)選中的應用[J].統(tǒng)計與決策,2017(10):85-87.
[5] 李煜華,劉立佳,胡瑤瑛.基于熵值TOPSIS模型的Kindle創(chuàng)意產(chǎn)品優(yōu)化評價[J].統(tǒng)計與決策,2016(20):183-185.
[6] 程慧平.基于主成分分析與熵權TOPSIS方法的期刊學術影響力研究[J].情報科學,2015,33(12):77-82.
[7] 李剛,李建平,孫曉蕾,等.主客觀權重的組合方式及其合理性研究[J].管理評論,2017,29(12):17-26,61.