王 卓 高 叢
(西安石油大學(xué) 油氣資源經(jīng)濟(jì)與管理研究中心,陜西 西安 710065)
基于信息論的熵值法的算法改進(jìn)
——以陜西省環(huán)境規(guī)制強(qiáng)度評(píng)價(jià)為例
王卓高叢
(西安石油大學(xué) 油氣資源經(jīng)濟(jì)與管理研究中心,陜西 西安 710065)
摘要:基于信息論的視角對(duì)熵值法的原理——賦權(quán)依據(jù)進(jìn)行了論證,證明了指標(biāo)的權(quán)重實(shí)際上是指標(biāo)所傳遞的信息量占所有指標(biāo)所傳遞的總信息量的比例,并基于此對(duì)傳統(tǒng)算法進(jìn)行了改進(jìn),由此選取了5個(gè)指標(biāo)以改進(jìn)的熵值法對(duì)陜西省2005—2013年環(huán)境規(guī)制強(qiáng)度進(jìn)行了評(píng)價(jià),最后說明了熵值法的局限性與權(quán)重的大小有關(guān),并非與其自身的重要性直接相關(guān)。
關(guān)鍵詞:熵值法; 算法改進(jìn); 環(huán)境規(guī)制; 差異性系數(shù)
0引言
在決策評(píng)價(jià)的過程中確定指標(biāo)權(quán)重,一般采用兩種方法:主觀賦權(quán)法和客觀賦權(quán)法[1]9,熵值法則屬于客觀賦權(quán)法的一種。由于較少受主觀因素影響,熵值法近年來得到了廣泛的應(yīng)用。熵值法中指標(biāo)權(quán)重的大小是基于指標(biāo)數(shù)據(jù)所提供的信息多少而定的[2]99-103。盡管這一原理早被提出,但現(xiàn)有文獻(xiàn)并未對(duì)此進(jìn)行嚴(yán)格的證明就直接給出了算法,同時(shí)傳統(tǒng)算法是從構(gòu)建差異性系數(shù)的角度進(jìn)行的,使得一部分學(xué)者在使用這一方法時(shí)對(duì)其原理及適用范圍產(chǎn)生了一些疑問。為此,本文在回顧了熵值法提出的背景及其演變過程之后,直接以熵值法的原理對(duì)其算法進(jìn)行了改進(jìn),以便更好地理解熵值法的思想。
1熵值法的研究狀況
熵最開始是作為一個(gè)熱力學(xué)概念出現(xiàn)的,它是由德國(guó)物理學(xué)家Clausius于1865年提出,并用以衡量能量的不可用程度的方法。在此之后,奧地利物理學(xué)家Boltzmann從分子運(yùn)動(dòng)論角度證明了表征系統(tǒng)宏觀狀態(tài)的熵與該宏觀狀態(tài)對(duì)應(yīng)微觀態(tài)數(shù)W的對(duì)數(shù)值lnW成正比。即:
S=klnW
(1)
(1)式中,k為玻爾茲曼常數(shù)。熵成為了衡量分子運(yùn)動(dòng)混亂水平的物理量[3] 24。
(2)
(2)式中,C=常數(shù)>0。
事實(shí)上,如果令C=1/lna,則:
(3)
可見常數(shù)C的不同取值只是改變了熵函數(shù)對(duì)數(shù)的底,這樣信息量被定義為熵的減少量,即:不確定程度的減少量。一般進(jìn)行理論推導(dǎo)時(shí)都使用自然對(duì)數(shù)為底,而對(duì)應(yīng)不同的底,信息量的單位也不同,詳見表1所示。
表1 信息量的單位
20世紀(jì)90年代以來,熵理論逐漸進(jìn)入決策過程中。1991年,顧昌耀和邱菀華第一次定義了復(fù)熵,且在決策分析過程中對(duì)其進(jìn)行了應(yīng)用[5]206。1994年,郭顯光提出了熵值法可以應(yīng)用于指標(biāo)賦權(quán)[6]56-60,1998年,他又提出了改進(jìn)的熵值法,但這只是對(duì)原始極端數(shù)據(jù)的改進(jìn)。之后出現(xiàn)的大量文獻(xiàn),都是直接采用熵值法對(duì)不同對(duì)象進(jìn)行評(píng)價(jià)。然而,也有極少數(shù)文獻(xiàn)探討了熵值法的原理。如:郭秀英依據(jù)客觀賦權(quán)的原理和序列信息熵的含義給出了確定各區(qū)間數(shù)指標(biāo)權(quán)重的一種熵值法[7]32-34,朱喜安和魏國(guó)棟對(duì)熵值法中無量綱化方法進(jìn)行了探討[8]12-15。由此可以看出,自熵值法提出后絕大部分文獻(xiàn)都是基于某種方法而進(jìn)行了實(shí)證,部分文獻(xiàn)雖探討了數(shù)據(jù)處理等方面的改進(jìn)意見,但都未直接對(duì)其原理進(jìn)行詳細(xì)論證。因此,這些文獻(xiàn)在探討熵值法的適用性的時(shí)候,往往難以進(jìn)行詳細(xì)說明。本文試圖對(duì)熵值法的算法從原理方面進(jìn)行改進(jìn),并在此基礎(chǔ)上達(dá)到對(duì)其適用性能更好地理解的目的。
2熵值法的算法及其改進(jìn)
為了對(duì)熵值算法進(jìn)行改進(jìn),現(xiàn)將傳統(tǒng)熵值法*熵值法由郭顯光教授提出,熵權(quán)法由邱菀華教授提出,但是其算法基本上一致,為統(tǒng)一本文記號(hào)遵照郭顯光教授的定義。的算法介紹如下:
假設(shè)有m個(gè)待評(píng)方案,n個(gè)評(píng)價(jià)指標(biāo),構(gòu)造原始決策矩陣X=(xij)m×n。首先對(duì)某項(xiàng)指標(biāo)j進(jìn)行列向量比例化,得到比例列向量(p1j,p2j,…,pmj)T,之后計(jì)算比例列向量的熵,并采用除以最大值*關(guān)于最大值,事實(shí)上是需要嚴(yán)格證明的,可以參見式(4)至式(10)的證明。lnm的方法進(jìn)行歸一化*這里隱含著,熵函數(shù)是非負(fù)的,且最小值為0。事實(shí)上,由于0pij1,故lnpij0,所以,pijlnpij≥0。如果我們定義函數(shù)f(x)=xlnx在區(qū)間[0,1]上是連續(xù)函數(shù),由。則當(dāng)任一pij=1,且其余值為0時(shí),熵函數(shù)取得最小值0。有些文獻(xiàn)中稱pij不能為0,則是一種誤解。,得到ej,接著定義差異性系數(shù):gi=1-ej,然后對(duì)差異性系數(shù)進(jìn)行比例化,得到權(quán)重aj。最后即可計(jì)算第i個(gè)方案的得分ajpij。
由表1可知,對(duì)熵歸一化的過程本質(zhì)上相當(dāng)于將對(duì)數(shù)的底由e換成常數(shù)m,雖使熵的單位改變了。但之后構(gòu)造的差異性系數(shù)與熵值法原理的直接聯(lián)系并不是很大,也不利于從根本上把握熵值法的本質(zhì)。
接下來證明差異性系數(shù)gj實(shí)質(zhì)上是指標(biāo)j的份額列向量所傳遞的信息量。本文以Nat為信息量的單位,并記指標(biāo)j的份額列向量的熵為Hj。
事實(shí)上,求解列向量(p1j,p2j,…,pmj)T最可能分布的數(shù)學(xué)模型為:
(4)
(5)
建立拉格朗日方程:
(6)
根據(jù)庫(kù)恩-塔克定理[9]162,其一階必要條件為:
Lpij=-lnpij-1-λ≤0,pij≥0滿足互補(bǔ)松弛條件
(7)
(8)
若?i∈m使pij=0,則-lnpij=+,明顯不滿足Lpij≤0,故?i∈m,pij>0,且Lpij=0。
由此得到:
lnp1j=lnp2j=…=lnpmj=-λ-1
(9)
聯(lián)系式(8)得到:
(10)
由此觀測(cè)到指標(biāo)j所傳遞的信息量就等于觀測(cè)前后列向量熵的減少量,即:
=lnm-Hj
=(lnm)gj
(11)
得到:
(12)
參考(3)式可知,如果將份額列向量傳遞給我們的信息量Ij(以Nat為單位),并轉(zhuǎn)化為一個(gè)未定義單位的信息量,即得到傳統(tǒng)算法所定義的差異性系數(shù)gj??梢妭鹘y(tǒng)算法中的差異性系數(shù)gj在本質(zhì)上也是信息量,但卻采用了一個(gè)未定義的單位。
由此可見,傳統(tǒng)算法中,將差異性系數(shù)gj進(jìn)行比例化的過程,實(shí)際上正是在計(jì)算指標(biāo)j所傳遞的信息占所有指標(biāo)所傳遞總信息的份額。
為了更好地體現(xiàn)熵值法原理,下面從信息論的角度對(duì)其算法進(jìn)行改進(jìn),改進(jìn)后的算法如下:
第一,對(duì)原始數(shù)據(jù)預(yù)處理得到歸一化矩陣:Y=(yij)m×n。
由于指標(biāo)列向量的量綱不同,需要先對(duì)列向量進(jìn)行歸一化處理。
(13)
(14)
若為越大越優(yōu)指標(biāo),則按照(13)式進(jìn)行處理,若為越小越優(yōu)指標(biāo),則按照(14)式進(jìn)行處理。
第二,對(duì)列向量比例化得到列比例矩陣:P=(pij)m×n,其中,
(15)
第三,計(jì)算各指標(biāo)所傳達(dá)的信息量Ij,其中,
(16)
第四,將信息量比例化得到各指標(biāo)權(quán)重aj,其中:
(17)
第五,計(jì)算各個(gè)待評(píng)方案得分vi,其中:
(18)
3陜西省環(huán)境規(guī)制強(qiáng)度的評(píng)價(jià)
由于環(huán)境規(guī)制的主體是政府,但政府并沒有單一的規(guī)制工具,這就造成了在實(shí)證研究中對(duì)環(huán)境規(guī)制強(qiáng)度測(cè)定的困難。早期的研究多采用單一指標(biāo)來衡量規(guī)制強(qiáng)度,但是單一的指標(biāo)往往被質(zhì)疑選取的標(biāo)準(zhǔn)過于隨意。鑒于此,近年來很多研究都采用了多指標(biāo)綜合評(píng)價(jià)的方法,如:傅京燕等利用廢水排放達(dá)標(biāo)率、二氧化硫去除率、煙塵去除率、粉塵去除率、固體廢物綜合利用率等5個(gè)指標(biāo)構(gòu)建了環(huán)境規(guī)制綜合指數(shù)[10]87-98,187,尤濟(jì)紅等以環(huán)保投入為出發(fā)點(diǎn),選取了治理工業(yè)污染項(xiàng)目投資額等10項(xiàng)指標(biāo)來構(gòu)建規(guī)制強(qiáng)度系數(shù)[11]1211-1219,韓晶等選取了工業(yè)廢水、廢氣、廢渣作為評(píng)價(jià)指標(biāo)層,建立了環(huán)境規(guī)制評(píng)價(jià)體系[12]61-67。本文根據(jù)以上學(xué)者的研究方法,在考慮數(shù)據(jù)可得性的基礎(chǔ)上,從對(duì)工業(yè)三廢的處理強(qiáng)度和環(huán)保投入的角度出發(fā),構(gòu)建出新的環(huán)境規(guī)制強(qiáng)度評(píng)價(jià)指數(shù)。
本文結(jié)合陜西省實(shí)際情況選取了5個(gè)指標(biāo),并采用改進(jìn)后的熵值法對(duì)陜西省2005—2013年的環(huán)境規(guī)制強(qiáng)度進(jìn)行了評(píng)價(jià),其具體指標(biāo)分別為:
X1:廢水治理設(shè)施本年運(yùn)行費(fèi)用;
X2:廢氣治理設(shè)施本年運(yùn)行費(fèi)用;
X3:工業(yè)固體廢物綜合利用率;
X4:環(huán)境污染治理投資額;
X5:排污費(fèi)征收額。
其中,X1及X2以原始值所占第二產(chǎn)業(yè)增加值的比例表示,X4及X5以原始值所占國(guó)內(nèi)生產(chǎn)總值的比例表示。
本文數(shù)據(jù)選自2006—2014年的《中國(guó)環(huán)境統(tǒng)計(jì)年鑒》和《陜西統(tǒng)計(jì)年鑒》。由于2011年以后,環(huán)境統(tǒng)計(jì)口徑進(jìn)行了大幅度修訂,對(duì)指標(biāo)的選取和數(shù)據(jù)的處理則做一些說明。廢水排放達(dá)標(biāo)率和二氧化硫去除率等數(shù)據(jù)不再公布,因此,本文選用了對(duì)應(yīng)的治理設(shè)施本年的運(yùn)行費(fèi)用。工業(yè)固體廢物綜合利用率在修訂之后不再公布,改為公布一般工業(yè)固體廢物綜合利用率,而工業(yè)固體廢物可分為一般工業(yè)固體廢物和危險(xiǎn)工業(yè)固體廢物,由于新的統(tǒng)計(jì)年鑒對(duì)工業(yè)固體廢物的兩種成分的數(shù)據(jù)均進(jìn)行了披露,為前后口徑一致,本文合成了2011—2013年的工業(yè)固體廢物綜合利用率*工業(yè)固體廢物綜合利用率=工業(yè)固體廢物綜合利用量/(工業(yè)固體廢物產(chǎn)生量+綜合利用往年貯存量)。2011年之后未披露的綜合利用往年貯存量可用如下公式合成:綜合利用往年貯存量=一般工業(yè)固體廢物綜合利用往年貯存量+危險(xiǎn)工業(yè)固體廢物綜合利用往年貯存量=一般工業(yè)固體廢物綜合利用往年貯存量+[(工業(yè)固體廢物綜合利用量-危險(xiǎn)工業(yè)固體廢物綜合利用量)/一般工業(yè)固體廢物綜合利用率-(工業(yè)固體廢物產(chǎn)生量-危險(xiǎn)工業(yè)固體廢物產(chǎn)生量)+危險(xiǎn)工業(yè)固體廢物綜合利用往年貯存量]。。
本文所選取的5個(gè)指標(biāo)均為越大越優(yōu),即數(shù)據(jù)越大,說明環(huán)境規(guī)制強(qiáng)度越強(qiáng),再將陜西省2005—2013年各項(xiàng)指標(biāo)數(shù)據(jù)分別代入(13)、(15)、(17)式,由此得到各個(gè)指標(biāo)所傳遞的信息量及其權(quán)重,詳見表2所示。
表2中所得到的各項(xiàng)指標(biāo)所傳遞的信息量是以Nat為單位的。根據(jù)(15)式可以得到各數(shù)據(jù)的列比例矩陣*由于篇幅所限,本文未報(bào)告此矩陣。,將此矩陣與表2的各項(xiàng)指標(biāo)的權(quán)重代入(18)式,可以得到2005—2013年陜西省環(huán)境規(guī)制強(qiáng)度指數(shù),并對(duì)環(huán)境規(guī)制強(qiáng)度指數(shù)進(jìn)行排名,詳見表3所示。
表2 陜西省環(huán)境規(guī)制指標(biāo)傳遞的信息量及其權(quán)重
表3 2005—2013年陜西省環(huán)境規(guī)制強(qiáng)度指數(shù)及名次
為了清楚地看出2005—2013年陜西省環(huán)境規(guī)制強(qiáng)度的變化情況,本文再利用以上年份指數(shù)繪制折線圖,詳見圖1所示。
由圖1可以看出,2005—2013年陜西省的環(huán)境規(guī)制強(qiáng)度并不是想象中逐年增大的,而是在經(jīng)歷了2005年的最強(qiáng)規(guī)制之后,規(guī)制出現(xiàn)了下降的趨勢(shì),并在2009年下降到低谷,與此同時(shí),規(guī)制強(qiáng)度伴隨著輕微的波動(dòng)并在2013年達(dá)到最低。
圖1 陜西省環(huán)境規(guī)制強(qiáng)度指數(shù)
4結(jié)語
在對(duì)環(huán)境規(guī)制強(qiáng)度進(jìn)行評(píng)價(jià)時(shí),最為關(guān)鍵的兩步是規(guī)制指標(biāo)的選取和指標(biāo)權(quán)重的確定。由于熵值法是目前使用最廣泛的確權(quán)方法,本文對(duì)指標(biāo)權(quán)重的確定進(jìn)行了重點(diǎn)討論,并在回顧了熵值法提出的歷史后,從決策矩陣中各個(gè)指標(biāo)列向量所傳達(dá)的信息量出發(fā)對(duì)熵值法原理進(jìn)行了論證。由此可以看出,決定指標(biāo)權(quán)重大小的并不是熵,而是熵的減少,即信息量。因此從本質(zhì)上講,熵值法或者熵權(quán)法都不如信息量權(quán)法更為確切。這也從另一個(gè)角度反映了熵值法的局限性,即某項(xiàng)指標(biāo)的權(quán)重小并不意味著該指標(biāo)不重要,只是數(shù)據(jù)所傳遞給我們的信息比較少,這也是我們?cè)趹?yīng)用熵值法進(jìn)行評(píng)價(jià)時(shí)需要特別注意的問題。熵值法本質(zhì)上屬于客觀賦權(quán)法,如果僅僅依靠數(shù)據(jù)來確定權(quán)重,就有可能忽略了決策者的主觀信息。因此,熵值法對(duì)于某些十分重要但卻不能從數(shù)據(jù)中獲得信息的指標(biāo)就顯得無能為力了,這時(shí)候就必須發(fā)揮主觀賦權(quán)法的作用,所以,我們?cè)谑褂渺刂捣〞r(shí)應(yīng)對(duì)其適用性準(zhǔn)確把握。
[參考文獻(xiàn)]
[1]李亮.評(píng)價(jià)中權(quán)系數(shù)理論與方法比較[D].上海:上海交通大學(xué),2009.
[2]郭顯光.改進(jìn)的熵值法及其在經(jīng)濟(jì)效益評(píng)價(jià)中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,1998(12).
[3]王彬.熵與信息[M].西安:西北工業(yè)大學(xué)出版社,1994.
[4]朱雪龍.應(yīng)用信息論基礎(chǔ)[M].北京:清華大學(xué)出版社,2001.
[5]邱菀華.管理決策與應(yīng)用熵學(xué)[M].北京:機(jī)械工業(yè)出版社,2002.
[6]郭顯光.熵值法及其在綜合評(píng)價(jià)中的應(yīng)用[J].財(cái)貿(mào)研究,1994(6).
[7]郭秀英.區(qū)間數(shù)指標(biāo)權(quán)重確定的熵值法改進(jìn)[J].統(tǒng)計(jì)與決策,2012(17).
[8]朱喜安,魏國(guó)棟.熵值法中無量綱化方法優(yōu)良標(biāo)準(zhǔn)的探討[J].統(tǒng)計(jì)與決策,2015(2).
[9]阿維納什 K 迪克西特.經(jīng)濟(jì)理論中的最優(yōu)化方法[M].2版.上海:上海三聯(lián)書店,2006.
[10] 傅京燕,李麗莎.環(huán)境規(guī)制 要素稟賦與產(chǎn)業(yè)國(guó)際競(jìng)爭(zhēng)力的實(shí)證研究:基于中國(guó)制造業(yè)的面板數(shù)據(jù)[J].管理世界,2010(10).
[11] 尤濟(jì)紅,高志剛.政府環(huán)境規(guī)制對(duì)能源效率影響的實(shí)證研究:以新疆為例[J].資源科學(xué),2013(6).
[12] 韓晶,陳超凡,施發(fā)啟.中國(guó)制造業(yè)環(huán)境效率 行業(yè)異質(zhì)性與最優(yōu)規(guī)制強(qiáng)度[J].統(tǒng)計(jì)研究,2014(3).
(責(zé)任編輯王栓芹)
Algorithm Improvement of Entropy Method Based on Information Theory—with the Assessment of Environmental Regulation Intensity in Shannxi Province as an Example
WANGZhuo,GAOCong
(TheResearchCenterofBusinessManagementofOil-GasResources,Xi`anShiyouUniversity,Xi`an,shaanxi,710065,china)
Abstract:From the perspective of information theory,the principle of entropy method,namely,the basis ofempowerment,isexpounded and verified.It is proved that the index weight is actually the proportion of the information conveyed by the index in all indices,based on which,the traditional algorithm is improved.Then five indices are selected to assess the environmental regulation intensity of Shannxi province from 2005 to 2013 by the improved entropy method.Finally it is explained that the limitation of entropy method is related to the size of the weight,but is not directly linked to its own importance.
Key words:entropy method;Algorithm improvement;environmental regulation;difference coefficient
收稿日期:2015-08-10
作者簡(jiǎn)介:王卓,男,河南鎮(zhèn)平人,西安石油大學(xué)經(jīng)濟(jì)管理學(xué)院碩士研究生,研究方向:資源經(jīng)濟(jì)與產(chǎn)業(yè)經(jīng)濟(jì)。
基金項(xiàng)目:西安石油大學(xué)全日制碩士研究生創(chuàng)新基金(2014cx130945)。
中圖分類號(hào):F224
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1008-5645(2016)01-0022-05
西安石油大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2016年1期