国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于粗糙集理論的多指標(biāo)綜合評價方法

2010-05-22 08:06鄭學(xué)敏
統(tǒng)計與決策 2010年5期
關(guān)鍵詞:信息量約簡粗糙集

鄭學(xué)敏

(河海大學(xué) 商學(xué)院,南京 210098)

0 引言

粗糙集理論由波蘭學(xué)者Z.Pawlak在1982年提出,這是一種新的處理模糊和不確定知識的數(shù)學(xué)工具,其主要特點在于無需提供問題所需處理的數(shù)據(jù)集合之外的任何先驗信息,所以對問題的描述或處理是比較客觀的,根據(jù)觀測數(shù)據(jù)刪除冗余信息,分析知識的粗糙度、屬性間的依賴性與重要性,生成分類或決策規(guī)則等[1]。針對無決策屬性的綜合評價問題,本文擬提出一種基于粗糙集理論的客觀評價方法:首先將介紹粗糙集信息系統(tǒng)和屬性約簡的概念,并在引入信息論中“信息量”的基礎(chǔ)上,提出信息系統(tǒng)屬性重要性的計算方法,進(jìn)而實現(xiàn)綜合評價系統(tǒng)的指標(biāo)約簡和權(quán)重設(shè)置。希望該方法能克服傳統(tǒng)評價方法中主觀性和片面性的問題,并且能夠有效地減少綜合評價問題的計算量。

1 信息系統(tǒng)與屬性約簡

1.1 信息系統(tǒng)

定義1 四元組S=(U,A,V,f)是一個信息系統(tǒng),其中U表示對象的非空有限集合,稱為論域;V=,其中 Va是屬性a的值域;f表示U×A→V是一個信息函數(shù),它為每個對象的每個屬性賦予一個信息值,即 a∈A,x∈U,f(x,a)∈Va。

1.2 等價關(guān)系

每一個屬性子集P?A決定了一個二元不可區(qū)分關(guān)系IND(P),信息系統(tǒng)S=(U,A,V,f)也稱為知識表達(dá)系統(tǒng)U/IND(A)或知識A。

定義2 如果(x,y)∈IND(P)是等價的,則稱 x和y是等價的。等價關(guān)系IND(P)構(gòu)成了U上的一個等價劃分,用U/IND(P)={X1,X2,…,Xn}表示。

1.3 屬性的核與約簡

定義3 設(shè)S=(U,A,V,f)是一個信息系統(tǒng),a∈A,如果IND(A-{a})=IND(A),則稱屬性a在A中是不必要的(多余的);否則,稱a在A中是必要的。

不必要的屬性在信息系統(tǒng)中是多余的,如果將它從信息系統(tǒng)中去掉,不會改變該信息系統(tǒng)的分類能力;相反,若從信息系統(tǒng)中去掉一個必要的屬性,則一定改變該信息系統(tǒng)的分類能力。

定義4 設(shè)S=(U,A,V,f)是一個信息系統(tǒng),A中所有必要的屬性組成的集合稱為屬性集A的核,記作Core(A)。

定義5 設(shè)S=(U,A,V,f)是一個信息系統(tǒng),如果P?A:

(1)IND(P)=IND(A);

(2)P 是獨立的;

則稱P是A的一個約簡。

可以證明核是所有約簡的交集[1]。

2 信息量與重要度度量

2.1 知識的信息量

定義6 設(shè)S=(U,A,V,f)是一個信息系統(tǒng),P?A,U/IND(P)={X1,X2,…,Xn}。 知識 P 的信息量定義為:

其中|X|表示集合X的基數(shù),|Xi|/|U|表示等價類Xi在U中的概率。

本文在信息系統(tǒng)中,引入信息論中信息量的概念,有如下定理:

定理1 設(shè)S=(U,A,V,f)是一個信息系統(tǒng),P?A。若U/IND(A)?U/IND(P),則 I(P)<I(A)。

由定理1可以得出如下結(jié)論:

定理2 設(shè)S=(U,A,V,f)是一個信息系統(tǒng),P?A,則U/IND(A)=U/IND(P)的充要條件是I(P)=I(A)。

2.2 屬性重要度

定義7 設(shè)S=(U,A,V,f)是一個信息系統(tǒng),屬性a∈A在A中的重要性定義為:

性質(zhì)1 屬性a∈A在A中是必要的當(dāng)且僅當(dāng)sigA-{a}>0。

性質(zhì) 2 Core(A)={a∈A|sigA-{a}(a)>0}。

定義8 設(shè)S=(U,A,V,f)是一個信息系統(tǒng),C?A,任意屬性a∈A-C關(guān)于屬性集C的重要性定義為:

sigC(a)=sigC∪{a}-{a}(a)=I(C∪{a})-I(C)

上述定義表明屬性a∈A-C關(guān)于屬性集C的重要性由C中添加a后所引起的信息量的變化大小來度量。sigC(a)的值越大,說明屬性a∈A-C關(guān)于屬性集C就越重要。

3 基于粗糙集綜合評價的指標(biāo)體系建立

給予粗糙集的多指標(biāo)綜合評價的基本步驟如圖1所示。

圖1 基于粗糙集的多指標(biāo)綜合評價的步驟

3.1 評價指標(biāo)約簡

在進(jìn)行指標(biāo)體系的選擇時,為更全面地反映評價問題的整體狀況,在指標(biāo)構(gòu)建原則的前提下,往往會選擇盡可能多的指標(biāo)和數(shù)據(jù),但這些信息中可能會有冗余信息,這些冗余信息不僅會增加問題的復(fù)雜性,還會影響評價的準(zhǔn)確性。評價問題中的指標(biāo)對應(yīng)于信息系統(tǒng)中的屬性,信息系統(tǒng)屬性約簡的過程其實質(zhì)就是指標(biāo)集合優(yōu)化的過程,由此方法得到的指標(biāo)集合是決定評價問題的關(guān)鍵因素。

本文利用屬性的重要度作為啟發(fā)式信息,根據(jù)性質(zhì)2計算指標(biāo)集A的核,再根據(jù)定義7選擇屬性重要度大的指標(biāo)依次加入到核中,直到約簡后的指標(biāo)集信息量與原指標(biāo)集A的信息量相同為止。

算法主要步驟如下:

輸入:信息系統(tǒng)S=(U,A,V,f),其中U為論域,A為指標(biāo)集。

輸出:該信息系統(tǒng)的核Core與最小約簡C。

STEP1根據(jù)(1)式計算評級指標(biāo)信息系統(tǒng)的信息量I(A);

STEP2令Core(A)=Ф。對于每一個ai∈A,根據(jù)(2)式計算在信息系統(tǒng)中的重要度sigA-{ai}(ai),若sigA-{ai}(ai)不為0,則使Core=Core∪{ai},得到的Core為指標(biāo)集A的核,計算I(Core),若I(Core)=I(A),算法終止(此時Core為A的最小近似約簡).否則,執(zhí)行STEP3;

STEP3令C=Core,對指標(biāo)集A-C重復(fù)執(zhí)行:

(1)對于每個指標(biāo) ai∈A-C,根據(jù)定義 8,計算其重要度sigC(ai);

(2) 取 max sigC(ai),C:=C∪{ai};

(3)若I(C)=I(A),算法終止(此時C為A的一個最小近似約簡);否則,轉(zhuǎn)(1)。

3.2 基于屬性重要度設(shè)置權(quán)重

傳統(tǒng)的主觀評價方法(如層次分析法),在權(quán)重的確定上過分依賴專家的意見,而忽略了評價指標(biāo)原始數(shù)據(jù)自身的信息。本文利用信息系統(tǒng)屬性重要度的定義,依靠屬性自身的信息量計算權(quán)重,很好地避免了確定權(quán)重時受主觀因素的影響。

指標(biāo)體系經(jīng)過指標(biāo)約簡后,可以得出約簡后的指標(biāo)C={r1,r2,…rm},由約簡的定義,C是獨立的,C中的屬性也是獨立的。根據(jù)知識的信息量的概念,本文提出了一種數(shù)據(jù)驅(qū)動的指標(biāo)權(quán)重確定的算法。算法步驟如下:

輸入:約簡后信息系統(tǒng)S=(U,C,V,f)。

輸出:指標(biāo)集C中各指標(biāo)的權(quán)重wi。

STEP1由等價關(guān)系C對論域U的劃分為:U/IND(C)={X1,X2,…,Xn};根據(jù)(1)式計算約簡后指標(biāo)集C的信息量I(C);

STEP2令 i=1,計算其屬性重要度為 sigc-{ri}(ri)=I(C)-I(C-{ri}),i:=i+1;若 i=m,進(jìn)入 STEP3;

STEP3令i=1,歸一化ri的重要度,得出每個指標(biāo)的權(quán)重:,i:=i+1;如果 i=m,算法結(jié)束。

3.3 建立評價模型

4 對某市各銀行服務(wù)客戶滿意度分析

4.1 數(shù)據(jù)收集和數(shù)據(jù)信度分析

本研究的樣本選自某城市主要商業(yè)銀行營業(yè)網(wǎng)點流水客戶,通過對工、招、農(nóng)、建、中、交五大銀行各選取10家營業(yè)網(wǎng)點對他們的零售業(yè)務(wù)流水客戶進(jìn)行隨機(jī)的問卷調(diào)查。本調(diào)查共發(fā)放問卷500份,回收436份,回收率87.2%,通過審核篩選獲得有效問卷418份,有效率83.8%,所有調(diào)查信息均采用SPSS15.0統(tǒng)計軟件進(jìn)行統(tǒng)計分析。

在廣泛查閱國內(nèi)外員工滿意度問卷基礎(chǔ)上,結(jié)合銀行行業(yè)特點設(shè)計的“商業(yè)銀行客戶滿意度調(diào)查問卷”,問卷分兩部分組成:(1)個人資料,包括年齡、性別、學(xué)歷程度、工作職位等;(2)員工滿意度測試,由36個項目組成,除去調(diào)查表中調(diào)查員工對銀行業(yè)目前主要優(yōu)勢、存在的困難等7個項目的認(rèn)知和預(yù)測調(diào)查外,顧客選擇商業(yè)銀行服務(wù)滿意度的主要指標(biāo)為:a1產(chǎn)品服務(wù)種類,a2服務(wù)收費透明度,a3可信度,a4服務(wù)效率,a5咨詢投訴處理,a6服務(wù)便利。擬選定6項主要指標(biāo){U1,U2,U3,U4,U5,U6},建立評價信息表。

數(shù)據(jù)信度主要考察問卷的內(nèi)部一致性,內(nèi)部一致性系數(shù)通常采用可靠性分析中的Cronbachα計算值,一般認(rèn)為該值應(yīng)在0.7以上。對于該問卷的信度,通過采用SPSS15.0統(tǒng)計軟件直接測算,結(jié)果表明問卷的內(nèi)部一致性系數(shù)為0.729,說明該滿意度調(diào)查問卷具有較高的信度。

根據(jù)所采集的數(shù)據(jù)對評價信息表進(jìn)行離散化,1表示達(dá)標(biāo),0表示未達(dá)標(biāo)。構(gòu)建綜合評價系統(tǒng)如表1所示。

表1 顧客滿意評價度

表2 約簡后的信息系統(tǒng)

表3 指標(biāo)權(quán)重表

表4 顧客評價結(jié)果

4.2 評價指標(biāo)集約簡

依照約簡算法,約簡步驟如下:

STEP1根據(jù)評價信息系統(tǒng),有等價關(guān)系 U/IND(A)={{U1,U6},U2,U3,U4,U5}計算 I(A)=30/36;

STEP2對于指標(biāo)集A-{a1},有等價關(guān)系 U/IND(A-{a1})={{U1,U6},U2,U3,U4,U5}以及公式(2)計算指標(biāo)a1的重要度sigA-{a1}(a1)=I(A)-I(A-{a1})=0,同理,計算得 sigA-{a2}(a2)=0,sigA-{a3}(a3)=0,sigA-{a4}(a4)=2/36,sigA-{a5}(a5)=0,sigA-{a6}(a6)=0,因此,Core(A)={a4};計算得 I(Core)=12/36<I(A),進(jìn)入 STEP3;

STEP3 令 C=Core={a4},A-C={a1,a2,a3,a5,a6,}:

(1)計算指標(biāo)集A-C中的指標(biāo)重要度。經(jīng)第一次計算得:sigC(a1)=I(C∪{a1})-I(C)=18/36,同理得:sigC(a2)=16/36,sigC(a3)=10/36,sigC(a5)=10/36,sigC(a6)=18/36,;

(2)取 max sigC(ai),C:=C∪{ai}。 第一次計算 C={a1,a4};

(3)第一次計算 I(C)=30/36<I(A),重復(fù)步驟(1);…

算法得出:核Core={a4},最小約簡指標(biāo)集為C={a1,a2,a4,a6}。

評價指標(biāo)約簡為{a1,a2,a4,a6},因而得出a1產(chǎn)品服務(wù)種類,a2服務(wù)收費透明度,a4服務(wù)效率,a6服務(wù)便利是該評價問題的主要因素。通過該算法,指標(biāo)個數(shù)減少了37%,因而減少了評價計算量。約簡后的信息系統(tǒng)如表2示。

4.3 指標(biāo)權(quán)重計算

STEP1對于最小約簡指標(biāo)集,其等價關(guān)系為:U/IND(C)={{U1,U5},U2,U3,U4,U5,U6},根據(jù)(1)式計算其信息量I(C)=30/36;

STEP2由(2)式計算指標(biāo)重要度水平sigC-{a1}(a1)=I(C)-I(C-{a1})=2/36,sigC-{a2}(a2)=2/36,sigC-{a4}(a4)=2/36,sigC-{a6}(a6)=6/36;

STEP3歸一化處理指標(biāo)的重要度得出權(quán)重信息,a1為同理計算得出其他幾個指標(biāo)權(quán)重如表3。

利用線性加權(quán)模型計算得出評價對象的評價值如表4。

以上排序結(jié)果說明,顧客在選擇商業(yè)銀行滿意度時最期望的指標(biāo)排序為U4為首選,其次為U6和U3。由實例看出,使用粗糙集綜合評價方法可以有效地約簡評價指標(biāo),減少評級問題的計算量,評價過程不需要人為干預(yù),故評價結(jié)果更真實可靠。

5 總結(jié)

在顧客滿意度評價中影響其價值的因素很多,各因素的重要性也會有很大的差別。本文基于粗糙集理論,融入信息論中信息量的概念,提出了一種完全數(shù)據(jù)驅(qū)動(依賴指標(biāo)原始數(shù)據(jù))的多指標(biāo)綜合評價方法,并用商業(yè)銀行顧客滿意度實例證明了該方法的客觀性和實用性,克服了傳統(tǒng)方法存在的主觀性和片面性的問題。粗糙集綜合評價法通過指標(biāo)的屬性重要度信息,計算指標(biāo)體系的約簡,并將權(quán)系數(shù)確定問題轉(zhuǎn)化為指標(biāo)的重要性評價問題。該方法綜合分析了各種影響因素,既體現(xiàn)了評價的全面性,又進(jìn)行了指標(biāo)的篩選,從而簡化了運算的復(fù)雜度;在確定各因素的權(quán)重中,既強調(diào)了評價的客觀性,又充分利用了專家的主觀經(jīng)驗。

[1]張文修,吳偉志,梁吉業(yè)等.粗糙集理論與方法[M].北京:科學(xué)出版社,2000.

[2]Li Wan-qing,MA Li-Hua,LIU Tao.Evaluation Method of Product Development Effect Based on Rough Sets and Unascertained Number[C].International Conference on Management Science,2007.

[3]Yitan Xu.Laisheng Wang.Fuzzy Comprehensive Evaluation Model Based on Rough Set Theory[C].IEEE Int.Conf.on Congitive Informatics(ICCI’06),2006.

[4]阿倫·杜卡.美國市場營銷學(xué)會顧客滿意度手冊[M].北京:中國宇航出版社,1998.

[5]張喜成,汪江洪.粗糙集綜合評價法在公交服務(wù)水平評價中的應(yīng)用[J].統(tǒng)計與決策,2006,(4).

[6]唐曉芬.顧客滿意度測評[M].上海:上??茖W(xué)技術(shù)出版社,2001.

猜你喜歡
信息量約簡粗糙集
基于粗糙集不確定度的特定類屬性約簡
基于Pawlak粗糙集模型的集合運算關(guān)系
基于二進(jìn)制鏈表的粗糙集屬性約簡
基于GIS和信息量法的四川峨眉山市地質(zhì)災(zāi)害易發(fā)性定量評價
基于信息理論的交通信息量度量
實值多變量維數(shù)約簡:綜述
廣義分布保持屬性約簡研究
多粒化粗糙集性質(zhì)的幾個充分條件
如何增加地方電視臺時政新聞的信息量
雙論域粗糙集在故障診斷中的應(yīng)用
保山市| 北碚区| 天津市| 彭水| 宜昌市| 山阴县| 加查县| 黄浦区| 华蓥市| 侯马市| 铜山县| 绩溪县| 新宁县| 梁平县| 桓仁| 马公市| 祥云县| 宁陕县| 乌鲁木齐市| 繁昌县| 娄烦县| 师宗县| 松溪县| 沿河| 上思县| 霍林郭勒市| 宁武县| 林周县| 仙游县| 礼泉县| 上栗县| 个旧市| 宁武县| 临沂市| 荥阳市| 威信县| 临猗县| 佛教| 板桥市| 刚察县| 息烽县|