余海燕,沈 江,徐 曼
(1.天津大學(xué)管理與經(jīng)濟學(xué)部,天津300072;2.南開大學(xué)商學(xué)院,天津300071)
類別誤標(biāo)下證據(jù)鏈推理的群決策分類方法
余海燕1,沈 江1,徐 曼2
(1.天津大學(xué)管理與經(jīng)濟學(xué)部,天津300072;2.南開大學(xué)商學(xué)院,天津300071)
針對群決策分類中可解釋性的推理信息存在類別錯誤標(biāo)識的問題,提出了類別誤標(biāo)下證據(jù)鏈推理的群決策分類方法。該方法采用可信度函數(shù)的一致性和凸性,以查詢案例與證據(jù)鏈之間的屬性關(guān)聯(lián)相似度作為群決策信息源的權(quán)重,建立了基于證據(jù)鏈推理的混合整數(shù)優(yōu)化模型,實現(xiàn)了決策分類標(biāo)識能力最大化,同時獲取了可解釋性最好的證據(jù)鏈集合。該模型考慮了決策類別的錯誤標(biāo)識情形,依據(jù)可信度序的概念,將推導(dǎo)出的融合可信度作為查詢案例推論可解釋性的評價標(biāo)準(zhǔn)。通過多源感知數(shù)據(jù)的診斷實例,說明了該方法的有效性和合理性。
群決策分析;證據(jù)鏈;關(guān)聯(lián)相似度;錯誤標(biāo)識;可信度序
群決策分類是指決策者對多屬性查詢方案依據(jù)數(shù)據(jù)庫中的案例和相關(guān)領(lǐng)域知識(如規(guī)則)等多源信息下的評價值,給出有限個查詢問題的分類結(jié)果。這類決策問題廣泛應(yīng)用于工程實踐中,例如,一組醫(yī)師提供群決策信息對疾病會診,可通過信息融合中的知識推理處理積累的證據(jù)和實時感知的查詢案例,使得醫(yī)師專注于處理診斷最重要環(huán)節(jié)。IBM開發(fā)的Watson智能機[1],將通過關(guān)聯(lián)患者記錄與臨床證據(jù),使用多源信息進行群決策等。目前關(guān)于多屬性群決策分類問題的研究已經(jīng)成為決策分析領(lǐng)域中的熱點[2]。隨著日益增長的信息積累、傳感器感知的大數(shù)據(jù)和對新出現(xiàn)案例決策規(guī)則知識增長,所面臨的多屬性群決策分類問題日趨復(fù)雜,根據(jù)單個證據(jù)信息源的案例或規(guī)則(虛擬案例)知識很難解釋查詢問題的所有相關(guān)方面,實際決策時往往需要多個決策信息源提供相關(guān)知識共同推理[3-4]。
與單個決策信息源的推理問題相比,群決策分類體現(xiàn)在多源決策信息下的推理問題更為復(fù)雜。首先,數(shù)據(jù)庫中給出案例或規(guī)則的專家們,由于認(rèn)知經(jīng)驗、從業(yè)領(lǐng)域和所站角度不同,各決策者對推理問題的觀點存在較大差異,需要按照一定的融合規(guī)則綜合決策者們的不同看法,并產(chǎn)生群體推理結(jié)論。其次,多源信息的可靠性、參考價值不一樣,其標(biāo)識的結(jié)論對最終決策結(jié)果的影響也會不同,需要在結(jié)果中體現(xiàn)各信息源的重要性。因此,研究多源證據(jù)信息決策環(huán)境下的推理問題具有挑戰(zhàn)性和實際價值。
現(xiàn)有的群決策分類方法中推論具有可解釋性的方法主要有兩類:基于案例推理與基于規(guī)則推理。這些方法只需要對案例特征屬性或?qū)σ?guī)則的前件屬性進行關(guān)聯(lián)匹配,并不需要提供推理邊界等模型參數(shù)信息,并且推論具有向前可追溯到證據(jù)方案(規(guī)則或案例),使得推理結(jié)論具有可解釋性。從決策信息結(jié)構(gòu)來看,文獻[5]提出了基于可轉(zhuǎn)移信度模型的案例推理方法,要求提供最緊密的k個案例信息作為證據(jù),k≥1,拓展了傳統(tǒng)的最近鄰?fù)评矸椒ǖ倪m用性;文獻[6]使用可信度函數(shù)進行案例推理,將決策概率最高的類作為推理的類別;文獻[7]提出了相似度加權(quán)頻率的案例推理方法,要求提供作為證據(jù)的所有案例和標(biāo)識類別的可信度;文獻[8]根據(jù)決策者提供的案例評價信息,提出案例信息的多屬性推理方法,將可信度作為推理模型的評價標(biāo)準(zhǔn),推導(dǎo)屬性的權(quán)重和類別的邊界值;文獻[9]使用證據(jù)推理的規(guī)則推斷方法,要求決策者提供證據(jù)的可信度分布、規(guī)則前件屬性的精確性等信息,實現(xiàn)以單個獨立性規(guī)則為證據(jù)源的可信度融合;文獻[10]提出了基于主成分分析的置信規(guī)則庫結(jié)構(gòu)學(xué)習(xí)方法,實現(xiàn)對前提屬性過多時的置信規(guī)則庫規(guī)模約簡。然而,這些方法主要是針對單決策信息源作為推論的直接推理證據(jù),目前僅有少量文獻探討了群決策環(huán)境下的推理問題;盡管如此,群決策環(huán)境下多信息源的推理逐漸成為研究的熱點,一些文獻[8- 11]強調(diào)將現(xiàn)有的推理方法拓展至群決策環(huán)境的重要性。
現(xiàn)有的針對群決策分類研究中,文獻[2]提供了屬性權(quán)重的反饋模型,研究了針對決策者提供的多源證據(jù)信息的推理問題。文獻[12]針對多屬性群決策中多源信息的實體異構(gòu)性問題,提出了基于證據(jù)鏈融合推理的群決策方法,構(gòu)建了半正定矩陣的二次優(yōu)化模型,共享了群決策專家的經(jīng)驗知識;文獻[11]利用魯棒閾值的知識推理方法,推導(dǎo)出案例和規(guī)則的多源信息決策空間的特征值,以確定分類邊界參數(shù),然后使用信息融合方法綜合這些個體決策信息源所確定的推理結(jié)果,從群體決策信息源中推導(dǎo)結(jié)果。在數(shù)據(jù)驅(qū)動的群決策分類問題中,錯誤標(biāo)識(或錯誤注釋)[13]作為一種輸入數(shù)據(jù)中類別標(biāo)識的噪聲。例如,在決策數(shù)據(jù)收集過程中,描述數(shù)據(jù)序列(如基因或心電信號等)的功能進行類別標(biāo)識(注釋)對研究人員實驗室調(diào)查和計算推理都極為重要,但所用的算法常對這些數(shù)據(jù)存在錯誤標(biāo)識,如將編碼為E的信號質(zhì)量級別極高的數(shù)據(jù)片段錯誤標(biāo)識為編碼為A的中等質(zhì)量的數(shù)據(jù)[14],或在多源數(shù)據(jù)監(jiān)測的預(yù)警決策中,將正確報警類(#true alarm)的數(shù)據(jù)樣本標(biāo)記為錯誤報警類(#false alarm)。數(shù)據(jù)標(biāo)識類別中存在的1%噪聲,意味著每一決策推理的每一步中,選擇的最近鄰證據(jù)都有1%的可能與訓(xùn)練樣本所預(yù)期選擇的近鄰證據(jù)集相反。傳統(tǒng)的決策方法,大多針對的是輸入數(shù)據(jù)中屬性的噪聲,如傳感器獲取數(shù)據(jù)的噪聲,常使用卡夫曼等方法進行融合估計[15],而本文關(guān)注的是歷史數(shù)據(jù)中分類標(biāo)識的噪聲,即決策類別存在錯誤標(biāo)識的問題。
雖然先前的研究從不同角度為群決策分類提供了新思路,但也有需要完善之處。從樣本誤標(biāo)角度,文獻[5]考慮到不確定性類別標(biāo)識的案例而能解決類別部分已知的情況;文獻[7]、文獻[9]均使用精確標(biāo)識的樣本,數(shù)據(jù)庫中的證據(jù)序列標(biāo)識是完全確定的,在證據(jù)是完全確知的情況下實現(xiàn)證據(jù)更新,未考慮樣本誤標(biāo)情形。本文考慮了數(shù)據(jù)庫中證據(jù)存在錯誤標(biāo)識的情形,因此提出了一個類別誤標(biāo)下證據(jù)鏈推理的多屬性群決策分類方法。該方法將群決策信息源提供的案例和規(guī)則知識組合成關(guān)聯(lián)證據(jù)鏈,并首先使用可信度性質(zhì)及可信度序概念,將基于證據(jù)鏈推理的多屬性群決策分類問題轉(zhuǎn)化為尋找候選證據(jù)序列的優(yōu)化問題。然后使用查詢案例與證據(jù)鏈之間的相似度信息和權(quán)重信息作為約束,構(gòu)建基于融合可信度的混合整數(shù)優(yōu)化模型。最后直接利用可信度序關(guān)系對查詢案例進行推斷。
令(C,R)為命題空間,可信度域R是一個建立在決策事件可能集合C上的布爾代數(shù)。證據(jù)系列EC為決策者在某時刻提供的證據(jù)(鏈)集合。信息源中第l條證據(jù)鏈[12]Rl表示為
式中,xlj為第j個前件的屬性取值;是其第r個類別標(biāo)識的屬性取值;對于二元標(biāo)識分類,如診斷,K=2為決策者提供的關(guān)于類別標(biāo)識的可信度,既可是數(shù)值觀測值也可是主觀評價值。前件屬性之間的邏輯關(guān)系可用∧表示“與”。邏輯關(guān)系“或”通過前件屬性的分解,可轉(zhuǎn)化為僅包括“與”的關(guān)系。另外,查詢案例記為其對應(yīng)的觀測值向量為 Ui的第r個標(biāo)識類別的可信度。前件屬性權(quán)重參數(shù)記為wj,δil為Ui與Rl的關(guān)聯(lián)系數(shù)。
以文獻[15]提供的傳感器波形數(shù)據(jù)ECG V為例,說明類別標(biāo)識,如圖1所示。這里的取值范圍為{E,A}。這里的類別標(biāo)識由PhysioNet研究機構(gòu)中的多個領(lǐng)域?qū)<姨峁?,對ECG V信號數(shù)據(jù)在一段時間內(nèi)的信號質(zhì)量所做的分類。每個類別標(biāo)識下方對應(yīng)的數(shù)據(jù)為多個屬性取值,常通過統(tǒng)計特征值或信號質(zhì)量指數(shù)計算得出,如圖1中的虛線框所示。其對應(yīng)的為主觀概率知識,可根據(jù)實際給出,這里將其記為:橫軸為時間軸,縱軸為波形信號幅度和類別標(biāo)識。
圖1 傳感器感知數(shù)據(jù)的類別標(biāo)識
通過案例和規(guī)則的信息共享,使用證據(jù)鏈推理,實現(xiàn)群決策分類。由于實際推理問題一般比較復(fù)雜,決策者難以給出推理參數(shù)的準(zhǔn)確值[16]。相比較而言,更實際的做法是選擇關(guān)聯(lián)最緊密的證據(jù)鏈,并據(jù)此給出針對查詢案例的類別標(biāo)識及其可信度。因此,利用證據(jù)鏈來推測推理參數(shù)可以簡化決策過程,提高決策效率和品質(zhì)。另外,考慮到證據(jù)信息源可來自不同水平的專家或不同的數(shù)據(jù)庫,對同一個查詢案例很難獲得一致的推理結(jié)果。因此,考慮查詢案例在各個標(biāo)識類別下的可信度分布更符合實際。
基于以上兩點考慮,本文擴展了一般的證據(jù)推理問題。證據(jù)鏈主要來源于兩方面:一方面是決策者歷史經(jīng)驗的決策案例;另一方面是領(lǐng)域規(guī)則等相關(guān)知識(或構(gòu)造的虛擬案例)。因此,本文的多屬性群決策分類的推理主體不限于多決策者,已拓展到多決策信息源。
為了直接利用證據(jù)鏈信息對查詢案例進行推理,并對多決策者提供的評價信息提供一致性分析,首先需要了解基于可信度函數(shù)的推理方法的基本性質(zhì)。
2.1 可信度函數(shù)與可信度序關(guān)系
可信度函數(shù)[17]是一個從R映射到一個封閉實數(shù)區(qū)間的函數(shù),它關(guān)于包含關(guān)系單調(diào),下極限在?上可達。
定義1令(C,R)為命題空間,證據(jù)系列EC?R,決策者對R中的元素存在可信度函數(shù)β(Rl),簡記為βl。其性質(zhì)包括:
考慮決策者的偏好,將符號型的標(biāo)識數(shù)據(jù)與數(shù)值型的不確定性推理聯(lián)系起來,引入可信度序關(guān)系,以使用具有一致性的可信度函數(shù)實現(xiàn)群決策分類。
定義2[18]命題空間(C,R)中存在可信度函數(shù)β,?∈C,其對應(yīng)的可信度分別為βr1和βr2??尚哦刃蜿P(guān)系?滿足:
依據(jù)定義2可知,基于證據(jù)鏈推理的多屬性群決策分類問題,可轉(zhuǎn)化為尋找候選證據(jù)序列的優(yōu)化問題。
2.2 基于證據(jù)鏈推理的混合整數(shù)優(yōu)化模型
傳統(tǒng)的基于實例的推理[6],如相似度推理[19]、案例檢索[20]等,采用了相似度準(zhǔn)則(最近鄰法),強調(diào)的是案例一對一的屬性匹配,將信息匹配取值最高的類別作為推論。但是,實際的決策問題(如醫(yī)療診斷)要求決策者提供證據(jù)的可信度分布,并將知識庫中的這些相關(guān)聯(lián)的特征信息與新案例數(shù)據(jù)對準(zhǔn)、關(guān)聯(lián),獲取最緊密關(guān)聯(lián)的多個證據(jù)鏈作為直接證據(jù)源。通過信息共享,進行證據(jù)融合和可信度集成,以實現(xiàn)多屬性群決策分類。
為了使構(gòu)造的模型盡可能地接近證據(jù)鏈中的屬性信息,需要確定一個合適的目標(biāo)函數(shù)去關(guān)聯(lián)查詢案例與候選證據(jù)鏈的屬性,評價模型的分類參數(shù)值。這里引入相似度來量化它們屬性數(shù)據(jù)之間的關(guān)聯(lián)緊密性。
定義3令為第i查詢案例的第j個屬性,為第l證據(jù)鏈的第j個屬性,wj為這兩個數(shù)據(jù)源信息的權(quán)重向量。第l個證據(jù)鏈與查詢案例i之間的屬性關(guān)聯(lián)的相似度函數(shù)為。指數(shù)型相似度函數(shù)為
為選擇與查詢案例Ui最緊密關(guān)聯(lián)的證據(jù)鏈Rl,并將其作為直接證據(jù)源,令為0-1決策變量,構(gòu)建基于證據(jù)鏈推理的混合整數(shù)優(yōu)化(mixed integer optimization of ECS-based reasoning,MIOER)模型)如下:
式中,式(4a)為目標(biāo)函數(shù),反映了推論可信度的一階差分最大值能使得決策分類標(biāo)識能力最大化,這一推理模型盡可能使得查詢案例的結(jié)論遠離其分類標(biāo)識的邊界;式(4b)反映了屬性關(guān)聯(lián)相似度與推論可信度的關(guān)系,以這些不同來源信息的相似度作為群決策信息源的權(quán)重,獲取查詢案例的可信度;式(4c)在證據(jù)系列中挑選出與查詢案例最緊密關(guān)聯(lián)的證據(jù)鏈;式(4d)表明為0-1決策變量取值為1時,選擇對應(yīng)的證據(jù)鏈取值為0時,不選擇對應(yīng)的證據(jù)鏈,且證據(jù)鏈的取值總數(shù)不小于1;式(4e)表明εi為小于1的非負實數(shù),用于控制候選證據(jù)鏈的規(guī)模,當(dāng)εi=0時篩選出的是相似度取最大值的證據(jù)鏈。利用Matlab、C++等軟件可求解上述模型,解集為和的值所對應(yīng)的向量。將=1的證據(jù)鏈,按由大到小的順序排列,即{Rh|h=h1,h2,…,hq},其中h為序數(shù)。
信息熵為
式中,Pr是證據(jù)鏈總體按照Cr劃分的概率Pr=|Nr|/|N|。
條件熵為
互信息為
屬性權(quán)重為
2.3 模型推理必要條件和敏感性分析
針對決策證據(jù)類別錯誤標(biāo)識的情形,需要分析模型推理的必要條件,以及對證據(jù)鏈類別錯誤標(biāo)識情形的敏感性。
定理1假設(shè)MIOER)模型的最優(yōu)解為(δ,為使成立的必要條件是
定義4任意證據(jù)鏈推論的與另一證據(jù)鏈的類別標(biāo)識的的可信度序關(guān)系一致,則滿足:當(dāng)則當(dāng),則
定理2設(shè)MIOER,)模型最優(yōu)解為為緊密關(guān)聯(lián)的證據(jù)鏈,的其分類標(biāo)識能力最顯著,即h2,h3)時,查詢案例推論的βi與的類別標(biāo)識的的可信度序關(guān)系一致,滿足:當(dāng)
證畢
式中
證明設(shè)類別被錯誤標(biāo)識的緊密關(guān)聯(lián)的證據(jù)鏈為,
因
所以
證畢
2.4 結(jié)果分析
利用已存儲的群決策的證據(jù)鏈,針對有限個查詢案例進行推理。獲取融合可信度后,需要對模型的推理結(jié)果進行分析。
查詢案例的結(jié)論經(jīng)由決策者(或更多的領(lǐng)域知識)檢驗正確后,又可形成新案例或提煉的規(guī)則知識,固化、存儲到知識庫,形成新的關(guān)聯(lián)證據(jù)鏈,以多次利用數(shù)據(jù),增加數(shù)據(jù)驅(qū)動決策的知識使用價值,提升群決策分類的推理性能。
為了說明本文方法的有效性,以Heart樣本數(shù)據(jù)的智能診斷進行決策分析。實驗數(shù)據(jù)使用UCI決策數(shù)據(jù)庫中的Heart(cleveland)數(shù)據(jù)集[22]。數(shù)據(jù)集中有一些列所描述的屬性值能夠很好地推理預(yù)測結(jié)果的發(fā)生。因此決策算法指令集里面常需要使用這些屬性數(shù)據(jù),進行可解釋性的證據(jù)推理論證,以找到有實際決策意義的模式。因現(xiàn)無公開數(shù)據(jù)庫提供這類數(shù)據(jù)[14],為模擬錯誤標(biāo)識情形,對數(shù)據(jù)集的標(biāo)識類別加入1%的噪聲作為錯誤標(biāo)識。形成的樣本數(shù)據(jù)包括270例,樣本空間中每個樣本由多個領(lǐng)域?qū)<腋鶕?jù)經(jīng)驗或領(lǐng)域知識給出。這些數(shù)據(jù)集常用于診斷推理的屬性有13個特征信息。這些數(shù)據(jù)樣本被分離為Present和Absent,分別記為C1和C2。
對邏輯布爾型屬性和描述型屬性進行符號化處理。計算屬性的信息熵、條件熵、互信息,進而使用式(5)計算屬性權(quán)重,獲取的特征集合為{Age,Sex,Cp,BP,restECG,Thalach,Exang,Slope,Thal},這9個特征對應(yīng)的權(quán)值向量為[0.074 3,0.010 5,0.234 2,0.011 1,0.035 2,0.103 0,0.157 7,0.143 7,0.230 3],數(shù)據(jù)集中的其余屬性為冗余屬性,權(quán)重為0。
多源信息生成的證據(jù)鏈ECl實例為
證據(jù)鏈所表示的信息具有特定的意義,這里將其統(tǒng)一視為傳感器或虛擬傳感器感知的信息,這些觀測值數(shù)據(jù)包括:3個虛擬傳感器Αge、Sex和Cp的觀測值依次為57、1和2,傳感器感知的BP、Restecg、Thalach的觀測值為124(mm Hg)、0(正常)、141;虛擬傳感器Exang的觀測值為0。
傳感器感知的Slope觀測值為1(向上傾斜),感知的Thal的觀測值為7。這些變量的觀測值常按照診斷的領(lǐng)域知識或流程路徑獲取。
利用Matlab求解,數(shù)據(jù)集樣本中的前200個樣本作為證據(jù)鏈系列ECs,剩余的70個樣本作為查詢案例X,獲得查詢案例與證據(jù)鏈的關(guān)聯(lián)相似度。針對證據(jù)鏈EC1-EC8(橫軸)和查詢案例X1-X6(縱軸),計算關(guān)聯(lián)相似度,如圖2所示。
圖2 查詢案例與證據(jù)鏈屬性關(guān)聯(lián)相似度
在模型求解過程中,對查詢案例X1,設(shè)定ε1=0.163 0,求解模型獲得δ1,1=1,δ1,4=1,δ1,5=1,其余的證據(jù)鏈對應(yīng)的解為0;對于查詢案例X2,設(shè)定ε1=0.412 7,求解模型獲得δ2,1=1,δ2,4=1,δ2,4=1,其余的證據(jù)鏈對應(yīng)的解為0。
使用MIOER模型推理X1的結(jié)論為:C2?C1,=34.68%=65.32%。使用文獻[5]中的k-NN(k=1)方法,將其最緊密關(guān)聯(lián)的單個證據(jù)鏈作為信息源,則X1推論為C2,且=100%。使用MIOER模型求解部分查詢結(jié)果,如表1所示。對于輸入決策系統(tǒng)中錯誤標(biāo)識的實例EC’4,它與EC4的推論可信度恰好相反=100%=0。使用證據(jù)鏈EC1,EC’4和EC5推理得到X’1推論:C1?C2且=(81.47+85.07)/(81.47+85.07+68.37)=70.90%=29.10%。Δ2β1=|Δ′β1-Δβ1|=11.76%。決策者根據(jù)這一值和定理3,判斷作用于可信度變化的證據(jù)鏈為EC’4,并據(jù)此檢驗和調(diào)整EC’4,直結(jié)論得滿意結(jié)果。對于X2得到類似結(jié)論。本方法對決策結(jié)果給出對應(yīng)的可信度,與其他方法(如文獻[5]中k-NN(k=1)方法僅給出確切推理的類別結(jié)論)相比,針對存在類別誤標(biāo)的多屬性群決策分類信息源具有更好的決策魯棒性。
表1 使用MIOER模型求解的部分查詢案例
為說明本方法的有效性與優(yōu)點,進一步從理論上將其與現(xiàn)有的其他證據(jù)推理方法比較,如表2所示。
表2 多屬性群決策分類推理方法比較
從類別誤標(biāo)角度,文獻[5]考慮到不確定性類別標(biāo)識的案例而能解決類別部分已知的情況,文獻[7]、文獻[9]均使用精確標(biāo)識的樣本,未考慮樣本誤標(biāo)情形,而本方法考慮了證據(jù)鏈的類別誤標(biāo)情形。從決策信息結(jié)構(gòu)來看,文獻[9]要求決策者提供證據(jù)的可信度分布、規(guī)則前件屬性的精確性等參數(shù),文獻[5]要求提供最緊密的k個案例信息作為證據(jù),k≥1,文獻[7]要求提供作為證據(jù)的所有案例和標(biāo)識類別的可信度,本方法依據(jù)案例、規(guī)則構(gòu)建證據(jù)鏈及其可信度,以關(guān)聯(lián)最緊密的k個證據(jù)鏈提供決策,k≥3。從考慮群決策的信息源權(quán)重角度,文獻[5]、文獻[7]不考慮信息源權(quán)重,文獻[9]和本方法考慮信息源權(quán)重。從決策規(guī)則角度,文獻[5]和本文基于可信度序關(guān)系的決策規(guī)則,文獻[7]采用相似度加權(quán)頻率的決策規(guī)則,文獻[9]采用基于效用的決策規(guī)則。從結(jié)論信息的形式,文獻[7]和文獻[9]給出結(jié)論的類別及其可信度或概率,文獻[5]將決策概率最高的類作為推論,本文給出結(jié)論的可信度序關(guān)系。
群決策分類的可解釋性推理在工程實踐中有著廣泛的應(yīng)用,是一類重要的決策分析問題。決策者依據(jù)經(jīng)驗案例、領(lǐng)域規(guī)則等知識對多屬性決策方案進行類別標(biāo)識,動態(tài)積累決策數(shù)據(jù)并為后續(xù)決策提供證據(jù)。在決策過程中,由于單個決策信息源對問題解釋的不完整性及其提供的證據(jù)信息對查詢案例支持程度不同,常常需要多決策數(shù)據(jù)源共同提供證據(jù),進行信息融合的知識推理。然而,現(xiàn)有的多屬性決策推理方法主要集中在對全部正確標(biāo)識的證據(jù)信息進行決策推理,對證據(jù)信息誤標(biāo)環(huán)境下的推理問題研究不深。為此,本文提出了一個類別誤標(biāo)下證據(jù)鏈推理的多屬性群決策分類方法。與已有的多屬性群決策分類方法相比,本方法最大特點是直接利用信息多決策證據(jù)信息和可信度函數(shù)的一致性和凸性進行推理,避免了誤標(biāo)的單決策信息源作為最接近的決策證據(jù)而出現(xiàn)錯誤推理,并不需要設(shè)置推理邊界參數(shù)。另外,本方法在證據(jù)鏈推理過程中最大限度地考慮了各決策證據(jù)鏈信息和決策權(quán)重,這主要體現(xiàn)在:①將決策證據(jù)鏈與查詢案例之間的關(guān)聯(lián)相似度作為群決策信息源的權(quán)重,優(yōu)化目標(biāo)使得融合可信度最大程度地滿足查詢案例的分類標(biāo)識能力;②在挑選群體證據(jù)鏈集合時,通過混合整數(shù)規(guī)劃模型使得挑選出來的證據(jù)鏈與查詢案例的屬性信息盡可能的接近。同時,文中還證明了該方法依據(jù)可信度序定義的條件,在群決策證據(jù)鏈不少于3個時實現(xiàn)證據(jù)鏈誤標(biāo)下的證據(jù)鏈推理。并通過Heart診斷實例,驗證了本方法的有效性和可行性。在本文中,群決策所提供多源證據(jù)信息已給出可信度完備的分類標(biāo)識,并通過互信息方法計算相似度量的權(quán)值參數(shù),而沒有分析知識庫中證據(jù)鏈感知數(shù)據(jù)的不確定性,以及動態(tài)更新策略和模型參數(shù)的學(xué)習(xí)過程,這類問題是進一步拓展研究的有趣方向。
[1]Ferrucci D,Levas A,Bagchi S,et al.Watson:beyond jeopardy![J].Artificial Intelligence,2013,199/200:93- 105.
[2]Fu C,Yang S.An attribute weight based feedback model for multiple attributive group decision analysis problems with group consensus requirements in evidential reasoning context[J].European Journal of Operational Research,2011,212(1):179- 189.
[3]Hoffmann S,F(xiàn)ischbeck P,Krupnick A,et al.Elicitation from large,heterogeneous expert panels:using multiple uncertainty measures to characterize information quality for decision analysis[J].Decision Analysis,2007,4(2):91- 109.
[4]Kumar K A,Singh Y,Sanyal S.Hybrid approach using casebased reasoning and rule-based reasoning for domain independent clinical decision support in ICU[J].Expert Systems with Applications,2009,36(1):65- 71.
[5]Denoeux T.A k-nearest neighbor classification rule based on Dempster-Shafer theory[J].IEEE Trans.on Systems,Man and Cybernetics,1995,25(5):804- 813.
[6]Denoeux T,Smets P.Classification using belief functions:relationship between case-based and model-based approaches[J].IEEE Trans.on Systems,Man,and Cybernetics,Part B:Cybernetics,2006,36(6):1395- 1406.
[7]Billot A,Gilboa I,Samet D.Probabilities as similarity-weighted frequencies[J].Econometrica,2005,73(4):1125- 1136.
[8]Cai F L,Liao X W.Multi-criteria sorting method with uncertinty in assignment examples[J].Systems Engineering-Theory& Practice,2010,30(3):513- 519.(蔡付齡,廖貅武.案例信息不確定下的多屬性分類方法[J].系統(tǒng)工程理論與實踐,2010,30(3):513- 519.)
[9]Yang J B,Liu J,Wang J,et al.Belief rule-base inference methodology using the evidential reasoning approach-RIMER[J].IEEE Trans.on Systems,Man and Cybernetics,Part A:Systems and Humans,2006,36(2):266- 285.
[10]Chang L L,Li M J,Lu Y J,et al.Structure learning for belief rule base using principal component analysis[J].Systems Engineering-Theory&Practice,2013,33(1):1- 8.(常雷雷,李孟軍,魯延京,等.基于主成分分析的置信規(guī)則庫結(jié)構(gòu)學(xué)習(xí)方法[J].系統(tǒng)工程理論與實踐,2013,33(1):1- 8.)
[11]Xu M,Yu H,Shen J.New algorithm for CBR-RBR fusion with robust thresholds[J].Chinese Journal of Mechanical Engineering,2012,25(6):1255- 1263.
[12]Shen J,Yu H Y,Xu M.Heterogeneous evidence chains based fusion reasoning for multi-attribute group decision making[J].Acta Automatica Sinica,2015,41(4):832- 842.(沈江,余海燕,徐曼.實體異構(gòu)性下證據(jù)鏈融合推理的多屬性群決策[J].自動化學(xué)報,2015,41(4):832- 842.)
[13]Schnoes A M,Brown S D,Dodevski I,et al.Annotation error in public databases:misannotation of molecular function in enzyme superfamilies[J].PLoS Computational Biology,2009,5(12):e1000605.
[14]Clifford G D,Long W J,Moody G B,et al.Robust parameter extraction for decision support using multimodal intensive care data[J].Philosophical Transactions of the Royal Society A:Mathematical,Physical and Engineering Sciences,2009,367:411- 429.
[15]Li Q,Clifford G D.Dynamic time warping and machine learning for signal quality assessment of pulsatile signals[J].Physiological Measurement,2012,33(9):1491- 1501.
[16]Qi L,Wang H P,Xiong W,et al.Track segment association algorithm based on multiple hypothesis models with priori information[J].Systems Engineering and Electronics,2015,37(4):732- 739.(齊林,王海鵬,熊偉,等.基于先驗信息的多假設(shè)模型中斷航跡關(guān)聯(lián)算法[J].系統(tǒng)工程與電子技術(shù),2015,37(4):732- 739.)
[17]Smets P,Kennes R.The transferable belief model[J].Artificial Intelligence,1994,66(2):191- 234.
[18]Wong S K M,Lingras P.Representation of qualitative user preference by quantitative belief functions[J].IEEE Trans.on Knowledge and Data Engineering,1994,6(1):72- 78.
[19]Lehman L,Saeed M,Moody G,et al.Similarity-based searching in multi-parameter time series databases[J].Comput Cardiol,2008,35:653- 656.
[20]Ram A,Santamaría J C.Continuous case-based reasoning[J].Artificial Intelligence,1997,90(12):25- 77.
[21]Xu M,Yu H,Shen J.New approach to eliminate structural redundancy in case resource pools using alpha mutual information[J].Journal of Systems Engineering and Electronics,2013,24(4):768- 777.
[22]Asuncion D N.UCI machine learning repository[EB/OL].[2014- 06- 30].http:∥www.ics.uci.edu/mlearn/MLRepository.html.
ECs-based reasoning for group decision analysis in the mislabeled classification context
YU Hai-yan1,SHEN Jiang1,XU Man2
(1.College of Management and Economics,Tianjin University,Tianjin 300072,China;2.Business School,Nankai University,Tianjin 300071,China)
Considering on the difficulty of interpretable reasoning for group decision in the mislabeled classification context,a method of evidential chains(ECs)-based reasoning for group decision analysis is proposed.Based on the consistency and convexity of the belief function,association similarities between the query case and ECs on their attributes are used as the weights of the multi-source information,and the mixed integer optimization model of ECs-based fusion reasoning is formed to maximize the reasoning performance,achieving the most closely related ECs.For reasoning with the mislabeled instances,this framework facilitates belief preference to induce the conclusion of queries.A diagnostic experiment with multi-source sensory data verifies the efficiency and rationality of the method.
group decision analysis;evidential chains(ECs);association similarity;mislabeled instances;belief preference
TP 273
A
10.3969/j.issn.1001-506X.2015.11.19
余海燕(1987-),男,博士研究生,主要研究方向為證據(jù)推理、CBRRBR智能決策。
E-mail:yhy188@tju.edu.cn
沈 江(1957- ),男,教授,博士,主要研究方向為復(fù)雜系統(tǒng)理論、決策科學(xué)、信息融合。
E-mail:motoshen@163.com
徐 曼(1977- ),女,講師,博士,主要研究方向為大數(shù)據(jù)分析、醫(yī)療工業(yè)工程。
E-mail:twinklexu@163.com
1001-506X(2015)11-2546-08
2014- 07- 30;
2015- 05- 02;網(wǎng)絡(luò)優(yōu)先出版日期:2015- 07- 09。
網(wǎng)絡(luò)優(yōu)先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20150709.1649.003.html 20150709
國家自然科學(xué)基金(71171143,71201087,71571105);天津市科技支撐計劃重點項目(13ZCZDSF01900);中央高校基本科研業(yè)務(wù)費專項資金(NKZXB1458)資助課題