国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于貝葉斯網(wǎng)絡(luò)的復(fù)雜產(chǎn)品設(shè)計過程知識挖掘方法

2015-12-26 08:06:18王明微韓紹歡劉曉晨李曙光
制造業(yè)自動化 2015年24期
關(guān)鍵詞:因果關(guān)系貝葉斯變量

王明微 ,韓紹歡,劉曉晨,李曙光

WANG Ming-wei1 , HAN Shao-huan2 , LIU Xiao-chen3, LI Shu-guang1

(1.西北工業(yè)大學(xué) 現(xiàn)代設(shè)計與集成制造技術(shù)教育部重點實驗室,西安 710072;2.中國空間技術(shù)研究院,北京 100094;3.航天人才開發(fā)交流中心,北京 100830)

0 引言

目前,在我國以衛(wèi)星、飛機為代表的飛行器總體設(shè)計中對功能分析、技術(shù)要求分配等設(shè)計活動,仍然主要依賴于個人經(jīng)驗進行主觀判斷與協(xié)調(diào);嚴格的評審程序只能保證最終設(shè)計結(jié)果的正確性,而忽略了設(shè)計整體實現(xiàn)過程,難以追溯問題產(chǎn)生根源。因此,獲取復(fù)雜產(chǎn)品設(shè)計過程中設(shè)計元素之間的因果知識,將產(chǎn)品開發(fā)過程從依賴個人經(jīng)驗轉(zhuǎn)變?yōu)閲乐敗⒂幸?guī)律可循的科學(xué)實踐,對于提高產(chǎn)品設(shè)計效率和質(zhì)量具有重要意義和作用。

貝葉斯網(wǎng)絡(luò)(Bayesian networks)[1,2]作為數(shù)據(jù)挖掘技術(shù)中的最重要理論工具之一,能夠以條件概率方式確定變量之間的因果依賴關(guān)系,直觀和全面地綜合分析影響決策的所有因素。目前,國內(nèi)外學(xué)者在不同領(lǐng)域?qū)谪惾~斯網(wǎng)絡(luò)的因果知識表達、獲取和推理展開了大量的研究。例如文獻[3]嘗試利用因果圖構(gòu)建貝葉斯網(wǎng)絡(luò),并比較二者異同;文獻[4]給出常見的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)因果關(guān)系知識模型的假設(shè)條件;文獻[5]通過貝葉斯網(wǎng)建立了設(shè)備故障原因與故障模型的因果關(guān)系;文獻[6]針對海岸安全評估問題建立了一個貝葉斯網(wǎng)絡(luò)模型用于表述問題中的因果關(guān)系,并提出了一個五層結(jié)構(gòu)框架用于預(yù)測潛在風(fēng)險。

由于復(fù)雜產(chǎn)品設(shè)計過程是一個涉及多約束、多問題域復(fù)雜問題,在因果傳播機理、內(nèi)部關(guān)聯(lián)關(guān)系及決策過程等方面都有其自身特點,很難直接利用貝葉斯網(wǎng)絡(luò)模型描述復(fù)雜開發(fā)開發(fā)過程,影響了因果知識提取的效果,迫切需要解決以下關(guān)鍵問題:

1)隨著開發(fā)活動的深入,設(shè)計元素間的耦合程度急劇上升,單純依靠設(shè)計人員認知能力無法準確分析出各種設(shè)計狀態(tài)和設(shè)計結(jié)果之間的內(nèi)涵和關(guān)聯(lián)。如何將貝葉斯網(wǎng)絡(luò)的基本要素(節(jié)點、有向邊、概率分布、狀態(tài)、事件等)與復(fù)雜的產(chǎn)品開發(fā)過程關(guān)聯(lián)起來,能夠準確且簡潔地描述設(shè)計元素間不確定的因果關(guān)系,是需要解決的基本問題。

2)雖然一些顯性映射規(guī)則能夠直接建立設(shè)計元素之間的因果聯(lián)系,但是總體來說設(shè)計元素之間的因果映射需要設(shè)計人員根據(jù)設(shè)計原理和自身經(jīng)驗才能建立。這種經(jīng)驗規(guī)則蘊含在設(shè)計實例中,具有模糊性和不確定性。如何將設(shè)計人員的經(jīng)驗信息與歷史設(shè)計數(shù)據(jù)相融合,并充分利用產(chǎn)品開發(fā)特點(例如具有一定的層次性),是提高知識獲取效果的關(guān)鍵。

因此,本文基于分層映射的產(chǎn)品開發(fā)過程思想[7,8],提出基于貝葉斯網(wǎng)絡(luò)的產(chǎn)品開發(fā)過程因果知識表達模型和知識獲取方法,通過融合設(shè)計人員先驗知識和已有產(chǎn)品設(shè)計數(shù)據(jù),從定量和定性二個角度實現(xiàn)設(shè)計要素之間隱含因果關(guān)系的顯性化。

1 基于貝葉斯網(wǎng)絡(luò)的設(shè)計過程因果知識模型

1.1 因果知識模型PDCKM定義

分層映射模型是最常用的產(chǎn)品開發(fā)過程的形式化表達和規(guī)律性描述,它通過將產(chǎn)品開發(fā)過程進行層次劃分,將復(fù)雜問題的求解分解為多個子問題域并進行層次化推理求解[8]。這意味著產(chǎn)品開發(fā)過程因果知識具有一定的層次性。同時,從飛行器總體設(shè)計過程全局角度來看,不僅僅單純關(guān)注于設(shè)計元素間的兩兩映射,總體設(shè)計過程所有設(shè)計元素的因果聯(lián)系呈現(xiàn)出網(wǎng)狀拓撲結(jié)構(gòu)。因此,本文在貝葉斯網(wǎng)絡(luò)的基礎(chǔ)上進行功能擴展,提出一種面向復(fù)雜產(chǎn)品總體設(shè)計的產(chǎn)品開發(fā)過程因果知識模型PDCKM(Product Development Causal Knowledge Model),表達不同問題域各設(shè)計元素的因果影響、因果影響傳遞以及因果影響程度,通過前向節(jié)點對后向節(jié)點狀態(tài)的遞推作用來實現(xiàn)產(chǎn)品開發(fā)過程的模擬。

定義1[產(chǎn)品設(shè)計過程因果知識模型](Product Development Causal Knowledge Model)采用有向圖方式表達開發(fā)過程中各種設(shè)計要素以及其因果關(guān)系的一種知識模型,以三元組來表達,其中:X={X1,…,Xn}是圖中所有節(jié)點對應(yīng)的設(shè)計要素變量集合,表達了產(chǎn)品開發(fā)設(shè)計過程中各種設(shè)計要素及其可行狀態(tài)取值;E={[eij],1≤i≤n,1≤j≤n,i≠j} 是圖中連接各個變量節(jié)點有向邊集合,表示各個變量節(jié)點之間的因果關(guān)系。eij表示一條由節(jié)點Xi到Xj的有向邊,即設(shè)計元素Xi的狀態(tài)變化會影響到設(shè)計元素Xj的狀態(tài)。P={p(Xi|Pa(Xi)}是圖中與各個節(jié)點有關(guān)的條件概率分布,從定量的角度描述了變量節(jié)點之間因果依賴關(guān)系的強度,Pa(Xi)為Xi的父節(jié)點集合。若Pa(Xi)為空,則表示該變量沒有父變量,只需給出其先驗概率分布。

1.2 節(jié)點變量類別

本文基于經(jīng)典的功能-行為-結(jié)構(gòu)層次模型[7],將PDCKM中的節(jié)點變量X劃分為3個無交集的集合:需求域變量子集R、功能域變量子集F、結(jié)構(gòu)域變量子集S,即X=R∪F∪S。

1)需求域變量:需求域節(jié)點表達了用戶對產(chǎn)品的設(shè)計要求,通過質(zhì)量功能配置(QFD)等方法用一組可度量的參數(shù)來明確地描述產(chǎn)品應(yīng)具有的基本需求特性。

2)功能域變量:功能域變量是為完成產(chǎn)品設(shè)計需求所必需具有的最小功能需求元素集合,表達了達到產(chǎn)品設(shè)計需求所必需的一系列行動。

3)結(jié)構(gòu)域變量:結(jié)構(gòu)域變量是滿足功能域變量要求的產(chǎn)品物理結(jié)構(gòu)元素的集,包括硬件類和軟件類。結(jié)構(gòu)域中的每一個元素至少應(yīng)滿足一項功能要求,或功能要求的一部分。當(dāng)然一個結(jié)構(gòu)元素也可滿足多項功能要求。

1.3 有向邊取向原則

PDCKM模型中的有向邊集合E表示父節(jié)點Pa(Xi)對子節(jié)點具有直接因果影響,有向邊的方向是進行決策推理的依據(jù)。為保證使PDCKM內(nèi)含的條件獨立性假設(shè)更為合適,本文基于分層映射模型思想,確定PDCKM中有向邊取向規(guī)則如下:需求域變量只受其他需求變量的影響(即發(fā)生需求分解);功能域變量可以受所有需求域變量以及其他功能域變量影響(即發(fā)生功能分解);需求域變量和功能域變量將共同影響結(jié)構(gòu)域變量。因此,確定PDCKM中有向邊取向規(guī)則如下:

1.4 概率參數(shù)

PDCKM采用為節(jié)點變量計算以其父節(jié)點的狀態(tài)取值為條件的概率分布,表示節(jié)點之間因果關(guān)系的連接強度,對于沒有父節(jié)點的節(jié)點則需要給出其先驗概率。如果有n個設(shè)計要素變量,并且當(dāng)所有的設(shè)計要素變量均取二值時,需要2n-1個參數(shù)才能確定其聯(lián)合概率分布,此計算量相當(dāng)巨大。因此在PDCKM中可以充分利用變量間的條件獨立關(guān)系,將聯(lián)合分布分解成多個復(fù)雜度較低的條件概率分布,有如式(1)所示的聯(lián)合概率計算公式,從而降低概率參數(shù)的表達復(fù)雜度,提高知識獲取效率。

2 因果知識獲取

基于數(shù)據(jù)的貝葉斯結(jié)構(gòu)學(xué)習(xí)已經(jīng)證明為NP-hard問題,本文采用最廣泛應(yīng)用的基于評分-搜索的結(jié)構(gòu)學(xué)習(xí)算法。為在聯(lián)合概率密度函數(shù)逼近程度和有向圖模型復(fù)雜度之間取折衷,采用基于附加懲罰函數(shù)的最大互信息作為評分函數(shù)[9],以改進的爬山算法獲得最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)。

設(shè):Bs是基于數(shù)據(jù)集D構(gòu)建的一個貝葉斯網(wǎng)絡(luò)結(jié)構(gòu),ri是變量Xi是的取值數(shù),是父節(jié)點集Pa(Xi)的配置數(shù)目,則基于附加懲罰函數(shù)的最大互信息評分函數(shù)如式(2)所示:

其中,MI(Xi,Pa(Xi))為Xi和Pa(Xi)的條件互信息,如式(3)所示,文獻[9]已證明使MI(Xi,Pa(Xi))最大的網(wǎng)絡(luò)結(jié)構(gòu)是對聯(lián)合密度p(X1,…,Xn)的最佳逼近;dim(S)指拓撲結(jié)構(gòu)Bs的復(fù)雜度,定義為拓撲結(jié)構(gòu)Bs下有向圖模型參數(shù)的最小數(shù)目

雖然完全基于專家經(jīng)驗建立PDCKM是不現(xiàn)實的,但是我們可以很容易利用專家已有經(jīng)驗知識,提高PDCKM獲取的準確度和速度。這些先驗知識主要包括:1)一個設(shè)計元素將受幾個因素影響,即最大父節(jié)點數(shù)目,記為max(Pa(Xi)) ;2)部分設(shè)計要素變量間的偏序關(guān)系,從而判斷節(jié)點之間的指向。所以本文除了采用爬山算法的加邊算子、減邊算子、換向算子,引入了修正算子,對候選PDCKM的拓撲結(jié)構(gòu)進行修正。修正算子包括3個:1)消除環(huán)狀回路算子:根據(jù)分層映射的產(chǎn)品開發(fā)過程思想,一般不考慮有回路的因果關(guān)系,如圖1(a)所示;2)最大父節(jié)點算子:根據(jù)先驗知識判斷一個設(shè)計要素最大有多少個父節(jié)點,這樣有利于減少搜索空間,如圖1(b)所示;3)修正偏序關(guān)系算子:為了保證因果關(guān)系正確性,改正與先驗知識不符的父子節(jié)點關(guān)系。

圖1 PDCKM參數(shù)學(xué)習(xí)

對于PDCKM參數(shù)學(xué)習(xí),當(dāng)訓(xùn)練樣本集完整時可以采用最大似然估計MLE進行參數(shù)估計,但是當(dāng)樣本數(shù)據(jù)不完整時,如當(dāng)父結(jié)點樣本數(shù)目為0時,MLE算法就會產(chǎn)生溢出問題,從而無法計算。在實際產(chǎn)品開發(fā)過程中,難免有些數(shù)據(jù)缺失。文獻[10]證明了期望最大化算法EM從不完整的數(shù)據(jù)中進行參數(shù)學(xué)習(xí)比較有效,因此本文采用EM算法進行PDCKM參數(shù)學(xué)習(xí)。

在EM算法中第t次迭代過程中,第一步根據(jù)式(4)計算期望對數(shù)似然函數(shù)Q(θ|θt),第二步是求得使Q(θ|θt)最大時候的θ。

當(dāng)θ取以下值時,Q(θ|θt)達到最大其中,其中是修補后數(shù)據(jù)中所有滿足Xi=k和Pa(Xi)=j的樣本的權(quán)重之和。

3 算例分析

本文以信標機系統(tǒng)為例,選取設(shè)計人員感興趣的一組11個設(shè)計要素變量,通過收集國內(nèi)外設(shè)計成功案例,提取出46個樣本作為數(shù)據(jù)集。同時,根據(jù)領(lǐng)域?qū)<医?jīng)驗確定部分先驗知識,包括有向邊的方向(如X1→X6)和最大父節(jié)點數(shù)目(如max(Pa(Xi)=5)。

采用基于最大互信息的啟發(fā)式搜索算法得到PDCKM拓撲結(jié)構(gòu),如圖2所示,可以看出天線(X7)只會載噪比(X8)參數(shù)。

基于所獲取的PDCKM拓撲結(jié)構(gòu),采用EM算法進行PDCKM參數(shù)學(xué)習(xí),獲得PDCKM參數(shù)分布P,部分參數(shù)如表2所示,定量化的描述節(jié)點之間的因果依賴程度。

圖2 PDCKM拓撲結(jié)構(gòu)學(xué)習(xí)結(jié)果

通過實驗結(jié)果,可以全面綜合而直觀的確定產(chǎn)品開發(fā)過程中各設(shè)計因素的因果關(guān)聯(lián)關(guān)系,為進行正確決策奠定基礎(chǔ)。同時,也可以提取概率較大的變量狀態(tài)作為典型設(shè)計案例,為產(chǎn)品開發(fā)過程有規(guī)律可循的科學(xué)實踐。

表2 PDCKM的部分參數(shù)

4 結(jié)束語

復(fù)雜產(chǎn)品開發(fā)過程各種設(shè)計元素因果關(guān)系具有模糊性和不確定性,本文提出了一種基于貝葉斯網(wǎng)絡(luò)的產(chǎn)品開發(fā)過程過程知識提取方法。闡述了產(chǎn)品開發(fā)過程過程因果知識模型基本概念及模型組成部分,然后詳細描述了模型結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)過程,從而能夠依次提取概率較大的變量狀態(tài)作為典型設(shè)計案例,為產(chǎn)品開發(fā)有規(guī)律可循的實現(xiàn)途徑。

[1]Kim K Y,Kim Y S.Causal design knowledge:Alternative representation method for product development knowledge management[J].Computer-Aided Design,2011,43(9):1137-1153.

[2]慕春棣,戴劍彬,葉俊.用于數(shù)據(jù)挖掘的貝葉斯網(wǎng)絡(luò)[J].軟件學(xué)報,2000,11(5):660-666.

[3]Nadkarni S,Shenoy P P.A causal mapping approach to constructing Bayesian networks[J].Decision Support Systems,2004,38(2):259-281.

[4]Eckerman D.A tutorial on learning with Bayesian networks[M].Springer Berlin Heidelberg,2008.

[5]蔡志強,孫樹棟,司書賓,王寧.基于貝葉斯網(wǎng)絡(luò)的不確定環(huán)境裝備故障推理模型[J].西北工業(yè)大學(xué)學(xué)報,2011,29(4):509-514.

[6]Ren J,Jenkinson I,Wang J,Xu D L,Yang J B.A methodology to model causal relationships on offshore safety assessment focusing on human and organizational factors.Journal of Safety Research,2008,39:87-100.

[7]Qian L,Gero J S.Function-Behavior-Structure path and their role in analogy-based design[J].AI EDAM,1996,10(4):289-312.

[8]王玉新,毛曉輝,李添益.功能-結(jié)構(gòu)雙向創(chuàng)新商空間模型關(guān)鍵技術(shù)研究[J].浙江大學(xué)學(xué)報(工學(xué)版),2010,44(8):1570-1578.

[9]李剛.知識發(fā)現(xiàn)的圖模型方法[D].2000.

[10]M.Drudzzel.Qualitative Verbal Explanations Byaesian Belief Networks.In Artificial Intelligence and Simulation of Behaviour Quarterly[J].Special Issue on Bayesian Belief Networks.1996.94:43-54.

猜你喜歡
因果關(guān)系貝葉斯變量
抓住不變量解題
玩忽職守型瀆職罪中嚴重不負責(zé)任與重大損害后果的因果關(guān)系
也談分離變量
做完形填空題,需考慮的邏輯關(guān)系
貝葉斯公式及其應(yīng)用
幫助犯因果關(guān)系芻議
基于貝葉斯估計的軌道占用識別方法
一種基于貝葉斯壓縮感知的說話人識別方法
電子器件(2015年5期)2015-12-29 08:43:15
SL(3,3n)和SU(3,3n)的第一Cartan不變量
介入因素對因果關(guān)系認定的影響
始兴县| 金塔县| 绥化市| 新乡市| 武宁县| 珲春市| 舟曲县| 宜城市| 高清| 佛山市| 临泉县| 自贡市| 吴江市| 梓潼县| 彩票| 大同市| 枣庄市| 双柏县| 花莲市| 梨树县| 成武县| 垦利县| 南安市| 乌审旗| 花莲市| 万山特区| 黄大仙区| 永胜县| 大足县| 大埔县| 平果县| 景德镇市| 建平县| 江孜县| 涞水县| 长寿区| 故城县| 马鞍山市| 台江县| 阿勒泰市| 蛟河市|