王宏,于勇 ,印璞,趙罡,3,王偉
(1.北京航空航天大學(xué) 機(jī)械工程及自動(dòng)化學(xué)院,北京100191; 2.中國(guó)空間技術(shù)研究院 通信衛(wèi)星事業(yè)部,北京100094;3.北京航空航天大學(xué) 北京市高效綠色數(shù)控加工工藝及裝備工程技術(shù)研究中心,北京100191)
隨著數(shù)字化技術(shù)水平的不斷提高,以航空航天為代表的大型裝備制造業(yè)逐漸采用了基于模型定義(MBD)的全三維數(shù)字化設(shè)計(jì)制造方法[1].國(guó)內(nèi)外針對(duì)MBD 技術(shù)的應(yīng)用進(jìn)行大量研究,文獻(xiàn)[2]在波音MBD 應(yīng)用技術(shù)基礎(chǔ)上,詳細(xì)闡述了基于模型定義的技術(shù)體系框架以及基本的定義方法和數(shù)據(jù)組織原則,文獻(xiàn)[3]則對(duì)MBD 標(biāo)注信息表達(dá)及多視圖過(guò)濾做了大量研究.這些研究為MBD 技術(shù)的應(yīng)用和推廣起到了重要的作用,MBD 數(shù)據(jù)集也逐漸成為產(chǎn)品研制過(guò)程中數(shù)據(jù)傳遞的唯一依據(jù)[2].然而,在實(shí)際應(yīng)用過(guò)程中,隨著時(shí)間積累,企業(yè)構(gòu)建的MBD 數(shù)據(jù)集數(shù)目呈爆炸性增長(zhǎng),這些數(shù)據(jù)集是大量的設(shè)計(jì)人員智慧和知識(shí)的結(jié)晶,如何獲取歷史數(shù)據(jù)集中有用的知識(shí)和經(jīng)驗(yàn)是每一個(gè)企業(yè)迫切需要解決的問(wèn)題.
對(duì)于產(chǎn)品研制過(guò)程中知識(shí)的發(fā)現(xiàn)、存儲(chǔ)、共享和推薦過(guò)程有很多專家和學(xué)者進(jìn)行了大量的研究.在MBD 定義過(guò)程中,也引入了相關(guān)的理論,其中,文獻(xiàn)[4]闡述一種通過(guò)構(gòu)建本體知識(shí)庫(kù)對(duì)MBD 數(shù)據(jù)集進(jìn)行分類管理方法.文獻(xiàn)[5]則進(jìn)一步提出了基于模型定義的工藝知識(shí)表示方法及工藝決策方法.然而這些知識(shí)的獲取方法大多是針對(duì)已知的、顯式的知識(shí)進(jìn)行處理,而針對(duì)隱含的、先前未知的經(jīng)驗(yàn)和規(guī)則的獲取大多通過(guò)專家系統(tǒng)通過(guò)集成研討廳的方式進(jìn)行提取[6],并且大多停留在理論階段,工程的可用性不好.本文則針對(duì)MBD 數(shù)據(jù)集中工程注釋信息進(jìn)行結(jié)構(gòu)化管理,通過(guò)統(tǒng)一編碼,利用關(guān)聯(lián)規(guī)則挖掘的方法分析MBD構(gòu)建歷史記錄中工程注釋信息,從而得到工程注釋間隱含的、對(duì)決策有潛在價(jià)值的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)對(duì)MBD 數(shù)據(jù)集定義過(guò)程中工程注釋信息的推薦.
基于模型定義是指用集成的三維實(shí)體模型來(lái)完整表達(dá)產(chǎn)品定義的方法,是將原來(lái)定義在二維圖紙上的幾何形狀、尺寸與公差以及工藝等產(chǎn)品信息,集成定義在三維實(shí)體模型中[7].由于MBD技術(shù)要求使用三維實(shí)體模型作為生產(chǎn)制造過(guò)程中的唯一依據(jù),這樣就要求產(chǎn)品數(shù)字化定義信息必須按照MBD 技術(shù)標(biāo)準(zhǔn)進(jìn)行分類組織和管理,來(lái)滿足產(chǎn)品研制過(guò)程中的各個(gè)階段對(duì)數(shù)據(jù)的需求.一個(gè)完整的MBD 數(shù)據(jù)集應(yīng)該包括產(chǎn)品的三維幾何信息、設(shè)計(jì)參考、尺寸、公差和工藝等信息,圖1所示為完整MBD 數(shù)據(jù)集應(yīng)包含的信息及其組織結(jié)構(gòu).
圖1 MBD 數(shù)據(jù)集組成元素Fig.1 Components of MBD dataset
MBD 數(shù)據(jù)集中包含了產(chǎn)品研制過(guò)程中大量的工藝、制造和檢驗(yàn)信息,因此,MBD 數(shù)據(jù)集中相關(guān)的非幾何信息必須按照一定的格式編輯,并進(jìn)行合理的存儲(chǔ)管理,以便后續(xù)的數(shù)字化制造系統(tǒng)無(wú)需人工干預(yù)就能夠有效讀取和識(shí)別這些工程注釋信息[8].因此,由計(jì)算機(jī)對(duì)所有工程注釋項(xiàng)統(tǒng)一編碼和發(fā)布.經(jīng)計(jì)算機(jī)發(fā)布的單條工程注釋被稱為工程注釋項(xiàng).如表1 所示,工程注釋項(xiàng)主要由“編碼”、“標(biāo)注內(nèi)容”和“URL”構(gòu)成.其中,“編碼”具有唯一性,以便工程注釋項(xiàng)被不同的數(shù)字化系統(tǒng)識(shí)別;“標(biāo)注內(nèi)容”則是對(duì)工程注釋項(xiàng)的簡(jiǎn)要描述信息;“URL”則連接產(chǎn)品研制過(guò)程中相關(guān)標(biāo)準(zhǔn)和規(guī)范,或者該工程注釋項(xiàng)的詳細(xì)要求信息,表明工程注釋項(xiàng)來(lái)源和依據(jù).
表1 工程注釋項(xiàng)Table 1 Engineering note item
Agrawal 等[9]于1993 年首先提出了挖掘顧客交易數(shù)據(jù)庫(kù)中項(xiàng)集間的關(guān)聯(lián)規(guī)則問(wèn)題,此后人們對(duì)關(guān)聯(lián)規(guī)則的挖掘進(jìn)行了大量研究,其核心都是基于頻集理論的遞推方法.設(shè)I={i1,i2,…,in}是所有項(xiàng)的集合.給定一個(gè)事務(wù)數(shù)據(jù)庫(kù)D,其中的每一個(gè)事務(wù)T 是項(xiàng)集I 中一些元素的集合,在事務(wù)數(shù)據(jù)庫(kù)中相當(dāng)于歷史數(shù)據(jù)記錄,即T?I.一條關(guān)聯(lián)規(guī)則就是形如A ?B 的蘊(yùn)含式,其中A ?I,B?I,并且A∩B=?,其支持度Ssup和置信度Cconf表示為:Ssup(A)=P(A);Cconf(A?B)=P(B|A).對(duì)于同時(shí)滿足最小支持度(Smin_sup)和最小置信度(Cmin_conf)的關(guān)聯(lián)規(guī)則,就是可以作為知識(shí)輸出的強(qiáng)關(guān)聯(lián)規(guī)則[10].
生成頻繁項(xiàng)集是關(guān)聯(lián)規(guī)則挖掘的第一步,在很大程度上決定著整體的挖掘效率[11].它通過(guò)計(jì)算事務(wù)數(shù)據(jù)庫(kù)中各種項(xiàng)集組合的最小支持度,判斷是否為頻繁項(xiàng)集.一旦從數(shù)據(jù)庫(kù)中找出所有頻繁項(xiàng)集,則可以從頻繁項(xiàng)集中提取關(guān)聯(lián)規(guī)則,通過(guò)設(shè)置最小置信度的約束,進(jìn)而獲取強(qiáng)關(guān)聯(lián)規(guī)則.
在MBD 數(shù)據(jù)集定義過(guò)程中,所有項(xiàng)的集合I對(duì)應(yīng)于企業(yè)標(biāo)準(zhǔn)管理系統(tǒng)中所有的工程注釋項(xiàng).事務(wù)數(shù)據(jù)庫(kù)D 對(duì)應(yīng)產(chǎn)品研制過(guò)程中MBD 數(shù)據(jù)集創(chuàng)建的所有歷史記錄,記錄了MBD 數(shù)據(jù)集代號(hào)及引用的工程注釋項(xiàng)編碼,如表2 所示,每一條歷史記錄都構(gòu)成事務(wù)數(shù)據(jù)庫(kù)中的一個(gè)事務(wù),MBD 數(shù)據(jù)集代號(hào)作為該事務(wù)的唯一事務(wù)碼.
表2 MBD 數(shù)據(jù)集構(gòu)建歷史記錄Table 2 Created history record of MBD dataset
挖掘頻繁項(xiàng)集的經(jīng)典算法是Apriori 算法和Frequent Pattern-growth (FP-growth)算 法.由 于Apriori 算法在生成頻繁項(xiàng)集前需要對(duì)數(shù)據(jù)庫(kù)進(jìn)行多次掃描,同時(shí)產(chǎn)生大量的候選頻繁集,導(dǎo)致Apriori 算法時(shí)間和空間復(fù)雜度較大[12].由此,Han[13]提出了FP-Growth 算法.FP-Growth 算法只需要掃描2 次數(shù)據(jù)庫(kù):第1 次掃描數(shù)據(jù)庫(kù),得到一維頻繁項(xiàng)集;第2 次掃描數(shù)據(jù)庫(kù),利用一維頻繁項(xiàng)集過(guò)濾數(shù)據(jù)庫(kù)中的非頻繁項(xiàng),同時(shí)生成FP 樹.由于FP 樹蘊(yùn)涵了所有的頻繁項(xiàng)集,其后的頻繁項(xiàng)集的挖掘只需要在FP 樹上進(jìn)行.本文采用FP-growth算法,其基本思路[14]為:
1)對(duì)事務(wù)數(shù)據(jù)庫(kù)進(jìn)行第1 遍掃描,利用數(shù)據(jù)庫(kù)中的事務(wù)集構(gòu)造一棵頻繁模式樹(Frequent Pattern-tree,F(xiàn)P-tree).
2)將FP-tree 分化成一些條件模式基,即包含F(xiàn)P-Tree 中與后綴模式一起出現(xiàn)的前綴路徑的集合,然后在對(duì)這些條件模式基重復(fù)以上過(guò)程,直到構(gòu)造的新FP-tree 為空,或者只包含一條路徑.
3)枚舉所有可能組合并與此樹的前綴連接即可得到頻繁項(xiàng)集.
以表2 的MBD 數(shù)據(jù)集構(gòu)建歷史記錄表為例使用FP-growth 算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘.首先,對(duì)事務(wù)數(shù)據(jù)進(jìn)行第1 次掃描,導(dǎo)出頻繁1 項(xiàng)集和支持度計(jì)數(shù),假設(shè)最小支持度計(jì)數(shù)為2.然后將頻繁1 項(xiàng)集按支持度計(jì)數(shù)遞減順序排序,結(jié)果集記為L(zhǎng).于是,就有 L = {{5SN01282:7 },{5SN00791:6 },{5SN00323:6},{5DN00214:2},{5PN01365:2}}.
然后,創(chuàng)建頻繁模式樹FP-tree.首先創(chuàng)建樹的根節(jié)點(diǎn),用“Null”標(biāo)記.接著第2 次掃描事務(wù)數(shù)據(jù)庫(kù).每個(gè)事務(wù)數(shù)據(jù)中的項(xiàng)按L 中支持度計(jì)數(shù)排列次序進(jìn)行重新排序,然后并對(duì)每一個(gè)事務(wù)創(chuàng)建一個(gè)分支.例如掃描第1 條事務(wù)數(shù)據(jù)“FDHZ1008-4B_5-13:{5SN00791,5SN01282,5PN01365}”按L中支持度計(jì)數(shù)排序后可表示為“{5SN01282,5SN00791,5PN01365}”,使FP-tree 包含3 個(gè)節(jié)點(diǎn)的第1 個(gè)分支<5SN01282 >,<5SN00791 >,<5PN01365 >,其中“5SN01282”作為根的子女鏈接 到 根,“5SN00791”鏈 接 到“5SN01282”,“5PN01365”鏈接到“5SN00791”,依次類推,最終構(gòu)建頻繁模式樹FP-tree,如圖2 所示,左邊表示表頭項(xiàng),樹中相同項(xiàng)的節(jié)點(diǎn)要鏈接起來(lái),其中每個(gè)節(jié)點(diǎn)數(shù)字代表對(duì)應(yīng)項(xiàng)在該節(jié)點(diǎn)支持度計(jì)數(shù).
圖2 頻繁模式樹Fig.2 Frequent pattern-tree
最后可通過(guò)對(duì)FP-tree 的挖掘獲得頻繁項(xiàng)集.首先在構(gòu)造的整個(gè)事務(wù)數(shù)據(jù)庫(kù)的頻繁模式樹上進(jìn)行條件模式基的挖掘,縱向沿著表頭向上,也就是按照表頭中頻繁1 項(xiàng)集支持度計(jì)數(shù)的升序方向,優(yōu)先遍歷頭表,同時(shí)橫向遍歷其所對(duì)應(yīng)的鏈表域,并對(duì)該鏈表域節(jié)點(diǎn)縱向向上遍歷直到根結(jié)點(diǎn)停止,即得到一個(gè)序列,這個(gè)序列就是條件模式基.接著,對(duì)條件模式基繼續(xù)建立局部FP-tree.直到生成只包含單個(gè)分支的FP-tree,通過(guò)枚舉所有可能組合并與此樹的前綴連接即可得到頻繁項(xiàng)集.表3 給出通過(guò)挖掘條件模式基生成頻繁項(xiàng)集.
表3 生成頻繁項(xiàng)集Table 3 Generate frequent item set
當(dāng)在事務(wù)數(shù)據(jù)中找出所有頻繁項(xiàng)集,可通過(guò)最小置信度過(guò)濾出強(qiáng)關(guān)聯(lián)規(guī)則.置信度可用式(1)[15]計(jì)算:
條件概率用項(xiàng)集支持度計(jì)數(shù)表示,其中,Ssup_count(A∪B)是包含項(xiàng)集A∪B 的事務(wù)數(shù),而Ssup_count(A)是包含項(xiàng)集A 的事務(wù)數(shù).
設(shè)定最小置信度,關(guān)聯(lián)規(guī)則的生成為:
1)對(duì)于每個(gè)頻繁項(xiàng)集L,產(chǎn)生L 的所有非空子集.
根據(jù)規(guī)則包含工程注釋項(xiàng)的數(shù)目,對(duì)于關(guān)聯(lián)規(guī)則A?B 可以是一對(duì)一、一對(duì)多、多對(duì)一和多對(duì)多的關(guān)系,由于在MBD 數(shù)據(jù)集工程注釋項(xiàng)推薦中,各工程注釋項(xiàng)相比電子商務(wù)商品項(xiàng)之間具有更強(qiáng)的邏輯性和規(guī)律性,為了提高推薦準(zhǔn)確性和推薦效率,本文僅保留一對(duì)一和多對(duì)一的關(guān)聯(lián)規(guī)則.對(duì)于表3中的頻繁項(xiàng)集{5SN01282,5SN00791,5PN01365},提取關(guān)聯(lián)規(guī)則如表4所示.
表4 關(guān)聯(lián)規(guī)則提取Table 4 Extraction of association rules
若設(shè)定最小置信度為0.7,則關(guān)聯(lián)規(guī)則{5PN01365,5SN00791 } ? {5SN01282 },{5PN01365,5SN01282}?{5SN00791}為強(qiáng)關(guān)聯(lián)規(guī)則.
推薦是系統(tǒng)根據(jù)當(dāng)前MBD 數(shù)據(jù)集已經(jīng)添加的工程注釋項(xiàng),與規(guī)則庫(kù)中規(guī)則前項(xiàng)進(jìn)行匹配,推薦規(guī)則后項(xiàng)過(guò)程.對(duì)于關(guān)聯(lián)規(guī)則A?B,關(guān)聯(lián)規(guī)則前項(xiàng)為當(dāng)前已經(jīng)添加到MBD 數(shù)據(jù)集中的工程注釋項(xiàng)的非空子集,關(guān)聯(lián)規(guī)則后項(xiàng)為系統(tǒng)推薦工程注釋項(xiàng).因此,工程注釋項(xiàng)推薦為根據(jù)當(dāng)前MBD數(shù)據(jù)集已經(jīng)添加的工程注釋項(xiàng)的非空子集作為規(guī)則前項(xiàng)提取規(guī)則后項(xiàng),進(jìn)而根據(jù)規(guī)則置信度大小產(chǎn)生top-n 推薦序列的過(guò)程,算法步驟為:①對(duì)每個(gè)當(dāng)前MBD 數(shù)據(jù)集u,設(shè)置一個(gè)候選推薦集Pu,并將候選推薦集Pu初始化為空.②對(duì)每個(gè)當(dāng)前MBD 數(shù)據(jù)集u,搜索規(guī)則數(shù)據(jù)庫(kù),找出該MBD數(shù)據(jù)集支持的所有關(guān)聯(lián)規(guī)則集合Ru,且關(guān)聯(lián)規(guī)則前項(xiàng)的所有工程注釋項(xiàng)出現(xiàn)在當(dāng)前MBD 數(shù)據(jù)集u 已經(jīng)添加的工程注釋項(xiàng)中.③將關(guān)聯(lián)規(guī)則集合Ru右部的所有工程注釋項(xiàng)加入候選推薦集Pu.④從候選推薦集Pu刪除當(dāng)前MBD 數(shù)據(jù)集已經(jīng)添加的工程注釋項(xiàng).⑤對(duì)候選推薦集Pu中所有候選項(xiàng)根據(jù)置信度值進(jìn)行排序,如果一個(gè)項(xiàng)在多條關(guān)聯(lián)規(guī)則中出現(xiàn),則選擇置信度值最高的關(guān)聯(lián)規(guī)則作為排序標(biāo)準(zhǔn).⑥從候選推薦集Pu中選擇置信度最高的前N 個(gè)項(xiàng)作為推薦結(jié)果返回.
基于關(guān)聯(lián)規(guī)則的MBD 數(shù)據(jù)集定義系統(tǒng)主要由對(duì)工程注釋進(jìn)行管理的集成標(biāo)準(zhǔn)管理模塊,離線關(guān)聯(lián)規(guī)則挖掘模塊、在線MBD 數(shù)據(jù)集定義模塊組成.圖3 為系統(tǒng)功能框架.
圖3 MBD 數(shù)據(jù)集定義系統(tǒng)框架Fig.3 Frame of MBD dataset definition system
1)集成標(biāo)準(zhǔn)管理模塊.
集成標(biāo)準(zhǔn)管理模塊管理產(chǎn)品研制過(guò)程中所有設(shè)計(jì)、工藝、制造和檢驗(yàn)的技術(shù)要求及相關(guān)標(biāo)準(zhǔn),以及相關(guān)工程注釋項(xiàng),任何授權(quán)的單位和研制人員都能夠進(jìn)行檢索,進(jìn)而保證產(chǎn)品研制過(guò)程中不同研制單位生成MBD 數(shù)據(jù)集可以被數(shù)字化設(shè)備有效的讀取和識(shí)別,也為實(shí)現(xiàn)工程注釋項(xiàng)挖掘和推薦的前提.同時(shí),在CATIA 中開發(fā)與集成標(biāo)準(zhǔn)管理模塊的接口,使得設(shè)計(jì)人員在CATIA 可以調(diào)用集成標(biāo)準(zhǔn)管理模塊中工程注釋項(xiàng),完成工程注釋項(xiàng)編輯.集成標(biāo)準(zhǔn)管理模塊主界面如圖4所示.
2)關(guān)聯(lián)規(guī)則挖掘模塊
由于關(guān)聯(lián)規(guī)則是以大量MBD 創(chuàng)建歷史記錄數(shù)據(jù)為基礎(chǔ)進(jìn)行分析,并且采用關(guān)聯(lián)規(guī)則挖掘生成頻繁項(xiàng)集的過(guò)程非常耗時(shí),因此采用離線處理方法對(duì)歷史記錄進(jìn)行挖掘.在長(zhǎng)期使用過(guò)程中,企業(yè)會(huì)根據(jù)自身實(shí)際情況會(huì)對(duì)自己的產(chǎn)品研制體系進(jìn)行變更、廢止或更新一部分工程注釋項(xiàng),因此首先要對(duì)MBD 創(chuàng)建歷史記錄中數(shù)據(jù)進(jìn)行清洗,去除一些無(wú)意義和噪聲數(shù)據(jù).然后再對(duì)清洗后的數(shù)據(jù)采用關(guān)聯(lián)規(guī)則算法對(duì)處理過(guò)的數(shù)據(jù)進(jìn)行挖掘,進(jìn)而生成強(qiáng)關(guān)聯(lián)規(guī)則.最后將獲取的強(qiáng)關(guān)聯(lián)規(guī)則導(dǎo)入關(guān)聯(lián)規(guī)則數(shù)據(jù)庫(kù)中.關(guān)聯(lián)規(guī)則挖掘模塊用戶界面如圖5 所示.
對(duì)于關(guān)聯(lián)規(guī)則存儲(chǔ)一般包含5 個(gè)部分:規(guī)則前項(xiàng)、規(guī)則后項(xiàng)、支持度、置信度和規(guī)則生成時(shí)間.工程注釋項(xiàng)推薦過(guò)程,也是MBD 數(shù)據(jù)集中當(dāng)前工程注釋項(xiàng)與規(guī)則前項(xiàng)匹配,獲取規(guī)則后項(xiàng)過(guò)程.表5為關(guān)聯(lián)規(guī)則表結(jié)構(gòu).
圖4 集成標(biāo)準(zhǔn)管理模塊主界面Fig.4 Main interface of integrated standard management module
圖5 關(guān)聯(lián)規(guī)則挖掘模塊Fig.5 Association rule mining module
表5 關(guān)聯(lián)規(guī)則表結(jié)構(gòu)Table 5 Structure of association rules table
3)MBD 數(shù)據(jù)集定義模塊.
MBD 數(shù)據(jù)集定義模塊包含MBD 數(shù)據(jù)集工程注釋項(xiàng)編輯及推薦功能.工程注釋項(xiàng)編輯功能可以通過(guò)添加或刪除相關(guān)工程注釋信息完成MBD數(shù)據(jù)集構(gòu)建.工程注釋項(xiàng)推薦功能通過(guò)讀取當(dāng)前MBD 數(shù)據(jù)集已經(jīng)添加的工程注釋項(xiàng),以當(dāng)前MBD 數(shù)據(jù)集中工程注釋項(xiàng)非空子集作為規(guī)則前項(xiàng),以規(guī)則庫(kù)中關(guān)聯(lián)規(guī)則后項(xiàng)為推薦內(nèi)容,生成推薦序列,進(jìn)而顯示在工程注釋項(xiàng)編輯界面中.圖6為系統(tǒng)工程注釋項(xiàng)的推薦界面.
本文將系統(tǒng)部署某航天企業(yè),利用該企業(yè)現(xiàn)有MBD 構(gòu)建歷史記錄為數(shù)據(jù)源,進(jìn)行關(guān)聯(lián)規(guī)則挖掘,獲取強(qiáng)關(guān)聯(lián)規(guī)則,并以某型號(hào)支架體MBD 數(shù)據(jù)集構(gòu)建為例,對(duì)系統(tǒng)有效性進(jìn)行驗(yàn)證.
1)關(guān)聯(lián)規(guī)則挖掘.
統(tǒng)計(jì)該企業(yè)于此相關(guān)工程注釋項(xiàng)共計(jì)134 條,在MBD 數(shù)據(jù)集構(gòu)建歷史記錄中選擇相關(guān)歷史數(shù)據(jù)記錄1 000 條,設(shè)置支持度為0.1,置信度為0.3,并以此1 000 條數(shù)據(jù)為基礎(chǔ)進(jìn)行關(guān)聯(lián)規(guī)則挖掘.圖7 為系統(tǒng)關(guān)聯(lián)規(guī)則挖掘的結(jié)果報(bào)告.
圖6 工程注釋項(xiàng)的推薦Fig.6 Recommendation of engineering note items
圖7 關(guān)聯(lián)規(guī)則挖掘結(jié)果報(bào)告Fig.7 Result report of association rule mining
2)工程注釋項(xiàng)推薦.
該支架體主要由4 塊蜂窩夾層復(fù)合材料板,2根支撐桿以及若干連接件組成.以該支架體為驗(yàn)證對(duì)象,對(duì)系統(tǒng)推薦有效性進(jìn)行評(píng)價(jià).設(shè)完成當(dāng)前編輯中MBD 數(shù)據(jù)集一共需添加n 項(xiàng)工程注釋項(xiàng),在系統(tǒng)當(dāng)前刷新中,數(shù)據(jù)集中已包含工程注釋項(xiàng)數(shù)目為m,推薦給用戶的工程注釋項(xiàng)數(shù)目為a,其中包含有效推薦項(xiàng)數(shù)目為b,則當(dāng)前系統(tǒng)推薦效率即有效推薦項(xiàng)占系統(tǒng)給出推薦項(xiàng)百分比η=a/b×100%,推薦準(zhǔn)確率即系統(tǒng)當(dāng)前刷新推薦有效項(xiàng)占數(shù)據(jù)集仍然缺少工程注釋項(xiàng)百分比R =b/(n-m)×100%.該支架體零件MBD 數(shù)據(jù)集所包含工程注釋項(xiàng)均在7 ~10 之間,取1 ~8 為數(shù)據(jù)統(tǒng)計(jì)區(qū)間,計(jì)算工程注釋項(xiàng)推薦效率及其準(zhǔn)確率,求平均值,分析結(jié)果統(tǒng)計(jì)如圖8 所示.
如圖8 可知,系統(tǒng)推薦的準(zhǔn)確性隨當(dāng)前所編輯的MBD 數(shù)據(jù)集中包含的工程注釋項(xiàng)的增加而增加.而當(dāng)MBD 數(shù)據(jù)集的編輯即將完成,在系統(tǒng)每次推薦工程注釋項(xiàng)數(shù)目不變條件下,包含有效項(xiàng)隨之減少,推薦效率降低.
圖8 推薦效率及準(zhǔn)確率統(tǒng)計(jì)Fig.8 Statistics of recommendation efficiency and accuracy rate
本文從應(yīng)用角度出發(fā),通過(guò)對(duì)MBD 數(shù)據(jù)集創(chuàng)建過(guò)程的歷史記錄進(jìn)行關(guān)聯(lián)規(guī)則挖掘,獲取工程注釋項(xiàng)間潛在的關(guān)聯(lián)關(guān)系,從而實(shí)現(xiàn)MBD 創(chuàng)建過(guò)程中相關(guān)工程注釋項(xiàng)的推薦,實(shí)際應(yīng)用中表明:
1)其相較于傳統(tǒng)的MBD 定義方法,在選擇注釋項(xiàng)準(zhǔn)確性及其效率上都有所提高,具有很好的工程可操作性.
2)本文所采用的單維單層次挖掘方法在準(zhǔn)確性和效率上還有待于改善和提高,后續(xù)的研究工作可以嘗試采用分層多維度關(guān)聯(lián)挖掘的方法,以提高挖掘質(zhì)量和效率.
此外,該方法不僅可以用于MBD 數(shù)據(jù)集的定義過(guò)程,也可以利用關(guān)聯(lián)規(guī)則庫(kù)中工程注釋項(xiàng)間關(guān)聯(lián)關(guān)系及其關(guān)聯(lián)強(qiáng)度實(shí)現(xiàn)MBD 數(shù)據(jù)集正確性和完整性檢查,為提高M(jìn)BD 建模質(zhì)量提供了另一種解決思路.
References)
[1] Alemanni M,Destefanis F,Vezzetti E.Model-based definition design in the product lifecycle management scenario[J].The International Journal of Advanced Manufacturing Technology,2011,52(1-4):1-14.
[2] 范玉青.基于模型定義技術(shù)及其實(shí)施[J].航空制造技術(shù),2012(6):42-47.
Fan Y Q.Model based definition technology and its practices[J].Aeronautical Manufacturing Technology,2012(6):42-47(in Chinese).
[3] Camba J,Contero M,Johnson M,et al.Extended 3D annotations as a new mechanism to explicitly communicate geometric design intent and increase CAD model reusability[J].Computer-Aided Design,2014,57(1):61-73.
[4] Zhang H J,Zhang S,Yan Q.Study on the archives management system of aviation products based on MBD[J].Applied Mechanics and Materials,2013,321-324:2396-2399.
[5] Wan N,Mo R,Liu L,et al.New methods of creating MBD process model:On the basis of machining knowledge[J].Computers in Industry,2014,65(4):537-549.
[6] Park D H,Kim H K,Choi I Y,et al.A literature review and classification of recommender systems research[J].Expert Systems with Applications,2012,39(11):10059-10072.
[7] Clark B,Gerald B,David S,et al.Model based definition,AIAA-2010-3138[R].Reston:AIAA,2010.
[8] 馮國(guó)成,梁艷,于勇,等.基于模型定義的數(shù)據(jù)組織與系統(tǒng)實(shí)現(xiàn)[J].航空制造技術(shù),2011(9):62-66.
Feng G C,Liang Y,Yu Y,et al.Dataorganization and system implementation of model based definition[J].Aeronautical Manufacturing Technology,2011(9):62-66(in Chinese).
[9] Agrawal R,Imieliński T,Swami A.Mining association rules between sets of items in large databases[C]∥Proceedings of the 1993 ACM SIGMOD.Washington,D.C.:ACM Press,1993:207-216.
[10] Bobadilla J,Ortega F,Hernando A,et al.Recommender systems survey[J].Knowledge-Based Systems,2013,46(1):109-132.
[11] 高建煌.個(gè)性化推薦系統(tǒng)技術(shù)與應(yīng)用[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2010.
Gao J H.Technology and application of personalized recommender systems[D].Hefei:University of Science and Technology of China,2010(in Chinese).
[12] 鮑玉斌,王大玲,于戈.關(guān)聯(lián)規(guī)則和聚類分析在個(gè)性化推薦中的應(yīng)用[J].東北大學(xué)學(xué)報(bào):自然科學(xué)版,2008,24(12):1149-1152.
Bao Y B,Wang D L,Yu G.Application of association rules and clustering analysis to personalized recommendation[J].Journal of Northeastern University:Natural Scienee,2008,24(12):1149-1152(in Chinese).
[13] Han J W.Miniing frequent patterns without candidate generation[C]∥Proceedings of the 2000 ACM SIGMOD Internal Conference on Management of Data.Washington,D.C.:ACM Press,2000:1-12.
[14] 莫同,褚偉杰,李偉平,等.一種基于擴(kuò)展FP-TREE 的服務(wù)推薦方法[J].華中科技大學(xué)學(xué)報(bào):自然科學(xué)版,2013,41(增刊Ⅱ):81-87.
Mo T,Zhu W J,Li W P,et al.A service recommended method based on extended FP-TREE[J].Journal of Huazhong University of Science and Technology:Natural Science Edition,2013,41(Supp1.Ⅱ):81-87(in Chinese).
[15] Lin W,Alvarez S A,Ruiz C.Efficient adaptive-support association rule mining for recommender systems[J].Data Mining and Knowledge Discovery,2002,6(1):83-105.