徐河杭
摘 要:為了系統(tǒng)化地挖掘和利用PLM產(chǎn)生的大量數(shù)據(jù),支持企業(yè)產(chǎn)品設(shè)計(jì)、制造、銷售服務(wù)等各階段的協(xié)調(diào)和面向PLM的決策,對(duì)面向PLM的數(shù)據(jù)挖掘技術(shù)進(jìn)行研究。首先建立了一個(gè)面向產(chǎn)品生命周期的數(shù)據(jù)挖掘體系結(jié)構(gòu);其次研究了各層次的編碼模型和字典設(shè)計(jì);然后研究了如何快速選擇數(shù)據(jù)源和數(shù)據(jù)挖掘方法模型;最后進(jìn)行了面向PLM的數(shù)據(jù)挖掘系統(tǒng)實(shí)現(xiàn)和實(shí)例應(yīng)用。
關(guān)鍵詞:PLM;數(shù)據(jù)挖掘;編碼模型;挖掘需求
1 引言
隨著PLM(product lifecycle management,產(chǎn)品生命周期管理)在制造企業(yè)中的應(yīng)用,對(duì)數(shù)據(jù)挖掘在制造企業(yè)的應(yīng)用也提出了新的需求。郭國(guó)印進(jìn)行了數(shù)據(jù)挖掘技術(shù)及其在PLM中的應(yīng)用研究,主要研究了PLM系統(tǒng)的理論和發(fā)展,數(shù)據(jù)挖掘過(guò)程中的數(shù)據(jù)預(yù)處理方法,根據(jù)業(yè)務(wù)數(shù)據(jù)闡述了某些算法應(yīng)用于PLM系統(tǒng)的具體思路,最后簡(jiǎn)單設(shè)計(jì)實(shí)現(xiàn)了PLM數(shù)據(jù)挖掘系統(tǒng)。其他多數(shù)數(shù)據(jù)挖掘的研究主要是從企業(yè)的某個(gè)角度或是某個(gè)層面上對(duì)一些問(wèn)題進(jìn)行分散和孤立的研究與應(yīng)用,并沒(méi)有涉及企業(yè)PLM。
如何從產(chǎn)品生命周期的角度,對(duì)企業(yè)各個(gè)環(huán)節(jié)的數(shù)據(jù)進(jìn)行分析和挖掘,發(fā)現(xiàn)隱含在大量數(shù)據(jù)背后的信息和知識(shí),將基礎(chǔ)數(shù)據(jù)轉(zhuǎn)化為滿足各部門(mén)和企業(yè)領(lǐng)導(dǎo)需要的信息和知識(shí)。另一方面,面對(duì)很多不同的挖掘需求和挖掘方法,如何快速找到合適的挖掘方法和源數(shù)據(jù),得到想要的挖掘結(jié)果。這是制造企業(yè)數(shù)據(jù)挖掘的一個(gè)重要研究方向。
2 面向PLM的數(shù)據(jù)挖掘體系結(jié)構(gòu)
面向PLM的數(shù)據(jù)挖掘過(guò)程是:首先從應(yīng)用需求出發(fā),提出對(duì)挖掘結(jié)果(指標(biāo))的需求;其次是根據(jù)需求查找合適的挖掘方法和獲取相關(guān)的數(shù)據(jù);然后針對(duì)挖掘需求和經(jīng)過(guò)預(yù)處理得到的數(shù)據(jù),進(jìn)行數(shù)據(jù)挖掘,得到相應(yīng)的挖掘結(jié)果,滿足應(yīng)用需求。因此,面向PLM的數(shù)據(jù)挖掘是一個(gè)從應(yīng)用需求出發(fā),最終滿足應(yīng)用需求的一個(gè)閉環(huán)結(jié)構(gòu)。其體系結(jié)構(gòu)主要包括四層:
2.1 數(shù)據(jù)層
數(shù)據(jù)很多,主要包括產(chǎn)品生命周期過(guò)程中各個(gè)階段的各種數(shù)據(jù),如:市場(chǎng)數(shù)據(jù)、專利數(shù)據(jù)、設(shè)計(jì)數(shù)據(jù)、供應(yīng)商數(shù)據(jù)、生產(chǎn)過(guò)程數(shù)據(jù)、銷售數(shù)據(jù)、維修服務(wù)數(shù)據(jù)和成本數(shù)據(jù)等。
2.2 方法層
挖掘方法很多,主要包括聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、分類、多維分析、異常點(diǎn)分析、預(yù)測(cè)、維修預(yù)警、評(píng)價(jià)分析等各種不同的挖掘方法模型。針對(duì)不同的挖掘目標(biāo)和應(yīng)用,從中選擇不同的方法。
2.3 結(jié)果層
數(shù)據(jù)挖掘結(jié)果很多,可以通過(guò)時(shí)間維、空間維和參數(shù)維進(jìn)行分類。
2.4 應(yīng)用層
應(yīng)用層又可看作是需求層。數(shù)據(jù)挖掘的目的是應(yīng)用其挖掘得到的結(jié)果,幫助實(shí)現(xiàn)企業(yè)的各種目標(biāo)。應(yīng)用層中的各種應(yīng)用不一定來(lái)自于獨(dú)立的一個(gè)階段的挖掘結(jié)果,可能來(lái)自于不同階段挖掘結(jié)果的集成與共享。
3 面向產(chǎn)品生命周期的數(shù)據(jù)挖掘編碼模型
建立面向產(chǎn)品生命周期的數(shù)據(jù)挖掘編碼模型的目的是,用較少的編碼描述盡可能多的產(chǎn)品生命周期中的數(shù)據(jù)、數(shù)據(jù)挖掘方法、數(shù)據(jù)挖掘結(jié)果和需求的信息,并建立它們之間的聯(lián)系,便于從挖掘需求出發(fā),尋找相關(guān)的數(shù)據(jù)挖掘方法和數(shù)據(jù)源,得到相應(yīng)的數(shù)據(jù)挖掘結(jié)果。主要包括數(shù)據(jù)編碼模、數(shù)據(jù)挖掘方法編碼模型、數(shù)據(jù)挖掘結(jié)果編碼模型和數(shù)據(jù)挖掘需求編碼模型。
數(shù)據(jù)的基本屬性是存儲(chǔ)在產(chǎn)品生命周期的不同數(shù)據(jù)庫(kù)的各個(gè)數(shù)據(jù)表中的字段,對(duì)由這些基本屬性組成的表或視圖統(tǒng)一利用編碼模型中的標(biāo)簽屬性來(lái)構(gòu)建源數(shù)據(jù)字典,以方便檢索源數(shù)據(jù)。采用具有分類特性的助記碼和唯一特性的順序碼組合的混合編碼方式來(lái)對(duì)源數(shù)據(jù)進(jìn)行編碼。
數(shù)據(jù)挖掘方法編碼模型包含模型編號(hào)、模型名稱、模型類型、功能、基本方法和應(yīng)用領(lǐng)域等等,基本方法中有相應(yīng)的幾種算法、相應(yīng)的控制參數(shù)、輸入和輸出。根據(jù)數(shù)據(jù)挖掘模型(方法)的編碼模型,設(shè)計(jì)數(shù)據(jù)挖掘模型字典來(lái)存儲(chǔ)數(shù)據(jù)挖掘模型,同時(shí)把這些不同類型的模型算法編譯成對(duì)應(yīng)的DLL文件,供模型使用時(shí)動(dòng)態(tài)加載,實(shí)現(xiàn)模型的共享和模型與程序的分離。
數(shù)據(jù)挖掘結(jié)果是由不同的源數(shù)據(jù)通過(guò)不同的數(shù)據(jù)挖掘方法模型得到的。因此數(shù)據(jù)挖掘結(jié)果編碼模型包含數(shù)據(jù)來(lái)源、數(shù)據(jù)挖掘方法模型、應(yīng)用領(lǐng)域、結(jié)果評(píng)價(jià)以及結(jié)果分類。
數(shù)據(jù)挖掘需求編碼模型一般包含需求編號(hào)、需求名稱、功能需求、數(shù)據(jù)需求、結(jié)果需求、應(yīng)用領(lǐng)域和需求所屬類別等等。
4 面向PLM的數(shù)據(jù)挖掘系統(tǒng)及實(shí)例應(yīng)用
面向產(chǎn)品生命周期的數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu)如圖1所示。首先在用戶界面中輸入數(shù)據(jù)挖掘需求,然后通過(guò)控制中心對(duì)數(shù)據(jù)挖掘需求中所涉及到的數(shù)據(jù)源參數(shù)和模型需求參數(shù)進(jìn)行收集,然后向數(shù)據(jù)預(yù)處理模塊發(fā)出數(shù)據(jù)請(qǐng)求,向挖掘模型模塊發(fā)出模型請(qǐng)求,向可視化模塊發(fā)出挖掘結(jié)果可視化請(qǐng)求,最后將數(shù)據(jù)挖掘結(jié)果以可視化的方式返回給用戶。數(shù)據(jù)預(yù)處理模塊根據(jù)挖掘需求,尋找所對(duì)應(yīng)的數(shù)據(jù)源和相關(guān)的屬性列表,對(duì)屬性進(jìn)行一系列操作,為數(shù)據(jù)挖掘模型提供完整、高質(zhì)量的數(shù)據(jù)。挖掘方法模型模塊根據(jù)挖掘需求中對(duì)模型需求的描述,根據(jù)模型字典檢索數(shù)據(jù)挖掘模型庫(kù)中相匹配的挖掘模型,提供合適的挖掘模型供控制中心使用。另外根據(jù)需求中對(duì)結(jié)果分類的描述將挖掘推送給有相同需求的決策者。
圖1 面向產(chǎn)品生命周期的數(shù)據(jù)挖掘系統(tǒng)
以產(chǎn)品生命周期中的生產(chǎn)過(guò)程中的質(zhì)量因素分析為例,首先輸入數(shù)據(jù)挖掘需求。根據(jù)數(shù)據(jù)需求描述的生產(chǎn)過(guò)程質(zhì)量數(shù)據(jù)查找數(shù)據(jù)字典中含相關(guān)屬性標(biāo)簽的數(shù)據(jù)源,選擇與質(zhì)量相關(guān)的一些基本屬性,并對(duì)其做進(jìn)一步處理,如刪除空值項(xiàng)或離散化等。然后根據(jù)功能需求等選擇關(guān)聯(lián)通用模型及其算法做質(zhì)量屬性的關(guān)聯(lián)分析。最終得到質(zhì)量相關(guān)因素的關(guān)聯(lián)挖掘結(jié)果。并對(duì)所挖掘得到的結(jié)果進(jìn)行評(píng)價(jià)。同時(shí)可以將此結(jié)果發(fā)送給制造部門(mén)和設(shè)計(jì)部門(mén)的員工和領(lǐng)導(dǎo),以便制造部門(mén)更好地進(jìn)行質(zhì)量控制,設(shè)計(jì)部門(mén)在設(shè)計(jì)過(guò)程中考慮零件的結(jié)構(gòu)和工藝問(wèn)題。
5 結(jié)語(yǔ)
本文在企業(yè)PLM需求和應(yīng)用的基礎(chǔ)上,首先提出了一個(gè)面向PLM的數(shù)據(jù)挖掘體系結(jié)構(gòu)。其次根據(jù)體系結(jié)構(gòu)中的數(shù)據(jù)層、方法層、結(jié)果層和需求層各構(gòu)建設(shè)計(jì)了其相應(yīng)的編碼模型和字典。然后根據(jù)各層次字典間的聯(lián)系和其關(guān)鍵字的相關(guān)匹配度,快速查找數(shù)據(jù)源和選擇挖掘方法模型。最后開(kāi)發(fā)了一個(gè)面向PLM的數(shù)據(jù)挖掘系統(tǒng)并進(jìn)行了實(shí)例應(yīng)用,可以將挖掘結(jié)果直接推送給有需要的決策者,提高產(chǎn)品生命周期中知識(shí)的共享和集成,幫助不同部門(mén)的領(lǐng)導(dǎo)集成其它部門(mén)的挖掘知識(shí)進(jìn)行決策,加大產(chǎn)品生命周期內(nèi)各階段的協(xié)調(diào)和優(yōu)化。
參考文獻(xiàn):
[1] 景旭文,易紅,趙良才.基于數(shù)據(jù)挖掘的產(chǎn)品概念設(shè)計(jì)建模研究[J].計(jì)算機(jī)集成制造系統(tǒng)-CIMS.2003(11):950-954.
[2] 景旭文,趙良才,易紅.產(chǎn)品動(dòng)態(tài)全息概念設(shè)計(jì)模型的研究[J].華東船舶工業(yè)學(xué)院學(xué)報(bào): 自然科學(xué)版.2002(05):61-66.
[3] 李飛,黃亞樓,劉麗君.數(shù)據(jù)挖掘中知識(shí)管理與表達(dá)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用.2001(14):25-28.
[4] 嚴(yán)雋琪,蔣祖華,馬登哲.基于全息產(chǎn)品建模的虛擬加工[J].計(jì)算機(jī)集成制造系統(tǒng)-CIMS.2000(05):18-22.
[5] 烏蘭木其,鄧家褆.現(xiàn)代產(chǎn)品設(shè)計(jì)方法及其演進(jìn)[J].機(jī)械工程學(xué)報(bào).
2000(05):1-6.
[6] 趙良才,景旭文,魯泳.基于智能體技術(shù)的計(jì)算機(jī)輔助概念設(shè)計(jì)研究[J].華東船舶工業(yè)學(xué)院學(xué)報(bào).2000(02):51-56.