岳繼光,鄒鴻宇,吳琛浩,王萍,劉軍
(1.同濟(jì)大學(xué)電子與信息工程學(xué)院,上海 201804;2.山東山大華天軟件有限公司,山東 濟(jì)南 250102)
為適應(yīng)企業(yè)產(chǎn)品的網(wǎng)絡(luò)協(xié)同制造需求,一些公司研發(fā)了產(chǎn)品全生命周期管理(product lifecycle management,PLM)系統(tǒng)[1]。其友好的用戶界面、涵蓋的功能組件、豐富的基礎(chǔ)模塊,為企業(yè)內(nèi)部和相關(guān)企業(yè)之間的產(chǎn)品協(xié)同研制提供了便利。
近年來,隨著產(chǎn)品高效研制要求的不斷提高,基于數(shù)據(jù)與文檔的PLM系統(tǒng)越來越難以滿足企業(yè)高質(zhì)量敏捷制造的要求。現(xiàn)代制造業(yè)希望能夠在PLM系統(tǒng)基礎(chǔ)上,加大產(chǎn)品深層次協(xié)同力度,縮短研發(fā)周期,推演預(yù)測產(chǎn)品研制狀況,實現(xiàn)跨單位、跨部門、跨層次的產(chǎn)品高效管理。因此,將具有解釋內(nèi)在屬性、描述內(nèi)涵知識、反應(yīng)研制流程的產(chǎn)品模型融入PLM系統(tǒng)[2],進(jìn)而形成產(chǎn)品全生命周期模型管理(product lifecycle model management,PLMM)系統(tǒng),對實現(xiàn)高層次的產(chǎn)品協(xié)同制造具有創(chuàng)新性。
PLMM系統(tǒng)是一種新的產(chǎn)品管理解決方案。在保留了PLM“前臺人機(jī)交互”方式的同時,還提供基于產(chǎn)品模型的“中臺”支持。PLM基于產(chǎn)品“文檔+數(shù)據(jù)交互”模式,提升到基于“模型”的產(chǎn)品屬性交互、模型協(xié)同、仿真推演乃至數(shù)字孿生的高層次聯(lián)動研制,是產(chǎn)品由“碎片化”數(shù)據(jù)管理轉(zhuǎn)型到“體系化”模型知識管理的有效途徑。
產(chǎn)品研制類的軟件系統(tǒng)管理的特點是文件交互。為將PLM系統(tǒng)高效地轉(zhuǎn)變?yōu)镻LMM系統(tǒng),其焦點是高效地處理涉及產(chǎn)品信息的文件。然而人工很難勝任非結(jié)構(gòu)化的文件文本數(shù)據(jù)處理[3],自動化、智能技術(shù)手段的運用和應(yīng)用文本數(shù)據(jù)的挖掘技術(shù)成為產(chǎn)品管理的關(guān)鍵部分之一[4]。本文提出一個基于“產(chǎn)品模型文件包”的“文本關(guān)鍵詞特征聯(lián)合預(yù)測算法”,實現(xiàn)面向協(xié)同研發(fā)的PLMM接口。
產(chǎn)品的協(xié)同研發(fā)是先進(jìn)制造技術(shù)中并行工程運行的核心[5-6]。將數(shù)據(jù)轉(zhuǎn)化為能夠影響產(chǎn)品性能的決策信息成為國內(nèi)外工業(yè)管理的共識,Siemens的HD-PLM框架為大規(guī)模、分布廣泛、來源不同的數(shù)據(jù)賦予意義[7],Solid Works Enterprise基于全產(chǎn)品線搭建產(chǎn)品生命周期解決方案[8],如華天PLM、武漢開目、數(shù)碼大方、艾克斯特、上海思普等國內(nèi)廠商,以產(chǎn)品數(shù)據(jù)為基礎(chǔ),以知識庫為核心,建立工藝設(shè)計與管理的軟件數(shù)據(jù)信息集成平臺[9]。
在PLMM平臺上的協(xié)同研發(fā),指通過PLMM完成產(chǎn)品的高質(zhì)量、高效研發(fā)。要使產(chǎn)品利益攸關(guān)者高效的協(xié)同工作,需要建立準(zhǔn)確、快速、高質(zhì)量地信息交換和相互協(xié)同機(jī)制[10]。因此,構(gòu)建面向協(xié)同研發(fā)的產(chǎn)品模型管理接口就顯得十分重要[11-12]。
面向協(xié)同研發(fā)的產(chǎn)品模型管理接口,應(yīng)滿足產(chǎn)品利益攸關(guān)者分享相關(guān)的產(chǎn)品模型,通過模型來提高協(xié)同設(shè)計的效率[13]。模型管理包括產(chǎn)品的概念模型、三維設(shè)計模型、工程分析模型、過程模型和知識模型的管理。
當(dāng)前國內(nèi)產(chǎn)品模型管理體系,例如山東大學(xué)華天團(tuán)隊的PLMM系統(tǒng),如圖1所示。在“前臺人機(jī)交互”層面依然為文件方式,將產(chǎn)品模型涉及的“功能、結(jié)構(gòu)、行為”等要素,表述為“文檔、圖紙、表單、實物圖”等文件類信息,進(jìn)而“打包”為若干文件,形成“產(chǎn)品模型文件包”。PLMM系統(tǒng)后臺,產(chǎn)品模型文件包通過相互關(guān)聯(lián)組織,形成具有結(jié)構(gòu)化、數(shù)字化意義的對象,在原型系統(tǒng)相關(guān)模型支持的軟件層中以模型為基本組成單位被調(diào)度和協(xié)同。
圖1 PLMM系統(tǒng)架構(gòu)Fig.1 Framework of PLMM system
“產(chǎn)品模型文件包”是指與產(chǎn)品概念、設(shè)計、采購、生產(chǎn)、銷售和售后服務(wù)全生命周期6個階段相關(guān)的所有文件,可以通過PLMM平臺打開或互聯(lián)、互通,由產(chǎn)品制造企業(yè)及產(chǎn)品利益攸關(guān)者在不同時間、不同地點、不同人員、按照不同權(quán)限查閱、設(shè)計、協(xié)同、制造、購置以及運行維護(hù)?!爱a(chǎn)品模型文件包”中的文件名稱用規(guī)范的編碼表示,具體參考產(chǎn)品全生命周期管理平臺編碼規(guī)范,見表1。
表1 基于模型的PLM平臺編碼規(guī)范Tab.1 Coding specification of PLM platform based on model
PLMM模型接口包括如下功能:①對來自不同領(lǐng)域、不同部門、不同來源、不同結(jié)構(gòu)的“產(chǎn)品模型文件包”進(jìn)行特征識別;②將產(chǎn)品的概念模型、三維設(shè)計模型、工程分析模型、過程模型以及知識模型等組成的“產(chǎn)品模型文件包”進(jìn)行分類;③根據(jù)用戶需求意見推送結(jié)果;④繼續(xù)推送直到協(xié)同研發(fā)結(jié)束。
面向協(xié)同研發(fā)的PLMM模型管理接口的結(jié)構(gòu)按照輸入-活動-輸出(input process output,IPO)三元組模式,如圖2所示。其輸入為“產(chǎn)品模型文件包”,其活動包括產(chǎn)品模型特征識別、提取、屬性分類以及協(xié)同推送,其輸出為產(chǎn)品利益攸關(guān)者。
圖2 PLMM系統(tǒng)上的產(chǎn)品模型接口結(jié)構(gòu)示意Fig.2 Schematic diagram of product model interface structure on PLMM system
面向協(xié)同研發(fā)的PLMM模型管理接口的核心是基于中文文本自然語言處理的智能化算法,輸入為產(chǎn)品文件包,及其包含文件的文本信息,輸出該產(chǎn)品的模型文件包對應(yīng)的模型類別。其具體步驟如圖3所示。
圖3 產(chǎn)品模型管理接口算法步驟Fig.3 The procedures of product model management interface algorithm
后機(jī)身平尾控制系統(tǒng)是軍機(jī)典型復(fù)雜產(chǎn)品,由油源、伺服閥、液壓缸、控制電路、連接機(jī)構(gòu)、平尾、傳感變送裝置以及供電電源等組成,核心是閥控液壓缸系統(tǒng),其方框圖如圖4所示。
圖4 閥控液壓缸系統(tǒng)方框圖Fig.4 Block diagram of valve-controlled hydraulic cylinder system
其“產(chǎn)品模型文件包”涵蓋了如下文件:①基于SysML表達(dá)的閥控液壓缸系統(tǒng)設(shè)計需求、用例、功能、架構(gòu)、參數(shù)約束以及其他文件;②閥控液壓缸系統(tǒng)配置、結(jié)構(gòu)、公差和拓?fù)潢P(guān)系、裝配關(guān)系和各類BOM等模型文件;③閥控液壓缸系統(tǒng)所涉及的機(jī)械、電子電氣、流體傳動等不同學(xué)科的仿真模型間的耦合關(guān)聯(lián)關(guān)系等模型文件;④表示閥控液壓缸系統(tǒng)不同生命周期階段的模型動態(tài)關(guān)聯(lián)的過程模型文件;⑤表示閥控液壓缸系統(tǒng)知識獲取、知識表示、知識變換、知識重用等知識模型文件。
產(chǎn)品模型管理接口復(fù)雜產(chǎn)品模型,根據(jù)模型在管理系統(tǒng)中的組織架構(gòu)與自身包含的信息,來提取出模型特征,并基于特征預(yù)測其產(chǎn)品模型類別。
圖5 協(xié)同接口識別分類功能Fig.5 Identification and classification function of collaborative interface
產(chǎn)品的任意一個模型,在PLMM系統(tǒng)中以“產(chǎn)品模型文件包”的形式呈現(xiàn)給用戶,一個“模型文件包”的定義為
任意一個產(chǎn)品文件包Pkg,其內(nèi)部包含的諸多文件fi,i的取值范圍為[0,∞)。對于任意一個產(chǎn)品模型,最低限度的文件特征是沒有文件,而文件數(shù)量不設(shè)上限,隨著產(chǎn)品的研發(fā)進(jìn)行而不斷增加。
產(chǎn)品模型文件包的模型類別識別遵循以下步驟:
步驟1文本清洗與正則化匹配。
每個產(chǎn)品模型中的文件信息,使用文本清洗與正則化匹配,與標(biāo)準(zhǔn)編碼進(jìn)行正則匹配,從而剔除不符合工業(yè)要求的目標(biāo)。正則表達(dá)式Re為
式中:0-9為任意有效阿拉伯?dāng)?shù)字;{3}為3位有效數(shù)字;A-Z為任意有效英文字母;{2}為2位有效字母;[∧/]*為任意多個非反斜杠符號字符的文本,故該正則表達(dá)式可匹配任意字段,單字母加數(shù)字結(jié)尾的編碼格式,不同的文件名匹配結(jié)果,如圖6所示。100-JG-CR32液壓缸設(shè)計圖紙/A1.1中,100匹配[0-9]{3},JG匹配[A-Z]{2},CR32液壓缸設(shè)計圖紙匹配[∧/]*,A匹配[A-Z],1.1匹配[0-9.]*。
圖6 不同的文件名匹配結(jié)果Fig.6 The match results of different file names
步驟2特征提取與特征轉(zhuǎn)義。
通過冗余信息的清理和規(guī)則匹配來快速從文本中提取有效特征,對符合標(biāo)準(zhǔn)編碼格式的文件fi進(jìn)行特征提取與解析。具體方法為:①載入語料庫C,獲取語料信息corpus;②讀取文件fi的名稱Ni;③將Ni與正則表達(dá)式Re進(jìn)行匹配,得到標(biāo)準(zhǔn)編碼的結(jié)果,即編碼段Code、數(shù)字段Num、文字段Str;④分別訪問corpus中的code、corpus映射區(qū)段、num_corpus映射區(qū)段,并與Code、Num進(jìn)行匹配,返回corpus中的映射結(jié)果,得到編碼特征;⑤遍歷Str中的字符,搜索corpus中相同的字符組合,存在復(fù)數(shù)搜索結(jié)果時按照字典序保留,得到文字特征。
對提取的特征屬性,使用精確率、召回率、F1-score等5項指標(biāo)對其效果進(jìn)行評估,實驗效果如圖7所示。
圖7 特征提取效果驗證Fig.7 Effect verification of feature extraction
通過對軍機(jī)后機(jī)身模擬控制系統(tǒng)中的文本內(nèi)容的驗證,在精確率、召回率、F1-score分?jǐn)?shù)以及已在語料庫中的數(shù)據(jù)(in vocabulary,IV)的召回率上均取得了較好的效果,但是對于未在語料庫中的數(shù)據(jù)(out of vocabulary,OOV),由于OOV的數(shù)據(jù)量過少,與IV數(shù)據(jù)的比例存在不平衡現(xiàn)象,所以分?jǐn)?shù)相比于其他指標(biāo)較低。
步驟3基于關(guān)鍵字的搜索匹配。
從“產(chǎn)品模型文件包”到模型體系需要進(jìn)行模型類別預(yù)測,本文采用語義推理的方法,通過在產(chǎn)品全生命周期詞料庫wd中,使用不同的關(guān)鍵字組KG對提取的特征進(jìn)行相似匹配,從而得到產(chǎn)品模型文件包中的模型類別。
預(yù)測方程如下:
式中:S()為歸一化方程,用于對產(chǎn)品模型文件的相似度向量vsim進(jìn)行歸一化,并得出對應(yīng)類別的預(yù)測分值。其中:
式中:vi為其中一條文件特征與關(guān)鍵字組KGi的查詢分值,由于不同的關(guān)鍵字庫的體積不一定保持一致,故需要∑KGi保證不同關(guān)鍵字庫的大小不會對結(jié)果造成影響;Q為其他一條文本的提取特征。
為加強(qiáng)產(chǎn)品模型的預(yù)測效果,實現(xiàn)對“產(chǎn)品模型文件包”中信息最大化的利用,在文件信息的基礎(chǔ)上,結(jié)合文件格式進(jìn)行協(xié)同預(yù)測,通過對產(chǎn)品模型文件包的數(shù)字化格式信息與文本化語義信息進(jìn)行訪問,對產(chǎn)品模型文件包所屬模型類別進(jìn)行預(yù)測:
式中:M為產(chǎn)品模型文件包的預(yù)測結(jié)果與分值;ts為具體文件的文件類型預(yù)測分值;α為標(biāo)準(zhǔn)系數(shù),用于保證Ls與ts在同一量級;λ為取值[0,1]的權(quán)重系數(shù),用于均衡兩者在最終預(yù)測中的作用程度。通過對兩者的加權(quán)評估,使得最終的文件推送能夠更準(zhǔn)確,如圖8所示,不同的λ對預(yù)測準(zhǔn)確度的效果,如圖9所示。
圖8 對模型類別的預(yù)測分值Fig.8 The forecast score for model category
圖9 不同λ對預(yù)測準(zhǔn)確度的影響Fig.9 The impact of different λ on prediction accuracy
通過對“文件包”中大量的異構(gòu)信息的提取其有效特征的預(yù)測,在華天公司PLMM系統(tǒng)中,對圖10所示的文件系統(tǒng)進(jìn)行模型類別預(yù)測,通過文本關(guān)鍵詞特征聯(lián)合預(yù)測算法的結(jié)果形成了圖11中按模型類別的分類視圖,從結(jié)果上來看,類似的內(nèi)容會被歸類到其關(guān)聯(lián)的模型類別中,實現(xiàn)文檔到模型的接口功能之一。
圖10 PLMM系統(tǒng)中的文件管理Fig.10 Documents management in PLMM
圖11 PLMM中按照模型類別管理Fig.11 Management method through model type in PLMM
對于PLMM系統(tǒng)的用戶而言,協(xié)同管理接口需要解決模型與產(chǎn)品利益攸關(guān)者的索引難題。協(xié)同管理接口的用戶視角可以被視為如下的IPO結(jié)構(gòu),如圖12所示。其中,輸入為用戶/利益攸關(guān)者在產(chǎn)品研發(fā)過程中的工程需求信息,不遵循固定規(guī)范,多為自然語言或關(guān)鍵詞的組合。處理環(huán)節(jié)中協(xié)同管理接口識別需求,從產(chǎn)品模型文件包資源數(shù)據(jù)庫中快速搜索與需求相匹配的資源數(shù)據(jù)。輸出為工程師需要的資源。
圖12 協(xié)同接口需求分析功能IPO結(jié)構(gòu)Fig.12 The IPO structure of collaborative interface
在對用戶輸入需求信息前,檢查產(chǎn)品模型數(shù)據(jù)庫是否建立了協(xié)同接口的索引,若未建立索引,則執(zhí)行數(shù)據(jù)庫的搜索引擎初始化過程。
對每一個Pkg中的產(chǎn)品文件fi,使用中文分詞算法,將f劃分為多個獨立的中文詞語,建立索引對象dxi={title,context}。其中,title為協(xié)同推薦引擎推薦的標(biāo)題,context為協(xié)同推薦引擎推薦的實際內(nèi)容。對于每個產(chǎn)品模型,有
式中:text(x)為對象x的文本內(nèi)容。通過遍歷所有產(chǎn)品模型文件包,可以得到當(dāng)前搜索引擎的索引
在已有數(shù)據(jù)庫索引的基礎(chǔ)上,對用戶的非結(jié)構(gòu)化輸入In,使用特征提取算法,得到其關(guān)鍵需求詞匯wdi組成的需求組N。
式中:Se為前文中的特征提取方法,通過對中文文本進(jìn)行切分得到關(guān)鍵詞匯信息wdi。每一個關(guān)鍵詞匯會在搜索引擎中進(jìn)行索引匹配,優(yōu)先在title中獲取返回結(jié)果,其次對context進(jìn)行二次訪問,得到推薦的資源和結(jié)果,在一定條目限制下,推薦的資源會被組合在一起,向提出需求的用戶展示。當(dāng)用戶對推薦的資源進(jìn)行一定了解后,如果產(chǎn)生新的需求,則可以再次通過搜索引擎輸入新的需求信息,來得到更準(zhǔn)確、更符合用戶需求的推薦結(jié)果。根據(jù)用戶需求的資源推薦系統(tǒng),如圖13所示。
圖13 根據(jù)用戶需求的資源推薦系統(tǒng)Fig.13 Resource recommendation system according to user needs
本文提出了基于PLMM模型管理接口方案,為產(chǎn)品制造企業(yè)和產(chǎn)品利益攸關(guān)者網(wǎng)絡(luò)化協(xié)同智能化和高效化的提供了一種可行性;使用了基于關(guān)鍵字的模型類別預(yù)測方法,通過對輸入的文件文本進(jìn)行清洗、切分、搜索匹配,計算其在各模型類別領(lǐng)域的權(quán)重,并通過歸一化給出其預(yù)測結(jié)果與對應(yīng)分值,實現(xiàn)文件管理到模型管理的轉(zhuǎn)化技術(shù),預(yù)測效果最高可達(dá)94.55%;實現(xiàn)了一種基于關(guān)鍵字的搜索引擎,能夠?qū)τ脩籼岢龅男枨筮M(jìn)行分析,提取其中的關(guān)鍵文本,并在PLM海量的數(shù)據(jù)庫中為用戶提供最匹配的資源信息,為工業(yè)軟件管理系統(tǒng)提供一種快速查詢的方案。