趙振剛,杜麗峰,王 磊
(1.天津大學 機械工程學院,天津 300350;2.天津市天鍛壓力機有限公司,天津 300232)
在工業(yè)4.0 背景下,全球制造業(yè)正朝智能化、服務(wù)化的方向發(fā)展,產(chǎn)品更新?lián)Q代加快,競爭更加激烈,這對企業(yè)的產(chǎn)品創(chuàng)新能力有了更高要求。硬件、軟件和信息等研發(fā)設(shè)計資源作為集團企業(yè)的核心資產(chǎn),是產(chǎn)品創(chuàng)新的重要支撐。然而集團企業(yè)研發(fā)設(shè)計資源有著地理上分散、形式上異構(gòu)以及存儲上分布的不足,這些不足對于產(chǎn)品創(chuàng)新的速度有一定的阻礙。同時,資源在集團企業(yè)內(nèi)部及合作伙伴間得到最大范圍共享、高效共享和安全共享也對產(chǎn)品創(chuàng)新有著很大影響。但是現(xiàn)有的研發(fā)資源主要是根據(jù)各自專用的專家信息系統(tǒng)來實現(xiàn),企業(yè)不同的部門之間實際共享研發(fā)資源困難[1]。因此構(gòu)建統(tǒng)一的研發(fā)設(shè)計資源組織體系,對分散異構(gòu)的資源統(tǒng)一集成管理顯得尤為必要。
本文對集團企業(yè)研發(fā)設(shè)計資源的內(nèi)涵和特性進行了深入研究,結(jié)合相關(guān)研究成果對研發(fā)設(shè)計資源進行分類,構(gòu)建了基于語義的集團企業(yè)研發(fā)設(shè)計資源信息模型,并利用XML 格式對該信息模型進行了描述。
傳統(tǒng)的制造資源有著廣義制造資源和狹義制造資源之分[2],狹義制造資源主要指加工一個零件所需要的物質(zhì)元素,是面向制造系統(tǒng)底層的制造資源,例如機床、刀具、工裝等。廣義制造資源是完成產(chǎn)品整個生命周期的所有生產(chǎn)活動的軟、硬件元素,包括了設(shè)計、制造、維護等相關(guān)活動過程中涉及的所有元素[3]。
研發(fā)設(shè)計資源屬于制造資源,沒有明確定義,可以認為研發(fā)設(shè)計資源是廣義制造資源的子集,是在云制造環(huán)境下用于產(chǎn)品設(shè)計階段的資源要素的總和[4]。文獻[5]認為設(shè)計資源是產(chǎn)品設(shè)計活動的元素,為產(chǎn)品設(shè)計活動提供幫助及支撐。本文對研發(fā)設(shè)計資源定義如下:研發(fā)設(shè)計資源是構(gòu)成產(chǎn)品設(shè)計活動最基本的要素,一般指所有能夠為產(chǎn)品設(shè)計活動提供支撐的資源總和。
從資源提供者的角度,按照資源的屬性、用戶需求、使用方式以及在制造活動中發(fā)揮的作用,可以將制造資源分為人力資源、制造設(shè)備資源、技術(shù)資源、物料資源、應(yīng)用系統(tǒng)資源、服務(wù)資源、用戶信息資源、計算資源和其他相關(guān)資源[6]。依據(jù)設(shè)計資源的存在形態(tài)及其之間的形成關(guān)系,將設(shè)計資源分為有實體的設(shè)計資源和無實體的設(shè)計能力,其中有實體的設(shè)計資源進一步分為智力、知識和工具資源,而無實體的設(shè)計能力包括用于產(chǎn)品設(shè)計階段的需求分析、方案選擇、概念設(shè)計、結(jié)構(gòu)設(shè)計和實體設(shè)計等方面的能力[4]。從管理角度,可以將資源分為人力資源、生產(chǎn)資源、財務(wù)資源、市場資源以及開發(fā)設(shè)計資源[7]。通過集團企業(yè)不同的設(shè)計活動和資源本身的內(nèi)涵和特性,可以在多種維度下對資源進行分類。根據(jù)研發(fā)設(shè)計資源的內(nèi)涵以及對資源統(tǒng)一管理和共享的需求,本文從以下5 個維度對資源進行分類:資源在集團企業(yè)中的功能、資源所屬的專業(yè)名稱、資源所在的業(yè)務(wù)活動、資源的權(quán)屬和資源的生命周期。圖1 為集團企業(yè)研發(fā)設(shè)計資源的多維度分類模型,其中功能維度作為資源分類的主維度,專業(yè)領(lǐng)域、業(yè)務(wù)活動、權(quán)屬、生命周期等為輔助維度。
圖1 研發(fā)設(shè)計資源多維度空間信息模型
(1)資源在集團企業(yè)中有各自的功能,既有聯(lián)系也有區(qū)別。根據(jù)功能的不同,研發(fā)設(shè)計資源可以劃分為軟件資源、硬件資源、人力資源、場地資源、技術(shù)資源和信息資源等6 類。其中,軟件資源是支撐集團企業(yè)設(shè)計過程管理與協(xié)同以及設(shè)計、仿真、分析、實驗等主要設(shè)計活動的軟件及系統(tǒng),包括管理軟件、協(xié)同與通訊軟件、設(shè)計軟件、仿真軟件、分析計算軟件;硬件資源是指支撐集團企業(yè)設(shè)計過程管理與協(xié)同以及設(shè)計、仿真、分析、實驗驗證、試制等主要設(shè)計活動的設(shè)備,包括生產(chǎn)試制設(shè)備、計算機與服務(wù)器、網(wǎng)絡(luò)設(shè)備、實驗設(shè)備、檢測設(shè)備、物流與運輸設(shè)備、辦公設(shè)備等;人力資源是參與到集團企業(yè)設(shè)計活動中工程技術(shù)人員、管理人員、服務(wù)人員和其他人員;場地資源是支撐集團企業(yè)設(shè)計過程管理與協(xié)同以及設(shè)計、仿真、分析、實驗驗證、試制等主要設(shè)計活動的場地、車間、實驗室等,包括實驗場地、加工制造裝配場地、測試場地、存貯場地等;技術(shù)資源是指集團協(xié)同設(shè)計過程中支持設(shè)計過程管理、設(shè)計、實驗、分析驗證的資源總和,包括標準、規(guī)范、模板、規(guī)則、方法、模型、經(jīng)驗等;信息資源是集團協(xié)同設(shè)計過程中形成的以多種介質(zhì)、媒體形式存在的信息綜合,包括市場信息、設(shè)計研制信息、制造信息、運維信息、質(zhì)量信息等。圖2 為集團企業(yè)研發(fā)設(shè)計資源功能維度下的信息模型框架。
圖2 資源功能維度信息模型框架
(2)集團企業(yè)中包含各個專業(yè)領(lǐng)域的資源,按照資源的專業(yè)名稱,從各個專業(yè)領(lǐng)域中提取出代表性的術(shù)語集合,作為資源分類的特征詞集,形成各專業(yè)資源的分類標準。此維度下資源可劃分為控制、液壓、制造、動力、結(jié)構(gòu)、電氣、測試、管理等類別。
(3)集團企業(yè)中的資源應(yīng)用到不同的業(yè)務(wù)活動中。對全部業(yè)務(wù)活動進行歸類,根據(jù)業(yè)務(wù)活動的類型、性質(zhì)等將研發(fā)設(shè)計資源劃分為需求分析類、研發(fā)設(shè)計類、仿真預測類、試驗測試類、生產(chǎn)制造類和行政管理類。
需求分析類資源包括與裝備及各分系統(tǒng)的指標論證、技術(shù)分析、方案設(shè)計、定型設(shè)計等活動相關(guān)的資源;研發(fā)設(shè)計類資源包括與裝備部件研發(fā)、信息系統(tǒng)開發(fā)、軟件開發(fā)等活動相關(guān)的資源;仿真預測類資源包括與裝備性能參數(shù)的仿真、系統(tǒng)性能的仿真等活動相關(guān)的資源;試驗測試類資源包括與裝備的試驗、系統(tǒng)測試等活動相關(guān)的資源;生產(chǎn)制造類資源包括與裝備的部件加工、批量生產(chǎn)、設(shè)備制造等活動相關(guān)的資源;行政管理類資源包括協(xié)同設(shè)計過程中涉及到管理、協(xié)同、績效等相關(guān)活動的資源。
(4)構(gòu)建研發(fā)設(shè)計資源信息模型的目的之一是便于資源共享,進而提高產(chǎn)品研發(fā)創(chuàng)新的效率。從資源共享的角度出發(fā),定義資源的權(quán)屬維度,以描述資源的可共享性和共享的基本規(guī)則。資源權(quán)屬維度下的資源包括資源持有者、共享范圍、共享級別、共享對象、共享方式和共享期限等類別。
(5)作為集團企業(yè)中的研發(fā)設(shè)計資源,無論是實體資源還是非實體資源,都有其本身的生命周期。從資源生命周期維度出發(fā),可以將資源劃分為購買日期、已使用年限和資源有效期等類別。
研發(fā)設(shè)計資源種類繁多,各資源均有若干屬性。本文結(jié)合面向?qū)ο蟮乃枷耄瑢⒏髻Y源看作獨立對象,各對象屬性既有共性也有差異,同時還應(yīng)有其他維度的相關(guān)信息。綜合以上因素,研發(fā)設(shè)計資源的屬性可以劃分為基本屬性、能力屬性、狀態(tài)屬性、繼承屬性和維度屬性。表1 為研發(fā)設(shè)計資源的屬性信息。
表1 研發(fā)設(shè)計資源的屬性
資源模型通過定義資源之間的邏輯關(guān)系和資源的屬性,來描述資源的結(jié)構(gòu)及結(jié)構(gòu)之間的邏輯關(guān)系[8]。文獻[9]提出了面向云制造系統(tǒng)的制造資源數(shù)據(jù)模型。文獻[10]結(jié)合語義知識和Web 技術(shù),建立了加工設(shè)備資源信息模型并用XML 進行描述。文獻[11]提出了基于資源功能的網(wǎng)絡(luò)化制造資源模型,并且采用Web 服務(wù)進行封裝。文獻[12]提出一種基于語義的云制造資源建模與服務(wù)化封裝方法,將制造資源抽象為制造能力,采用本體建模技術(shù)構(gòu)建了基于語義的云服務(wù)結(jié)構(gòu)模型。文獻[13]基于XML 的研究,描述了制造資源模型的數(shù)據(jù)元素、資源庫等多個內(nèi)容。文獻[14]提出了一種基于雙層規(guī)劃的資源優(yōu)化配置模型。文獻[15]以檢測時間為約束,總成本為目標函數(shù),建立了檢測資源分配模型。
基于面向?qū)ο蟮乃枷耄偨Y(jié)研發(fā)設(shè)計資源的屬性,以資源的功能維度為主維度,將資源的共同屬性抽象出來,并考慮資源的不同點,加入其他屬性,實現(xiàn)資源維度、屬性和描述的動態(tài)擴展及自動繼承。
定義1 研發(fā)設(shè)計資源
RDDR(Research &Development and Design Resources)={ Sw_R,Hw_R,HR_R,Tech_R,Info_R,Field_R}。
其中RDDR:研發(fā)設(shè)計資源(Research &Development and Design Resources)
Sw_R:軟件資源(Software_Resources),
Hw_R:硬件資源(Hardware_Resources),
HR_R:人力資源(HumanResource_Resources),
Tech_R:技術(shù)資源(Technology_Resources),
Info_R:信息資源(Information_Resources),
Field_R:場地資源(Filed_Resources)。
軟件資源、硬件資源、人力資源、場地資源、技術(shù)資源和信息資源的定義相同。本文以軟件資源為例,給出軟件資源的定義及屬性,其他資源的定義同軟件資源,在屬性值上根據(jù)資源類型的不同而有所差別。
定義2 軟件資源
Sw_R(Software Resources)={BasicProp,A-biliProp,StatuProp,InherProp,DimProp},其中BasicProp 是基本屬性;AbiliProp 是能力屬性;StatuProp是狀態(tài)屬性;InherProp 是繼承屬性;DimProp 是維度屬性。
定義3 基本屬性
BasicProp={name,brand,FBuyDate,FCost,FManagerUse,FVersion,FSoftType,FInstallModel,License,FLicNum,FKeyWord,FFromInfo,FCountry,FNecornot,other},其中name 為資源名稱;brand 為資源品牌;FBuyDate 為資源購置日期;FCost 為費用;FManagerUse 為資源負責人FVersion 為軟件資源版本號;FSoftType 為資源類型;FFieldUrl 為資源文件存儲位置;FInstallModel 為軟件資源安裝方式;License 為資源許可證;FLicNum為License數(shù)量;FKeyWord 為資源的關(guān)鍵詞;FFromInfo 為資源的來源信息,包括來源系統(tǒng)、來源數(shù)據(jù)庫、來源表和來源URL 等;FCountry 為國別;FNecornot 為是否必須;other 為可擴展的屬性,根據(jù)實際情況進行擴充,以適應(yīng)資源的柔性變化。
定義4 能力屬性
AbiliProp={FAbility,FParameter,FRange,FPurpose,FObject,FFiletype,FTecIndex,FTech},其中FAbility 為資源的專業(yè)技術(shù)能力;FParameter 為資源的能力參數(shù);FRange 為資源的能力范圍;FPurpose 為資源根據(jù)其能力可以完成的任務(wù),與資源的能力屬性值是一對多的關(guān)系,隨任務(wù)和時間的變化而變;FObject 為資源能力對象;FFiletype 為軟件資源的文件類型;FTecIndex 為技術(shù)指標;FTech 為資源涉及到的技術(shù)。
定義5 狀態(tài)屬性
StatuProp={status,FValidityDate,FNote,FItem},其中status 為資源的狀態(tài)信息,包括資源的使用狀態(tài)、任務(wù)狀態(tài)、維護狀態(tài)等;FValidityDate 為資源的使用有效期;FNote 為資源的說明備注,根據(jù)企業(yè)實時狀態(tài)進行修改;FItem 為所屬項目。
定義6 繼承屬性
InherProp 是資源的繼承屬性,將資源看作獨立對象,繼承屬性描述了該資源與上層資源的繼承關(guān)系。以運動仿真軟件為例:運動仿真繼承了仿真系統(tǒng)及其屬性,仿真系統(tǒng)繼承了軟件資源及其屬性。
定義7 維度屬性
DimProp={FFunction,FBusiness,FFiled,FOwnership,FCycle,other},其中FFunction 為資源功能屬性;FBusiness 為資源業(yè)務(wù)活動屬性;FFiled 為資源專業(yè)屬性;FOwnership 為資源權(quán)屬屬性,包括來源信息、資源持有者、共享范圍、共享級別、共享對象、共享方式和共享期限等;FCycle 為資源生命周期屬性,包括購買日期、已使用年限和資源有效期等;other 為資源維度屬性補充信息,允許維度屬性動態(tài)可拓展。
集團企業(yè)研發(fā)設(shè)計資源信息是一種非結(jié)構(gòu)化數(shù)據(jù),本文以某企業(yè)SolidWorks 軟件為例,用半結(jié)構(gòu)化的XML 語言進行描述。圖3 為資源的XML 格式描述。
圖3 研發(fā)設(shè)計資源信息模型XML 描述
隨著產(chǎn)品多年的設(shè)計、生產(chǎn)、維護和更新?lián)Q代,集團企業(yè)積累了各種各樣的海量研發(fā)設(shè)計資源信息,包括產(chǎn)品設(shè)計文檔、產(chǎn)品模型、各類知識庫等等,這些形式各樣的資源包含了資源的分類和屬性等大部分信息。在眾多信息的形式中,資源文本信息占比最大,因此其中包含的研發(fā)設(shè)計資源信息最多。傳統(tǒng)的依靠人工方法閱讀資源文本獲取資源信息效率低,嚴重制約了產(chǎn)品的創(chuàng)新,因此高效、有針對性地提取資源文本中的資源屬性信息變得越來越重要。基于對上文已經(jīng)定義的研發(fā)設(shè)計資源信息模型的分析,本節(jié)以某企業(yè)軟件資源文本為語料,在python 環(huán)境下利用TF-IDF 算法對某企業(yè)軟件資源語料進行預處理,對生成的語料庫進行分析,提取軟件資源屬性值,實現(xiàn)對資源的信息模型應(yīng)用與驗證。
術(shù)語頻率逆文檔頻率(TF-IDF)是在術(shù)語頻率統(tǒng)計方法的基礎(chǔ)上改進的特征詞加權(quán)方法,用以評估詞條對于一個文件集或一個語料庫中的其中一份文件的重要程度。TF 為詞頻(Term Frequency),指的是某一個給定的詞語在該文件中出現(xiàn)的次數(shù),IDF 為逆文本頻率指數(shù)(Inverse Document Frequency),是一個詞語普遍重要性的度量,代表了詞條與文本的負相關(guān)關(guān)系。TF-IDF 能過濾掉一些常見的無關(guān)緊要的詞語,同時保留影響整個文本的重要詞語。其詞頻TF、逆文本頻率指數(shù)IDF 和兩種頻率統(tǒng)計方法之后的新權(quán)重公式如下所示:
式中:tf 為詞頻,詞條在文檔中出現(xiàn)的次數(shù);idf 為逆文本頻率;D 為語料庫文檔總數(shù);D(x)為包含詞條的文檔數(shù),對數(shù)中D(x)+1 是為了保證分母不為0。
對于給定的某企業(yè)軟件資源清單文本,提取資源屬性的具體步驟如下:
(1)企業(yè)軟件資源清單文本作為原始資料保存到文本數(shù)據(jù)庫中,以便后續(xù)處理。
(2)將分詞工具無法識別的機械行業(yè)領(lǐng)域內(nèi)的行業(yè)術(shù)語詞匯添加到分詞數(shù)據(jù)庫中,保證分詞結(jié)果的完整性和準確性。
(3)使用分詞工具對軟件資源清單文本進行分詞處理,將文本從文本粒度降低到詞粒度,通過停用詞表去除語義表達無效的詞,將這些詞作為文本的基本特征。
(4)通過TF—IDF 統(tǒng)計方法,對分詞后的語料庫進行訓練,對具有區(qū)分能力的特征詞賦予更多的權(quán)重,得到TF—IDF 模型。
(5)整理TF—IDF 模型輸出的數(shù)據(jù),并結(jié)合人工輔助進行無關(guān)聯(lián)詞的去除,從中提取出軟件資源的各屬性值。
本文所用工具為Spyder 軟件,程序界面及輸出結(jié)果示例如圖4 所示。
圖4 資源信息屬性提取程序及輸出
輸入企業(yè)的軟件資源文本信息“AutoCAD 2010是Autodesk 公司出品的CAD 軟件,借助AutoCAD,你可以安全、高效和準確地和客戶共享設(shè)計數(shù)據(jù)。您可以體驗本地DWG 格式所帶來的強大優(yōu)勢。DWG是業(yè)界使用最廣泛的設(shè)計數(shù)據(jù)格式之一,您可以通過它讓所有人員隨時了解您的最新設(shè)計決策。借助支持演示的圖形、渲染工具和強大的繪圖和三維打印功能,您的設(shè)計將會更加出色?!?,經(jīng)過預處理得到結(jié)果。表2 為整理后的某企業(yè)軟件資源清單中AutoCAD 軟件資源的TF-IDF 預處理結(jié)果,該輸出結(jié)果為二元組的形式,在二元組中,第一位是詞條,第二位是詞條的權(quán)重值(保留5 位小數(shù))。
根據(jù)表2 中AutoCAD 軟件資源文本信息預處理的輸出數(shù)據(jù),按照詞條的權(quán)重將提取出的詞條進行排序,按詞條權(quán)重從高到低的順序的排序結(jié)果為:DWG、三維打印、數(shù)據(jù)格式、格式、渲染、演示圖形、設(shè)計數(shù)據(jù)、設(shè)計決策、繪圖、Autodesk 公司、AutoCAD、設(shè)計、共享、決策、圖形、CAD、數(shù)據(jù)、軟件??梢钥闯?,該軟件資源信息預處理可以很好地去除資源文本信息中的無關(guān)詞條,同時給資源屬性賦予較高的權(quán)重,為后續(xù)企業(yè)的軟件資源清單的屬性提取提供了很大的便利。不過該方法無法全部去除無關(guān)詞條,仍有少量無關(guān)詞條殘留,這是算法的不足之處。所以經(jīng)過預處理后還需人工輔助進行少量無關(guān)詞條的去除處理。
表2 軟件資源文本預處理結(jié)果
本文以某企業(yè)軟件資源清單文本為語料進行屬性提取,其中包含59 個軟件資源,每種軟件資源的提取結(jié)果中包含了資源的屬性值和少量無關(guān)詞語,經(jīng)過人工輔助過濾,去除無關(guān)詞語,將資源的屬性值提取并整理出來。由于篇幅限制,表3 僅列出了其中10 個軟件資源的屬性值提取結(jié)果。根據(jù)表3 中的數(shù)據(jù),將資源的屬性值按照定義好的各種屬性進行歸類整理,得到軟件資源的屬性值并存儲在屬性庫中,以供后續(xù)使用。
表3 資源屬性提取結(jié)果
經(jīng)過對提取結(jié)果的分析,本文所采用的方法對軟件資源文本提取出的資源屬性比較完整。按照已經(jīng)定義的資源屬性,提取出的屬性值如下:
ANSYSMechanical:FAbility(機械分析、結(jié)構(gòu)力學分析、熱分析、耦合分析、聲學分析、壓電分析、熱/結(jié)構(gòu)耦合分析、熱/電耦合分析),F(xiàn)Object(金屬材料、橡膠、泡沫、巖土、非金屬材料);
AutoCAD 2010:FPurpose(共享設(shè)計數(shù)據(jù)),F(xiàn)Filetype(DWG),F(xiàn)Ability(繪圖、三維打印、渲染、演示圖形);
AutoForm:FObject(金屬板材),F(xiàn)Ability(沖壓成形、仿真分析),F(xiàn)SoftType(CAE 模擬軟件);
capp 成組技術(shù)編輯系統(tǒng):FTech(成組技術(shù)),F(xiàn)Ability(capp 工藝編制、PDM、數(shù)據(jù)統(tǒng)計);
Pro/Engineer:FTech(CAD/CAM/CAE 一體化、參數(shù)化技術(shù)),F(xiàn)SoftType(三維軟件),F(xiàn)Ability(三維造型),FPurpose(產(chǎn)品設(shè)計);
SAP:FAbility(FI 財務(wù)會計、TR 財務(wù)管理、CO 管理會計、EC 企業(yè)管理、IM 投資管理、PP 生產(chǎn)計劃、MM 物料管理);
SINOVATION:FTech(CAD/CAM 一體化),F(xiàn)Ability(混合型建模、參數(shù)化設(shè)計、特征造型、CAM 加工,沖壓模具、注塑模具),F(xiàn)Object(汽車、汽車零部件、機床、通用機械、模具及工藝裝備、)FPurpose(設(shè)計及加工);
PDMLink:FFromInfo(參數(shù)技術(shù)公司(PTC)),F(xiàn)Ability(PDM 解決方案),F(xiàn)Tech(基于Web、基于Java),F(xiàn)SoftType(產(chǎn)品數(shù)據(jù)管理平臺),F(xiàn)Purpose(信息共享、集中存儲、集中管理、保障數(shù)據(jù)安全);
山大華天WIT-CAPP:FRange(工藝流程、工藝設(shè)計、工藝管理);
無錫制造業(yè)服務(wù)網(wǎng):FRange(企業(yè)供需信息、新聞動態(tài)、企業(yè)招聘、資料下載)。
研發(fā)設(shè)計資源是集團企業(yè)的核心資產(chǎn),是產(chǎn)品創(chuàng)新的重要支撐。本文依據(jù)研發(fā)設(shè)計資源的內(nèi)涵和特性,基于語義知識構(gòu)建的集團企業(yè)研發(fā)設(shè)計資源信息模型,對集團企業(yè)組織內(nèi)外部資源進行了統(tǒng)一有效的分類和定義,實現(xiàn)了對模型維度、屬性、描述的動態(tài)可擴展及自動繼承。在下一步工作中,將以研發(fā)設(shè)計資源的語義模型為基礎(chǔ),進行集團企業(yè)設(shè)計資源的空間模型研究。