梁 蕾,宋慶明,康陸佳,沈思遠(yuǎn),田黃田,吳 敏
(1.上海飛機制造有限公司制造工程技術(shù)中心,上海 201324;2.上海飛機制造有限公司科技管理部,上海 201324)
知識圖譜作為語義網(wǎng)的數(shù)據(jù)支撐,近年來成為了研究與應(yīng)用的熱點問題。知識圖譜將實體表示為節(jié)點,實體與實體間的關(guān)系表示為節(jié)點間的邊,從而形成了一個巨大的知識網(wǎng)絡(luò)。例如,“ARJ21-700”是“客機”的實例,“機翼”是“客機”的部件,而“上飛公司”是“ARJ21-700”的生產(chǎn)商,上述知識都可以通過(實體-關(guān)系-實體)的形式來描述。這種表示形式被稱為三元組,以上事實通過三元組可以表示為:
(ARJ21-700,類型,客機)
(ARJ21-700,部件,機翼)
(ARJ21-700,生產(chǎn)者,上飛公司)
知識圖譜可分為開放領(lǐng)域知識圖譜與限定領(lǐng)域知識圖譜。開放領(lǐng)域知識圖譜以描述普遍通識為主,如:WordNet、FrameNet、Mind-Net、OpenCYC、Yago、HowNet、CCD、CFN、Knowledge Graph、“知心”與“知立方”等。限定領(lǐng)域知識圖譜描述某一特定領(lǐng)域內(nèi)的知識或是事實,如:地理信息領(lǐng)域知識圖譜Geonames,計算機、金融與法律領(lǐng)域的“愛圖譜”,航空領(lǐng)域HowNet等。
知識圖譜的構(gòu)建需要投入大量的人力,特別是限定領(lǐng)域知識圖譜,需要構(gòu)建人員同時掌握知識圖譜構(gòu)建方法及領(lǐng)域內(nèi)專業(yè)知識,相較于開放領(lǐng)域知識圖譜,具有更高的難度。制造領(lǐng)域相比于計算機、金融與法律領(lǐng)域,公開可獲得的文本資源有限,并且每個制造單位產(chǎn)品、數(shù)據(jù)及管理模式差別較大,使得制造領(lǐng)域知識圖譜的構(gòu)建成為具有挑戰(zhàn)的研究問題,相關(guān)領(lǐng)域的知識圖譜更是鮮有報道。
本文在飛機總裝制造領(lǐng)域構(gòu)建了含17 種實體、20種實體關(guān)系、實體總量25846,關(guān)系總量64402的總裝制造領(lǐng)域知識圖譜。總結(jié)出了知識圖譜架構(gòu)、數(shù)據(jù)匯聚、數(shù)據(jù)標(biāo)注、圖譜生成等構(gòu)建步驟。本文后續(xù)部分組織如下:第二部分介紹構(gòu)建方法,第三部分展示所構(gòu)建的知識圖譜,最后為總結(jié)。
本文將知識圖譜構(gòu)建過程總結(jié)為架構(gòu)、數(shù)據(jù)匯聚、數(shù)據(jù)標(biāo)注、圖譜生成4 個步驟。其中,知識圖譜架構(gòu)確定知識圖譜包含的實體種類及實體間的關(guān)系種類,文獻[11]將該過程稱為本體的建立;數(shù)據(jù)匯聚實現(xiàn)支撐圖譜構(gòu)建的全部數(shù)據(jù)的獲??;數(shù)據(jù)標(biāo)注實現(xiàn)數(shù)據(jù)內(nèi)實體及實體關(guān)系的標(biāo)注;圖譜生成從標(biāo)注的數(shù)據(jù)內(nèi)抽取出實體及關(guān)系,后經(jīng)過消歧、歸約與校對,形成最終知識圖譜。
通過知識圖譜描述總裝制造人員、業(yè)務(wù)、產(chǎn)品與技術(shù)等知識域,以知識管理為目標(biāo),規(guī)劃了7 大類知識圖譜。具體為:產(chǎn)品結(jié)構(gòu)圖譜、崗位圖譜、技術(shù)譜系圖譜、零部件圖譜、業(yè)務(wù)流程圖譜、知識條目圖譜、制造方法圖譜。圖譜的架構(gòu)(本體)如圖1所示。
圖1 知識圖譜架構(gòu)(本體定義)
(1)產(chǎn)品結(jié)構(gòu)圖譜描述企業(yè)產(chǎn)品的零部件構(gòu)成結(jié)構(gòu),包括工位實體、工種實體、機身部位實體、AO(裝配大綱)模板實體、圖紙實體、零件實體。關(guān)系包括工位與工種關(guān)系、工種與機身部位關(guān)系、機身部位與AO 模板的關(guān)系、AO模板與圖紙的關(guān)系、圖紙與零件的關(guān)系。
(2)崗位圖譜描述公司崗位構(gòu)成與層級關(guān)系,實體包括組織機構(gòu)實體、崗位實體、人員實體,關(guān)系包括組織機構(gòu)間的關(guān)系,組織機構(gòu)與崗位關(guān)系,人員與崗位的關(guān)系。
(3)技術(shù)譜系圖譜描述管理及技術(shù)專業(yè)構(gòu)成及關(guān)系,實體包括技術(shù)類型實體,關(guān)系包括技術(shù)類型間的關(guān)系。
(4)零部件圖譜描述零部件類型及關(guān)系,實體包括零件類型實體與零件實體,關(guān)系包括零件類型與零件的關(guān)系。
(5)業(yè)務(wù)流程圖譜描述公司關(guān)鍵業(yè)務(wù)流程,實體包括任務(wù)實體與任務(wù)步驟實體,關(guān)系包括任務(wù)與任務(wù)步驟關(guān)系。
(6)知識條目圖譜描述知識類型與知識條目身,實體包括知識類型實體與知識條目實體,關(guān)系包括知識條目與知識類型關(guān)系,知識類型間關(guān)系,以及知識條目與知識來源關(guān)系。
(7)制造方法圖譜描述制造與裝配工藝方法構(gòu)成與關(guān)系,實體包括專業(yè)實體與制造方法實體,關(guān)系包括專業(yè)與制造方法的關(guān)系。
(8)此外,還包括崗位與任務(wù)關(guān)系、任務(wù)步驟與知識條目關(guān)系、零件與制造方法的關(guān)系、制造方法與知識條目的關(guān)系。
以工藝規(guī)范、培訓(xùn)資料、操作規(guī)程、技術(shù)要求、MBOM、裝配大綱數(shù)據(jù)等為基礎(chǔ)數(shù)據(jù),利用人工智能領(lǐng)域的自然語言理解與數(shù)據(jù)挖掘技術(shù),獲取產(chǎn)品、零部件、工藝方法、材料、崗位等概念的文本內(nèi)容描述,并建立同義等關(guān)系,形成初始知識圖譜,如圖2所示。該過程能夠充分保證所建立圖譜涉及概念的全面性,也能夠保證所形成圖譜與知識條目的關(guān)聯(lián)性,避免知識圖譜建成后無法自動地標(biāo)注與理解知識條目的問題。
圖2 數(shù)據(jù)匯聚、標(biāo)注與圖譜生成過程示意圖
在形成初始圖譜并與現(xiàn)有技術(shù)體系語義對齊后,人工介入干預(yù)圖譜的構(gòu)建結(jié)果,保證圖譜中概念的規(guī)范性。人工干預(yù)工作包括:確定具有歧義描述的唯一規(guī)范性描述,但圖譜將保留歧義關(guān)系保證語義覆蓋度;確定概念間關(guān)系,如工藝方法歸屬關(guān)系、零部件結(jié)構(gòu)關(guān)系、零部件類型關(guān)系等。
本節(jié)展示所構(gòu)建的知識圖譜。所構(gòu)建的總裝制造知識圖譜的各類實體及實體關(guān)系數(shù)量如表1 及表2 所示。7 大類知識圖譜17 種實體總計實體25846個,20種實體關(guān)系總計64402項。
表1 知識圖譜中各類實體數(shù)量統(tǒng)計
表2 知識圖譜中各類實體關(guān)系數(shù)量統(tǒng)計
知識圖譜采用圖數(shù)據(jù)庫存儲并可以用力導(dǎo)引圖的方式展示各圖譜中實體與實體間的關(guān)系。另外,所有圖譜通過關(guān)系形成關(guān)聯(lián)。每個圖譜的展示,是從各圖譜視角切入,能夠通過逐步點擊實體展開與該實體通過關(guān)系關(guān)聯(lián)的其他實體,從而展開到其他圖譜的實體。例如,從產(chǎn)品結(jié)構(gòu)圖譜為切入,點擊企業(yè)實體“上飛公司”能夠展開該部件下全部零部件(如,制造工程技術(shù)中心),點擊“制造工程技術(shù)中心”展開下設(shè)單位(如,冷加工工藝室),點擊“冷加工工藝室”展開下設(shè)全部崗位(如,機加工藝崗),點擊“機加工藝崗”展開該崗位全部任務(wù)(如,編制DC)(任務(wù)屬于業(yè)務(wù)流程圖譜的實體)及該崗位下的全部人員,點擊任務(wù)結(jié)點能夠展開任務(wù)步驟(任務(wù)步驟屬于業(yè)務(wù)流程圖譜的實體),點擊任務(wù)步驟展開相關(guān)的知識(知識屬于知識類型圖譜下實體)。圖3、圖4與圖5分別為崗位知識圖譜、產(chǎn)品結(jié)構(gòu)知識圖譜與制造方法知識圖譜的可視化展示圖。
圖3 崗位圖譜的可視化展示
圖4 產(chǎn)品結(jié)構(gòu)圖譜可視化展示
圖5 制造方法圖譜可視化展示
知識圖譜作為人工智能基礎(chǔ)知識組件,其構(gòu)建與應(yīng)用受到了廣泛的關(guān)注。由于總裝制造領(lǐng)域的專業(yè)性較強,在該領(lǐng)域知識圖譜的構(gòu)建與應(yīng)用尚研究不足。本文通過知識圖譜架構(gòu)、數(shù)據(jù)匯聚、數(shù)據(jù)標(biāo)注、圖譜生成等步驟,構(gòu)建了含17 種實體、20 種實體關(guān)系、實體總量25846,關(guān)系總量64402 的總裝制造領(lǐng)域知識圖譜。本文的研究能夠為相關(guān)限定領(lǐng)域知識圖譜的構(gòu)建工作提供參考與借鑒。進一步擴大本知識圖譜的數(shù)據(jù)量,研究其在各工藝相關(guān)業(yè)務(wù)場景下的應(yīng)用,具體地如,利用機器學(xué)習(xí)等方法,降低人工工作量;增加知識有效性驗證方法,降低對人員專業(yè)知識的需要;在工藝設(shè)計中利用知識圖譜實現(xiàn)工藝過程的自生成、工藝參數(shù)自決策、工裝工具的自選擇等知識驅(qū)動的智能應(yīng)用將是本文今后的重點工作。