寧偉航,劉檢華,熊 輝+,曹遠(yuǎn)沖,趙文浩
(1.北京理工大學(xué) 機械與車輛學(xué)院,北京 100081;2.上海衛(wèi)星裝備研究所,上海 200240)
復(fù)雜產(chǎn)品指客戶需求復(fù)雜、產(chǎn)品組成復(fù)雜、產(chǎn)品技術(shù)復(fù)雜、制造過程復(fù)雜、項目管理復(fù)雜的一類產(chǎn)品,如衛(wèi)星、飛機、火箭、武器系統(tǒng)等[1]。目前,我國復(fù)雜產(chǎn)品裝配屬于典型的離散型裝配,具有以手工操作為主、作業(yè)周期長(可達10個月)、涉及多學(xué)科交叉領(lǐng)域、裝配數(shù)據(jù)復(fù)雜、返工返修多等特點。在復(fù)雜產(chǎn)品的裝配過程中,通常會由于設(shè)計或工藝不完善、操作失誤等原因出現(xiàn)現(xiàn)場技術(shù)問題,這些問題的產(chǎn)生將會增加生產(chǎn)成本,并直接影響產(chǎn)品質(zhì)量和裝配進度[2]。因此,對離散裝配過程的現(xiàn)場技術(shù)問題管控策略進行研究,探索具有前瞻性、主動性的現(xiàn)場技術(shù)問題事前管控方法,對于提高裝配質(zhì)量,保障裝配生產(chǎn)效率具有十分重要的意義。
近年來,風(fēng)險管理的思想逐漸被引入制造領(lǐng)域,其目的主要包括:在生產(chǎn)活動開始前準(zhǔn)確評估制造系統(tǒng)的健康狀態(tài),避免漸變或突然產(chǎn)生的失效模式,并保障生產(chǎn)過程的平穩(wěn)性和產(chǎn)品最終質(zhì)量[3]?,F(xiàn)場技術(shù)問題的產(chǎn)生對于復(fù)雜產(chǎn)品的裝配過程可視為一種風(fēng)險事件。關(guān)于如何對制造過程的風(fēng)險事件進行有效管控,國內(nèi)外學(xué)者的相關(guān)研究主要集中在預(yù)測性維護、預(yù)警系統(tǒng)(Early Warning System, EWS)和大數(shù)據(jù)技術(shù)的集成應(yīng)用方面。張根保等[4]針對傳統(tǒng)制造系統(tǒng)維修策略研究中,未全面考慮動態(tài)環(huán)境事件對制造系統(tǒng)性能退化影響的問題,提出一種因素驅(qū)動的制造系統(tǒng)動態(tài)預(yù)測維修策略及優(yōu)化方法。該方法構(gòu)建了加工過程、人員、環(huán)境等方面的外在因素與瞬時合格產(chǎn)品生產(chǎn)率之間的映射模型,以實現(xiàn)系統(tǒng)服役階段效益產(chǎn)出最大化的目標(biāo)。VAFAEI等[5]提出一種模糊預(yù)警方法,用于改善基于狀態(tài)的維護(Condition Based Maintenance, CBM)策略,可就潛在的生產(chǎn)線故障或其他危險情況提供預(yù)警,從而使維護策略的選擇決策更為明智,該方法的有效性在一個汽車生產(chǎn)線的應(yīng)用中得到驗證。JI等[6]面向制造過程的多粒度層面,提出一種基于大數(shù)據(jù)分析的故障預(yù)測方法。在車間層,該方法可在任務(wù)開始前以及加工期間預(yù)測潛在故障,并通過重調(diào)度技術(shù)規(guī)避高風(fēng)險任務(wù);在機床層,可預(yù)測機器故障模式,從而提高機器利用率并防止錯誤使用;在加工過程層,可計算出潛在的加工誤差,通過動態(tài)調(diào)整加工操作減少缺陷,并且無需額外的加工成本。VAFEIADIS等[7]面向?qū)崿F(xiàn)零缺陷制造(Zero Defect Manufacturing, ZDM)的目標(biāo),構(gòu)想建設(shè)一種基于數(shù)據(jù)知識的早期決策支持系統(tǒng)(Early Stage-Decision Support System, ES-DSS),通過傳感網(wǎng)絡(luò)對包括離線歷史數(shù)據(jù)和實時數(shù)據(jù)在內(nèi)的所有可用數(shù)據(jù)進行收集、集成融合與建模,以識別車間層面的潛在問題。在產(chǎn)品裝配方面,學(xué)者們嘗試引入新技術(shù)手段,以實時感知并引導(dǎo)修正、解決裝配過程中的失誤或問題。MURA等[8]設(shè)計了一套桌面級手工裝配環(huán)境,使用扭矩/力傳感器和增強現(xiàn)實(Augmented Reality, AR)技術(shù)輔助工人進行操作,具有隨過程進行錯誤檢測、集成可視化指令并反饋信息的能力;但該環(huán)境仍處于開發(fā)階段,對于復(fù)雜的裝配順序需要大量初始測試,尚缺乏實用性。LAREK等[9]將工業(yè)4.0元素引入手工裝配過程,設(shè)計了一套可穿戴的移動電子設(shè)備,支持多方人員通過圖像、視頻等多媒體數(shù)據(jù)進行實時溝通,簡化了問題反饋處理流程;但其普及應(yīng)用仍面臨較多阻力,需要和多階段業(yè)務(wù)工作流集成兼容,并完善人體工程學(xué)設(shè)計以提升可用性。
綜上所述,目前國內(nèi)外對機械加工制造/裝配過程的風(fēng)險預(yù)警和管控取得了一定研究成果。然而,離散型復(fù)雜產(chǎn)品裝配過程的生產(chǎn)特點,使得現(xiàn)有研究成果不適用于對復(fù)雜產(chǎn)品裝配現(xiàn)場技術(shù)問題進行管控,其難點可歸納為以下3個方面:
(1)目前制造領(lǐng)域風(fēng)險預(yù)警與管控相關(guān)的研究成果,主要聚焦于自動化柔性生產(chǎn)線,其生產(chǎn)節(jié)拍和工藝流程穩(wěn)定;而離散型復(fù)雜產(chǎn)品裝配的工藝流程和生產(chǎn)節(jié)拍不穩(wěn)定,裝配工藝需要結(jié)合反復(fù)的試驗、試制過程設(shè)計定型,涉及多學(xué)科領(lǐng)域,對工藝人員的經(jīng)驗知識水平依賴性強。
(2)對于機械加工制造過程中設(shè)備故障、加工缺陷等風(fēng)險,現(xiàn)有研究主要關(guān)注數(shù)值型數(shù)據(jù)的影響,利用模型和算法預(yù)測并控制其浮動范圍;而復(fù)雜產(chǎn)品裝配過程的大量關(guān)鍵信息,如工藝數(shù)據(jù)、現(xiàn)場技術(shù)問題數(shù)據(jù)等是以非結(jié)構(gòu)化的文本形式記錄的,為后續(xù)有效分析利用造成了困難。
(3)裝配現(xiàn)場技術(shù)問題的解決不同于一般的重復(fù)性實踐活動,它也是創(chuàng)造具有場景性附加價值知識的過程。有效地重用問題解決中蘊含的知識,是對企業(yè)生產(chǎn)成本和效率的重要保障。但這部分知識體現(xiàn)出較強的內(nèi)隱性,模糊且難以明確形式化表達,從而給有效使用帶來了挑戰(zhàn)。
案例推理(Case-Based Reasoning, CBR)是一種人工智能的推理范式,其核心思想是將過往經(jīng)驗用于現(xiàn)有問題的快速解決[10]。CBR方法能夠在缺乏精確數(shù)學(xué)模型的情形下實現(xiàn)良好的信息獲取效果,是知識密集型領(lǐng)域中對隱性知識進行重用的有效手段。張壯雅等[11]將CBR與神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立了一種面向真空注型工藝的質(zhì)量控制模型,以實現(xiàn)初始工藝參數(shù)的智能推薦和試模產(chǎn)品缺陷的智能修正。FARHAN等[12]提出一種與SolidWorks應(yīng)用編程接口(Application Programming Interface, API)集成的CBR方法,應(yīng)用于專用機床(Special Purpose Machines, SPMs)的計算機輔助設(shè)計過程,顯著提高了SPMs的設(shè)計效率。文家富等[13]將領(lǐng)域本體嵌入CBR,對文本屬性進行語義相似計算,以提高案例檢索準(zhǔn)確率;但本體適用于概念、屬性及關(guān)系相對固化的領(lǐng)域,其構(gòu)建邏輯嚴(yán)密,且隨著粒度細(xì)化維度會迅速增長。詞移距離(Word Mover’s Distance, WMD)是一種無監(jiān)督的短文本相似性度量算法,由KUSNER等[14]于2015年提出。WMD基于詞嵌入技術(shù)word2vec運行[15],具有靈活的領(lǐng)域遷移性,不依賴標(biāo)注數(shù)據(jù),且能準(zhǔn)確量化文本相似度,已在文本挖掘[16]、問答系統(tǒng)[17]和文檔摘要[18]等研究中取得良好應(yīng)用。
本文將CBR和WMD算法引入復(fù)雜產(chǎn)品裝配生產(chǎn),提出一種基于案例推理和詞移距離的裝配現(xiàn)場技術(shù)問題管控方法。該方法首先采集并融合裝配工藝數(shù)據(jù)和現(xiàn)場技術(shù)問題數(shù)據(jù),實現(xiàn)案例構(gòu)建;然后對WMD進行適應(yīng)性改進,并嵌入CBR以表征案例語義相似性,提高檢索的準(zhǔn)確率;該方法在裝配工藝設(shè)計階段,通過識別工序級的潛在風(fēng)險問題并進行預(yù)警,形成了對現(xiàn)場技術(shù)問題的事前管控機制,為改變傳統(tǒng)的現(xiàn)場技術(shù)問題事后管控模式提供了一種新思路。該方法的有效性通過在企業(yè)的工程應(yīng)用得到了驗證。
從產(chǎn)品裝配生產(chǎn)全過程來看,復(fù)雜產(chǎn)品的裝配生產(chǎn)可以分為工藝端和車間端兩部分,工藝端主要包括裝配工藝設(shè)計,而車間端可以看作是裝配工藝的具體實施。通常,離散裝配生產(chǎn)基于流程進行組織,工藝設(shè)計處于操作執(zhí)行的上游階段。針對型號產(chǎn)品組部件的裝配,工藝端首先編制由一系列串、并行的工序節(jié)點構(gòu)成的部裝工藝流程。某衛(wèi)星載荷艙結(jié)構(gòu)的部裝工藝流程如圖1所示。工序是生產(chǎn)的基本單位,每道工序的信息記錄于一張工藝卡中,包括工序內(nèi)容、物料、工位等。工序內(nèi)容是工藝設(shè)計的核心,它以文本形式對操作對象、方法、目標(biāo)等進行描述。工藝端編制完成且通過審簽的工藝文件,將下發(fā)至車間端,指導(dǎo)操作人員進行裝配作業(yè)。
對于研制產(chǎn)品或者剛剛定型產(chǎn)品而言,現(xiàn)場裝配中往往出現(xiàn)較多現(xiàn)場技術(shù)問題,技術(shù)問題的管控不足,將對后續(xù)作業(yè)造成嚴(yán)重影響?,F(xiàn)場技術(shù)問題按照產(chǎn)生原因可分為設(shè)計、工藝、操作、器材等多種類型,如設(shè)計缺陷影響可裝配性;工藝對新材料、新技術(shù)缺乏適用性;操作者由于個人水平或客觀因素出現(xiàn)操作失誤;儀器失靈、設(shè)備失效等。其中工藝類、操作類問題涉及多學(xué)科領(lǐng)域,解決過程依賴密集的知識,是本文管控研究的重點。當(dāng)現(xiàn)場技術(shù)問題出現(xiàn)時,操作人員填報現(xiàn)場技術(shù)問題處理單,將問題現(xiàn)象反饋給工藝端。工藝師對問題進行分析后提出處理方案,對于工藝類問題,進行工藝更改或制定臨時工藝,以修正或適當(dāng)增補原版工序內(nèi)容;對于操作類問題則制定反向作業(yè)指導(dǎo)內(nèi)容。操作人員依據(jù)處理方案展開返工返修,確保問題得到有效解決,形成閉環(huán)。
傳統(tǒng)的現(xiàn)場技術(shù)問題管控方式屬于事后反應(yīng)式管控,其繁冗耗時、知識利用率低,不適應(yīng)當(dāng)前復(fù)雜產(chǎn)品裝配需求。特定工序和其執(zhí)行中產(chǎn)生的現(xiàn)場技術(shù)問題在邏輯上密切相關(guān),CBR能夠以案例的形式表達這種隱性關(guān)聯(lián),形成對現(xiàn)場技術(shù)問題進行事前管控的數(shù)據(jù)基礎(chǔ);而工序內(nèi)容具有簡明扼要的特點,是一種典型的短文本,通過WMD算法能夠以結(jié)構(gòu)化的形式表達工序間的語義相似性,為案例匹配提供便利。因此,將CBR和WMD算法相結(jié)合,對于在產(chǎn)品裝配工藝設(shè)計階段就開展現(xiàn)場技術(shù)問題管控有著積極的作用。
CBR從領(lǐng)域案例庫中提煉隱性知識用以快速解決新問題,其工作流程如圖2所示,主要包括案例檢索與篩選、案例修改與重用、案例存儲等環(huán)節(jié)。其中,案例檢索與篩選是CBR的關(guān)鍵步驟,所獲取案例是否和用戶定義的需求準(zhǔn)確相關(guān),直接決定了知識重用的效果。在CBR中,具體案例可表達為一個三元組CA={P,S,R},其中P為案例應(yīng)用情形的描述,S為與P相應(yīng)的方案知識實例,R為當(dāng)前知識S的應(yīng)用效果。P通常包含依據(jù)用戶需求定義的一系列技術(shù)特征屬性,能夠?qū)Σ煌咐M行良好的區(qū)分。案例檢索時,將當(dāng)前需求按照預(yù)定義的技術(shù)特征屬性來描述,通過計算各案例的P與當(dāng)前需求的綜合相似度進行匹配,選取最相似的案例進行重用。
將用于現(xiàn)場技術(shù)問題管控的案例表達為CA={APF,IS,RE},其中APF來自裝配工藝數(shù)據(jù),表示工序特征屬性集合;IS和RE來自現(xiàn)場技術(shù)問題數(shù)據(jù),IS表示在工序APF的執(zhí)行中,所產(chǎn)生的現(xiàn)場技術(shù)問題及其處理信息,RE以布爾值表達問題是否解決。APF、IS、RE分別對應(yīng)于元素P、S、R,在案例重用時通過APF啟發(fā)獲得IS,為潛在的現(xiàn)場技術(shù)問題提供預(yù)警管控信息。在此基礎(chǔ)上,利用WMD算法對案例中的工序內(nèi)容文本進行高精度編碼,提高CBR對非結(jié)構(gòu)化信息的利用率。
WMD算法基于詞嵌入技術(shù)word2vec定量表征短文本間的語義相似程度。word2vec通過神經(jīng)網(wǎng)絡(luò)模型將文本詞語訓(xùn)練為向量空間中的分布式表達,每個詞語被轉(zhuǎn)化為特定維度的多維單位實向量,語義相似的詞向量彼此接近。Skip-gram是一種無監(jiān)督的淺層神經(jīng)網(wǎng)絡(luò)詞嵌入模型,因?qū)Φ皖l詞具有良好的預(yù)測效果而得到廣泛使用[15]。Skip-gram通過以中心詞預(yù)測周圍詞的方式訓(xùn)練獲得詞向量。給定詞匯序列w1,w2,…,wL,Skip-gram模型的目標(biāo)函數(shù)為:
(1)
式中k表示訓(xùn)練上下文對于中心詞的窗口范圍,k值增大時,模型可以習(xí)得長程語義關(guān)系,但k較大時易導(dǎo)致過擬合,在應(yīng)用中通常取k=5。p(wt+j|wt)是通過層次softmax函數(shù)對詞向量vt+j和vt計算得到的條件概率,Skip-gram在訓(xùn)練中通過使周圍詞的組合對數(shù)概率最大化來不斷調(diào)整詞向量,最終得到收斂的詞嵌入結(jié)果[15]。
WMD將兩篇文檔中詞語的權(quán)值分別抽象為遷移量和容量,兩者的語義相似度定義為一篇文檔中詞語的總權(quán)值完全遷移,并填補另一篇文檔中詞語總?cè)萘克璧淖钚±鄯e距離。算法中詞語的權(quán)值d以詞頻計算,兩文檔間的總遷移量和總?cè)萘肯嗟?,均為單?。給定兩篇文檔D1和D2,首先構(gòu)建詞典矩陣Xn×m,n是兩篇文檔中非重復(fù)詞語的總數(shù),X的第i行xi∈Rm代表詞i對應(yīng)的m維向量。詞語間距離定義為c(i,j)=‖xi-xj‖2,由于x為單位向量,c(i,j)∈[0,2],是有界的。定義遷移矩陣T∈Rn×n,元素Tij表示D1中的詞i遷移至D2中的詞j時所分配的權(quán)值。遷移過程中,D1中詞i的總遷出量與D2中詞j的總?cè)萘啃璺謩e等于各自權(quán)值,D1和D2間的WMD值為下述線性規(guī)劃問題的最優(yōu)解:
s.t.
(2)
裝配工藝中較多低頻術(shù)語對相應(yīng)工序有著標(biāo)志性意義,僅以詞頻對詞語加權(quán)易影響WMD對語義相似性度量的準(zhǔn)確性。為了從文檔局部角度和語料全局角度更綜合地表征某詞語的重要性,將領(lǐng)域語料中稀有術(shù)語對所在文檔的重要性進行放大,本文對WMD進行適應(yīng)性改進,重定義詞權(quán)值為詞頻—逆文檔頻率(Term Frequency-Inverse Document Frequency, TF-IDF)[19]:
(3)
式中:n(wi,z)表示詞i在文檔z中的頻數(shù),n(z)是文檔z的總詞數(shù),N是語料集中的總文檔數(shù),ni是含有詞i的文檔數(shù)。
引入逆文檔頻率idf因子后,兩文檔詞語的總權(quán)值可能不再相等,從而造成過約束現(xiàn)象。本文定義詞移過程由總權(quán)值較小的一方D1向較大的一方D2進行,放松WMD原型的約束條件,令D2中詞j的總?cè)萘坎怀^其權(quán)值;同時在目標(biāo)函數(shù)中引入懲罰項修正WMD值,定義兩文檔間詞語的權(quán)值差為補給遷移量,同樣由D1遷出,填補D2的剩余容量。保守起見,懲罰項遷移距離取全體c(i,j)中的最大值mdist。通過將最小累積距離除以遷移總量進行標(biāo)準(zhǔn)化,最終的WMD值仍表征單位詞權(quán)的遷移距離,滿足WMD∈[0,2],使不同文檔間的WMD值具有可比性。修正后的計算公式為:
s.t.
(4)
基于復(fù)雜產(chǎn)品的裝配業(yè)務(wù)流程,構(gòu)建面向裝配工藝設(shè)計過程的現(xiàn)場技術(shù)問題管控模型,為采集關(guān)聯(lián)裝配工藝數(shù)據(jù)和現(xiàn)場技術(shù)問題數(shù)據(jù),進行案例構(gòu)建和重用奠定基礎(chǔ)。目前,復(fù)雜產(chǎn)品裝配生產(chǎn)各階段的業(yè)務(wù)數(shù)據(jù)通常由不同的信息系統(tǒng)進行采集和管理,儲存于多個數(shù)據(jù)庫中,使企業(yè)數(shù)據(jù)呈現(xiàn)多源分散的特點。在工藝端,工藝師通過計算機輔助工藝規(guī)劃(Computer Aided Process Planning, CAPP)系統(tǒng)進行工藝編制,而車間端現(xiàn)場技術(shù)問題等數(shù)據(jù)的采集處理通過制造執(zhí)行系統(tǒng)(Manufacturing Execution System, MES)來實現(xiàn)。系統(tǒng)間數(shù)據(jù)的共享依賴專門的軟件接口,將數(shù)據(jù)編碼為可擴展標(biāo)記語言(eXtensible Markup Language, XML)格式進行發(fā)送和接收,并解析出源對象。這種模式下數(shù)據(jù)的傳輸效率低、冗余程度高,且接收方在使用數(shù)據(jù)后往往不對其進行持久化管理,從而導(dǎo)致不同階段業(yè)務(wù)數(shù)據(jù)間的關(guān)聯(lián)性弱,不便于進行深入分析和利用。
本文建立的管控模型如圖3所示,其核心功能結(jié)構(gòu)是現(xiàn)場技術(shù)問題管控系統(tǒng)。該系統(tǒng)對CAPP和MES進行一體化設(shè)計,貫通從工藝端到車間端的業(yè)務(wù)流程。工藝端和車間端的業(yè)務(wù)圍繞型號產(chǎn)品的研制周期遞進展開,工藝端生成的工藝數(shù)據(jù)可在系統(tǒng)內(nèi)直接向車間端映射,指導(dǎo)裝配操作過程;車間端執(zhí)行中生成的現(xiàn)場技術(shù)問題數(shù)據(jù)可在同一平臺中回溯至工藝端,即時尋求反饋處理信息。工藝端和車間端通過閉環(huán)的數(shù)據(jù)流進行業(yè)務(wù)流程的集成,在提高問題處理效率的同時,使數(shù)據(jù)具有良好的可追溯性。在此基礎(chǔ)上使用同一數(shù)據(jù)庫存儲工藝數(shù)據(jù)和現(xiàn)場技術(shù)問題數(shù)據(jù),將生產(chǎn)過程不同階段產(chǎn)生的數(shù)據(jù)進行持久化存儲,并保證后續(xù)用于技術(shù)問題管控的基礎(chǔ)數(shù)據(jù)具有單一來源。工藝數(shù)據(jù)和問題數(shù)據(jù)對應(yīng)于關(guān)系型數(shù)據(jù)庫中的兩個數(shù)據(jù)表,每張工藝卡和現(xiàn)場技術(shù)問題處理單分別是數(shù)據(jù)表的記錄單元,其間通過外鍵字段相關(guān)聯(lián),進一步實現(xiàn)工藝數(shù)據(jù)和現(xiàn)場技術(shù)問題數(shù)據(jù)的融合。管控系統(tǒng)借助由融合數(shù)據(jù)生成的案例的支撐,在新型號的裝配工藝設(shè)計過程調(diào)用改進的WMD算法,獲取潛在現(xiàn)場技術(shù)問題的預(yù)警信息,對裝配執(zhí)行過程進行事前管控。通過兩階段業(yè)務(wù)流程的集成和數(shù)據(jù)的融合,型號工藝在繼承歷史數(shù)據(jù)的過程中優(yōu)化完善,降低導(dǎo)致問題的可能性,形成復(fù)雜產(chǎn)品裝配現(xiàn)場技術(shù)問題管控模型。
管控模型的具體工作流程如圖4所示。對于工藝端編制完成的工藝流程,每個工序節(jié)點關(guān)聯(lián)一張工藝卡,掛載該道工序的特征屬性信息。工藝流程隨著裝配任務(wù)的啟動實例化映射至車間端,發(fā)生現(xiàn)場技術(shù)問題的工序節(jié)點進一步關(guān)聯(lián)現(xiàn)場技術(shù)問題處理單,掛載問題的閉環(huán)處理信息。在產(chǎn)生現(xiàn)場技術(shù)問題的工序節(jié)點,創(chuàng)建如2.1節(jié)所述結(jié)構(gòu)的案例CA={APF,IS,RE},其數(shù)量隨研制生產(chǎn)積累而增長,形成案例庫。復(fù)雜產(chǎn)品不同型號間的工藝流程存在差異,但工序級信息的交叉復(fù)用十分普遍。在新型號的裝配工藝設(shè)計中,將工序按特征屬性表達為APFn,使用CBR與歷史案例的APF進行匹配,實現(xiàn)案例檢索。工藝師可由相似案例的IS預(yù)判潛在的現(xiàn)場技術(shù)問題,即時修改與完善工序內(nèi)容,并添加預(yù)警指導(dǎo)信息。該模型通過重用工序—問題關(guān)聯(lián)知識,在協(xié)助操作人員識別風(fēng)險點,避免誤操作,降低現(xiàn)場技術(shù)問題產(chǎn)生概率的同時,推動型號工藝的迭代演進和優(yōu)化升級。
依據(jù)工藝卡中的具體項目,工序特征屬性細(xì)化表達為APF={OT,AMT,PM,PS,QCL,PC}。其中:PC表示工序內(nèi)容,是非結(jié)構(gòu)化的文本數(shù)據(jù);其余各項元素是結(jié)構(gòu)化的分類屬性,將其編碼為離散的數(shù)值變量,各元素的具體含義和編碼方式如表1所示。使用現(xiàn)場技術(shù)問題處理單中的關(guān)鍵數(shù)據(jù),將預(yù)警管控信息進一步表達為IS={PH,TS},其中PH表示問題現(xiàn)象,TS是相應(yīng)的處理方案。
表1 結(jié)構(gòu)化工序特征屬性及編碼方式
對于工序內(nèi)容屬性,將新工序APFn的工序內(nèi)容PCn編碼為基準(zhǔn)值0,各案例工序APF的工序內(nèi)容PC通過計算它與PCn之間的WMD值進行編碼。傳統(tǒng)的CBR案例編碼僅取決于案例自身屬性,是固化的,本文中的PC編碼是一種動態(tài)碼,同一案例的PC編碼隨待匹配內(nèi)容PCn而變化。
算法使用的詞向量通過在數(shù)據(jù)庫全部文本數(shù)據(jù)形成的語料集中訓(xùn)練獲得,并隨著業(yè)務(wù)數(shù)據(jù)量的擴展定期重復(fù)訓(xùn)練,以保證領(lǐng)域詞語的全面性和詞向量語義的準(zhǔn)確性。對語料預(yù)處理時,使用包括機械、質(zhì)監(jiān)、航空航天、能源、物流、安全工程等領(lǐng)域的專業(yè)詞典協(xié)助分詞,并過濾無意義的停用詞。工藝師團隊對分詞結(jié)果抽樣復(fù)審,確保分詞的合理和可靠性。
案例獲取以雙層檢索的方式實現(xiàn)。首先將案例工序APF與新工序APFn通過表1中的5個結(jié)構(gòu)化屬性進行匹配,并設(shè)置RE=True,以確認(rèn)案例實際有效,從案例庫過濾得到候選案例。首層檢索通過定性搜索快速壓縮檢索空間,提高效率。第二層檢索計算候選案例的PC編碼并按照升序進行排列,通過實驗分析設(shè)定閾值進行二次過濾,結(jié)合實際情況取PC編碼低于閾值的各案例進行知識重用。
本文以上海航天某所的實際生產(chǎn)過程為研究對象。該所主要負(fù)責(zé)多種型號軍用、民用衛(wèi)星的總裝生產(chǎn),不同型號產(chǎn)品的結(jié)構(gòu)多樣,在實際生產(chǎn)中積累了豐富的裝配工藝數(shù)據(jù)和現(xiàn)場技術(shù)問題數(shù)據(jù)。根據(jù)工藝ID、具體產(chǎn)品ID、型號任務(wù)ID等多鍵值間的關(guān)聯(lián)關(guān)系,對CAPP和MES數(shù)據(jù)庫中半年內(nèi)的歷史裝配數(shù)據(jù)進行集成,形成面向本文研究主題的工序—問題案例數(shù)據(jù)集。該數(shù)據(jù)集總計1 513條有效案例,某條案例的數(shù)據(jù)樣例如表2所示。
表2 工序—問題案例數(shù)據(jù)樣例
匯總案例數(shù)據(jù)集中的PC、PH和TS部分構(gòu)建語料集,基于網(wǎng)絡(luò)詞庫(https://pinyin.sogou.com/dict/)的相關(guān)專業(yè)詞典和中文常用停用詞表(https://github.com/goto456/stopwords)進行分詞、去停用詞等預(yù)處理后,語料集共包含7 916項專業(yè)詞語。本文實驗基于Python 3.6語言,在集成開發(fā)環(huán)境(Integrated Development Environment, IDE)Anaconda中展開。
對完成預(yù)處理的語料使用Skip-gram模型訓(xùn)練獲得詞向量。在相關(guān)應(yīng)用研究中,詞向量維度m通常在200~300之間,本文取m=200,窗口寬度為默認(rèn)值k=5,執(zhí)行2 000輪迭代獲得詞嵌入結(jié)果。t分布隨機鄰域嵌入(t-distributed Stochastic Neighbor Embedding,t-SNE)算法是一種常用的高維數(shù)據(jù)降維和可視化技術(shù),能使得高維空間中相似的樣本在降維后仍足夠接近[20]。本文隨機選擇100項術(shù)語,使用t-SNE算法將相應(yīng)的詞向量降維至二維平面,觀察訓(xùn)練結(jié)束后詞向量間的相對位置,如圖5所示。
可以看出,詞嵌入模型從語料中學(xué)習(xí)到了語義信息,具有較強語義相關(guān)性的術(shù)語間彼此接近,如“分離艙”、“散線”和“沖撞”,“油泵”、“渦輪”、“振動”和“噪聲”,“無水乙醇”和“丙酮”,“無損檢測”和“探傷”等。在此基礎(chǔ)上隨機抽取400條案例的工序內(nèi)容PC,使用WMD計算出PC1~PC200和PC201~PC400間的語義相似度交叉矩陣,以熱力圖形式呈現(xiàn),如圖6所示。結(jié)果表明,語義相似度矩陣中的WMD值具有明顯的梯度,以WMD值對案例的PC進行編碼能夠?qū)崿F(xiàn)良好的語義區(qū)分性。
為了觀測案例工序內(nèi)容和問題現(xiàn)象間的語義關(guān)聯(lián)強度,對數(shù)據(jù)集中全體案例的PC和PH間的WMD值進行計算,將所得的1 513項數(shù)據(jù)結(jié)果進行分布建模,作直方圖并擬合出相應(yīng)的核密度曲線[21],實驗結(jié)果如圖7a所示。對圖6中隨機抽樣條件下,工序內(nèi)容間的40 000項無重復(fù)WMD值同樣建立分布模型,進行對比,結(jié)果如圖7b所示。
通過對比兩種分布情況可以發(fā)現(xiàn),工序內(nèi)容間的WMD結(jié)果覆蓋了區(qū)間[0.0,1.4],具有較廣的范圍;工序內(nèi)容和關(guān)聯(lián)問題現(xiàn)象間的WMD分布則更加集中,主要落在區(qū)間[0.2,1.2]內(nèi)。這是因為裝配工藝包含廣泛多樣的語義信息,而特定工序和其執(zhí)行中產(chǎn)生的現(xiàn)場技術(shù)問題則有著相對穩(wěn)定的關(guān)聯(lián)模式。同時,PC-PH間WMD分布的均值為0.738 4,低于PC間交叉WMD分布的均值0.839 6。從核密度曲線來看,PC-PH分布的概率密度峰值點出現(xiàn)在均值左側(cè),約為0.66;而PC間交叉分布的峰值點顯著高于均值,約為1.06。這表明工序內(nèi)容和問題現(xiàn)象間相對普遍地存在著更強的語義關(guān)聯(lián)性,與直觀經(jīng)驗相吻合,WMD算法能夠合理地度量語義相似性,也體現(xiàn)了面向裝配工藝設(shè)計過程進行現(xiàn)場技術(shù)問題管控的可行性。
平臺結(jié)構(gòu)是衛(wèi)星產(chǎn)品的關(guān)鍵功能結(jié)構(gòu),涉及多個分系統(tǒng)組部件的裝配。由CAPP系統(tǒng)數(shù)據(jù)庫抽取獲得某新型號星推進系統(tǒng)的裝配工藝,取其中一道工序作為新工序APFn,通過CBR從案例集中檢索相似案例,識別潛在的現(xiàn)場技術(shù)問題并重用處理方案知識進行預(yù)警管控。APFn的詳細(xì)內(nèi)容如表3所示。
表3 新工序APFn特征屬性內(nèi)容
首先進行第一層檢索,獲取候選案例。設(shè)置{OT,AMT,PM,PS,QCL,RE}={3,3,1,2,3,True},由案例集中過濾得到121條候選案例。計算各候選案例的PC與PCn間的WMD值,結(jié)果區(qū)間為[0.533 0,1.353 0]。將WMD結(jié)果除以理論上界值2進行歸一化,作為候選案例的工序內(nèi)容編碼PC_code,并按照升序進行排列,取排名前10的案例列于表4中。
表4 經(jīng)過排序的候選案例
由結(jié)果可見,案例CA81依據(jù)最小的PC_code排名第一。從第三條案例CA73開始,PC_code躍升至0.4以上,表明相應(yīng)案例的PC和新工序內(nèi)容PCn具有較低的語義相似性。取CA81作為獲取案例進行分析重用,其具體內(nèi)容如表5所示。
表5 案例CA81的具體內(nèi)容
通過直觀對比分析可以判斷,PC81和PCn的語義內(nèi)容具有顯著的相似性,均描述了將不同力級的發(fā)動機/推力器保護罩安裝至平臺結(jié)構(gòu)的操作目標(biāo)。在推進系統(tǒng)的裝配工藝中,“發(fā)動機”和“推力器”兩詞存在多處互用的情形,在語義上并無實質(zhì)差異。PH81揭示了安裝過程中由于意外磕碰導(dǎo)致發(fā)動機表面劃傷的風(fēng)險問題;相應(yīng)地,處理方案TS81中的信息可作為預(yù)警管控措施,主要包括對操作人員的裝備穿戴要求、對發(fā)動機機體關(guān)鍵部位的保護方法和必要的安防技術(shù)規(guī)范等。PH81和TS81可由工藝師結(jié)合當(dāng)前工序APFn的具體內(nèi)容進行適當(dāng)修改,加載到工藝卡中,通過參考在相似歷史工序執(zhí)行過程中產(chǎn)生的現(xiàn)場技術(shù)問題,并在新工序的設(shè)計中重用技術(shù)問題處理知識,促進工序級工藝內(nèi)容的完善。
同時對表4中排名第二和第三的案例CA78、CA73的工序內(nèi)容進行分析。PC78同樣描述了某力級發(fā)動機保護罩的裝配操作,安裝位置為承力筒下端框,除目標(biāo)位置外,其余內(nèi)容與PCn、PC81總體相似。而PC73描述了將工藝側(cè)板安裝至星體的過程,操作對象和方法等均與PCn有較大差異,對當(dāng)前工序APFn的設(shè)計不具有明顯指導(dǎo)價值。該次實驗中,CA78為最后一項有效案例,CA73為首項無效案例。通過進一步研究選取合適的閾值,對完成排序的候選案例進行二次過濾,降低返回案例的冗余率。
類似地,對新型號星的熱控、姿態(tài)控制、遙測、供配電等多個分系統(tǒng)裝配工藝中的工序進行案例檢索,在213組平行實驗中有100組匹配出有效案例及相應(yīng)的問題管控信息,有效實驗占比47%。通過對排序后的候選案例進行逐一分析,分別記最后一項有效案例與首項無效案例的PC_code為有效閾值threshold_val和截止閾值threshold_inval。在每組實驗中,補充計算經(jīng)首層檢索排除的各非候選案例工序?qū)τ诖ヅ涔ば虻腜C_code,取最小值記為irrelevant_near。對100組有效實驗相應(yīng)的threshold_val、threshold_inval和irrelevant_near作折線圖,觀察波動范圍和相對關(guān)系,如圖8所示。
結(jié)果表明,各組實驗的有效閾值threshold_val均大幅低于相應(yīng)的irrelevant_near,采用工序結(jié)構(gòu)化屬性匹配進行首層檢索,能夠有效濾除弱語義相關(guān)性案例;同時,irrelevant_near整體高于相應(yīng)的截止閾值threshold_inval,首層檢索未造成有價值案例的損失。和截止閾值的波動幅度相比,有效閾值的變化更加穩(wěn)定,集中在區(qū)間[0.31,0.37]內(nèi);而96%的截止閾值分布在0.4以上。當(dāng)閾值取0.4對候選項進行二次過濾時,可返回全部有效案例,并以較高的置信度濾除低價值案例。故在實際應(yīng)用中將二次過濾的閾值取為0.4,保障結(jié)果中有效案例的比例。
為了驗證WMD算法在文本檢索與匹配中具有更加優(yōu)良的準(zhǔn)確度,使用TF-IDF模型[19]、潛在狄利克雷分布(Latent Dirichlet Allocation, LDA)[22]和詞嵌入質(zhì)心(Centroids of Word Embeddings, CWE)[17]等文本處理領(lǐng)域中比較成熟的算法進行對比實驗。上述算法將文本進行分詞處理后,進一步轉(zhuǎn)化為多維向量,以向量間的余弦距離表征文本間的語義相似度。將以詞頻對詞語加權(quán)的WMD算法原型(WMD-prototype)也納入對比,觀察改進后WMD算法的使用效果。
MAP是一項廣泛使用于評價信息檢索方法效果的指標(biāo),它是多次實驗結(jié)果平均準(zhǔn)確率(AP)的平均值[23]。在每次實驗中,給定待匹配對象和若干個預(yù)標(biāo)記的相關(guān)對象,經(jīng)算法排序后相關(guān)對象的排名越高,排名順序和預(yù)期越吻合,則方法效果越好,AP值越接近1。AP的計算公式為:
(5)
式中:t表示預(yù)選取的相關(guān)對象總數(shù),IdealRi和ActualRi分別表示第i個相關(guān)對象的理想排名和實際排名。本文基于案例集中的PC文本進行5輪平行實驗。每輪實驗預(yù)選取6項具有強語義相關(guān)性的工序內(nèi)容PC,隨機選擇其中一項為待匹配對象,其余t=5項標(biāo)記為相關(guān)對象,通過各算法對全體案例的PC排序。各輪實驗的AP和MAP結(jié)果如表6所示。
表6 算法對比實驗結(jié)果 %
實驗結(jié)果表明,WMD算法取得了最高的MAP得分97.87%,對于相關(guān)工序的檢索效果顯著優(yōu)于其他幾種算法。WMD在5輪實驗中的AP值均在90%以上,從而反映了它在工程實際應(yīng)用中的可靠性和穩(wěn)定性。同時,WMD的MAP值相較于WMD-prototype有了進一步提升,驗證了本文對WMD算法的改進方式能夠使其在案例匹配中實現(xiàn)更高的準(zhǔn)確率。
基于上述理論和實驗研究,利用Microsoft Visual Studio 2008、Microsoft.Net Framework 3.5技術(shù)開發(fā)了瀏覽器/服務(wù)器模式(Browser/Server, B/S)的復(fù)雜產(chǎn)品裝配過程現(xiàn)場技術(shù)問題管控系統(tǒng)。目前,該系統(tǒng)已在上海航天某所得到試運行,對本文提出的基于案例推理和詞移距離的裝配現(xiàn)場技術(shù)問題管控方法進行了驗證。系統(tǒng)關(guān)鍵功能的實現(xiàn)和應(yīng)用效果如下:
在工藝端,工藝師可進入如圖9所示的裝配工藝設(shè)計界面,在工藝內(nèi)容編制區(qū)域逐步設(shè)計當(dāng)前裝配工藝流程的每道工序。對于新型號工藝,可使用案例檢索與風(fēng)險預(yù)警信息加載區(qū)域進行工藝審查與完善。點擊“相似案例一鍵匹配”,系統(tǒng)基于算法進行雙層檢索,獲得相似案例,排序后在列表中展示案例工序名稱。勾選一或多項案例并點擊“風(fēng)險預(yù)警信息加載”,相應(yīng)案例的現(xiàn)場技術(shù)問題現(xiàn)象、處理方案等信息將以XML格式批量加載到工序內(nèi)容中,工藝師可根據(jù)實際需求適當(dāng)修改,并關(guān)聯(lián)至當(dāng)前工序?qū)崿F(xiàn)復(fù)用。
車間端可對裝配工藝信息進行查看,并進入如圖10所示的“風(fēng)險識別庫”,與各道工序關(guān)聯(lián)的XML數(shù)據(jù)經(jīng)解析后展示在“工序風(fēng)險問題識別與控制措施”列表中,對操作過程進行預(yù)警管控。
系統(tǒng)應(yīng)用后,對平均約40%以上的新型號工序提供了關(guān)聯(lián)問題的預(yù)警信息,為工藝師進行現(xiàn)場技術(shù)問題的事前管控提供了重要的決策支持。對來自3種型號總計1 000道經(jīng)過審查與優(yōu)化的工序,分別統(tǒng)計案例匹配結(jié)果中有效案例的比例,結(jié)果如圖11所示。
由結(jié)果可見,取0.4作為PC_code閾值進行二次過濾,能夠使有效案例比例基本穩(wěn)定在80%以上,避免反饋大量的冗余數(shù)據(jù)。
對3個裝配車間連續(xù)10個月的生產(chǎn)情況進行跟蹤,按照當(dāng)月發(fā)起的現(xiàn)場技術(shù)問題總數(shù)/當(dāng)月完成工序總數(shù),計算每月的現(xiàn)場技術(shù)問題產(chǎn)生率。同時調(diào)取相同車間的歷史數(shù)據(jù),計算在系統(tǒng)使用前連續(xù)10個月的現(xiàn)場技術(shù)問題產(chǎn)生率,進行對比,結(jié)果如圖12所示。系統(tǒng)應(yīng)用后月平均問題產(chǎn)生率由之前的32.1%下降到20.9%,降幅約35%,對現(xiàn)場技術(shù)問題的產(chǎn)生起到了顯著的事前管控效果。
本文提出了一種基于CBR和改進WMD算法的復(fù)雜產(chǎn)品裝配現(xiàn)場技術(shù)問題管控方法,該方法利用工藝端和車間端的融合數(shù)據(jù)構(gòu)建案例,通過雙層檢索進行案例匹配,在裝配工藝設(shè)計階段就對工序級的潛在技術(shù)問題進行預(yù)警,從而解決傳統(tǒng)事后管控模式缺乏主動性、預(yù)測性的問題。在應(yīng)用WMD算法時,本文使用TF-IDF取代詞頻對詞語加權(quán),以準(zhǔn)確度量工藝術(shù)語的重要性,并定義補給遷移量和引入懲罰項來修正權(quán)值變化造成的影響。改進的WMD算法和CBR集成,用于編碼工序內(nèi)容文本,提高了CBR對非結(jié)構(gòu)化信息的利用率。通過企業(yè)生產(chǎn)數(shù)據(jù)實例分析和系統(tǒng)應(yīng)用驗證,得到了以下結(jié)論:
(1)WMD算法能夠準(zhǔn)確度量工序內(nèi)容間的語義相似性,本文對WMD原型的改進方式使其在算法對比中取得了最高的MAP得分97.87%,可有效提升CBR的案例匹配準(zhǔn)確率。
(2)多次案例重用實驗結(jié)果顯示,40%以上的新型號工序可通過本文方法獲得有效的問題管控信息,歷史工序—問題關(guān)聯(lián)知識對新工序的設(shè)計具有顯著指導(dǎo)意義。
(3)通過工序結(jié)構(gòu)化屬性匹配進行首層案例檢索,可在提高效率的同時濾除低價值案例;在二層檢索中,以0.4為工序內(nèi)容編碼閾值對候選案例進行二次過濾,能夠保留強語義相關(guān)性案例,使最終反饋案例集的可用率基本穩(wěn)定在80%以上,為工程實際應(yīng)用提供便利。
(4)基于本文研究成果開發(fā)的復(fù)雜產(chǎn)品裝配現(xiàn)場技術(shù)問題管控系統(tǒng),在上海航天某所的應(yīng)用中,使現(xiàn)場技術(shù)問題的產(chǎn)生率總體降低約11%,驗證了本文方法在實際生產(chǎn)中的有效性。
本文提出的復(fù)雜產(chǎn)品裝配現(xiàn)場技術(shù)問題管控方法,雖然能夠?qū)崿F(xiàn)對現(xiàn)場技術(shù)問題的事前管控,但在降低管控環(huán)節(jié)的人工參與度方面仍有待繼續(xù)研究。后續(xù)將針對企業(yè)多源數(shù)據(jù)的深度融合進行細(xì)化研究,結(jié)合機器學(xué)習(xí)及人工智能算法,力求實現(xiàn)裝配工藝的自動審查與優(yōu)化,進一步提升現(xiàn)場技術(shù)問題管控的智能化水平。