桂勇,冷晟 ,吳紀(jì)元 ,陽祥貴
(1. 南京航空航天大學(xué) 機電學(xué)院,江蘇 南京 210016;2. 中國航空工業(yè)昌河飛機工業(yè)(集團)有限責(zé)任公司,江西 景德鎮(zhèn) 333002)
隨著復(fù)合材料的大規(guī)模生產(chǎn),合理地在生產(chǎn)中進(jìn)行動態(tài)調(diào)度,能夠有效提高車間生產(chǎn)效率和降低生產(chǎn)成本。由于熱壓罐是復(fù)材生產(chǎn)中的瓶頸資源,故復(fù)材車間的動態(tài)調(diào)度中常以熱壓罐的利用率作為調(diào)度目標(biāo),并按約束理論進(jìn)行每個工段的動態(tài)調(diào)度,即以熱壓成型工段為基準(zhǔn),對其前面的生產(chǎn)環(huán)節(jié)實行拉動式生產(chǎn),后面的生產(chǎn)環(huán)節(jié)實行推動式生產(chǎn)。如高波等以熱壓罐的利用率為動態(tài)調(diào)度目標(biāo),將復(fù)材制造過程分為若干個工段,提出了按約束理論進(jìn)行工段動態(tài)調(diào)度[1]。陳國慧等以復(fù)材熱壓成型工序為研究重點,提出了基于啟發(fā)式規(guī)則的熱壓成型工段計劃排程[2]。因此,對熱壓成型工段的動態(tài)調(diào)度進(jìn)行研究,具有重大意義。
對于動態(tài)調(diào)度,啟發(fā)式調(diào)度規(guī)則相比搜索優(yōu)化算法、整數(shù)規(guī)劃等有著排程迅速和靈活易實施的優(yōu)勢,在實際車間動態(tài)調(diào)度中廣泛應(yīng)用。然而,大量文獻(xiàn)研究普遍認(rèn)為:沒有一個規(guī)則在所有的性能指標(biāo)和調(diào)度環(huán)境下始終比其他規(guī)則要好[3-4]。因此,有大量學(xué)者提出了基于數(shù)據(jù)的生產(chǎn)動態(tài)調(diào)度方法,期望從車間歷史遺留的調(diào)度相關(guān)數(shù)據(jù)中挖掘出有用的調(diào)度知識,根據(jù)所處的實時調(diào)度環(huán)境狀態(tài),定出較優(yōu)的調(diào)度策略。SHIUE Y R[5]利用支持向量機學(xué)得動態(tài)調(diào)度規(guī)則選擇分類器,用于車間控制系統(tǒng)進(jìn)行實時調(diào)度決策。吳啟迪等[6]針對半導(dǎo)體生產(chǎn)線動態(tài)調(diào)度問題,基于調(diào)度優(yōu)化數(shù)據(jù)樣本,利用特征選擇和分類算法獲得動態(tài)調(diào)度模型,以實時定出近似最優(yōu)的調(diào)度策略。吳秀麗等[7]研究了基于數(shù)據(jù)驅(qū)動的流水車間實時調(diào)度,從歷史近優(yōu)的調(diào)度方案中提取訓(xùn)練樣本,通過BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)獲取生產(chǎn)系統(tǒng)狀態(tài)與調(diào)度規(guī)則的映射關(guān)系網(wǎng)絡(luò),并將其應(yīng)用于在線實時調(diào)度。但上述文獻(xiàn)所學(xué)得調(diào)度知識的輸出仍為單一調(diào)度規(guī)則,由于單一調(diào)度規(guī)則僅是根據(jù)工件的某一屬性進(jìn)行兩個工件的比對,其在調(diào)度環(huán)境的適應(yīng)性上仍存在一定的局限性。因此本文針對復(fù)材熱壓成型工段動態(tài)調(diào)度,提出一種基于極限學(xué)習(xí)機(extreme learning machine,ELM)的動態(tài)調(diào)度方法,學(xué)習(xí)獲取有用的調(diào)度知識模型,并根據(jù)實時的調(diào)度環(huán)境信息以及工件的多種屬性對比信息,定出較好的工件排入罐中。
熱壓成型工段動態(tài)調(diào)度問題可看作單工序并行多機調(diào)度問題和優(yōu)化排樣問題[8]的融合:有n個相互獨立的工件,需要在m臺功能和加工時間均相同但容量不同的熱壓罐中加工,每個工件都有確定的加工時間ti(i=1,2,…,n)和確定的長和寬(li,bi),每臺熱壓罐內(nèi)的排樣面都有確定的長度和寬度(Lj,Bj)(j=1,2,…,m),每個工件只需選擇其中一臺熱壓罐進(jìn)行加工,并且可成批組合進(jìn)罐。調(diào)度目標(biāo)是最大化設(shè)備平均利用率Umax。約束條件有:1)工件的長度和寬度必須小于所排入罐的排樣面的長和寬;2)排入每個罐內(nèi)的所有工件面積總和不能超過該罐排樣面的面積;3)任意兩個工件所占的區(qū)域不得有交叉部分;4)一旦工件在機器上加工就不能中斷直至其被加工完成;5)只有加工時間、壓力、溫度等相關(guān)參數(shù)相同的工件才能組成同批入罐。
根據(jù)以上描述,熱壓成型工段調(diào)度的數(shù)學(xué)模型如下:
(1)
li≤Lk,bi≤Bk
(2)
(3)
Di∩Di′=?
(4)
ti=ti′,Fi=Fi′,Ti=Ti′
(5)
Ei≤Hi,Hi+Pi≤Qi
(6)
式中:p為所排的罐數(shù);k為熱壓罐的索引號;nk為第k罐的工件數(shù)量;Lk、Bk分別為第k罐的排樣面的長度和寬度;Di為第i個工件的所占區(qū)域;ti、Fi、Ti分別為第i工件的加工時間、固化壓力和溫度;Ei、Hi、Pi、Qi分別為第i個工件的計劃開工時間、實際開工時間、加工周期和計劃完工時間。
根據(jù)以上的動態(tài)調(diào)度問題描述,可將調(diào)度過程分為兩部分:調(diào)度序列優(yōu)化+熱壓罐排樣優(yōu)化。如圖1所示,調(diào)度序列優(yōu)化是將可合罐的工件排列成優(yōu)化的順序;熱壓罐排樣優(yōu)化是基于已排好的調(diào)度序列,根據(jù)設(shè)定的排樣算法將工件依次排入熱壓罐中。關(guān)于排樣優(yōu)化的方法主要有啟發(fā)式算法和智能優(yōu)化算法,由于智能優(yōu)化算法搜索時間較長,效率低,因此實際應(yīng)用中常采用啟發(fā)式算法進(jìn)行排樣。近些年來,賈志欣等提出的最低水平線法[9]受到了理論界的廣泛關(guān)注,眾多學(xué)者對其加以改進(jìn)應(yīng)用,都取得了較好的排樣效果。然而,選擇不同的調(diào)度序列優(yōu)化算法與最低水平線法結(jié)合,會獲得不同的排樣效果。傳統(tǒng)的啟發(fā)式調(diào)度規(guī)則多是按某種指標(biāo)(如面積、邊長)[10-11]對矩形零件排序,但單一的調(diào)度規(guī)則并不能在所有的排樣環(huán)境中都取得較好的效果。因此,本文提出基于ELM的熱壓成型工段動態(tài)調(diào)度方法與最低水平線法結(jié)合,在每個排樣的決策點時刻,根據(jù)實時的調(diào)度環(huán)境信息和工件對比信息,實時地決策出最佳的工件排入罐中。
圖1 熱壓成型工段動態(tài)調(diào)度過程
圖2為所提出的基于ELM的熱壓成型工段動態(tài)調(diào)度方法總體框架。整個框架分為兩個部分:離線學(xué)習(xí)階段和在線調(diào)度階段。
離線學(xué)習(xí)階段:該階段有獲取訓(xùn)練數(shù)據(jù)和調(diào)度知識模型學(xué)習(xí)兩個任務(wù)。復(fù)材車間在常年的運行生產(chǎn)中積累了大量的歷史數(shù)據(jù),涵蓋了企業(yè)訂單、工藝、設(shè)備、較優(yōu)調(diào)度方案等多方面的調(diào)度相關(guān)數(shù)據(jù)。這些數(shù)據(jù)中隱含了反映實際調(diào)度環(huán)境特點以及相關(guān)調(diào)度知識的大量有效信息。因此,需要先從中提取出有價值的訓(xùn)練樣本數(shù)據(jù),然后通過極限學(xué)習(xí)機算法進(jìn)行學(xué)習(xí),從而獲得調(diào)度知識模型。
在線調(diào)度階段:該階段相當(dāng)于一個在線實時動態(tài)調(diào)度器。在每一個調(diào)度決策點時刻,根據(jù)實時的訂單、生產(chǎn)系統(tǒng)狀態(tài)等數(shù)據(jù),提取模型輸入數(shù)據(jù),輸入離線學(xué)習(xí)階段學(xué)得的調(diào)度知識模型中,從而定出較優(yōu)的調(diào)度策略,指導(dǎo)熱壓成型工段動態(tài)調(diào)度的進(jìn)行。
由2.1節(jié)可知,該調(diào)度方法的核心就在于調(diào)度知識模型的挖掘,因此本節(jié)主要介紹調(diào)度知識模型的輸入與輸出特征以及模式的定義。對于熱壓成型工段動態(tài)調(diào)度問題,單一調(diào)度規(guī)則在對兩個工件進(jìn)行比較時,一般是根據(jù)工件之間的一些屬性差值,如長、寬,面積等。但在不同的調(diào)度環(huán)境狀態(tài)下,僅僅靠單一的工件屬性進(jìn)行比較無法總是獲得較好的結(jié)果。因此,本文定義調(diào)度模式為:根據(jù)實時所處的調(diào)度環(huán)境狀態(tài)和工件之間的各種屬性差,比較出任意兩個工件的優(yōu)先關(guān)系。令調(diào)度知識模型的輸入特征為調(diào)度環(huán)境狀態(tài)特征和工件的各種屬性差值特征,表1所示為根據(jù)文獻(xiàn)[9-11]研究歸納出的一些特征屬性,其中序號1-5為工件之間相關(guān)屬性的差值特征,序號6-18的特征描述了實時調(diào)度環(huán)境的特征;輸出特征為值是0或1的類屬性,其中0代表作比較的兩個工件的后者優(yōu)先,1則代表前者優(yōu)先。
表1 輸入特征屬性
圖3所示為本文所需學(xué)習(xí)的極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),由輸入層、隱含層和輸出層總共三層神經(jīng)元構(gòu)成,其中輸入層有18個神經(jīng)元對應(yīng)18個輸入特征屬性,輸出神經(jīng)元有1個,對應(yīng)一個類屬性。
圖3 極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
選取N個任意各不相同的樣本(xi,yi)(i=1,2,…,N),其中xi=[xi1,xi2,…,xin]T∈Rn,yi=[yi1,yi2,…,yim]T∈Rm,并設(shè)隱含層神經(jīng)元的激活函數(shù)為g(x),則含有l(wèi)個隱含層節(jié)點的ELM數(shù)學(xué)模型可表示為
(7)
式中:ωj表示輸入層神經(jīng)元與隱含層的第j個神經(jīng)元之間的連接權(quán)值;βj為隱含層的第j個神經(jīng)元與輸出層神經(jīng)元之間的連接權(quán)值;bj為隱含層第j個神經(jīng)元的閾值;ti表示ELM模型的期望輸出。
若該ELM模型能以零誤差逼近N個樣本,則存在βj、ωj、bj,使得
(8)
式(8)可表示為
Hβ=Y
(9)
式中:H為神經(jīng)網(wǎng)絡(luò)的隱含層輸出矩陣;Y為ELM網(wǎng)絡(luò)輸出矩陣;β為隱含層到輸出層的權(quán)值矩陣。因此,一旦輸入層與隱含層之間的神經(jīng)元連接權(quán)值ω和隱含層神經(jīng)元的閾值b給定,矩陣H就被唯一確定。單隱層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練就可以轉(zhuǎn)化為一個線性系統(tǒng),只需求出輸出權(quán)重β就能完成訓(xùn)練,β可由式(9)取得:
β=H+Y
(10)
式中H+表示隱含層輸出矩陣H的Moore-Penrose廣義逆。
為驗證所提出的基于ELM的熱壓成型工段動態(tài)調(diào)度方法的有效性,本文以某企業(yè)復(fù)材車間的熱壓成型工段為例進(jìn)行研究,基于Tecnomatix plant simulation進(jìn)行仿真實驗,并對實驗結(jié)果進(jìn)行分析與比較。
本文通過Tecnomatix plant simulation仿真軟件對某企業(yè)復(fù)材車間熱壓成型工段的動態(tài)調(diào)度問題進(jìn)行仿真實驗。由于實驗數(shù)據(jù)資源有限,本文通過仿真實驗,根據(jù)該車間的工藝、設(shè)備、歷史訂單數(shù)據(jù),確定了一些調(diào)度問題實例的參數(shù)取值范圍(如工件的數(shù)量和尺寸、機器的加工時間等),隨機構(gòu)造了30個實例問題,然后針對每個問題實例利用GA進(jìn)行仿真,取出每個問題對應(yīng)的最優(yōu)調(diào)度方案,并在此基礎(chǔ)上提取出訓(xùn)練數(shù)據(jù)對。基于Python語言實現(xiàn)ELM學(xué)習(xí)算法,用于調(diào)度知識模型的學(xué)習(xí)。相關(guān)算法的實驗參數(shù)如表2所示,所有實驗均在Intel Core i7-4510U、2.6GHz CPU、8GB RAM、Win8 64為系統(tǒng)的平臺下運行,所涉及的軟件有Tecnomatix plant simulation、python 3、PyChram。
表2 算法實驗參數(shù)
為了驗證所挖掘出ELM模型的調(diào)度性能,在調(diào)度問題參數(shù)的取值范圍內(nèi)隨機構(gòu)造了10個調(diào)度問題實例,分別利用ELM模型和各種常見的單一調(diào)度規(guī)則(面積、寬度、高度、高寬比等進(jìn)行排序)對問題實例進(jìn)行求解,并對調(diào)度結(jié)果進(jìn)行分析與比較。
表3為各種算法的調(diào)度性能(設(shè)備平均利用率)的數(shù)值比較。從表3中可以看出,在8/18的調(diào)度問題求解情況下,ELM模型的調(diào)度性能明顯優(yōu)于其他單一調(diào)度規(guī)則。此外,關(guān)于ELM對訓(xùn)練樣本進(jìn)行學(xué)習(xí)的過程較為耗時,但學(xué)習(xí)得出的ELM模型用來對測試樣本進(jìn)行決策時,幾乎是瞬間完成。據(jù)實驗統(tǒng)計,ELM模型預(yù)測一條樣本的結(jié)果大約耗時0.02s。因此,完全滿足動態(tài)調(diào)度的實時性要求。
表3 各種算法的調(diào)度性能(設(shè)備平均利用率)比較
另一方面從算法穩(wěn)定性角度考察ELM模型,圖4所示為ELM模型與各單一調(diào)度規(guī)則在不同的調(diào)度問題實例下的調(diào)度性能表現(xiàn)??梢钥闯龈鞣N單一調(diào)度規(guī)則在不同調(diào)度問題下的表現(xiàn)差異較大,無法取得穩(wěn)定的調(diào)度結(jié)果,而ELM模型在不同調(diào)度問題下表現(xiàn)良好且穩(wěn)定。
圖4 各算法在不同調(diào)度問題下的表現(xiàn)
本文針對復(fù)材熱壓成型工段動態(tài)調(diào)度問題,研究了一種基于ELM的動態(tài)調(diào)度方法,從車間歷史存留的調(diào)度相關(guān)數(shù)據(jù)中提取訓(xùn)練樣本,利用ELM從中學(xué)得調(diào)度知識模型,在每一個調(diào)度決策點時刻,根據(jù)實時的調(diào)度環(huán)境狀態(tài)信息和工件間屬性差信息,定出較優(yōu)的工件排入罐中。該方法不僅適用于實時的車間動態(tài)調(diào)度過程,而且在調(diào)度性能上明顯優(yōu)于其他單一的調(diào)度規(guī)則。