薛 麗,賈元忠,曹逗逗
(鄭州航空工業(yè)管理學(xué)院 管理工程學(xué)院,河南 鄭州 450046)
統(tǒng)計(jì)過程控制(SPC)應(yīng)用中,通常運(yùn)用傳統(tǒng)控制圖監(jiān)控一元或者多元質(zhì)量特性值。如果一個(gè)產(chǎn)品的質(zhì)量特性值可以用多個(gè)響應(yīng)變量與多個(gè)自變量之間的函數(shù)關(guān)系表示,則可以采用輪廓控制圖監(jiān)控該產(chǎn)品的質(zhì)量特性值,此時(shí)這種函數(shù)關(guān)系稱為輪廓。為了監(jiān)控半導(dǎo)體工業(yè)校準(zhǔn)過程中的穩(wěn)定性,2000年Kang 和Albin[1]對壓力和流量之間的關(guān)系用簡單線性輪廓模型進(jìn)行描述,并提出相應(yīng)輪廓監(jiān)控方法。簡單線性輪廓模型易于處理且可應(yīng)用于許多生產(chǎn)過程,許多學(xué)者先后對涉及簡單線性輪廓監(jiān)控進(jìn)行了相關(guān)研究(Woodall等[2],Wang 和Tsung等[3])。
SPC第一階段主要分析生產(chǎn)過程是否穩(wěn)定,并對生產(chǎn)過程中的參數(shù)進(jìn)行估計(jì),其中Mestek 等[4]、Kim等[5]、Taghipourde等[6]對控制圖的第一階段方法進(jìn)行研究。SPC第二階段對生產(chǎn)過程進(jìn)行監(jiān)控,當(dāng)過程中存在異常波動時(shí)控制圖報(bào)警。Kang和Albin[1]提出了T2、指數(shù)加權(quán)移動平均(EWMA)聯(lián)合R控制圖的方法,以監(jiān)控線性輪廓的變化。Kim等[7]對變量數(shù)據(jù)進(jìn)行中心化處理,使用EWMA控制圖對參數(shù)進(jìn)行監(jiān)控。Abbas等[8]構(gòu)造了三種單變量貝葉斯EWMA控制圖,分別對截距、斜率和誤差方差進(jìn)行了監(jiān)控。Abbas等[9]將貝葉斯理論用于累積和(CUSUM)控制圖,研究表明,在共軛先驗(yàn)下提出的CUSUM控制圖性能更佳。Huwang等[10]運(yùn)用空間秩的EWMA圖對誤差項(xiàng)不符合正態(tài)性假定的線性輪廓進(jìn)行監(jiān)控研究。Haq等[11]通過調(diào)整可變抽樣區(qū)間提高控制圖的靈敏度。Yeganeh等[12]提出了一種多元指數(shù)加權(quán)移動平均(MEWMA)控制圖和運(yùn)行規(guī)則相結(jié)合的方法,提高了監(jiān)控簡單線性輪廓的性能。Zhang等[13]使用CUSUM控制圖對預(yù)先指定的線性輪廓變化進(jìn)行監(jiān)控。Noorossana等[14]研究了第一階段參數(shù)估計(jì)誤差對第二階段輪廓監(jiān)控的影響。
隨著生產(chǎn)過程中數(shù)據(jù)采集技術(shù)的發(fā)展以及抽樣間隔越來越短,許多輪廓數(shù)據(jù)具有自相關(guān)性,此時(shí)應(yīng)用傳統(tǒng)獨(dú)立過程的監(jiān)控方法會大大增加虛發(fā)警報(bào)[15]。針對誤差項(xiàng)遵循一階自回歸模型AR(1)的簡單線性輪廓,Soleimani 等[15]提出了T2控制圖和EWMA控制圖來監(jiān)控生產(chǎn)過程。Chiang等[16]提出了MEWMA控制圖,用于檢測截距和斜率的變化。
以上研究均是基于構(gòu)造統(tǒng)計(jì)量建立控制圖以監(jiān)控生產(chǎn)過程,需要對原始數(shù)據(jù)進(jìn)行處理,其過程較為復(fù)雜。控制圖可以看成區(qū)分受控過程和失控過程的分類器,因此使用機(jī)器學(xué)習(xí)方法可以監(jiān)控生產(chǎn)過程,且不需要對數(shù)據(jù)進(jìn)行復(fù)雜的處理,亦能達(dá)到較好的效果。Hosseinifard等[17]以及Yeganeh和Shadman[18]運(yùn)用神經(jīng)網(wǎng)絡(luò)對線性輪廓監(jiān)控進(jìn)行了研究。賀辰然[19]討論了二分類支持向量機(jī)在監(jiān)控線性輪廓中的應(yīng)用。二分類的方法需要大量受控和失控樣本訓(xùn)練分類器,但在實(shí)際生產(chǎn)過程中,這一條件有時(shí)不能得到滿足,因此在一定程度上限制了其應(yīng)用范圍。針對實(shí)際生產(chǎn)過程中僅有受控樣本的情況,SVDD方法被引入輪廓監(jiān)控中,且取得了不錯的效果[20-22]。
在以上研究背景下,為盡快監(jiān)測出自相關(guān)線性輪廓數(shù)據(jù)的異常,本文針對實(shí)際生產(chǎn)過程中異常類樣本難以收集或者收集異常樣本需要消耗大量的時(shí)間或成本的情況,提出基于一類支持向量機(jī)(OCSVM)[23-24]的監(jiān)控方法。以平均運(yùn)行長度(ARL)為準(zhǔn)則,通過仿真實(shí)驗(yàn)討論不同核函數(shù)對監(jiān)控性能的影響,并將結(jié)果與現(xiàn)有的一些傳統(tǒng)方法進(jìn)行比較。
OCSVM是基于支持向量機(jī)(SVM)的一種一類分類器[23-24]。模型描述如下:設(shè)有受控訓(xùn)練樣本{z|zi∈Rn,i=1,2,…,m},坐標(biāo)原點(diǎn)坐標(biāo)為(0,0,…,0)nx1,通過核函數(shù)將訓(xùn)練樣本映射到高維特征空間,在特征空間中找到一個(gè)最優(yōu)超平面實(shí)現(xiàn)訓(xùn)練樣本與坐標(biāo)原點(diǎn)的最大分離。最優(yōu)超平面表達(dá)式為w·z-b=0,w為權(quán)重向量,b為偏差。使最優(yōu)超平面與坐標(biāo)原點(diǎn)的距離b/‖w‖最大,轉(zhuǎn)化為二次規(guī)劃問題:
s.tw·zi-b+ξi≥0,ξi≥0.
(1)
其中ξi為松弛變量,u為訓(xùn)練樣本中噪聲數(shù)據(jù)比例。用拉格朗日方法將式(1)轉(zhuǎn)化為無約束最優(yōu)化問題,即:
(2)
其中αi≥0,βi≥0為拉格朗日乘子。對式(2)中的變量w,b,ξ分別求導(dǎo)并令偏導(dǎo)數(shù)為0可得:
(3)
(4)
(5)
將得到的式(3)~(5)帶入式(2)可將原問題轉(zhuǎn)化為其對偶問題,并將對偶問題求最小可得:
(6)
式(6)中(zi·zj)為內(nèi)積運(yùn)算,OCSVM中用核函數(shù)代替內(nèi)積運(yùn)算。式(6)可以轉(zhuǎn)化為:
(7)
對二次規(guī)劃問題式(7)進(jìn)行求解,可得到拉格朗日乘子α=(α1,α2,…,αm),其中αi不為0,對應(yīng)的zi為超平面的支持向量。對新的測試樣本o,該點(diǎn)所屬類別的判別式為:
(8)
根據(jù)f(o)的輸出值判斷測試樣本o的所屬類別。如圖 1所示,以二維數(shù)據(jù)說明OCSVM的原理。
圖1 用于異常檢測的二維OCSVM示意圖圖解
若f(o)≥0,則測試樣本o屬于受控類,若f(o)<0,則測試樣本o屬于失控類。
假設(shè)過程或產(chǎn)品質(zhì)量特性Y為某一變量X的函數(shù),過程處于統(tǒng)計(jì)受控狀態(tài)時(shí),Y與X的函數(shù)關(guān)系為:
Y=f(X,β)+α,Xι (9) 其中,β為受控輪廓的系數(shù)向量,Xι和Xh界定了的X的范圍,α為獨(dú)立隨機(jī)變量且服從均值為0、方差為σ2的正態(tài)分布。上述獨(dú)立變量X可以是時(shí)間、加工產(chǎn)品的測量位置、溫度等。 對抽樣時(shí)刻i(i=1,2,…,m),可以測得輪廓內(nèi)n個(gè)觀測點(diǎn)xi1,xi2,…,xin響應(yīng)變量的值為yi1,yi2,…,yin。每條輪廓為一個(gè)觀測樣本,每個(gè)樣本由n個(gè)數(shù)據(jù)點(diǎn)(xij,yij),j=1,2,…,n構(gòu)成。為方便分析數(shù)據(jù),常假設(shè)不同輪廓中點(diǎn)(Xι,Xh)內(nèi)觀測點(diǎn)位置相同,即對任意時(shí)刻i的輪廓有xij=xj。用AR(1)模型表示線性輪廓內(nèi)的相關(guān)性[15]。過程處于統(tǒng)計(jì)控制狀態(tài)時(shí),線性輪廓內(nèi)自相關(guān)模型可以表示為: yij=A0+A1xj+εij εij=ρεi(j-1)+αij (10) 其中εij為相關(guān)誤差項(xiàng),αij為獨(dú)立隨機(jī)變量且服從均值為0、方差為σ2的正態(tài)分布。ρ是自相關(guān)系數(shù),為已知常數(shù)。本文中,考慮第二階段,即假設(shè)參數(shù)A0,A1,σ2已知。 圖2 OCSVM方法流程圖 利用訓(xùn)練階段得到的超平面對后續(xù)新收集的輪廓數(shù)據(jù)進(jìn)行監(jiān)控,判斷其生產(chǎn)過程是否處于受控狀態(tài),如果存在異常原因,則發(fā)出警報(bào)。OCSVM控制方法的結(jié)構(gòu)如圖3所示。 圖3 OCSVM控制方法結(jié)構(gòu)圖 為驗(yàn)證所提出方法的監(jiān)控效果,采用Soleimani等[15]的仿真模型來進(jìn)行模擬。每個(gè)輪廓的截距A0=3,斜率A1=2,回歸方程為: yij=3+2xj+εij, εij=ρεi(j-1)+αij, (11) 其中εij是相關(guān)誤差項(xiàng),αij為獨(dú)立隨機(jī)變量,且αij~N(0,1),ρ為自相關(guān)系數(shù)。在模擬仿真中,分別針對自相關(guān)系數(shù)ρ=0.1(弱相關(guān))或ρ=0.9(強(qiáng)相關(guān))兩種情況,所提出的方法與Soleimani等[8]提出方法的監(jiān)控效果進(jìn)行比較。 假定式(7)中的訓(xùn)練樣本噪聲數(shù)據(jù)比例u=0.001。針對自相關(guān)系數(shù)ρ=0.1(弱相關(guān))或ρ=0.9(強(qiáng)相關(guān))兩種情況,分別采用高斯核函數(shù)和多項(xiàng)式核函數(shù)進(jìn)行訓(xùn)練,并將這兩種訓(xùn)練模型的監(jiān)控效果進(jìn)行比較,選擇對具有自相關(guān)性的輪廓數(shù)據(jù)監(jiān)控效果較好的核函數(shù)。最后與Soleimani等[15]提出的方法進(jìn)行比較。 以平均運(yùn)行長度為評價(jià)準(zhǔn)則對不同控制圖性能進(jìn)行比較。首先確定OCSVM方法參數(shù),訓(xùn)練階段調(diào)整參數(shù)令控制圖誤警率α=0.005,即受控運(yùn)行長度ARL0=200,然后比較失控運(yùn)行長度ARL1,ARL1越小的控制圖監(jiān)控性能越好。 β=(-0.2,-0.3,-0.4,-0.5,-0.6,-0.7,-0.8,-0.9,-1)同時(shí)變化的9種異常。 以ρ=0.1(弱相關(guān))時(shí)為例,(ρ=0.9過程同ρ=0.1)仿真步驟如下: 步驟一:生成訓(xùn)練數(shù)據(jù)。根據(jù)式(11)生成M個(gè)受控樣本數(shù)據(jù),樣本類別為+1。 步驟二:數(shù)據(jù)預(yù)處理。將步驟一生成的樣本值轉(zhuǎn)化到[0,1]的區(qū)間內(nèi)。 步驟三:確定核函數(shù)及核函數(shù)參數(shù)。本文選取高斯和多項(xiàng)式兩種核函數(shù)進(jìn)行比較。 步驟四: 尋找最優(yōu)參數(shù)。在[2-10,210]范圍內(nèi)采用遍歷法調(diào)整核函數(shù)參數(shù),使訓(xùn)練數(shù)據(jù)的誤警率為0.005,誤差為0.0001。訓(xùn)練時(shí)對受控?cái)?shù)據(jù)采用10折交叉驗(yàn)證的方式,將受控?cái)?shù)據(jù)隨機(jī)分成10份,其次輪流將其中9份做訓(xùn)練1份做驗(yàn)證,10次結(jié)果的均值作為對算法精度的估計(jì)值,使訓(xùn)練數(shù)據(jù)最終的誤警率為0.005,受控運(yùn)行長度ARL0=200。 步驟五:構(gòu)建模型。由步驟四得到最優(yōu)參數(shù),對訓(xùn)練樣本訓(xùn)練得到分離超平面,對后續(xù)過程進(jìn)行監(jiān)控。 步驟六:生成異常數(shù)據(jù)。對4類異常數(shù)據(jù)每種異常生成1000批數(shù)據(jù)集,每批數(shù)據(jù)集含有1000個(gè)對應(yīng)的異常數(shù)據(jù)。 步驟七:計(jì)算ARL1。采用步驟五中得到的分離超平面對步驟六中的異常樣本進(jìn)行監(jiān)控,由于每種異常有1000批數(shù)據(jù)集,故迭代1000次之后得到的均值即為ARL1。 運(yùn)用高斯核函數(shù)與多項(xiàng)式核函數(shù)的訓(xùn)練模型分別記為OCSVMR、OCSVMP。在受控運(yùn)行長度ARL0相同的情況下,通過比較不同控制方法對應(yīng)的失控平均運(yùn)行長度ARL1值的大小來評價(jià)其性能。采用上節(jié)中的步驟進(jìn)行仿真模擬,表1—4顯示了ρ分別為0.1和0.9時(shí)截距變化、斜率變化、標(biāo)準(zhǔn)差變化以及截距、斜率同時(shí)變化的失控運(yùn)行長度,其中λ、β、γ分別為截距、斜率、標(biāo)準(zhǔn)差的變化量,變化單位為σ。 表1 截距A0偏移至A0+λσ時(shí)OCSVMR模型與OCSVMP模型ARL1比較 表2 斜率A1偏移至A1+βσ時(shí)OCSVMR模型與OCSVMP模型ARL1比較 表3 標(biāo)準(zhǔn)σ差偏移至γσ時(shí)OCSVMR模型與OCSVMP模型ARL1比較 表4 斜率、截距以同時(shí)發(fā)生偏移時(shí)OCSVMR模型與OCSVMP模型ARL1比較 為直觀顯示OCSVMP模型與OCSVMR模型的監(jiān)控效果,下面用圖形的方式對表1—4中的情況進(jìn)行比較,具體見圖 4。 圖4 OCSVMR模型與OCSVMP模型監(jiān)控效果比較 由圖4可知,監(jiān)控截距發(fā)生偏移時(shí),OCSVMP模型優(yōu)于OCSVMR模型。監(jiān)控斜率方面,在自相關(guān)系數(shù)ρ=0.1,斜率偏移小于0.175時(shí),OCSVMP模型優(yōu)于OCSVMR模型;自相關(guān)系數(shù)ρ=0.9時(shí),OCSVMP模型優(yōu)于OCSVMR模型。監(jiān)控標(biāo)準(zhǔn)差方面,OCSVMP模型整體優(yōu)于OCSVMR模型。另外,在監(jiān)控截距、斜率同時(shí)變化時(shí),OCSVMP模型整體優(yōu)于OCSVMR模型。從整體看,OCSVMP模型的監(jiān)控效果優(yōu)于OCSVMR模型。 表5 截距A0偏移至A0+λσ時(shí)OCSVMP模型與傳統(tǒng)控制圖ARL1比較 續(xù)表5 截距A0偏移至A0+λσ時(shí)OCSVMP模型與傳統(tǒng)控制圖ARL1比較 表6 斜率A1偏移至A1+βσ時(shí)OCSVMP模型與傳統(tǒng)控制圖ARL1比較 表7 標(biāo)準(zhǔn)差σ偏移至γσ時(shí)OCSVMP模型與傳統(tǒng)控制圖ARL1比較 表8 斜率、截距以同時(shí)發(fā)生偏移時(shí)OCSVMP模型與傳統(tǒng)控制圖ARL1比較 續(xù)表8 斜率、截距以同時(shí)發(fā)生偏移時(shí)OCSVMP模型與傳統(tǒng)控制圖ARL1比較 為直觀顯示OCSVMP模型與傳統(tǒng)控制圖的監(jiān)控效果,下面用圖形的方式對表5—8中的情況進(jìn)行比較,具體見圖 5。 圖5 OCSVMR模型與傳統(tǒng)控制圖監(jiān)控效果比較 由圖5可知,監(jiān)控截距發(fā)生偏移時(shí),自相關(guān)系數(shù)ρ=0.1,在截距偏移大于1.2時(shí),及自相關(guān)系數(shù)ρ=0.9時(shí),OCSVMP模型優(yōu)于另外四種方法。監(jiān)控斜率偏移時(shí), EWMA-3方法表現(xiàn)最優(yōu)。監(jiān)控標(biāo)準(zhǔn)差發(fā)生偏移時(shí),OCSVMR模型整體優(yōu)于另外四種方法。監(jiān)控截距、斜率同時(shí)變化時(shí),OCSVMP模型明顯優(yōu)于另外四種方法。3.2基于OCSVM的監(jiān)控模型
4 仿真分析
4.1仿真過程
4.2不同核函數(shù)監(jiān)控性能對比
4.3與傳統(tǒng)控制圖方法比較研究
5 結(jié) 論