王美涵,陳培樂,潘曉映,施建華,2,3,4*
(1.閩南師范大學數學與統計學院,福建漳州363000;2.福建省粒計算及其應用重點實驗室,福建漳州363000;3.福建省數據科學與統計重點實驗室,福建漳州363000;4.數字福建氣象大數據研究所,福建漳州363000)
在傳統的統計過程控制(SPC)中,質量特征的觀測值總是假設滿足相互獨立的要求,而當質量特征具有相依性時,傳統的指數加權移動平均(EWMA)控制圖發(fā)揮了良好的效果.1959年,Roberts[1]首次提出EWMA控制圖,此后眾多專家學者對監(jiān)控過程均值變化[2]或監(jiān)控過程標準差變化[3]的EWMA 控制圖進行研究.而在實際生產生活中,許多情形需要同時監(jiān)控過程均值和過程標準差的變化,因此一些學者提出了可以同時監(jiān)控均值和標準差的EWMA控制圖[4].
然而,隨著測量技術的發(fā)展,越來越多的數據以相依區(qū)間值的形式來描述或記錄.例如氣象部門需要每小時檢測一次空氣中顆粒物的濃度,顆粒物殘留在空氣中的時間較長,這就導致了檢測值是相互依賴的,即后面所檢測的濃度還是會受到前面顆粒物滯留的影響.當收集到的原始數據是相依區(qū)間值數據時,就不適合應用傳統的EWMA控制圖來監(jiān)測質量特征的變化.因此,如何設計基于相依區(qū)間值數據質量特征的控制圖是一個重要而有趣的課題.
當數據是區(qū)間值數據時,傳統的EWMA控制圖和EWMA MSE 控制圖通常是用對區(qū)間取平均值后的單一值來構建控制圖,但是這樣的做法有可能會丟失一些重要的信息.在質量特征具有相依性且是區(qū)間值的數據形態(tài)情況下,如何在保留相依區(qū)間值數據集的原始信息的同時,還能及時檢測質量特征的變化,是質量管理的重要課題.Yang[5]評估了基于相依區(qū)間值數據的模糊相對加權移動平均(FRWMA)控制圖的監(jiān)控性能,發(fā)現該圖的監(jiān)控性能優(yōu)于傳統的移動平均控制圖,可以更快地檢測到過程均值和方差的變化.
針對相依區(qū)間值數據,模糊區(qū)間均方誤差(FIMSE)作為均值偏移目標值和過程均值方差變異的綜合度量,可以快速地檢測到區(qū)間值數據的變異,而指數加權移動平均(EWMA)方法對全部歷史數據分配了逐步減少的權重,可以快速地檢測到相依數據小偏移的變異.首次將指數加權移動平均(EWMA)方法與模糊區(qū)間均方誤差(FIMSE)統計量相結合,提出了基于相依區(qū)間值數據的指數加權移動平均的模糊區(qū)間均方誤差(Exponentially Weighted Moving Average Fuzzy Interval Mean Square Error;EWMA FIMSE)控制圖來監(jiān)控過程質量特征的變化,這樣可以在最大程度上保留區(qū)間數據所蘊含的信息并提高監(jiān)控性能.
1959年,Roberts[1]首次提出EWMA控制圖,其中EWMA統計量形式如下:
其中,μ為總體均值,Xˉi為樣本均值,λ為平滑系數,0<λ≤1.與傳統的控制圖相比,它的優(yōu)勢在于賦予歷史數據以一定的權重,距離單位時間點越近的數據權重值越大,并且隨著距離單位時間點距離的增加,這種權重以指數的形式遞減.EWMA控制圖可以很好地應用于相依單一值數據均值的監(jiān)測.
2004年,Chen[4]等提出了一種新的EWMA控制圖,其統計量形式如下:
其中T?i=(n/σ2)Ti,Ti=(Xˉi?μ)2+(n?1)S2i/n,i=1,2,…,λ為平滑系數,0<λ≤1,與EWMA控制圖相比,它的優(yōu)勢在于可以同時監(jiān)測相依單一值數據的均值和方差.
除均值和方差以外,在質量控制領域中,接近目標值也是一個值得關注的問題.1998年,Spiring 等[6]首次提出的MSE控制圖可以同時監(jiān)測均值和方差以及與目標值的接近程度,其中MSE統計量形式如下:
其中T為目標值,Xˉj為樣本均值,S2j為樣本方差.
借鑒MSE 統計量的構造,將Chen 等提出統計量中的μ用目標值T來替換,構造EWMA MSE 統計量來設計EWMA MSE 控制圖,它的好處是可以同時監(jiān)測相依單一值數據的均值和方差以及與目標值的接近程度.
設xi1,xi2,…,xin,i=1,2,…,是來自均值為μ,方差為σ2的正態(tài)分布N(μ,σ2)的隨機變量,其均方誤差統計量可表示為:
其中T為目標值,令MSE*i=(n?1)MSEi/σ2,則MSE*i統計量服從自由度為n,參數為γ=n[(μ?T)/σ]2的非中心卡方分布,即MSE*i~,令μ?T=δ3σ,δ3>0,δ3為過程均值偏離目標值的幅度,當過程受控時,過程均值沒有偏離目標值,即δ3=0時,MSE*i的均值和方差分別為:
構造EWMA MSE統計量Qi如下:
其中Q0=n+n[(μ-T)/σ]2為初始值,λ為平滑系數,0<λ≤1,當過程受控時,Qi的均值和方差分別為:
因為統計量Qi大于等于0,所以控制下限(LCL)為0,控制上限為:
其中L為控制界限系數.
注意到,當數據為區(qū)間值數據時,上述的EWMA MSE 控制圖只能將區(qū)間的最大值最小值取平均值,將區(qū)間值轉化為單一值來計算,這樣的方法有可能會損失大量重要的信息.為了在最大程度上保留區(qū)間值數據所蘊含的信息,首次提出EWMA FIMSE控制圖,它可以同時監(jiān)測相依區(qū)間值數據的均值和方差以及與目標值的接近程度.
假設有一組來自均值為μ,方差為σ2的正態(tài)分布N(μ,σ2)的相依區(qū)間值隨機變量序列(xi1,yi1),(xi2,yi2),…,(xin,yin),i=1,2,…,且滿足關系式xin 令FIMSE1i=min(MSE1i,MSE2i),FIMSE2i=max(MSE1i,MSE2i),定義模糊區(qū)間均方誤差統計量FIMSEi為: 令FIMSE*i=(n?1)FIMSEi/σ2,FIMSE*i服從參數為γ=n[(μ?T)/σ]2=nδ23,自由度為n的非中心卡方分布. 當過程受控時,FIMSE*i的均值和方差分別為: 定義EWMA FIMSE統計量FQi如下: 則 其中FQ0=[n+n[(μ?T)/σ]2,n+n[(μ?T)/σ]2]為初始值,λ為平滑系數,0<λ≤1,當過程受控時,FQi的均值和方差分別為: Wu等[7]介紹關于模糊區(qū)間變量的假設檢驗方法,本文借鑒該方法構建FQi的假設檢驗問題,設 因為統計量FQi大于等于0,且越趨于0 代表與目標值的差異越小,所以設控制下限(LCL)為0,在α的顯著水平下,FQi落入拒絕域的概率函數為: 當過程受控時,控制上限為: 其中L為控制界限系數. 本節(jié)將使用蒙特卡羅模擬法來生成模糊區(qū)間值的時間序列數據,這些模糊區(qū)間值數據用于評估EW‐MA MSE控制圖的平均運行長度(ARL)值,ARL指第一個質量特征落在控制界限之外時所期望的樣本子組的數量,受控狀態(tài)下用ARL0表示,失控狀態(tài)下用ARL1表示,ARL1越小說明控制圖的統計性能越好.并通過均方誤差值將EWMA FIMSE 控制圖的性能與傳統的EWMA MSE 控制圖、EWMA控制圖進行比較. 計算ARL[8]的步驟如下: 1)生成一組服從均值為μ,標準差為σ的正態(tài)分布的模糊區(qū)間樣本觀測值. 2)利用生成的模糊區(qū)間樣本觀測值分別采用式(1)、式(3)、式(17)計算統計量EWMA,EWMA MSE,EWMA FIMSE. 3)利用式(21)、式(22)計算當觀測統計值大于控制下限(LCL)且小于控制上限(UCL)時的ARL0,當ARL0的值近似370(固定α=0.0027,即ARL0=1/α=370)時,得到控制界限系數L的值. 4)生成一組服從均值為μ+δ1σ,δ1>0,標準差為δ2σ,δ2>1 的正態(tài)分布的模糊區(qū)間樣本觀測值,計算失控狀態(tài)下,各觀測統計值小于控制下限(LCL)和大于控制上限(UCL)時的ARL1. 表1列出了n=5,δ3=0.0 和1.0,λ=0.1,0.2 和0.3,EWMA控制圖,EWMA MSE 控制圖和EWMA FIMSE 控制圖的ARL0近似等于370 時的控制界限系數L 的值.隨著δ3的增加,EWMA FIMSE 控制圖和EWMA MSE 控制圖對應的L 值增加,EWMA控制圖對應的L 值不變.隨著λ的增加,EWMA FIMSE 控制圖對應的L值減少,EWMA控制圖對應的L值增加.說明EWMA FIMSE控制圖和EWMA MSE控制圖的控制界限系數L 的值的選取與參數δ3和λ的選取有關,EWMA控制圖的控制界限系數L 的值的選取只與參數λ的選取有關. 表1 基于EWMA 、EWMA MSE、EWMA FIMSE三個控制圖的ARL0Tab.1 ARL0 based on EWMA ,EWMA MSE and EWMA FIMSE control charts 表1 基于EWMA 、EWMA MSE、EWMA FIMSE三個控制圖的ARL0Tab.1 ARL0 based on EWMA ,EWMA MSE and EWMA FIMSE control charts δ3 λ EWMA images/BZ_7_401_2895_442_2945.pngL 2.702 2.860 2.925 2.702 2.860 2.925 ARL0 369.9 370.1 370.4 369.9 370.1 370.4 EWMA MSE L 2.731 3.168 3.445 11.482 9.997 9.407 ARL0 370.1 370.8 370.4 370.1 369.9 370.0 0.0 1.0 0.1 0.2 0.3 0.1 0.2 0.3 EWMA FIMSE L 5.130 4.849 4.779 19.908 16.040 14.345 ARL0 370.3 370.8 369.8 370.8 370.5 369.8 表2列出了λ=0.1 時EWMA控制圖、EWMA MSE 控制圖和EWMA FIMSE 控制圖的ARL1.顯然,EWMA FIMSE 控制圖的ARL1都小于EWMA MSE 控制圖和EWMA控制圖的ARL1,例如:當δ3=0.0,δ1=0.5,δ2=1.1 時,EWMA FIMSE 控制圖的ARL1=11.83,EWMA MSE 控制圖的ARL1=18.03,EWMA控制圖的ARL1=26.28,這表明EWMA FIMSE 控制圖比EWMA MSE 控制圖和EWMA控制圖更敏感,特別是當δ1和δ2取較小值時,EWMA FIMSE控制圖的監(jiān)測效果更好. 表2 基于EWMA 、EWMA MSE、EWMA FIMSE三個控制圖的ARL1Tab.2 ARL1 based on EWMA ,EWMA MSE and EWMA FIMSE control charts 表2 基于EWMA 、EWMA MSE、EWMA FIMSE三個控制圖的ARL1Tab.2 ARL1 based on EWMA ,EWMA MSE and EWMA FIMSE control charts δ3 δ1 δ2 0.1 0.0 0.5 1.0 0.1 1.0 0.5 1.0 1.1 1.3 1.5 1.1 1.3 1.5 1.1 1.3 1.5 1.1 1.3 1.5 1.1 1.3 1.5 1.1 1.3 1.5 EWMA images/BZ_7_401_2895_442_2945.png154.25 76.36 46.12 26.28 23.17 20.56 9.683 9.550 9.396 154.25 76.36 46.12 26.28 23.17 20.56 9.683 9.550 9.396 EWMA MSE 44.81 11.76 6.610 18.03 8.514 5.546 6.747 4.893 3.887 40.42 16.59 10.22 10.17 7.598 6.079 4.795 4.154 3.707 EWMA FIMSE 34.51 10.15 6.194 11.83 7.006 5.110 5.168 4.280 3.680 31.97 14.68 9.552 9.705 6.526 5.916 4.446 3.816 3.328 作為應用,搜集了漳州市2019年3月每天5 個時間段內一氧化碳(CO)的最高濃度和最低濃度的共155 個區(qū)間數據(https://quotsoft.net/air/),將其按日期分成31 組進行分析,試圖檢測出這個時間段的CO濃度異常的時間點.為此,分別構建EWMA控制圖,EWMA MSE 控制圖和EWMA FIMSE 控制圖.利用S-W檢驗數據是否服從正態(tài)分布,算得p=0.111 2>0.05,說明數據服從正態(tài)分布. 首先,為了估計過程受控時的樣本均值和標準偏差,先計算搜集的31 組區(qū)間值樣本數據每個時間段CO 的最高濃度和最低濃度的均值,繪制傳統的Xˉ控制圖、S控制圖,剔除失控的樣本組.再用受控的樣本組計算出過程受控時的平均值和標準偏差,計算全部的樣本組的平均值和標準偏差,從而估計出偏移值然后分別計算EWMA、EWMA MSE、EWMA FIMSE 統計量的值,并分別繪制EWMA控制圖、EWMA MSE控制圖、EWMA FIMSE控制圖. 為了計算方便,假設目標值T=0.672 1(T值可視實際需要而定),剔除Xˉ控制圖和S控制圖中失控的樣本組26,27,28,30,31,即圖1、圖2中上下界外的的樣本組.算得過程受控時的樣本均值和標準偏差分別為=0.790 3和=0.118 2,估計的偏移值分別為 圖1 控制圖Fig.1 control chart 圖2 S控制圖Fig.2 S control chart 如圖3-圖5所示,在EWMA控制圖、EWMA MSE控制圖和EWMA FIMSE控制圖中,最先被監(jiān)測到出界的樣本組分別為第22號、第23號和第26號,即分別在3月22日、3月23日和3月26日發(fā)現空氣中CO濃度的異常.這表明,使用EWMA FIMSE 控制圖來監(jiān)控漳州市CO 濃度這一“質量特征”的效果要優(yōu)于EWMA MSE 控制圖和EWMA控制圖.因此,當質量特征滿足模糊相依區(qū)間值數據時,EWMA FIMSE控制圖可以很好地應用于工業(yè)、經濟、環(huán)境和管理領域的質量控制. 圖3 EWMA 控制圖Fig.3 EWMA control chart 圖4 EWMA MSE控制圖Fig.4 EWMA MSE control chart 圖5 EWMA FIMSE控制圖Fig.5 EWMA FIMSE control chart 據調查,2019年3月下旬正是春節(jié)假期結束之時,大多數企事業(yè)單位、工廠等在這段時間復工、復產,這些因素導致車流量急劇增加,汽車尾氣的排放導致了CO 濃度的升高,數據分析結果從CO 的濃度異常變化角度很大程度地反映出這一社會現象,因此本文提出的方法有助于政府有關部門采取相關措施,實時監(jiān)測這樣的社會活動變化,做好預案. 針對具有相依性的區(qū)間值數據,提出了一種基于相依區(qū)間值數據的指數加權移動平均模糊區(qū)間均方誤差(EWMA FIMSE)控制圖.通過模擬和實證分析表明,所提出的EWMA FIMSE 控制圖的監(jiān)控性能優(yōu)于傳統的EWMA MSE 控制圖和EWMAXˉ控制圖,可以更快地監(jiān)測到過程均值和方差發(fā)生較小的變化時的失控現象.除了在氣象監(jiān)測上的應用,也可以應用在經濟、工程等領域.2 模擬分析
3 實證分析
4 結論