胡霽芳, 鄭 強, 宋學力
(長安大學 理學院, 陜西 西安 710064)
統(tǒng)計過程控制(Statistical Process Control, SPC)是質量管理中一個很重要的統(tǒng)計工具.它主要是指應用統(tǒng)計分析技術對生產(chǎn)過程進行實時監(jiān)控,科學地區(qū)分出生產(chǎn)過程中產(chǎn)品質量的隨機波動與異常波動,從而對生產(chǎn)過程的異常趨勢提出預警,以便使生產(chǎn)管理人員及時采取措施,消除異常,恢復過程的穩(wěn)定,從而達到提高和控制質量的目的[1,2].這種質量管理技術思想,由于強調(diào)全員參與質量管理的全過程,并能真正起到“事前”預防與控制的作用,而被成功地應用到許多其他領域,如在環(huán)境科學中監(jiān)控臭氧含量的變化、在金融中監(jiān)控股市收益的早期暗示[3].股票市場是國家經(jīng)濟與金融發(fā)展的一個至關重要的部分[4].股票作為一種具有虛擬資本的共性特征的現(xiàn)代化金融工具,其特有的性質包括投機性和回歸性決定了風險會伴其左右[5].因此,股票市場不僅影響國家的經(jīng)濟,也影響居民的福利.在股票市場中,由于投資的風險高,人們扮演一名投資者的同時也要對風險進行科學全面的監(jiān)控和分析,以便能更好地做出正確的判斷,并采取合理防范措施降低風險獲得最大的利益[6].
那么,我們可以將股票市場的運動演進視為一個系統(tǒng)內(nèi)的投資者連續(xù)競價交易的過程[7],且將影響股票價格波動的幾種因素作為過程變量來進行監(jiān)控.
由于影響股價因素的多元化,需要應用統(tǒng)計過程中的多變量控制圖來進行分析.在分析股票多種因素對股價波動的影響時,多變量控制圖T方統(tǒng)計量相對于單變量Shewhart控制圖更能準確地反應波動過程是否處于受控狀態(tài)[5].但是,多變量控制圖沒有考慮多變量是否服從正態(tài)分布以及是否具有相關性等問題.Alwan指出:不考慮自相關問題的話,多變量控制圖會導致虛發(fā)警報和漏發(fā)警報[8].如今針對自相關過程的控制圖有修正Shewhart控制圖、修正CUSUM控制圖[9,10]和修正EWMA控制圖[9,10]等,另有殘差控制圖[10],其利用時間序列模型對自相關過程進行擬合,擬合模型的殘差序列被認為是服從獨立同分布的,即可以用常規(guī)控制圖.以上這些修正控制圖適用于監(jiān)控具有單因素的股市運動過程,那么對于影響股價波動的多種因素之間的高度相關性,應該怎么處理使其相互獨立?本文引用主成分分析方法[11-15]和EWMA控制圖結合的方案,先處理多元因素之間的相關性,在確保數(shù)據(jù)信息丟失最小的前提下,對多維因素變量進行降維處理.然后將最后得到的綜合得分作為代替原始多維變量數(shù)據(jù)信息的一組新的單變量,從而進行EWMA控制圖的操作.由于在監(jiān)控股票風險因素的綜合得分時,距今越近的信息對我們研究下一步操作是買入、觀望還是賣出越有用.因此可以很適當?shù)厥褂脝沃礒WMA控制圖.它利用了所有的歷史數(shù)據(jù),對不同階段的數(shù)據(jù)取不同的權重,距今越近的數(shù)據(jù)權重越大,距今越遠的數(shù)據(jù)權重越小.因此,能夠同時兼顧系統(tǒng)的頻域和時域特性[16].這里,因為本文選取的開盤價、漲幅、振幅、金額和換手率從不同程度上反映了股票的活躍程度,所以將它們作為影響股價波動的過程變量.相對于股票中一些數(shù)據(jù)的不易取得,本文所選取的都是股市上可以查找的數(shù)據(jù).基于這些局部數(shù)據(jù)建立數(shù)學模型,短期監(jiān)控,及時更新樣本數(shù)據(jù),調(diào)整模型結構,重估模型參數(shù),以實現(xiàn)動態(tài)化監(jiān)控.
主成分分析法是設法將原來一系列具有一定相關性的多個指標,重新組合成一系列新的相互無相關性的指標來替代原指標[11],重新組合后的這組指標稱為主成分,在確保數(shù)據(jù)信息丟失最小的前提下,對高維變量和空間進行降維處理的方法,具體計算步驟如下[11,13]:
設有n個樣本,每個樣本觀測m項指標(即m個變量):X1,X2,…,Xm,將原始數(shù)據(jù)寫成矩陣
其中,Xj=(x1j,x2j,…,xnj)T,j=1,…,m;xij為過程變量第i次的采樣值.
(1)將X標準化:
這樣標準化的目的是為了消除變量間量綱差異對分析結果的影響.
(2)計算樣本的相關系數(shù)矩陣
R=(rij)m×m.
不妨假設原始數(shù)據(jù)標準化后仍用X表示.標準化后的數(shù)據(jù)相關系數(shù)為
(3)求R的特征值λ1≥λ2≥λ3≥…λm>0及相應的單位特征值向量:
a1=(a11,a21,…,am1)T,
a2=(a12,a22,…,am2)T,…,
am=(a1m,a2m,…,amm)T.
Fi=a1iX1+a2iX2+…+apiXp,i=1,…,p.
(5)計算綜合得分構造一個綜合評價函數(shù)
f=f(Z1,Z2,…,Zp).
首先由前p個主成分Z1,Z2,…,Zp的信息量分別為λ1,λ2,…,λp確定各主成分的權重:
即把Zk的權重取為Wk,于是可構造綜合評價函數(shù)為
將主成分的得分值Zk(i=1,2,…,n;k=1,2,…,p)代入上式可得各個樣品綜合得分為
將f1,f2,…,fn從小到大排序,可得到樣品的排序名次.
K-S檢驗是一個擬合優(yōu)度檢驗,它是基于經(jīng)驗分布函數(shù)來檢驗樣本是否來自于某一個特定分布的方法.通過對兩個分布之間的差異分析,判斷樣本的觀察結果是否來自指定分布的總體.
Kolmogorov[17]將檢驗統(tǒng)計量KS定義為
(1)
其中:Fn(x)表示樣本數(shù)據(jù)的經(jīng)驗分布函數(shù),F(x)表示某個特定的理論分布.在檢驗時,如果KS≥KS1-α,則拒絕原假設H0:X~F(x),也就是說認為樣本數(shù)據(jù)不是來自于事先假定的分布F(x);否則,不能拒絕原假設H0.當用K-S檢驗法來檢驗樣本數(shù)據(jù)是否來自正態(tài)分布時,假設F(x)表示某個正態(tài)分布.當樣本根據(jù)不是來自正態(tài)分布時,為了進行有關問題分析,需用Johnson轉換把樣本數(shù)據(jù)進行標準正態(tài)分布轉換.
假設X1,X2,…,Xn是相互獨立的隨機變量,當過程是受控時,它們服從正態(tài)分布N(μ0,σ2),在過程變成失控后,假設分布變成N(μ1,σ2),其中μ0,μ1分別是受控和失控的過程均值且μ0≠μ1,則EWMA控制圖統(tǒng)計量[18]為
En=λXn+(1-λ)En-1,n≥1,
(2)
其中:E0=μ0;λ∈(0,1]為權重參數(shù),是一個常數(shù).式(2)可以寫成
λXn+(1-λ)En-1=
λXn+λ(1-λ)Xn-1+…+
λ(1-λ)n-1X1+(1-λ)nμ0=
(3)
從式(3)中可知,當前觀測值Xn的權重為λ,Xn-1的權重為λ(1-λ),距離當前越遠的數(shù)據(jù),權重越小,并且以指數(shù)形式遞減.初始值μ0的權重為(1-λ)n.
易知
當λ→1時,Xn的權重趨近于1;當λ=1時,EWMA控制圖完全退化為單值控制圖;當λ→0時,EWMA統(tǒng)計量中,觀測值的權重基本相等,EWMA控制圖近似于經(jīng)典的CUSUM統(tǒng)計量.
那么,EWMA控制圖的控制限為
(4)
這里ρ>0是一個參數(shù).
可以將股票市場的運動演進視為一個系統(tǒng)內(nèi)的投資者連續(xù)競價交易的過程,所有過程都有變量,統(tǒng)計過程控制提供基本的工具,可用于測量和檢測過程變量[5].因此選擇股民很容易得知的表征股票市場風險的開盤價、漲幅、振幅、金額和換手率作為過程變量,采用主成分分析得出它們的綜合得分后,再利用EWMA控制圖對其綜合得分進行分析.通過監(jiān)控其波動來預警股票市場的風險,以判斷下一步是買入、賣出還是繼續(xù)觀望.
(1)為了分析討論所考慮的問題,我們選取美股中的一只股票——美國航空(AAL)為例.收集了2016年8月22日到2016年12月22日的美國航空(AAL)的4個月每天的開盤價、漲幅(%)、振幅(%)、金額和換手率(%)的變化值作為此股的5個指標.
(2)利用Minitab 16軟件分析知,美國航空(AAL)每天的開盤價、漲幅(%)、振幅(%)、金額和換手率(%)這5種風險變量均服從非正態(tài)分布且相互之間有高度相關性,為此對這些數(shù)據(jù)采用R語言進行主成分分析,結果如表1.
由表1中可以看出,5個變量中的前3個主成分的貢獻率為0.95,超過0.85,因此取前3個主成分代替原來的5個變量.前3個主成分的特征向量(見表2),可得出它們的得分,并計算出綜合得分.于是,由
Fi=a1iX1+a2iX2+…+apiXp,(i=1,…,p),
可得出前3個主成分的線性組合為
F1=0.06X1-0.23X2-0.54X3-0.57X4-0.58X5,
F2=0.97X1+0.12X2-0.09X3+0.20X4-0.07X5,
F3=0.09X1-0.94X2-0.07X3+0.22X4+0.23X5.
表1 主成分分析后得出的3個主成分
表2 前三個主成分的特征向量
K-S檢驗是基于經(jīng)驗分布函數(shù)來檢驗樣本是否來自某一特定分布的方法.將樣本數(shù)據(jù)的經(jīng)驗分布函數(shù)和某個特定的分布F(x)對比,如果它們之間的差距很小,則可以認為樣本數(shù)據(jù)是來自這個特定的理論分布的.
利用Minitab 16 軟件,對綜合得分數(shù)據(jù)進行K-S正態(tài)性檢驗,得出p<0.05,說明此組數(shù)據(jù)不具有正態(tài)性分布,因此,需要使用Johnson分布系統(tǒng)對此組數(shù)據(jù)進行標準正態(tài)分布的轉換,將轉換后得到的數(shù)據(jù)進行作圖,詳情見2.3節(jié).
利用Minitab 16軟件,畫出美國航空這只股票風險因素變換后的綜合得分的87個歷史數(shù)據(jù)的EWMA控制圖,如圖1.
在圖1中,紅線(參見文章電子版)表示EWMA控制圖的UCL和LCL,分別為0.893和-0.874.如同股票布林(BOLL)線指標.本文利用統(tǒng)計方法,先求出各風險因素的綜合得分的標準差及其信賴區(qū)間,進而確定綜合得分的波動范圍及未來走勢,利用波帶顯示股票的風險、安全價位的高低對股票波動進行監(jiān)控.因此,LCL設為支撐線,指股票受到突發(fā)的利空信息等諸多因素影響,綜合得分跌至前期買入成本時的分數(shù),既前期籌碼比較密集區(qū)域時,會有人認為該股票可以買進,會有大量買盤涌入,阻止股價下跌,從而使股價止跌回穩(wěn)的價位.UCL設為阻力線,指綜合得分上漲達到某一分數(shù)附近時,投資者就會產(chǎn)生賣出的意愿,大量的賣出對股價上升形成一定的阻力,使之停止上揚,甚至回跌,這一分數(shù)線就叫阻力線.一旦突破阻力線,則該阻力線反而會轉變成為綜合得分的下一個支撐線.綠線表示中心線,為0.009.這意味著,綜合得分在UCL和LCL以內(nèi)時,投資者對該股票持觀望態(tài)度,抵達上限,說明該時間點上的綜合得分已達極限,將不再受控,投資者此時要對該票持謹慎觀望的態(tài)度,綜合各方分析,是繼續(xù)持有還是賣出鎖住利潤.同理抵達下限,該股票的綜合得分已經(jīng)進入低谷,此時投資者可以考慮是否建倉買入,等待其呈上升階段后再考慮擇時賣出.
圖1 綜合得分的EWMA控制圖
基于UCL和LCL上下限,從圖1中可知,第1個到第41個黑點,綜合得分的數(shù)值在UCL和LCL之間,呈一種下滑的趨勢,在受控范圍內(nèi),需要繼續(xù)觀察不做買進的考慮.第42個點和第43個點已到甚至超出了下限,呈紅色,可認為,這是一種警示.數(shù)值已不在控制范圍內(nèi),此時需要綜合各方面分析,弄清楚該票是正常的技術調(diào)整,還是因股市整體震蕩調(diào)整使人心恐慌導致的股票下跌或是其他突發(fā)利空消息導致的下跌,同時根據(jù)量能的變化和實盤K線圖的走勢作為輔助依據(jù).如下跌過程中量能逐漸萎縮,說明該點位已跌近底部,止跌、企穩(wěn)、反彈會隨時開始,可以考慮準備建倉買入.反之量能逐漸放大,就得棄之.如手中已有此類股票就要考慮是繼續(xù)持有還是果斷斬倉止損.
接下來,第44個點再一次進入受控范圍內(nèi),此時是受控內(nèi)的最低點,是買入時機的預警信號,此時可以考慮擇時漸進買進.第44個點到第69個點呈不斷上升趨勢,可在這個時段進行跟蹤監(jiān)控,上漲到最高第68個點時已達上限安全范圍界線,在此可以進行賣出,獲取收益,落袋為安.
從第69個點到第85個點的波點走勢可以看出,該股票的多頭趨勢已經(jīng)完全走穩(wěn),其實跌一、二個點也沒事.應是受大盤指數(shù)的影響,是有正常調(diào)整的需求,大量資金都等著指數(shù)回調(diào)再買,這樣未來才有漲的動力.不過此時應減倉,把倉位降低,跟蹤觀察找準時機果斷加倉買進.
第86和87點呈紅色,已超出上限控制范圍,從第86個點超出控制限的趨勢可以預警該票上行動力非常強或有什么利好事件將要發(fā)生,第二天繼續(xù)上漲的概率較大,可以等到第87個點上再進行賣出,以便達到收益最大化.
從上述圖示及數(shù)據(jù)分析可知,利用EWMA控制圖能夠較好地對股票交易情況進行適時監(jiān)控,進而做好股票交易的決策.但是,利用EWMA控制圖,只是對股票未來趨勢的預警.凡事都不能絕對,也不可能是100%的正確,只是將其控制在最佳范圍內(nèi).
為了說明基于主成分分析的EWMA控制圖在股票交易監(jiān)控與決策方面的有效性,現(xiàn)將其與現(xiàn)有的Shewhart單值控制圖[5]和多元T方控制圖進行對比分析.將上述得到的股票風險因素的綜合得分運用到Shewhart單值控制圖,如圖2.
圖2 綜合得分的Shewhart單值控制圖
對比圖1和圖2,可以看出,在Shewhart單值控制圖中,綜合得分的數(shù)值全部在UCL和LCL之間,不能有效地檢測出該股票的綜合得分是否有上升趨勢和下降趨勢,也不能靈敏地檢測出投資者不再持觀望態(tài)度的異常點,給出信號,作出判斷.
在沒有對股票的多元風險因素進行主成分分析之前,直接對多元因素作T方控制圖,如圖3.
圖3 利用原始數(shù)據(jù)作的多元T方控制圖
對比圖1和圖3可知,在沒有對股票的多元風險因素數(shù)據(jù)進行相關性和正態(tài)性處理之前,多元T方控制圖雖然能給出其上升和下降的趨勢情況,但是超出控制限范圍的數(shù)值太多,以至于不能明確地向投資者給出買入、賣出還是繼續(xù)持觀望態(tài)度的信號,使投資者不能很好地把握賺取收益的機會.
綜上可知,EWMA控制圖能更明確有效地為投資者給出買入、賣出和繼續(xù)觀望的信號.
本文首先通過主成分分析法對股票的多種風險因素進行了變量之間的相關性處理,進而得到主成分的綜合得分.再通過K-S正態(tài)性檢驗方法檢驗綜合得分數(shù)據(jù),結果表明它不服從正態(tài)分布.針對此非正態(tài)數(shù)據(jù),進行了Johnson變換,得到一組新的綜合得分數(shù)據(jù),然后利用新的數(shù)據(jù)制作EWMA單值控制圖與Shewhart單值控制圖和多元T方控制圖進行對比,發(fā)現(xiàn)EWMA控制圖更能有效靈敏地檢測出異常點并給出信號,讓投資者更容易判斷是否應該買入、賣出或者繼續(xù)持觀望態(tài)度.所以,將EWMA控制圖應用到監(jiān)控股票風險因素波動的研究中有很好的效果.