徐亦凡
摘? ?要:基于模式識別的時間序列數(shù)據(jù)分析方法,因其能夠揭示復雜、非線性的股價運行模式,在經(jīng)濟學、統(tǒng)計學和機器學習領域受到了廣泛的關注。為了避免人判斷的主觀性,因此采用一種與雙底形態(tài)的目標模板進行對比的方法,把一維的股價時間序列變換成二維的圖形與目標模板進行對比,對比后相似度高的時間片段能作為未來市場價格上漲的信號。實驗結果表明,此方法能夠產(chǎn)生正收益,且對股票的未來漲跌具有一定的預測能力。
關鍵詞:模式識別;股票價格預測;機器學習;人工神經(jīng)網(wǎng)絡
中圖分類號:F830.592? ? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2024)08-0081-04
引言
在對金融時間序列數(shù)據(jù)進行分析時,技術分析投資者認為,股票價格的未來走勢是能夠基于某些特定形態(tài)來進行預測的,因為他們相信在金融市場中“歷史會重演”。對于股票價格形態(tài)的研究有助于投資者作出合理的投資決策[1],因此,技術分析投資者把對股價走勢形態(tài)的分析認作是一種能夠在時域上評估特定股票未來變動趨勢的技巧[2,3]。而隨著金融科技應用范圍的逐漸擴大,這一領域越來越受到人們的關注[4]。
美國經(jīng)濟學家尤金·法瑪提出的有效市場假說[5]認為,投資人是不可能戰(zhàn)勝市場的,任何股價形態(tài)都無法提前反映股票的未來走勢。與此相對的,有一些研究人員支持市場并非有效的觀點。這一觀點揭示了投資者能夠通過使用如基本面分析、技術面分析等來擊敗市場。為實現(xiàn)這一目標,本文試圖找到一個能夠處理大量數(shù)據(jù)并且基于數(shù)據(jù)生成適當交易信號(買入或賣出)的投資策略,這是本文的研究目的。目前已有研究人員提出不同的方法來表示時間序列,常見的表示可以分為三類:基于生成式模型的表示方式、基于變換的表示方式和基于時域的表示方式。生成式模型使用不同模型中的參數(shù)來表示時間序列,如隱馬爾可夫模型[6]、貝葉斯網(wǎng)絡[7]等?;谧儞Q的表示方式旨在將原始數(shù)據(jù)轉移到另一特征空間來表示時間序列,如離散傅立葉變換[8]、時間序列符號聚合近似方法SAX[9]?;跁r域的表示方式的核心是從原始時間序列中找出具有代表性的點,如感知重要點PIP[10]、分段線性逼近PLA[11]、分段聚合逼近PAA[12]、分段常數(shù)逼近PCA[13]等。上述這幾種基于時域的表示方式,其本質上都是進行數(shù)據(jù)降維工作,用少數(shù)的數(shù)據(jù)來重新表示原始時間序列[14]。
一、相關工作
(一)證券投資分析
在證券投資分析領域主要有兩種分析方法:基本面分析和技術分析?;久娣治隼门c公司有關的財務數(shù)據(jù)來尋找出同一行業(yè)中最具有競爭力的公司。技術分析是通過分析股票的歷史價格圖表來識別趨勢以預測股票未來的走勢。它是通過事先定義一些技術指標,當技術指標達到某一閾值時即意味著產(chǎn)生出了買入、賣出的投資機會[15]。技術指標通常是通過股票的歷史價格計算出新的數(shù)值來預測未來的價格。比如波動率指標,如果該技術指標的走勢不穩(wěn)定并且其數(shù)值朝著正反兩個方向不斷變化,則說明該支股票波動率較大,其股價日后出現(xiàn)大漲或者大跌的概率也較大[16]。
(二)模式識別
由于國內(nèi)A股市場缺乏做空手段,普通投資者只能以做多來盈利。因此,本文選取代表見底回升轉勢形態(tài)的雙底形態(tài)(又稱W底)為研究對象。雙底形態(tài)技術分析中的經(jīng)典形態(tài),代表股價趨勢將發(fā)生巨大變化,股價將從先前下跌趨勢中發(fā)生反轉。它的形狀像英文字母W,股價先是下跌然后反彈,在形成了第一個底部之后第二次下跌至與第一次下跌底部接近的價格水平后股價又一次發(fā)生反彈,股價在兩次觸及低點之后都發(fā)生了反彈,此時這個低點被認為是一個重要的支撐位,股價有可能開始轉勢上漲。圖1是展示雙底形態(tài)的示意圖。
在過往研究中已有研究者使用不同的方法來識別股票技術形態(tài),如感知重要點PIP、時間序列符號聚合近似方法SAX等。本文采用與模板對比的方法,使用一個儲存著各個點相應權重的矩陣[17]作為模板,如圖2所示。通過把股價序列與目標模板進行對比,當股票的價格恰巧落在目標形態(tài)所在的點上,則給予該點高分;當股價遠離目標形態(tài)時,則給予低分。最終對整個矩陣中各個點的分值求和得到表征擬合程度的擬合值,擬合值越高則表明待檢測的股價序列與目標模板越接近。
二、方法
我們使用圖2作為模板來進行股價形態(tài)識別。這是一個10 ×10 的矩陣,矩陣中的每一個元素代表該點的權重Wij,其值介于1到-2之間。在這個矩陣中,權重值定義為1的區(qū)域代表著股價走勢呈現(xiàn)出以雙底或雙頂形態(tài),在圖中以深色顯示。我們用代表著雙底形態(tài)與雙頂形態(tài)的模板和待檢測股票收盤價的時間序列數(shù)據(jù)進行匹配,具體方法是,將待檢測股票時間序列的收盤價格取一個寬度為40個交易日的時間窗口,從最早的價格開始與模板對照,之后將時間窗口向后移動一個交易日進行下一次匹配,之后逐步向前直至對整個時間序列完成匹配。對待檢測股價序列與目標模板之間進行匹配的方法是一種在圖像檢測中用于目標識別的模式識別技術。我們把移動窗口中第t個交易日的收盤價記作Pt,t = 0,...,39,移動窗口本身的順序以k表示,k從1開始。對于在時間窗口中的40個交易日的收盤價,我們將把它轉換至那個10 ×10二維矩陣中的某一個元素的位置上,并把這個時間窗口記作Ik。最后,我們計算雙底形態(tài)模板與轉換后的矩陣Ik的互相關,把第k個時間窗口的擬合值記為FITk。除了FITk以外,我們還計算了第k個時間窗口最高價與最低價之差,并記為RANGEk。其中,互相關[18]在信號處理領域中通常用來衡量兩個信號之間相似性,它通常用于在一段長信號中搜索較短的已知特征。此外,通過滑動模板來與源圖像的各個部位進行比較,互相關也可用于識別圖像中的特定目標。
這個算法的關鍵是對于每一個寬度為40個交易日的時間窗口k,如何將一維的時間序列信息映射到 10×10 的二維矩陣Ik中去。首先,我們把二維矩陣Ik中每一個元素的值記為gij,通過計算時間窗口內(nèi) 40 個交易日收盤價的最高價與最低價之差,并把這個差值范圍除以 10 以得到一個增量值inc,之后將通過這個增量值來計算每日的收盤價將映射到二維矩陣中的那一行去。
Pmax與Pmin分別是時間窗口內(nèi)40個交易日收盤價的最高價與最低價。在得到了增量值inc之后,我們可以給二維矩陣中的每一行行i一個對應的區(qū)間:
二維矩陣中的第j列對應著40日移動窗口內(nèi)的連續(xù)4日的收盤價格,例如,P4 ·j,P4 ·j+1,P4 ·j+2,P4 ·j+3對應著二維矩陣中的第j列,j=1,2,...,10。第j列中每個元素gij的值則由第j列所對應的4個交易日的收盤價格分別屬于哪一行行i所對應的價格區(qū)間來決定:
最后,我們計算并記錄第k個時間窗口的擬合值FITK與代表價格區(qū)間的值RANGEk。FITk是匹配模板的矩陣與經(jīng)轉換后的二維矩陣兩者間的互相關,RANGEk是移動窗口內(nèi)每日收盤價的價格區(qū)間除以該時間窗口最后一個交易日的收盤價Pk歸一化的值,其計算公式分別為:
三、實驗結果與分析
實驗從國內(nèi)A股市場中隨機選取了10支規(guī)模大、流動性好、上市時間久的股票作為數(shù)據(jù)集。數(shù)據(jù)從Tushare平臺上下載,時間段從2000年初到2022年12月30日為止,所選取的股票數(shù)據(jù)基本都有20年以上歷史交易記錄。選取交易歷史記錄長的股票以保證其股價模式具有代表性。
實驗1:通過模式識別來識別雙底形態(tài)。
我們通過將應用交易規(guī)則之后的結果與在比較期內(nèi)每日買入并持有一段時間的結果進行比較以觀察該方法的有效性。在使用移動窗口前進與模板對比時,移動窗口前進的步進設定為移動窗口長度的十分之一。因為如果將步進設定為一,相鄰兩個窗口幾乎是相同的,時常會出現(xiàn)連續(xù)幾天時間窗口的擬合值都高于閾值的情況。為了避免重復檢測以及加快計算速度,故將移動窗口移動的步進設為窗口長度的十分之一。設pk為第k交易日的收盤價,RANGEk與FITk如上文所述分別代表價格區(qū)間與擬合值,買入股票之后的預測期內(nèi)的交易天數(shù)用h表示,其中h的取值為5、10、20。對于買入并持有策略,同樣采用移動窗口的方式,一共有k個移動窗口,其中,第一個移動窗口的編號為m,最后一個移動窗口的編號為n。然后計算每一個子區(qū)間的收益率,當每日都買入時,市場的平均收益為:
而只當買入信號產(chǎn)生后才買入時:
買入次數(shù)nb=■■Rk(7)
其中,Rk=1,如果RANGE■與FIT■滿足我們所設定的買入規(guī)則0,如果RANGE■與FIT■不滿足買入規(guī)則 (8)
那么按照交易規(guī)則后的平均收益率為:
最后,我們把應用交易規(guī)則后的平均收益率與采取每日買入并持有策略代表市場的平均收益率兩者相減,得到超額收益率:
rex=rtavg-ravg(10)
表1展示了運用交易規(guī)則之后所得到的超額利潤。表1中的超額利潤值是市場平均回報和應用交易規(guī)則后再買入股票的平均回報之間的差值。兩種市場策略都是在買入后持有一段時間以對比收益率。采用模式識別方法所用的交易規(guī)則如下:在某一交易日,如果RANGEk> RANGE且FITk>FIT,則買入并持有n個交易日。從結果可以看出,對于用于預測價格向上的雙底形態(tài)進行匹配后的擬合值FITk較高的時間序列片段其后市股價的上漲幅度較大。
四、結束語
本文通過構建模型,提出了一種基于模板對比的股票時間序列模式識別方法,具有避免人的主觀判斷、能從全局的視角尋找極值點等優(yōu)勢。實驗結果表明,與雙底形態(tài)擬合度較高的股價時間序列片段其后市在平均上能有正的收益。在市場運行模式不變的前提下,按照此策略投資能夠實現(xiàn)盈利。該模型是一種分析時間序列數(shù)據(jù)的有效方法,能夠幫助投資者作出短期預測。
參考文獻:
[1]? ?約翰·墨菲.金融市場技術分析[M].丁圣元,譯.北京:地震出版社,2010.
[2]? ?BLAKEY P. Pattern recognition techniques[J].IEEE Microwave Magazine,2002,3(1):28-33.
[3]? ?SHAH D.ISAH H.ZULKERNINE F.Stock market analysis:A review and taxonomy of prediction techniques[J].International Journal of Financial Studies,2019,7(2):26.
[4]? ?KUMAR D,SARANGI P K,VERMA R.A systematic review of stock market prediction using machine learning and statistical techniques[J].Materials Today:Proceedings,2022(49):3187-3191.
[5]? ?FAMA E F.Efficient capital markets: A review of theory and empirical work[J].The journal of Finance,1970,25(2):383-417.
[6]? ?張旭東,黃宇方,杜家浩,等.基于離散型隱馬爾可夫模型的股票價格預測[J].浙江工業(yè)大學學報,2020,48(2):148-153,211.
[7]? ?ZHAO Z Y.Bayesian Multiregression Dynamic Models with Applications in Finance and Business[D].Durham,USA:Duke University,2015.
[8]? ?SAMIEE K,KOVACS P,GABBOUJ M.Epileptic seizure classification of EEG time-series using rational discrete short-time Fourier transform[J].IEEE transactions on Biomedical Engineering,2014,62(2):541-552.
[9]? ?LEITAO J,NEVES R F,Horta N.Combining rules between PIPs and SAX to identify patterns in financial markets[J].Expert Systems with Applications,2016(65):242-254.
[10]? ?ZHANG Z,JIANG J,WANG H.A new segmentation algorithm to stock time series based on pip approach[C]//2007 International Conference on Wireless Communications, Networking and Mobile Computing.Shanghai,China:IEEE,2007:5609-5612
[11]? ?Li H L,GUO C H,QIU W R,2011.Similarity measure based on piecewise linear approximation and derivative dynamic time warping for time series mining[J].Expert Systems with Applications,2011,38(12):14732-14743.
[12]? ?BRASILEIRO R C, SOUZA V L,OLIVEIRA A L.Automatic trading method based on piecewise aggregate approximation and multi-swarm of improved self-adaptive particle swarm optimization with validation[J].Decision Support Systems,2017(104):79-91.
[13]? ?MEGALOOIKONOMOU V, Li G, WANG Q.A dimensionality reduction technique for efficient similarity analysis of time series databases[C]//Proceedings of the thirteenth ACM international conference on Information and knowledge management.Washington D.C.,USA:ACM,2004:160-161.
[14]? ?BAO D.A generalized model for financial time series representation and prediction[J].Applied Intelligence,2008(29):1-11.
[15]? ?OZTURK M,TOROSLU I H,F(xiàn)IDAN G.Heuristic based trading system on Forex data using technical indicator rules[J].Applied Soft Computing,2016(43):170-186.
[16]? ?GORGULHO A,NEVES R, HORTA N.2011.Applying a GA kernel on optimizing technical analysis rules for stock picking and portfolio composition[J].Expert systems with Applications,2011,38(11):14072-14085.
[17]? ?LEIGH W,PAZ N,PURVIS R.Market timing:a test of a charting heuristic[J].Economics Letters,2002,77(1):55-63.
[18]? ?ELHADI M,MERZOUGUI M,Hadi M,et al.Detection of the Objects by the Cross-correlation[J].International Journal of Computer Applications,2016,136(12):23-27.
Research on Stock Price Prediction Based on Pattern Recognition
XU Yifan
(School of Management, University of Shanghai for Science and Technology, Shanghai 200093, China)
Abstract: The method of time series data analysis based on pattern recognition has attracted wide attention in the fields of economics, statistics, and machine learning due to its ability to reveal complex and nonlinear stock price patterns.A heuristic based template called the “Double Bottoms”, which transfers a one-dimensional stock price time series to a two-dimensional template, and identifies time segments with high similarity to the template as signals which can predict future market price increments.Experimental results show that this method can generate positive returns and has a certain predictive ability for future stock price movements.
Key words: Pattern recognition; Stock price prediction; Machine learning; Artificial neural networks
[責任編輯? ?若? ?云]