計(jì)萍, 宋焱燚
?
一種新的時(shí)間序列周期檢測(cè)算法
計(jì)萍, 宋焱燚
(安徽財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院, 安徽蚌埠, 233030)
提出了一種SJ周期檢測(cè)算法, 利用計(jì)算機(jī)虛擬了3個(gè)序列來(lái)評(píng)價(jià)SJ算法的可行性和需要改進(jìn)的地方。將SJ算法應(yīng)用到鐵路客流量數(shù)據(jù)上, 檢測(cè)到客流量數(shù)據(jù)存在4、7和26的周期規(guī)律。
時(shí)間序列周期; SJ周期檢測(cè)算法; 客流量周期
時(shí)間序列的周期性檢驗(yàn)是非常重要的, 對(duì)于一些簡(jiǎn)單的時(shí)間序列, 例如水文序列[1-3]、天氣序列和客流量序列等, 其周期性更是人們關(guān)注的焦點(diǎn)。已有的周期檢驗(yàn)方法有簡(jiǎn)單分波法、傅里葉分析法、功率譜分析法、最大熵譜分析法和小波方差法等[4-5]。針對(duì)適用于簡(jiǎn)單序列的周期檢測(cè),本文將介紹一種新的算法——SJ周期檢測(cè)算法。此算法是作者在一次數(shù)據(jù)挖掘競(jìng)賽(第四屆泰迪杯全國(guó)大學(xué)生數(shù)據(jù)挖掘競(jìng)賽B題)中開(kāi)發(fā)的, 挖掘的目標(biāo)是“鐵路客流量的分析與預(yù)測(cè)”, 在分析過(guò)程中, 發(fā)現(xiàn)客流量雖然在節(jié)假日發(fā)生突變, 但其仍然具有一定的周期規(guī)律, 于是本文著手于客流量的周期分析, 這也是SJ周期檢測(cè)算法的初衷。
SSJ本質(zhì)上是一種遍歷搜索算法, 由于分析的序列大多為1 d或者1 yr之類(lèi)的離散性序列, 這使得SJ的周期為整數(shù)而不存在小數(shù)情況。
SJ算法的流程[6]如下:
step3. 采用Pearson線(xiàn)性相關(guān)系數(shù)作為向量相似性的度量, 計(jì)算的各個(gè)向量之間的相似性;
SJ算法的偽代碼如下:
begin
end(for)
end(for)
end(for)
end(for)
end(while)
end(begin)
圖1 2個(gè)虛擬時(shí)間序列(周期為8)
圖2 第1個(gè)虛擬時(shí)間序列的SJ檢測(cè)結(jié)果
圖3 第2個(gè)虛擬時(shí)間序列的SJ檢測(cè)結(jié)果
數(shù)據(jù)來(lái)源于第四屆泰迪杯全國(guó)大學(xué)生數(shù)據(jù)挖掘競(jìng)賽B題整理數(shù)據(jù)[9-10], 是ZD111市2015年1月1日到2016年3月20日共439 d (有7 d的缺失值)的客流量數(shù)據(jù)。其客流量情況如圖4所示, 在360 d用豎線(xiàn)進(jìn)行標(biāo)記(1~360是2015全年的情況)。從圖4可以看出, ZD111客流確實(shí)具有一定的周期規(guī)律, 且周期約為7 d。
圖4 ZD111市2015/01/01-2016/03/20的客流量
利用adftest對(duì)ZD111市的客流量進(jìn)行平穩(wěn)性檢驗(yàn),檢驗(yàn)結(jié)果表明ZD111市的客流量平穩(wěn)。在此基礎(chǔ)上分析序列的自相關(guān)和偏自相關(guān)[11], 自相關(guān)和偏自相關(guān)的定義為。
圖5 ZD111客流量的自相關(guān)及偏自相關(guān)圖
為驗(yàn)證客流量的周期為7, 利用設(shè)計(jì)的SJ周期檢驗(yàn)算法對(duì)ZD111的周期進(jìn)行檢驗(yàn)。設(shè)置初始周期為3, 浮動(dòng)量為1, 最大周期為30。SJ檢測(cè)的結(jié)果如圖6所示, 檢測(cè)到的ZD111客流量周期為4、7和26, 它們的SJ相似性分別為0.072 6、0.060 7和0.065 2, 3個(gè)周期的相似性伴隨概率均小于0.05, 說(shuō)明相似性顯著。為了研究小周期內(nèi)客流的變化規(guī)律給出3個(gè)星期(305~326) ZD111的客流量, 如圖7所示。從圖7可以看出: ZD111客流量以7為周期的變化規(guī)律明顯, 即周期為7。ZD111的客流量在一個(gè)星期內(nèi)的變化規(guī)律是周1的客流量最小, 從周1~周5, 客流量逐漸增加, 在周5 (第305 d)時(shí), 客流量最大, 周6會(huì)變小, 之后周日又有所增加。
圖6 ZD111客流量的SJ周期檢測(cè)結(jié)果
圖7 ZD111客流量的3周的客流規(guī)律圖
本文指出一種新的周期檢測(cè)算法(SJ), 并介紹了其原理、模型、步驟以及偽代碼。用2個(gè)簡(jiǎn)單周期序列驗(yàn)證了本算法的準(zhǔn)確性。用該算法對(duì)某市一段時(shí)間內(nèi)的客流量進(jìn)行了周期分析, 結(jié)果顯示, 該市客流量具有7 d的周期, 并得到了一周內(nèi)客流量的變化規(guī)律。
[1] 于浩. 基于時(shí)間序列的延河流域水沙周期分析及趨勢(shì)預(yù)測(cè)[D]. 西安: 西北農(nóng)林科技大學(xué), 2008.
[2] 楊華. 水文時(shí)間序列周期分析方法的研究[J]. 中國(guó)水能及電氣化: 科學(xué)研究及工程設(shè)計(jì), 2015(5): 63-66.
[3] 楊玲霞, 孫東永, 張莉. R/S在徑流時(shí)間序列周期分析中的應(yīng)用[J]. 人民黃河: 水文·泥沙, 2013(9): 51-52.
[4] 趙利紅. 水文時(shí)間序列周期分析方法的研究[D]. 青島: 中國(guó)海洋大學(xué), 2007.
[5] 肖志國(guó). 幾種水文時(shí)間序列周期分析方法的比較研究[D]. 青島: 中國(guó)海洋大學(xué), 2006.
[6] 郁磊, 史峰, 王輝. MATLAB智能算法30個(gè)案例分析[M]. 北京: 北京航空航天大學(xué)出版社, 2015: 178-182.
[7] 趙海青. 動(dòng)態(tài)時(shí)間序列周期分析預(yù)測(cè)模型[J]. 鄭州: 鄭州大學(xué), 2002.
[8] 郭龍. 時(shí)間序列數(shù)據(jù)的周期性研究[D]. 成都: 電子科技大學(xué), 2013.
[9] 張良均, 楊坦, 肖剛,等. MATLAB數(shù)據(jù)分析與挖掘?qū)崙?zhàn)[M]. 北京: 機(jī)械工業(yè)出版社, 2015: 123-129.
[10] 盛驟, 謝氏千, 潘承毅. 概率論與數(shù)理統(tǒng)計(jì)[M]. 北京: 高等教育出版社, 2008: 106-108.
[11] 楊桂元, 朱家明. 數(shù)學(xué)建模競(jìng)賽優(yōu)秀論文評(píng)析[M]. 合肥: 中國(guó)科學(xué)技術(shù)大學(xué)出版社, 2013: 134-146.
(責(zé)任編校:劉曉霞)
A period detection algorithm for time series-SJ cycle detection algorithm
Ji Ping, Song Yanyi
(School of statistics and applied mathematics, Anhui Finance and Economics University, Bengbu 233030, China)
A SJ cycle detection algorithm is put forward. Three sequences are used to evaluate the feasibility and disadvantages of SJ algorithm by the use of computer. By SJ algorithm, it is recognized that the cycle of 4, 7 and 26 exists in traffic data.
time series cycle; SJ cycle detection algorithm; traffic cycle
10.3969/j.issn.1672–6146.2017.01.002
P 171.5
A
1672–6146(2017)01–0005–04
計(jì)萍, 2474296173@qq.com。
2016-05-27
國(guó)家自然科學(xué)基金(11301009); 安徽財(cái)經(jīng)大學(xué)教研項(xiàng)目(acjyzd201429)。