葉小鶯 鄭學(xué)瑜 陳峰 韓飛
摘要:該文研究波動數(shù)據(jù)的處理與分析方法。波動性數(shù)據(jù)在各個行業(yè)的應(yīng)用實踐中,經(jīng)常出現(xiàn),對該類數(shù)據(jù)的處理方法的研究,具有重要的理論與實用價值。波動數(shù)據(jù)有的很有周期規(guī)律性,例如復(fù)合周期函數(shù)型的電子信號;有的波動數(shù)據(jù)沒有明顯的周期特性,例如直線軸上不定時波動的數(shù)據(jù)疊加白噪聲的數(shù)據(jù)模式。
關(guān)鍵詞:數(shù)據(jù);時間序列;分析;處理
中圖分類號:TP311文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2012)09-2090-02
Time Series Analysis of Wave data
YEXiao-ying, ZHENG Xue-yu, CHEN Feng, HAN Fei
(Neusoft Institute of Information Technology,Foshan 528225,China)
Abstract: In this paper, we discuss the analysis and process methods of time series data. Time series come from a lot of industrial data procession. The Analysis of time series is important. Some time series data are periodical, such as complex periodical functions of electrical signal. Others are aperiodicity, such as a signal with stochastic processes.
Key words: data; time series; analysis; process
在實踐應(yīng)用的很多領(lǐng)域,都有對波動數(shù)據(jù)的分析與處理。從最簡單形式的周期性物理波形,到復(fù)雜一些的聲波等復(fù)合波動的時域頻域分析,模式識別領(lǐng)域的處理與應(yīng)用方法,經(jīng)濟金融領(lǐng)域的非周期復(fù)雜波動數(shù)據(jù)的特性研究。雖然問題產(chǎn)生的各自領(lǐng)域有很大的跨度,從方法論的角度來看,認(rèn)識與解決問題的時候,常常有穿越領(lǐng)域的應(yīng)用。而一些最常用的處理方法基本上成為所有領(lǐng)域內(nèi)分析理論的基礎(chǔ)。例如使用更簡單的多個函數(shù)來擬合復(fù)雜函數(shù)、微分分段考察問題特性、積分近似實際情形、使用隨機統(tǒng)計分析方法等等。
波動數(shù)據(jù)有的具有規(guī)律的周期性,更普遍的波動數(shù)據(jù)沒有規(guī)律的周期性。
1時域與頻域的分析
周期性出現(xiàn)的波動數(shù)據(jù)時間序列,在知識領(lǐng)域內(nèi)通??梢苑Q為周期信號或簡稱信號,可以通過考察其時域與頻域特性來分析。時域與頻域作為周期信號的基本性質(zhì),是觀察信號的不同角度,兩者可以通過傅里葉變換來互相轉(zhuǎn)換。信號的上升時間與下降時間,是判斷信號是否高速的依據(jù)。信號的頻寬表示的是信號所含的高頻分量。信號的上升與下降時間決定了信號的高頻分量。
波動數(shù)據(jù)的時間序列信號唯一存在于時域中(張賢達(dá),2002),這是我們可以真實觀察并感受到波動數(shù)據(jù)的域。時域中信號的可見波形,可以簡單直觀表達(dá)信號的存在以及變化趨勢。當(dāng)以波形描述一個信號時,應(yīng)注意在波形圖上可見的該信號關(guān)鍵值,關(guān)鍵值包括有信號的不連續(xù)點、零點、最大值點和最小值點等。許多問題的求解都可以通過分析信號波形而得到簡化。
包含隨機因素的數(shù)據(jù),處理起來需要加入更復(fù)雜的模型,或需要引入數(shù)理統(tǒng)計模型。不包含隨機因素的信號是確定性信號。對于不包含隨機信號的確定性信號,一般分為連續(xù)信號與離散信號。通過數(shù)據(jù)抽樣,可以把連續(xù)信號轉(zhuǎn)化為離散信號。時域中的任何波形,都可以用頻域中的正弦波來合成,并且可以得到唯一的描述。
時域與頻域是從不同的域來觀察同一件事物。時域是從現(xiàn)實中觀察動態(tài)的信號。頻域是在另一個空間以頻率為坐標(biāo)軸來觀察動態(tài)信號(奧本海姆,2010)。在很多時候,這種觀察空間的轉(zhuǎn)換,能夠更加容易看出信號的特性,而頻域分析也具有更為簡練的描述形式。
傅里葉變換可以將時域的信號變換到頻域。傅里葉變換有三種類型:傅里葉積分(FI)、離散傅里葉變換(DFT)、快速傅里葉變換(FFT)。在頻域中,對波形的描述變?yōu)椴煌也ǖ募?。每個頻率分量都有各自的幅度與相位。對于時域中非周期的信號可以進(jìn)行以信號存在時間為周期的周期拓延,從而變?yōu)橹芷谛盘杹磉M(jìn)行分析。
在頻域中,第一個正弦波頻率稱為一次諧波,第二個正弦波頻率稱為二次諧波,依次類推。每個諧波都有不同的幅度和相位。所有諧波及其幅度的集合稱為頻譜。頻域中的頻譜表示的是時域波形包含的所有正弦波頻率的幅度。在知道頻譜的情況下,要觀察它的時域波形,只需將每個頻率分量變換成它的時域正弦波,再將其全部疊加即可。這個過程稱為傅里葉逆變換。不同的數(shù)學(xué)變換,變換對原始數(shù)據(jù)觀察的角度與空間,或許能使得內(nèi)在規(guī)律性變得更加清晰。
圖1時域與頻域變換示意圖
2有限元方法
在結(jié)構(gòu)分析領(lǐng)域中,關(guān)于靜力結(jié)構(gòu)、結(jié)構(gòu)震動、彈塑性材料等研究中,為了得到盡可能精確的數(shù)學(xué)物理數(shù)據(jù),常采用有限元分析方法來進(jìn)行波動與震動的描述。有限元分析的目的:針對具有任意復(fù)雜幾何形狀變形體,完整獲取在復(fù)雜外力作用下它內(nèi)部的準(zhǔn)確力學(xué)信息,即求取該變形體的三類力學(xué)信息(位移、應(yīng)變、應(yīng)力)。
有限元方法使用基于“離散逼近(discretized approximation)”的基本策略,可以采用較多數(shù)量的簡單函數(shù)的組合來“近似”代替非常復(fù)雜的原函數(shù)。例如(廖振鵬等,1992)所進(jìn)行的對波動有限元模擬的研究。時域有限元法不但可以用于研究復(fù)雜線彈性介質(zhì)中的波動問題,而且利用計算機圖形仿真技術(shù)還可以把波動過程動態(tài)地顯示出來,直觀地揭示與波動源和傳播路徑等有關(guān)的各種物理因素和波動特征之間的關(guān)系.因此,這一方法是研究工程科學(xué)中一系列重要波動問題的有力工具。
有限元方法對波動時間序列傳播的物理介質(zhì)媒體建立結(jié)構(gòu)震動的三大類方程(平衡方程、幾何方程、物理方程等)以及邊界與初始條件,來進(jìn)行波動時間序列的研究(來翔,2007)。這一類波動數(shù)據(jù)的時間序列,其物理特征是完全依賴于傳播的媒介。在時域頻域分析中,具有一定帶寬的信號,其在一定媒介中傳播的過程,也是需要考慮信號衰減的。在這一點上,與有限元方法的情況類似。
3模式識別與神經(jīng)網(wǎng)絡(luò)方法
時間序列數(shù)據(jù)或信號在更復(fù)雜的分析處理情形下,就不僅僅停留在信號本身的物理特性上。對信號攜載的語法以及語義的判斷分析是更重要的目的。線性神經(jīng)網(wǎng)絡(luò)可以應(yīng)用于系統(tǒng)辨識、信號辨識、自適應(yīng)濾波和控制等方面。目前在神經(jīng)網(wǎng)絡(luò)的多數(shù)應(yīng)用中,采用BP神經(jīng)網(wǎng)絡(luò),其具有廣泛的適應(yīng)性與有效性,主要應(yīng)用于模式識別與分類。
在BP神經(jīng)網(wǎng)絡(luò)的應(yīng)用中(孫虎兒,2009),增加網(wǎng)絡(luò)層數(shù)可以提高網(wǎng)絡(luò)識別性能,提高精度,但同時使得網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,增加訓(xùn)練時間。因此首先考慮增加隱含層的神經(jīng)元數(shù),而不是增加網(wǎng)絡(luò)層數(shù)來提高網(wǎng)絡(luò)性能。隱含層數(shù)、隱含層的神經(jīng)元數(shù)的適當(dāng)數(shù)量,需要通過具體的試驗來大概確定。
在使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行字母表的圖像識別中(朱凱,2010),設(shè)計并訓(xùn)練一個BP網(wǎng)絡(luò),完成26個英文字母的5X7像素二值數(shù)字圖像的識別。取得了較好的噪聲樣本訓(xùn)練下的一定容錯性。
4經(jīng)濟與金融領(lǐng)域的復(fù)雜數(shù)據(jù)模式的波動性研究
在經(jīng)濟與金融領(lǐng)域里,對時間序列數(shù)據(jù)的研究,具有非常重要的理論與實踐應(yīng)用意義。在時間序列中,按照所得到的數(shù)據(jù)的連續(xù)性分為離散時間序列與連續(xù)時間序列。按照是否存在一定的趨勢,分為平穩(wěn)時間序列與非平穩(wěn)時間序列。平穩(wěn)時間序列的觀測值基本上在一定的范圍之內(nèi),不會有增長或者減少的趨勢,也不會有超出范圍的波動。在現(xiàn)有的平穩(wěn)時間序列處理中,往往把波動看作是隨機的。非平穩(wěn)時間序列包含趨勢性,或有季節(jié)性、周期性,也可能是趨勢性與季節(jié)與周期性的復(fù)合序列。
在時間序列分析的過程中(王燕,2008),首先對取得的數(shù)據(jù)進(jìn)行相關(guān)分析。在有趨勢拐點的時候,使用不同的模型分段擬合前后時間序列。然后判斷恰當(dāng)?shù)碾S機模型來擬合時間序列的觀測數(shù)據(jù)。對于簡單的時間序列,可以用趨勢模型和季節(jié)模型來擬合。對于平穩(wěn)時間序列,可用ARMA模型來擬合。對于非平穩(wěn)時間序列要將其轉(zhuǎn)化為平穩(wěn)時間序列來分析。
在更加復(fù)雜的情況下,可以考慮數(shù)據(jù)的Markov特性,使用Markov鏈的運用。有時一個時間序列中僅僅部分?jǐn)?shù)據(jù)體現(xiàn)出Markov性,而其他部分的則是無規(guī)律的。
5結(jié)論
該文從波動數(shù)據(jù)的時間序列的最簡單的形式出發(fā),論述在數(shù)據(jù)不同領(lǐng)域以及不同復(fù)雜度之下的分析處理方法。很多處理方法是跨領(lǐng)域的,例如時域頻域分析方法就從數(shù)學(xué)這樣的純理論研究領(lǐng)域出發(fā),應(yīng)用在電子、通訊、計算機、機械、農(nóng)林、地質(zhì)、經(jīng)濟、金融等幾乎所有的學(xué)科中。波動數(shù)據(jù)如果不借助領(lǐng)域內(nèi)知識,很難建立有效的分析判斷模型。在諸多波動數(shù)據(jù)的時間序列處理中,依然沒有有效的方法。例如外匯市場價格的高頻數(shù)據(jù)分析于處理,迄今沒有很好的方法。對波動數(shù)據(jù)時間序列的研究在可見的未來一直具有理論與實用意義。
參考文獻(xiàn):
[1]張賢達(dá).現(xiàn)代信號處理[M].2版.北京:清華大學(xué)出版社,2002.
[2](美)奧本海姆.信號與系統(tǒng)[M].西安:西安交通大學(xué)出版社,2010.
[3]廖振鵬,劉晶波.波動有限元模擬的基本問題[J].中國科學(xué)B輯,1992(8).
[4]來翔.幾類雙曲型方程交替方向有限元分析[D].山東大學(xué),博士學(xué)位論文,2007.
[5]孫虎兒.基于神經(jīng)網(wǎng)絡(luò)的優(yōu)化設(shè)計及應(yīng)用[M].北京:國防工業(yè)出版社,2009:36-53
[6]朱凱,王正林.精通MATLAB神經(jīng)網(wǎng)絡(luò)[M].北京:電子工業(yè)出版社,2010:220-224.
[7]王燕.應(yīng)用實踐序列分析[M].2版.北京:中國人民大學(xué)出版社,2008:121-148.
[8]郭昊坤,吳軍基,應(yīng)展烽,陸嫻.一類特殊隨機序列的改進(jìn)馬爾科夫鏈建模[D].第十六屆全國青年通信學(xué)術(shù)會議論文集(上),2011.