祁冠文
摘 要: 隨著中國經(jīng)濟的迅猛發(fā)展,中國對外開放的程度不斷加深,體現(xiàn)在教育行業(yè)中很顯著的一點便是中國留學(xué)生人數(shù)增加、規(guī)模擴大,掀起了一股留學(xué)熱潮。本文運用統(tǒng)計學(xué)的原理和時間序列分析的基本理論,選取每年赴美留學(xué)人數(shù)作為觀測值,對這一現(xiàn)象進行基本的探究和分析,擬構(gòu)建合適的模型,做出科學(xué)的預(yù)測,為定量研究這一社會現(xiàn)象提供依據(jù)和思路。
關(guān)鍵詞: 時間序列 ARIMA模型 中國赴美留學(xué)人數(shù)
一、引言
中國作為世界上最大的發(fā)展中國家,正在日新月異地提升其各方面的軟硬實力。無論是經(jīng)濟、政治還是社會領(lǐng)域,整個社會和國民都在不斷進步、發(fā)展,視野和心態(tài)越來越理性、開闊、兼容并包。在教育領(lǐng)域,科學(xué)和技術(shù)日益受到重視,人們對知識和學(xué)術(shù)更尊重和推崇,對政治和經(jīng)濟的穩(wěn)定進步與發(fā)展,知識的作用都愈發(fā)明顯,知識經(jīng)濟甚至可以算老生常談了。
本文在反映留學(xué)熱潮的各種數(shù)據(jù)和信息中,選取了比較具有代表性的——1996年至2012年每年中國學(xué)生赴美留學(xué)的人數(shù)作為觀察值序列,應(yīng)用課程學(xué)習(xí)的時間序列分析的理論,對其進行歸納和研究,并以此構(gòu)建ARIMA模型,對所收集的數(shù)據(jù)進行擬合。一方面從更本質(zhì)更基礎(chǔ)的層面上認識時間序列理論,另一方面對所學(xué)內(nèi)容做一次基本的實踐應(yīng)用,并對數(shù)據(jù)進行預(yù)測。經(jīng)過具有代表性的數(shù)據(jù)和模型的構(gòu)建,可以更充分更全面地了解近年的留學(xué)趨勢,對留學(xué)的形勢有一個更客觀的把握。
2.模型的理論基礎(chǔ)
2.1時間序列分析理論基礎(chǔ)
時間序列分析是將某種統(tǒng)計指標(biāo),或在不同時間的不同數(shù)值,按時間順序排列起來,以便于研究其發(fā)展變化,并能以此預(yù)測未來的一種統(tǒng)計方法。
在拿到一個觀察值序列后,首先要對它的平穩(wěn)性和純隨機性進行檢驗。非平穩(wěn)序列,由于它不具有二階矩平穩(wěn)的性質(zhì),因此對它的統(tǒng)計分析要周折一些,通常要進行進一步的檢驗、變換或處理,才能確定適當(dāng)?shù)臄M合模型。如果序列平穩(wěn),則進行純隨機檢驗。如果序列值彼此之間沒有任何相關(guān)性,就意味著該序列是一個沒有記憶的序列,過去的行為對將來的發(fā)展沒有絲毫影響,從統(tǒng)計分析的角度而言,這種序列沒有任何分析價值。只有這些序列值之間具有密切的相關(guān)關(guān)系,歷史數(shù)據(jù)對未來的發(fā)展有一定影響的序列,才值得我們花時間挖掘其中的有效信息,預(yù)測序列的未來發(fā)展。
2.2模型構(gòu)建的理論基礎(chǔ)
一個序列經(jīng)過預(yù)處理被識別為平穩(wěn)非白噪聲序列,那就說明該序列是一個蘊含相關(guān)信息的平穩(wěn)序列。在統(tǒng)計上,我們通常建立一個線性模型擬合該序列的發(fā)展,借此提取該序列中的有用信息。ARMA(Auto Regression Moving Average)模型是目前最常用的平穩(wěn)序列擬合模型。
ARMA(p,q)模型的結(jié)構(gòu)為
x■=Φ■+Φ■x■+…+Φ■x■+ε■-θ■ε■-…-θ■ε■Φ■≠0,θ■≠0E(ε■)=0,Var (ε■)=σ■■,E(ε■ε■)=0,s≠tEx ?搖■ε■=0,?坌s 式中,p為自回歸模型的階數(shù),q為移動平均模型的階數(shù)。在用ARMA模型擬合觀察值序列時,要根據(jù)樣本自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的性質(zhì)進行估計。這就是模型的識別過程即定階過程。 實際上,在自然界中絕大部分序列都是非平穩(wěn)的,因而對非平穩(wěn)序列的分析更普遍、更重要,人們采用的分析方法更多。由確定性導(dǎo)致的非平穩(wěn),通常顯示出非常明顯的規(guī)律性,比如有顯著的趨勢或者有固定的變化周期,這種規(guī)律性信息通常比較容易提取,而由隨機因素導(dǎo)致的波動則非常難以確定和分析。確定性因素分解方法不能充分提取觀察值序列中的有效信息,導(dǎo)致模型擬合精度不夠理想。隨機時序分析方法的發(fā)展彌補了確定性分解方法的不足。差分運算具有強大的確定性信息提取能力,許多非平穩(wěn)序列進行差分運算后會顯示出平穩(wěn)序列的性質(zhì),這時我們稱這個非平穩(wěn)序列為差分平穩(wěn)序列。對差分平穩(wěn)序列可以使用ARIMA(Auto Regressive Integrated Moving Average)模型擬合。 ARIMA(p,d,q)模型的結(jié)構(gòu)為 Φ(B)?犖■x■=Θ(B)ε■E(ε■)=0,Var (ε■)=σ■■,E(ε■ε■)=0,s≠tEx ?搖■ε■=0,?坌s 其中,Φ(B)=1-Φ■B-Φ■B■-…-Φ■B■為平穩(wěn)可逆ARMA(p,q)模型的自回歸系數(shù)多項式;?犖■=(1-B)■,d表示x■的差分階數(shù);Θ(B)=1-θ■B-θ■B■-…-θ■B■為平穩(wěn)可逆ARMA(p,q)模型的移動平滑系數(shù)多項式。ARIMA模型的實質(zhì)就是差分運算與ARMA模型的組合。這說明任何非平穩(wěn)序列只要通過適當(dāng)階數(shù)的差分運算實現(xiàn)差分后平穩(wěn),就可以對差分后序列進行ARMA模型擬合。 3.結(jié)語 社會科學(xué)文獻出版社近日發(fā)布的《國際人才藍皮書:中國留學(xué)發(fā)展報告》顯示,2012年中國出國留學(xué)人數(shù)已占全球人數(shù)的14%,而成為全球輸出留學(xué)生最多的國家?!斑M入新世紀以來,最突出的新情況就是自費出國群體激增,低齡化、大眾化、選擇多樣化、地域分布廣,專業(yè)選擇更實用,出國方式更多”。中國與全球化研究中心主任王輝耀如是總結(jié)。在全球教育水平發(fā)展各異的各個國家中,美國以其最權(quán)威的學(xué)術(shù)水平、最高端的科研能力及匯集了頂尖的名校、教授和人才的特征成為對中國學(xué)生最有吸引力的國家。美國是我們研究留學(xué)發(fā)展趨勢最有代表性的國家。近幾年中國赴美國留學(xué)人數(shù)激增,成為美國第一國際生源國。自中美兩國建交以來,美國成為中國開展教育對外交流最重要的國家。 留學(xué)的大潮勢必會對未來的國際國內(nèi)形勢造成巨大影響。隨著出國留學(xué)從精英教育向大眾教育的轉(zhuǎn)變,留學(xué)會越來越受到各界的關(guān)注。不斷升溫的“留學(xué)熱”不僅是中國社會發(fā)展的必然結(jié)果,還是加快中國發(fā)展進程的積極力量。 本文確定了一個較合適的ARIMA模型,對歷年赴美留學(xué)人數(shù)進行了相對簡單的擬合和預(yù)測,定量分析了留學(xué)發(fā)展的基本情勢。但是留學(xué)的“大眾化”只是近一二十年才日漸顯著的,數(shù)據(jù)明顯不足。時間序列分析可以提供一種分析思路。眾多留學(xué)機構(gòu)、部門及專家學(xué)者都是基于非常有限的信息,但通過更復(fù)雜、全面的數(shù)據(jù)與模型對今后數(shù)年的留學(xué)人數(shù)做了更科學(xué)的估計與預(yù)測。2013年后,每當(dāng)新的一年的留學(xué)生數(shù)據(jù)產(chǎn)生的,本模型可以不斷修正、完善,并因觀測值的增加而具備更精準的預(yù)測能力,從而得出更有價值的預(yù)測結(jié)果。 參考文獻: [1]王燕.應(yīng)用時間序列分析[M].北京:中國人民大學(xué)出版社,2008. [2]王輝耀.中國留學(xué)發(fā)展報告(2012)[M].北京:社會科學(xué)文獻出版社,2012:37-47. [3]鄧暉,崔琦,賈遠琨.出國留學(xué)人數(shù)激增莘莘學(xué)子究竟為了啥[N].中國改革報,2012-10-17(4).