国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于注意力機(jī)制的區(qū)域小學(xué)入學(xué)規(guī)模預(yù)測(cè)

2021-12-17 09:18:08雷建軍
關(guān)鍵詞:學(xué)齡入學(xué)注意力

陳 宇,邢 銳,雷建軍

(1.湖北第二師范學(xué)院計(jì)算機(jī)學(xué)院,武漢 430205;2.湖北省教育云服務(wù)工程技術(shù)研究中心,武漢 430205;3.湖北省教育信息化發(fā)展中心(湖北省電化教育館),武漢 430071)

義務(wù)教育均衡是我國(guó)基礎(chǔ)教育的基本政策,合理的配置教育資源是政府教育管理部門(mén)的重要目標(biāo).學(xué)齡人口是各級(jí)教育管理部門(mén)對(duì)教育資源進(jìn)行配置的主要依據(jù),而每年小學(xué)入學(xué)規(guī)模的變化是區(qū)域內(nèi)學(xué)齡人口波動(dòng)的重要原因.當(dāng)前,隨著我國(guó)經(jīng)濟(jì)的迅猛發(fā)展,城鎮(zhèn)化的進(jìn)程加速,大量的人口從農(nóng)村向城鎮(zhèn)和發(fā)達(dá)城市遷移,也因此在區(qū)域間造成了教育資源需求的變化波動(dòng).由于,教育資源比如校舍的建設(shè)、教師的培養(yǎng)及配置都需要較長(zhǎng)的周期.因此,如何適應(yīng)人口的機(jī)械增長(zhǎng)變化,科學(xué)預(yù)測(cè)未來(lái)區(qū)域內(nèi)小學(xué)入學(xué)規(guī)模的變化趨勢(shì),準(zhǔn)確把握區(qū)域內(nèi)教育資源的配置需求,及時(shí)對(duì)教育資源進(jìn)行合理配置對(duì)提高我國(guó)各級(jí)教育管理部門(mén)的治理能力,促進(jìn)教育公平,創(chuàng)辦讓人民滿意的教育具有重要意義.

1 入學(xué)規(guī)模預(yù)測(cè)方法

目前針對(duì)區(qū)域內(nèi)入學(xué)規(guī)模預(yù)測(cè)的研究尚少,而入學(xué)規(guī)模的預(yù)測(cè)問(wèn)題是人口預(yù)測(cè)的一種.因此,對(duì)入學(xué)規(guī)模的預(yù)測(cè)可參考人口預(yù)測(cè)的相關(guān)研究工作.當(dāng)前對(duì)于人口預(yù)測(cè)的研究可以分為基于統(tǒng)計(jì)的方法和基于機(jī)器學(xué)習(xí)的預(yù)測(cè)模型.

1.1 基于統(tǒng)計(jì)的人口預(yù)測(cè)模型

現(xiàn)有的人口預(yù)測(cè)模型大多采用傳統(tǒng)的統(tǒng)計(jì)模型,國(guó)外最早對(duì)人口問(wèn)題進(jìn)行定量研究的是英國(guó)人口學(xué)家 Malthus建立了人口指數(shù)增長(zhǎng)模型Malthus模型[1],隨后,荷蘭科學(xué)家Verhulst對(duì)人口指數(shù)增長(zhǎng)模型進(jìn)行了修正,把影響人口增長(zhǎng)的社會(huì)環(huán)境、自然環(huán)境等相關(guān)因素考慮進(jìn)去提出了logistic 人口阻滯增長(zhǎng)模型[2].Leslie提出了一個(gè)能夠綜合考慮多個(gè)影響因素的預(yù)測(cè)模型,即著名的 Leslie 矩陣模型[3],在人口預(yù)測(cè)領(lǐng)域得到了廣泛的應(yīng)用.

近年來(lái),我國(guó)有不少學(xué)者借鑒了人口預(yù)測(cè)的研究開(kāi)展了學(xué)齡人口的預(yù)測(cè)研究工作.李玲等利用CPPS軟件基于人口普查第六次數(shù)據(jù),對(duì)我國(guó)2016—2035年義務(wù)教育階段學(xué)生規(guī)模進(jìn)行預(yù)測(cè)[4];薛耀鋒等采用LESLIE人口模型,以全國(guó)第六次人口普查數(shù)據(jù)模擬預(yù)測(cè)了2016—2025年的我國(guó)學(xué)齡人口變化趨勢(shì)[5];周志等針對(duì)天津義務(wù)教育情況,采用灰色預(yù)測(cè)模型和線性回歸原理對(duì)天津市戶籍學(xué)齡人口的規(guī)模進(jìn)行了預(yù)測(cè)[6].以上學(xué)者針對(duì)學(xué)齡人口預(yù)測(cè)普遍采用數(shù)理統(tǒng)計(jì)方法,如灰色預(yù)測(cè)、CPPS人口預(yù)測(cè)、Logistic回歸預(yù)測(cè)以及隊(duì)列要素法等.但從已有研究表明,采用灰色模型對(duì)人口發(fā)展趨勢(shì)做預(yù)測(cè),通常只能反映出人口的邏輯增長(zhǎng),無(wú)法解釋生育率變化及遷移引發(fā)的人口規(guī)模變動(dòng),CPPS人口預(yù)測(cè)系統(tǒng)中設(shè)定的生育率為全國(guó)人口普查的全國(guó)維度,不適用于省級(jí)預(yù)測(cè),Logistic模型只適合在短時(shí)期內(nèi)的、較小區(qū)域的預(yù)測(cè).雖然Leslie矩陣模型,有效解決了上述存在的問(wèn)題,但Leslie矩陣模型的基本假定是所分年齡組內(nèi)的人數(shù)穩(wěn)定,但通常情況下分年齡人口數(shù)的數(shù)據(jù)很難獲取,使其很難得到大規(guī)模應(yīng)用.

1.2 基于機(jī)器學(xué)習(xí)的預(yù)測(cè)模型

隨著人工智能技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)模型在求解時(shí)間序列預(yù)測(cè)問(wèn)題上得到了廣泛的關(guān)注.在人口預(yù)測(cè)的問(wèn)題上,F(xiàn)olorunso等在其論文中使用了具有反向傳播的前饋人工神經(jīng)網(wǎng)絡(luò)對(duì)人口進(jìn)行了預(yù)測(cè)[7],Tang在其論文中證明了采用神經(jīng)網(wǎng)絡(luò)的方法在預(yù)測(cè)人口方面比Logistic回歸預(yù)測(cè)模型更有效[8].我國(guó)的譚永宏采用神經(jīng)網(wǎng)絡(luò)理論來(lái)建立了基于 BP 神經(jīng)網(wǎng)絡(luò)的人口預(yù)測(cè)模型,較好地表現(xiàn)了人口增長(zhǎng)的非線性動(dòng)力學(xué)的特點(diǎn),其預(yù)測(cè)結(jié)果具有較高的精度[9].Zhan在其論文中使用了LSTM-RNN模型較好的解決了人口時(shí)間序列通常較短的問(wèn)題[10].近年來(lái),在旅游人數(shù)預(yù)測(cè)和交通流量人口預(yù)測(cè)等特殊場(chǎng)景下,Shi采用了神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)了某地每年的旅游人數(shù)變化,取得了較好的效果[11],上述模型雖然為預(yù)測(cè)入學(xué)規(guī)模提供了思路,但都是基于一個(gè)特征的建模預(yù)測(cè),沒(méi)考慮入學(xué)規(guī)模在實(shí)際中和各地經(jīng)濟(jì)、人口等相關(guān)特征的關(guān)聯(lián)關(guān)系,得到的預(yù)測(cè)結(jié)果會(huì)存在一些片面性.Berry的研究表明在影響人口變化的因素方面,許多社會(huì)和自然因素與人口趨勢(shì)相互作用,如人口總量和經(jīng)濟(jì)增長(zhǎng)具有較強(qiáng)的相關(guān)性[12],Goldstein的研究得出了區(qū)域內(nèi)生育率與經(jīng)濟(jì)的關(guān)系[13].

隨著我國(guó)統(tǒng)計(jì)數(shù)據(jù)的逐步完善,各年度學(xué)齡人口數(shù)、經(jīng)濟(jì)、人口數(shù)據(jù)逐漸開(kāi)始累積,本文通過(guò)構(gòu)建包含經(jīng)濟(jì)、人口等相關(guān)參量的多元時(shí)間序列來(lái)避免單一變量預(yù)測(cè)的局限性,挖掘?qū)W齡人口與各地經(jīng)濟(jì)、人口等相關(guān)特征和時(shí)序關(guān)系.與此同時(shí),為了充分利用特征間的關(guān)聯(lián)和時(shí)序間的依賴(lài)關(guān)系,本文在時(shí)間序列模型長(zhǎng)短時(shí)記憶網(wǎng)絡(luò) (long short-term memory,LSTM)的基礎(chǔ)上引入注意力(ATTENTION)機(jī)制.提出了基于ATTENTION-LSTM的小學(xué)入學(xué)規(guī)模預(yù)測(cè)模型,利用注意力機(jī)制對(duì)多元時(shí)間序列不同特征不同時(shí)刻的特征值描述其對(duì)待預(yù)測(cè)指標(biāo)的權(quán)重,提取特征在歷史時(shí)間點(diǎn)與待預(yù)測(cè)指標(biāo)之間的關(guān)系,提高小學(xué)入學(xué)規(guī)模 預(yù)測(cè)模型的精度.

2 問(wèn)題定義

本文研究的問(wèn)題可以表示為給定包含n個(gè)外部時(shí)間序列在t—1時(shí)刻的值預(yù)測(cè)某個(gè)目標(biāo)序列在t時(shí)刻的值,通過(guò)學(xué)習(xí)得到它們之間的非線性關(guān)系.即:

(1)

式中,y=(y1,y2,…,yT-1)是目標(biāo)序列,F(xiàn)函數(shù)就是準(zhǔn)備利用深度學(xué)習(xí)的函數(shù).

3 基于注意力機(jī)制的循環(huán)網(wǎng)絡(luò)學(xué)齡人口預(yù)測(cè)模型設(shè)計(jì)

利用多元時(shí)間序列對(duì)學(xué)齡人口進(jìn)行預(yù)測(cè)問(wèn)題,一個(gè)重要的挑戰(zhàn)是如何捕捉多變量之間的不同時(shí)間步的依賴(lài)關(guān)系.但是循環(huán)神經(jīng)網(wǎng)絡(luò)由于本身結(jié)構(gòu)問(wèn)題很難捕捉到這種依賴(lài)關(guān)系,因此,我們引入了注意力機(jī)制,同時(shí),由于LSTM在時(shí)間序列預(yù)測(cè)上的良好表現(xiàn),選擇了LSTM模型作為循環(huán)神經(jīng)網(wǎng)絡(luò)單元構(gòu)建了ATTENTION-LSTM模型對(duì)學(xué)齡人口進(jìn)行預(yù)測(cè).

3.1 長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)

長(zhǎng)短時(shí)記憶網(wǎng)絡(luò) (LSTM)是一種特殊的RNN結(jié)構(gòu),由Schmidhuber教授于1997年提出,在許多時(shí)序預(yù)測(cè)的研究中,LSTM模型都取得了很大的成功,得到了廣泛的應(yīng)用[14].傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)RNN在修正權(quán)重的過(guò)程中,面臨梯度爆炸或梯度消失的問(wèn)題.而LSTM對(duì)有意義的信息通過(guò)引入細(xì)胞狀態(tài)進(jìn)行保存,并通過(guò)“遺忘門(mén)”“更新門(mén)”“輸出門(mén)”增加或者去除權(quán)重到細(xì)胞狀態(tài)中,從而能夠有效解決梯度爆炸或梯度消失問(wèn)題.

3.2 注意力機(jī)制

注意力機(jī)制是利用了人們視覺(jué)在處理圖像時(shí),對(duì)關(guān)注的信息能夠自我增強(qiáng)同時(shí)抑制其他無(wú)效信息,從而派生出一種從大量信息中自主選擇最關(guān)鍵信息的一種信息處理方式,其已在深度學(xué)習(xí)里的語(yǔ)音識(shí)別、自然語(yǔ)言處理和圖像描述等多個(gè)領(lǐng)域里取得了良好的效果[15].近年來(lái),隨著其應(yīng)用的發(fā)展也逐漸應(yīng)用于時(shí)間序列處理上.

注意力機(jī)制在時(shí)間序列上的應(yīng)用主要由編碼器和解碼器兩部分組成,編碼器負(fù)責(zé)計(jì)算時(shí)間序列在某時(shí)刻上各特征的注意力權(quán)重,權(quán)重代表了各特征在某時(shí)刻對(duì)當(dāng)前預(yù)測(cè)指標(biāo)的重要程度,輸入時(shí)間序列的所有特征值權(quán)重和為1,以注意力權(quán)重對(duì)初始輸入的時(shí)間序列進(jìn)行加權(quán)產(chǎn)生新的時(shí)間序列向量;解碼器利用循環(huán)神經(jīng)網(wǎng)絡(luò)等時(shí)序分析模型對(duì)新的時(shí)間序列向量以及預(yù)測(cè)目標(biāo)歷史信息進(jìn)行綜合處理,得到當(dāng)前的近似輸出,注意力機(jī)制模型公式如下:

αt=fattetion(x),

(2)

ct=αtx,

(3)

(4)

其中,fattetion為權(quán)重函數(shù).

3.3 基于注意力機(jī)制的輸入序列編碼器

基于上述原理,本文通過(guò)采用注意力機(jī)制分別學(xué)習(xí)人口、經(jīng)濟(jì)等相關(guān)指標(biāo)的時(shí)間序列中各時(shí)間點(diǎn)的特征值對(duì)待入學(xué)規(guī)模的重要程度,以進(jìn)一步提升待預(yù)測(cè)入學(xué)規(guī)模的預(yù)測(cè)質(zhì)量.ATTENTION-LSTM模型結(jié)構(gòu)圖如圖1所示.

圖1 ATTENTION-LSTM結(jié)構(gòu)圖Fig.1 Architecture of ATTENTION-LSTM Model

(5)

(6)

(7)

(8)

(9)

(10)

LSTM的細(xì)胞狀態(tài)和隱藏狀態(tài)由下面兩個(gè)公式進(jìn)行更新:

(11)

(12)

其隱藏狀態(tài)由下面公式更新:

(13)

編碼器輸出t個(gè)時(shí)間步的隱藏單元的狀態(tài)值.上述式中,Wf、bf、Wi、bi、Wc、bc、Wo、bo分別為遺忘門(mén)、輸入門(mén)、輸出門(mén)和門(mén)控單元的權(quán)重和偏置.

3.4 基于注意力機(jī)制的解碼器

模型同樣使用了LSTM單元進(jìn)行解碼,為了克服LSTM隨著時(shí)間步數(shù)的增長(zhǎng)而帶來(lái)的權(quán)重下降的問(wèn)題,在解碼階段同樣也引入了注意力機(jī)制,對(duì)于編碼器輸出的單元含有t個(gè)時(shí)間步的編碼器隱藏狀態(tài)進(jìn)行相應(yīng)的解碼工作.

(14)

(15)

(16)

以環(huán)境變量和目標(biāo)序列t時(shí)刻的值為解碼器的輸入:

(17)

解碼器的三個(gè)門(mén)的更新公式為:

(18)

(19)

(20)

其細(xì)胞狀態(tài)由以下公式更新:

(21)

(22)

隱藏細(xì)胞的更新公式為:

(23)

預(yù)測(cè)結(jié)果:

(24)

式中,Wy、bw、bv為權(quán)重系數(shù)和偏置參數(shù).

4 實(shí)驗(yàn)結(jié)果與分析

4.1 實(shí)驗(yàn)平臺(tái)及數(shù)據(jù)集說(shuō)明(預(yù)處理)

本文全部數(shù)據(jù)來(lái)源于國(guó)家統(tǒng)計(jì)局網(wǎng)站(http://data.stats.gov),選取了31個(gè)省(區(qū)、市)的1978—2017年的年度數(shù)據(jù)構(gòu)建多元時(shí)間序列數(shù)據(jù)集.其中選取指標(biāo)普通小學(xué)招生數(shù)為預(yù)測(cè)指標(biāo),人口出生率、年末常駐人口數(shù)、居民消費(fèi)水平指數(shù)為相關(guān)序列,反映預(yù)測(cè)指標(biāo)小學(xué)入學(xué)人數(shù)與人口、經(jīng)濟(jì)等指標(biāo)的相關(guān)性.

對(duì)于多元時(shí)間序列數(shù)據(jù)集通過(guò)設(shè)置滑動(dòng)時(shí)間窗口大小進(jìn)行重新劃分,對(duì)于缺失數(shù)據(jù),取相鄰的兩個(gè)數(shù)據(jù)的平均值填充,所有時(shí)間序列的值采用最大-最小歸一化的方法進(jìn)行預(yù)處理,經(jīng)過(guò)預(yù)處理所有數(shù)據(jù)取值范圍在[0,1]之間.

訓(xùn)練集和測(cè)試集的劃分采用截?cái)喾?,選取31個(gè)省市自治州的1978—2011年的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)構(gòu)造訓(xùn)練數(shù)據(jù)集,2012—2017年的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù)集.

4.2 評(píng)價(jià)指標(biāo)

為了對(duì)預(yù)測(cè)模型進(jìn)行評(píng)價(jià),采用平均絕對(duì)誤差(mean absolute errors,MAE),均方誤差(root mean square error,RMSE),平均絕對(duì)百分比誤差(mean average percentage error,MAPE)三個(gè)評(píng)價(jià)指標(biāo)來(lái)評(píng)定預(yù)測(cè)模型的準(zhǔn)確性.

(25)

(26)

(27)

4.3 入學(xué)規(guī)模預(yù)測(cè)模型訓(xùn)練和性能分析

根據(jù)前述入學(xué)規(guī)模預(yù)測(cè)模型的訓(xùn)練原理,本文的模型使用python 3.6、tensorflow 2.0、keras實(shí)現(xiàn).tensorflow是谷歌公司開(kāi)發(fā)的一個(gè)開(kāi)源機(jī)器學(xué)習(xí)庫(kù),用于輔助構(gòu)建和部署機(jī)器學(xué)習(xí)模型.Keras是一個(gè)神經(jīng)網(wǎng)絡(luò)API,具有界面友好、模塊化、可擴(kuò)充的特點(diǎn),并支持Tensorflow,本文以Tensorflow作為后端.

模型參數(shù)由兩部分組成,一部分為普通參數(shù),包括注意力的權(quán)重系數(shù)、LSTM各隱藏單元的權(quán)重系數(shù)及全連接層內(nèi)的連接參數(shù)和權(quán)重,這部分參數(shù)通常用模型通過(guò)梯度算法求得最優(yōu)解,另一部分為超參數(shù),主要包括:

1)訓(xùn)練迭代次數(shù)epoch:模型訓(xùn)練完整的數(shù)據(jù)集次數(shù).通常根據(jù)經(jīng)驗(yàn)所得;

2)訓(xùn)練塊大小batch_size:一次輸入模型訓(xùn)練的樣本個(gè)數(shù);

3)訓(xùn)練學(xué)習(xí)率learning_rate:通過(guò)調(diào)整學(xué)習(xí)率可調(diào)整各權(quán)重的超參數(shù),學(xué)習(xí)率越低,收斂速度越慢,但精度較高,學(xué)習(xí)率越高,收斂速度越快,但易陷入局部最優(yōu)解;

4)隱藏層數(shù)和神經(jīng)元個(gè)數(shù)cells:這兩個(gè)參數(shù)直接確定整個(gè)神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu),層數(shù)越多,神經(jīng)元越多,參數(shù)就越多,模型訓(xùn)練所花時(shí)間就越長(zhǎng).

5)時(shí)間窗口寬度windows:通過(guò)設(shè)置 時(shí)間窗口寬度限定時(shí)間序列的長(zhǎng)度.

為了能夠取得較好的超參數(shù),我們采用網(wǎng)格搜索方法對(duì)訓(xùn)練塊大小batchsize、學(xué)習(xí)率learningrate、時(shí)間窗口寬度、隱藏層數(shù)和神經(jīng)元數(shù)進(jìn)行優(yōu)選.首先,固定訓(xùn)練迭代次數(shù) epoch=300隨機(jī)種子數(shù) seed=1;訓(xùn)練塊大小batchsize=32等非關(guān)鍵參數(shù)值,然后,設(shè)定三個(gè)參數(shù)的取值范圍:歷史數(shù)據(jù)時(shí)間窗寬度 windows={4,6,8,10,12},LSTM 細(xì)胞數(shù)cells={64,128,192,256},學(xué)習(xí)速率learningrate={0.001,0.003,0.005,0.01,0.03,0.05};以均方根誤差(RMSE)值最小為測(cè)試集上預(yù)測(cè)精度最高,以此進(jìn)行相關(guān)參數(shù)優(yōu)選.實(shí)驗(yàn)記錄入學(xué)規(guī)模預(yù)測(cè)模型在不同參數(shù)組合下的仿真結(jié)果,由于篇幅所限,以下列出學(xué)習(xí)率learing_rate為0.001,0.01,0.05的仿真結(jié)果.

圖中,顏色較淺代表RMSE越大,圖2中,顏色普遍較淺,說(shuō)明當(dāng)學(xué)習(xí)率為0.01時(shí),RMSE較大.根據(jù)圖3和圖4可知,當(dāng)神經(jīng)元個(gè)數(shù)cells較大及時(shí)間窗口windows長(zhǎng)度偏小時(shí),RMSE值較好,模型精度較高.參數(shù)尋優(yōu)結(jié)果中5組最優(yōu)的參數(shù)組合及對(duì)應(yīng)的RMSE如表1所示.

圖2 參數(shù)尋優(yōu)(learning_rate=0.01)Fig.2 Parameter optimization (learning rate=0.01)

圖3 參數(shù)尋優(yōu)(learning_rate=0.001)Fig.3 Parameter optimization (learning rate=0.001)

圖4 參數(shù)尋優(yōu)(learning_rate=0.05)Fig.4 Parameter optimization (learning rate=0.05)

表1 最優(yōu)參數(shù)組合及RMSE對(duì)應(yīng)表Tab.1 Optimal parameter combination and RMSE correspondence table

通過(guò)參數(shù)優(yōu)選最后選取的相關(guān)參數(shù)為windows=8,cell=256,batchsize=32,learning_rate=0.001.

4.4 對(duì)比方法

為了進(jìn)一步驗(yàn)證本文的ATTENTION-LSTM模型在提升入學(xué)規(guī)模預(yù)測(cè)的有效性,將本文中的模型與傳統(tǒng)基于統(tǒng)計(jì)的時(shí)序預(yù)測(cè)算法歷史平均模型(HA)及整合移動(dòng)平均自回歸模型(ARIMA)及不帶 ATTENTION機(jī)制的長(zhǎng)短周期記憶網(wǎng)絡(luò)LSTM模型進(jìn)行比較.其中傳統(tǒng)的LSTM模型包括兩層LSTM層以及一個(gè)全連接層.HA模型使用三個(gè)歷史時(shí)間段的入學(xué)規(guī)模平均值作預(yù)測(cè).ARIMA模型通過(guò)序列的一階差分進(jìn)行預(yù)處理,根據(jù)AIC準(zhǔn)則定階P、Q的值分別為3和1.

圖5 給出了四種模型分別對(duì)某省市2012—2017年入學(xué)規(guī)模的預(yù)測(cè)結(jié)果.

圖5 入學(xué)規(guī)模預(yù)測(cè)模型比較Fig.5 Comparison of enrollment scale forecasting models

從圖中可知,對(duì)于入學(xué)規(guī)模變化的規(guī)律,四種模型都能夠?qū)ξ磥?lái)年份的入學(xué)規(guī)模進(jìn)行一定的有效預(yù)測(cè),但ARIMA模型和HA 模型與真實(shí)曲線存在較大偏差;LSTM 模型曲線除某階段效果較差以外,其余預(yù)測(cè)效果較 HA模型 有大幅提升.ATTENTION—LSTM 模型與真實(shí)曲線形態(tài)最為接近.

四種模型分別在測(cè)試集上進(jìn)行10次實(shí)驗(yàn)后的平均結(jié)果如表2所示.

表2 模型測(cè)試集結(jié)果對(duì)比表Tab.2 Comparison of model test set results table

實(shí)驗(yàn)結(jié)果表明,ARIMA和HA 模型兩種傳統(tǒng)的統(tǒng)計(jì)時(shí)序預(yù)測(cè)模型由于沒(méi)有考慮復(fù)雜的非線性序列變化規(guī)律,主要還是應(yīng)用于時(shí)序平穩(wěn)的場(chǎng)景,因此,實(shí)驗(yàn)精度相對(duì)最差.LSTM模型作為非線性時(shí)序預(yù)測(cè)模型可以通過(guò)細(xì)胞的狀態(tài)來(lái)解決時(shí)間序列數(shù)據(jù)的長(zhǎng)期依賴(lài)問(wèn)題,保留預(yù)測(cè)變量變化的長(zhǎng)短期變化規(guī)律,各項(xiàng)指標(biāo)對(duì)比有所提升,但由于其只利用單個(gè)時(shí)間序列數(shù)據(jù)訓(xùn)練,無(wú)法挖掘其他因素如人口、經(jīng)濟(jì)等對(duì)區(qū)域內(nèi)入學(xué)規(guī)模人數(shù)的影響.而ATTENTION—LSTM模型與其他模型比較更貼近實(shí)際結(jié)果,在所有測(cè)試集中MAE、MAPE、RMSE三個(gè)指標(biāo)的值均優(yōu)于其它模型.

5 結(jié)束語(yǔ)

小學(xué)入學(xué)規(guī)模預(yù)測(cè)對(duì)我國(guó)區(qū)域內(nèi)義務(wù)教育工作具有重要意義,傳統(tǒng)基于統(tǒng)計(jì)的時(shí)序預(yù)測(cè)方法由于無(wú)法描述學(xué)齡人口會(huì)隨經(jīng)濟(jì)條件造成的人口遷移、生育政策影響等產(chǎn)生不規(guī)則的波動(dòng)關(guān)系,難以取得較好的效果.本文利用機(jī)器學(xué)習(xí),根據(jù)學(xué)齡人口時(shí)間序列的時(shí)序特征,結(jié)合人口因素、經(jīng)濟(jì)因素等相關(guān)時(shí)間序列,建立了一種基于Attention-Lstm網(wǎng)絡(luò)的區(qū)域小學(xué)入學(xué)規(guī)模預(yù)測(cè)模型,利用Attention機(jī)制為不同的輸入特征賦予權(quán)重,以突出對(duì)小學(xué)入學(xué)規(guī)模預(yù)測(cè)起到關(guān)鍵作用的特征,通過(guò)實(shí)驗(yàn)表明本文提出的模型能夠充分挖掘人口、經(jīng)濟(jì)等因素于小學(xué)入學(xué)規(guī)模中規(guī)律的信息,具有較好的魯棒性,比傳統(tǒng)的時(shí)序預(yù)測(cè)方法具有更好的準(zhǔn)確率,提高了中長(zhǎng)期預(yù)測(cè)的精度,有助于教育管理部門(mén)更好的提前進(jìn)行布局和規(guī)劃.

猜你喜歡
學(xué)齡入學(xué)注意力
西班牙學(xué)齡籃球錦標(biāo)賽組織體系研究及啟示
讓注意力“飛”回來(lái)
無(wú)紙化入學(xué)報(bào)名值得推廣
甘肅教育(2020年6期)2020-11-25 14:25:06
無(wú)紙化入學(xué)報(bào)名值得提倡
甘肅教育(2020年6期)2020-09-11 07:44:52
仙桃市初中學(xué)生視力狀態(tài)篩查分析
學(xué)齡孤獨(dú)癥兒童教育模式研究
不同學(xué)齡段的小學(xué)語(yǔ)文課堂教學(xué)中的技巧分析
入學(xué)面試
“揚(yáng)眼”APP:讓注意力“變現(xiàn)”
A Beautiful Way Of Looking At Things
措美县| 富阳市| 曲松县| 讷河市| 达拉特旗| 紫阳县| 昭苏县| 长丰县| 伊金霍洛旗| 河西区| 垦利县| 沁阳市| 治县。| 花莲市| 洛阳市| 万盛区| 彭州市| 古丈县| 诏安县| 福建省| 临猗县| 府谷县| 丹寨县| 滕州市| 吉木萨尔县| 桑日县| 邳州市| 陆良县| 宁波市| 名山县| 平定县| 十堰市| 克拉玛依市| 会昌县| 宜兰县| 彭泽县| 洪江市| 乡城县| 昂仁县| 南部县| 金乡县|