蔡淑芳,林營志,吳寶意,鄭東海,雷錦桂
利用線性和非線性耦合方式建立溫室溫濕度預(yù)測模型*
蔡淑芳,林營志,吳寶意,鄭東海,雷錦桂**
(福建省農(nóng)業(yè)科學(xué)院數(shù)字農(nóng)業(yè)研究所,福州 350003)
基于蔬菜種植試驗溫室內(nèi)溫度、相對濕度和光照強度的實測數(shù)據(jù),根據(jù)ARIMA模型和RBF神經(jīng)網(wǎng)絡(luò)對線性和非線性問題的預(yù)測能力差異,構(gòu)建ARIMA-RBF神經(jīng)網(wǎng)絡(luò)權(quán)重組合的溫濕度預(yù)測模型,對溫室內(nèi)溫度和濕度的動態(tài)變化進(jìn)行預(yù)測,并比較各模型預(yù)測精度。結(jié)果表明:溫室內(nèi)溫濕度分別具有更明顯的線性和非線性變化特征,對應(yīng)預(yù)測性能較好的單一模型分別為ARIMA模型和RBF模型。相較單一模型,ARIMA-RBF神經(jīng)網(wǎng)絡(luò)權(quán)重組合模型的預(yù)測精度更高、穩(wěn)定性更好。最佳溫度組合模型的MAE、MAPE和RMSE分別為1.04℃、2.95%和1.21℃;最佳濕度組合模型的MAE、MAPE和RMSE分別為0.35個百分點、0.36%和0.55個百分點。權(quán)重組合模型通過適當(dāng)?shù)募訖?quán)策略充分發(fā)揮了單一模型對數(shù)據(jù)不同特征的處理能力,能較好地評估溫室內(nèi)溫濕度狀態(tài),可為建立更具普適性的溫室環(huán)境因子模型提供參考。
溫室;溫度;濕度;模型;ARIMA;RBF
溫室是人為建造的封閉設(shè)施,通過對溫室局部范圍內(nèi)環(huán)境和氣象因素的調(diào)控,把最適宜的溫度、濕度、光照、水分等環(huán)境條件提供給作物生長,使作物達(dá)到最佳生長狀態(tài),以獲得高產(chǎn)和優(yōu)質(zhì)產(chǎn)品[1]。日光溫室的相對封閉性決定了其內(nèi)部環(huán)境參數(shù)不同于外界氣候。目前,蔬菜溫室環(huán)境調(diào)控方式大多依靠農(nóng)業(yè)生產(chǎn)者的經(jīng)驗,通過對當(dāng)前采集的監(jiān)測點位環(huán)境數(shù)據(jù)進(jìn)行分析,進(jìn)而做出調(diào)控決策,其數(shù)據(jù)采集的反饋與調(diào)控措施的生效都存在滯后性和片面性[2]。
常見的環(huán)境因子預(yù)測模型主要有2類,即機理模型和經(jīng)驗?zāi)P?。機理模型根據(jù)能量守恒和質(zhì)量守恒定律對溫室環(huán)境進(jìn)行探究,模型中每個參數(shù)代表某個實際的物理量,具有明確的物理意義,方便人們的理解,但存在建模復(fù)雜、未知參數(shù)眾多、測量代價高和模型自適應(yīng)性較差等問題。經(jīng)驗?zāi)P褪且袁F(xiàn)代計算理論為基礎(chǔ),直接根據(jù)輸入輸出數(shù)據(jù)所提供的信息來建立過程模型,無需考慮溫室耗散、熱輻射等因素的影響。一些學(xué)者將易于測量的溫室外界環(huán)境因子同溫室內(nèi)部環(huán)境因子建立關(guān)聯(lián)映射進(jìn)行求解預(yù)測,回歸預(yù)測法、時序分析法、支持向量機、神經(jīng)網(wǎng)絡(luò)等模型均在該領(lǐng)域有應(yīng)用研究[3?4]。但對于一些復(fù)雜的預(yù)測系統(tǒng),采用單一的預(yù)測方法,往往難以獲得滿意的結(jié)果。
近年來,為提高預(yù)測精度,一些研究者在經(jīng)驗?zāi)P偷幕A(chǔ)上對預(yù)測方法進(jìn)行優(yōu)化,包括對不同經(jīng)驗?zāi)P偷慕M合預(yù)測[5?6]、經(jīng)驗?zāi)P偷膮?shù)優(yōu)化[7?8],經(jīng)驗?zāi)P偷姆诸愵A(yù)測[9]等。其中,經(jīng)驗?zāi)P偷慕M合預(yù)測方法是,利用不同預(yù)測函數(shù)或算法對數(shù)據(jù)特征的提取能力差異,通過從單一模型中提取有效的預(yù)測信息,使不同預(yù)測模型并行工作,達(dá)到提高預(yù)測精度和增強預(yù)測穩(wěn)定性的目的。組合預(yù)測方法在風(fēng)速、風(fēng)電功率、水文領(lǐng)域研究上表現(xiàn)出較高的準(zhǔn)確性和適用性,在溫濕度領(lǐng)域研究方面相對較少。田東等[5]將組合方法引入食用菌溫室溫度預(yù)測并取得了較好的預(yù)測效果,其具體應(yīng)用的是經(jīng)驗?zāi)P偷臍埐顑?yōu)化組合方法,而經(jīng)驗?zāi)P偷臋?quán)重優(yōu)化組合方法[10]在溫室溫濕度預(yù)測的研究中未見報道。
本研究以生產(chǎn)型果蔬溫室的歷史環(huán)境數(shù)據(jù)為基礎(chǔ),將溫室溫濕度視為是蘊含線性和非線性分量的動態(tài)疊加的時間序列,利用ARIMA模型和RBF神經(jīng)網(wǎng)絡(luò)分別對線性問題和非線性問題的預(yù)測能力,提出ARIMA-RBF神經(jīng)網(wǎng)絡(luò)權(quán)重組合預(yù)測方法建立溫濕度預(yù)測模型。通過設(shè)置不同樣本集和不同維度輸入變量,系統(tǒng)性探討樣本選擇、輸入?yún)?shù)對模型溫度和濕度預(yù)測性能的影響,探究權(quán)重組合模型對預(yù)測性能的優(yōu)化能力,以期為溫室環(huán)境調(diào)控和果蔬高效生產(chǎn)提供科學(xué)依據(jù)。
試驗數(shù)據(jù)采自福建省農(nóng)業(yè)科學(xué)院中以示范農(nóng)場薄膜溫室。溫室(26°7′43"N,119°20′0"E)長115.2m,寬68m,肩高4m,頂高6.5m,鋼架結(jié)構(gòu),鋼架上方覆蓋聚乙烯棚膜,溫室配備環(huán)流風(fēng)機、噴霧、內(nèi)遮陰、頂開窗、水肥一體化等設(shè)備。一年兩茬蔬菜基質(zhì)栽培,夏季和冬季分別種植黃瓜、番茄。試驗數(shù)據(jù)采集裝置使用威海某公司所提供的溫度、濕度、光照度傳感器自動采集記錄,溫度、相對濕度和光照強度的觀測精度分別為±0.5℃、±3個百分點、±0.126%μmol·m?2·s?1。傳感器位于栽培區(qū)域離地面高約1.5m處,采集頻率為每30s采集一次。
考慮到月度溫濕度變化具有較高的相似性[9],基于相似數(shù)據(jù)集的模型訓(xùn)練有利于提高預(yù)測性能;同時,試驗溫室位于福州,當(dāng)?shù)匾荒曛幸愿邷馗邼駳夂驗橹?,尤其是?月等夏季高溫時段對溫室通風(fēng)降溫功能的需求較高。因此,以2020年7月數(shù)據(jù)為例進(jìn)行模型研究,不同月份可根據(jù)本研究提出的方法進(jìn)行分別建模。鑒于樣本量對模型預(yù)測精度會產(chǎn)生影響[3],將7月28?29日的數(shù)據(jù)作為驗證集,前5d(7月23?27日)、10d(7月18?27日)、15d(7月13?27日)、20d(7月8?27日)和25d(7月3?27日)的數(shù)據(jù)作為樣本集,探討不同樣本集的溫濕度模型預(yù)測效果。因輸入變量的高自相關(guān)可能出現(xiàn)過擬合而影響模型預(yù)測精度[11],對影響溫濕度的溫度、相對濕度和光照強度的數(shù)據(jù)進(jìn)行篩選,探討不同輸入變量對模型預(yù)測效果的影響。
采用拉依達(dá)法則[10]即當(dāng)測量值與平均值差的絕對值大于3個標(biāo)準(zhǔn)差時,認(rèn)為該測量值為異常值,將該值替換為異常點兩側(cè)數(shù)據(jù)的平均值。由于1h內(nèi)溫室環(huán)境數(shù)據(jù)變化不大,因此將采集頻率為每30s一次的溫室環(huán)境數(shù)據(jù)按小時平均進(jìn)行平滑。經(jīng)測算,7月溫室內(nèi)溫度變化范圍為30.16~45.95℃,相對濕度變化范圍為86.17%~99.80%,光照強度變化范圍為0~744.07μmol·m?2·s?1。為避免某一維數(shù)據(jù)值過大而導(dǎo)致訓(xùn)練錯誤,提高預(yù)測的準(zhǔn)確性,對溫室環(huán)境數(shù)據(jù)進(jìn)行歸一化處理,在預(yù)測分析結(jié)束后再通過反歸一化恢復(fù)。
1.2.1 ARIMA模型
自回歸移動平均模型(Autoregressive Integrated Moving Average Model,ARIMA)是將自回歸過程(AR)和移動平均過程(MA)相結(jié)合的時間序列組合模型[12]。其基本思想是,利用時間序列取得的變量自身歷史數(shù)據(jù),通過曲線擬合和參數(shù)估計來建立數(shù)學(xué)模型,對變量未來發(fā)展?fàn)顩r進(jìn)行推斷和估計。溫室內(nèi)溫度和相對濕度每24h呈現(xiàn)周期性變化特征,可用季節(jié)ARIMA模型進(jìn)行分析。
對于D階季節(jié)差分,則有
其中
式中,p表示非季節(jié)性自回歸過程滯后的階數(shù),q表示非季節(jié)性移動平均過程滯后的階數(shù),P表示季節(jié)性自回歸過程滯后的階數(shù),Q表示季節(jié)性移動平均過程滯后的階數(shù)。
ARIMA模型比較簡單,對資料的要求單一,只需變量本身的歷史數(shù)據(jù),且對數(shù)據(jù)線性關(guān)系特征的提取能力較強,在實際中有著廣泛的適用性。其建模的主要思路為[12],通過觀察溫度和相對濕度序列的自相關(guān)函數(shù)(ACF)、偏自相關(guān)函數(shù)圖(PACF)和散點圖、方差、ADF單位根檢驗等方式,判斷時間序列的平穩(wěn)性。對非平穩(wěn)的時間序列進(jìn)行差分處理、對數(shù)轉(zhuǎn)換等使其平穩(wěn)化。通過判斷時間序列ACF和PACF的拖尾性和截尾性,確定模型的階數(shù)。以BIC貝葉斯信息準(zhǔn)則對階數(shù)的不同組合進(jìn)行篩選,得到最優(yōu)的ARIMA模型。通過模型參數(shù)和殘差白噪聲檢驗,判斷模型的合理性。應(yīng)用所建立的模型預(yù)測下一時刻溫濕度值。
1.2.2 RBF神經(jīng)網(wǎng)絡(luò)
RBF神經(jīng)網(wǎng)絡(luò)屬于3層前向網(wǎng)絡(luò)類型,具有結(jié)構(gòu)簡單、計算收斂速度快、結(jié)果穩(wěn)定且逼近精度高的特點。其基本思想是用RBF作為隱單元的“基”構(gòu)成隱藏層空間,隱藏層對輸入矢量進(jìn)行變換,將低維的模式輸入數(shù)據(jù)變換到高維空間內(nèi),使得在低維空間內(nèi)的線性不可分問題在高維空間內(nèi)線性可分[13]。溫室內(nèi)溫度和相對濕度除了受自身歷史值的影響,還受到光照強度等環(huán)境因素的影響,即溫濕度時間序列是由線性部分和非線性部分構(gòu)成的時間序列,其非線性部分可應(yīng)用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行建模預(yù)測。
RBF神經(jīng)網(wǎng)絡(luò)表達(dá)式為
t時刻的隱含層節(jié)點線性組合輸出為
網(wǎng)絡(luò)的學(xué)習(xí)指標(biāo)函數(shù)為
RBF神經(jīng)網(wǎng)絡(luò)具有良好的非線性映射能力,在不使用先驗知識的情況下,能快速對模型進(jìn)行無線逼近,是應(yīng)用較為廣泛的環(huán)境因子預(yù)測模型。其建模的主要思路為[13],根據(jù)預(yù)測溫度和相對濕度的建模目的和輸入變量選擇,確定輸入層、輸出層節(jié)點數(shù);以誤差平方和最小為約束目標(biāo),確定隱含層節(jié)點數(shù);使用聚類特征樹和距離聚類相結(jié)合的兩步聚類法確定徑向基函數(shù)的中心和寬度;采用普通最小二乘法求取隱含層至輸出層的權(quán)值向量;利用確定的RBF模型預(yù)測下一時刻溫濕度值。
1.2.3 ARIMA-RBF權(quán)重組合模型
因溫度和相對濕度是蘊含線性分量和非線性分量的時間序列,ARIMA和RBF神經(jīng)網(wǎng)絡(luò)分別具有較高的線性和非線性特征數(shù)據(jù)的提取能力,因此有必要將二者結(jié)合。ARIMA-RBF權(quán)重組合模型是從單一模型中提取有效的預(yù)測信息,通過適當(dāng)?shù)募訖?quán),集成不同模型預(yù)測性能,達(dá)到提高預(yù)測精度和穩(wěn)定性,提高預(yù)測時間序列發(fā)展趨勢能力的目的。
采用平均絕對誤差MAE、平均絕對百分比誤差MAPE、均方根誤差RMSE對模型進(jìn)行評價。
采用Origin、SPSS等軟件對模型進(jìn)行作圖和處理。
2.1.1 模型識別與診斷
應(yīng)用季節(jié)模型ARIMA(p,d,q)(P,D,Q)S對溫室內(nèi)溫度和濕度序列數(shù)據(jù)進(jìn)行分析。以驗證集的前5d、10d、15d、20d和25d數(shù)據(jù)作為樣本集。經(jīng)過序列平穩(wěn)性檢驗以及ACF和PACF對差分序列定階,根據(jù)BIC值,分別確定不同樣本集的最優(yōu)溫度和濕度ARIMA模型,結(jié)果見表1。對所有模型參數(shù)進(jìn)行T檢驗,不同樣本集所建模型各參數(shù)均通過了0.05水平的顯著性檢驗,說明模型參數(shù)有效;殘差白噪聲檢驗的統(tǒng)計量均未通過0.05水平的顯著性檢驗,表明殘差符合隨機分布,且沒有離群值出現(xiàn),反映所建模型合理。
2.1.2 模型預(yù)測結(jié)果及分析
應(yīng)用所建立的不同樣本集的溫濕度ARIMA模型對2020年7月28?29日共48h的溫室內(nèi)溫濕度進(jìn)行預(yù)測,結(jié)果見圖1。由圖1a可見,5d樣本集模型溫度預(yù)測結(jié)果與實際值具有明顯的偏差;10d樣本集模型對7月29日的溫度預(yù)測結(jié)果與實際值偏差較大。相對地,15d、20d和25d樣本集模型溫度預(yù)測結(jié)果與實際值較為接近,其中,25d預(yù)測結(jié)果與實際值最為接近。由圖1b可見,幾組預(yù)測模型在濕度最低時段均有較為明顯的偏差,尤其是在7月28日的濕度最低時段,幾組預(yù)測模型的預(yù)測結(jié)果偏差均較大。從總體上看,5d樣本集模型濕度預(yù)測結(jié)果與實際值的偏差最為明顯;10d、20d和25d樣本集模型的預(yù)測結(jié)果與實際值的偏差次之;相對地,15d樣本集模型濕度預(yù)測結(jié)果與實際值更為接近。
表1 不同樣本集的溫濕度ARIMA模型及48h預(yù)測誤差統(tǒng)計結(jié)果
Note: MAE is mean absolute error, MAPE is mean absolute percentage error, RMSE is root mean square error. The same as below.
圖1 不同樣本集的溫度(a)和濕度(b)ARIMA模型48h預(yù)測結(jié)果
2.1.3 模型預(yù)測性能評價
由表1可見,使用不同樣本集的溫濕度ARIMA模型,其預(yù)測效果不盡相同。溫度預(yù)測結(jié)果的3項誤差指標(biāo)MAE、MAPE和RMSE分別為1.08~3.64℃、2.94%~9.45%和1.35~4.68℃;濕度預(yù)測結(jié)果的3項誤差分別為0.39~0.82個百分點、0.41%~0.85%、0.91~1.42個百分點。隨著樣本集天數(shù)從25d到5d的逐步減少,ARIMA模型溫度預(yù)測結(jié)果的3項誤差逐漸變大,預(yù)測精度和穩(wěn)定性逐漸變差。濕度預(yù)測結(jié)果3項誤差從低到高排序的樣本集為15d、10d、25d、20d和5d,表明太少天數(shù)樣本集的預(yù)測效果最差,中等天數(shù)樣本集的預(yù)測效果最佳。綜上所述,25d樣本集溫度預(yù)測和15d樣本集濕度預(yù)測模型精度最高。
2.2.1 模型求解
為分析周圍環(huán)境對溫濕度的影響,且避免輸入變量的高自相關(guān)可能出現(xiàn)的過擬合問題,設(shè)置3種輸入變量以進(jìn)行預(yù)測效果比較。輸入變量A為前a個時刻溫度、濕度和光照強度;輸入變量B分為B1和B2兩種,B1為前b個時刻濕度和光照強度(溫度建模時),B2為前b個時刻溫度和光照強度(濕度建模時);輸入變量C為前c個時刻光照強度。為適當(dāng)減少冗余參數(shù)和簡化模型,初始賦值a=b=c=6,通過經(jīng)驗調(diào)優(yōu),當(dāng)a=b=c=1時,RBF模型預(yù)測效果最佳。因此,最終將對應(yīng)的前1個時刻歷史值確定為輸入變量A、B、C。模型輸出為t時刻溫度、濕度預(yù)測值。因輸入變量B不同,據(jù)此分別訓(xùn)練溫度、濕度模型;其余變量則合并訓(xùn)練模型。模型訓(xùn)練時,將樣本集前60%的數(shù)據(jù)作為訓(xùn)練樣本,后40%的數(shù)據(jù)作為測試樣本。以誤差平方和最小為約束目標(biāo),確立隱含層節(jié)點數(shù);經(jīng)兩步聚類法確定徑向基函數(shù)的中心和寬度;采用普通最小二乘法進(jìn)行計算,建立相應(yīng)的溫濕度RBF預(yù)測模型,結(jié)果見表2。
表2 不同輸入變量和樣本集的溫濕度RBF模型及48h預(yù)測誤差統(tǒng)計結(jié)果
Note: A is temperature, humidity and light intensity, B1is humidity and light intensity, B2is temperature and light intensity, C is light intensity. The same as below.
2.2.2 模型預(yù)測結(jié)果及分析
應(yīng)用所建立的不同輸入變量和樣本集的RBF模型對2020年7月28?29日的溫濕度進(jìn)行預(yù)測。以輸入變量B1的RBF模型溫度預(yù)測和輸入變量A的RBF濕度預(yù)測為例,預(yù)測結(jié)果見圖2。由圖2a可見,輸入變量B1的不同樣本集的RBF模型溫度預(yù)測結(jié)果與實際值均有不同程度的偏差,尤其是在2日溫度最低時段的偏差明顯,各模型均未能較好地捕捉低溫變化特征。由圖2b可見,輸入變量A的RBF模型濕度預(yù)測結(jié)果與實際值均有一定偏差。其中,在對7月28日的濕度最低時段預(yù)測上,幾組模型之間預(yù)測結(jié)果差別明顯;25d樣本集RBF模型濕度預(yù)測結(jié)果與實際值最為接近,20d樣本集模型次之,其余樣本集模型預(yù)測結(jié)果與實際值偏差較大。
2.2.3 模型預(yù)測性能評價
由表2可見,使用不同輸入變量和樣本集的溫濕度RBF模型,其預(yù)測性能表現(xiàn)不一。溫度預(yù)測結(jié)果的3項誤差MAE、MAPE和RMSE分別為1.41~2.84℃、4.11%~8.25%和1.75~3.44℃;濕度預(yù)測結(jié)果的3項誤差范圍為0.49~1.10個百分點、0.50%~1.12%和0.72~1.81個百分點。當(dāng)輸入變量為A、B、C時,溫度預(yù)測結(jié)果與實際值3項誤差最小的為25d、20d和20d樣本集模型;濕度預(yù)測結(jié)果為25d、10d和10d樣本集模型。當(dāng)樣本集一致時,溫度預(yù)測結(jié)果的3項誤差大小為輸入變量B1模型<A模型,輸入變量C模型<A模型;濕度預(yù)測結(jié)果的3項誤差大小為輸入變量C模型<B2模型,輸入變量A模型<B2模型。總體來看,輸入變量B1的20d樣本集模型的溫度預(yù)測以及輸入變量A的25d樣本集模型的濕度預(yù)測3項誤差最小,預(yù)測精度和穩(wěn)定性最好。
2.3.1 構(gòu)建組合預(yù)測模型
2.3.2 組合模型預(yù)測結(jié)果及分析
由圖3a1、3a2可見,單獨使用RBF神經(jīng)網(wǎng)絡(luò)的溫度預(yù)測結(jié)果誤差相對較大,尤其是在低溫時段附近誤差明顯,ARIMA模型在低溫時段附近的預(yù)測結(jié)果與實際值更接近,表明溫度變化受時序影響較大。除低溫時段外,ARIMA-RBF模型溫度預(yù)測曲線與實際值曲線更貼近,誤差更小。由圖3b1、3b2可見,ARIMA模型的濕度預(yù)測效果較差,特別是濕度低值階段誤差最大,表明濕度此時可能受到非線性因素的影響較大。由于RBF在捕捉數(shù)據(jù)序列非線性特征上效果較好,因此,其在濕度低值階段的預(yù)測曲線與實際值曲線相對更吻合。總體上看,ARIMA-RBF模型濕度預(yù)測結(jié)果與實際值最接近,預(yù)測誤差曲線最靠近0值線。
圖2 輸入變量B1的溫度RBF模型(a)和輸入變量A的濕度RBF模型(b)48h預(yù)測結(jié)果
圖3 溫度(a)和濕度(b)ARIMA、RBF、ARIMA-RBF模型48h預(yù)測結(jié)果(1)及誤差(2)對比
2.3.3 組合模型預(yù)測性能評價
由表3可見,ARIMA-RBF模型溫度預(yù)測結(jié)果MAPE略高于ARIMA模型,除此之外,ARIMA-RBF模型溫濕度預(yù)測結(jié)果3項誤差MAE、MAPE和RMSE均較ARIMA和RBF模型有不同程度的降低,表明ARIMA-RBF模型溫濕度預(yù)測性能最佳。溫度ARIMA模型預(yù)測結(jié)果3項誤差均小于RBF模型,表明溫度ARIMA模型預(yù)測性能優(yōu)于RBF模型。濕度ARIMA模型預(yù)測結(jié)果MAE、MAPE小于RBF模型,RMSE大于RBF模型;在3項誤差指標(biāo)中,RMSE反映的是模型預(yù)測結(jié)果異常值情況,RMSE越小表明異常值越少,預(yù)測性能越穩(wěn)定,可以認(rèn)為模型綜合預(yù)測效果更佳。因此,溫度預(yù)測模型總體效果排序為ARIMA-RBF>ARIMA>RBF,濕度預(yù)測模型總體效果排序為ARIMA-RBF>RBF>ARIMA。相同方法在2019年7月30?31日為驗證集的溫濕度建模與分析中也得出了類似結(jié)論。
表3 溫濕度最佳ARIMA、RBF、ARIMA-RBF模型及48h預(yù)測誤差統(tǒng)計結(jié)果
(1)應(yīng)用5~25d的樣本集對蔬菜溫室內(nèi)溫濕度的ARIMA模型預(yù)測表明,25d樣本集溫度模型ARIMA(0,1,1)(1,1,1)24的預(yù)測精度最高,其預(yù)測結(jié)果的MAE、MAPE和RMSE分別為1.08℃、2.94%和1.35℃;15d樣本集濕度模型ARIMA(2,0,0)(1,0,1)24的預(yù)測精度最高,其3項誤差指標(biāo)分別為0.39個百分點、0.41%和0.91個百分點。
(2)應(yīng)用5~25d的樣本集和3種輸入變量對溫濕度的RBF模型預(yù)測表明,輸入變量B1(濕度、光照強度)的20d樣本集溫度RBF模型(2-10-1)的預(yù)測精度最高,其預(yù)測結(jié)果MAE、MAPE和RMSE分別為1.41℃、4.11%和1.75℃;輸入變量A(溫度、濕度、光照強度)的25d樣本集濕度RBF模型(3-6-2)的預(yù)測精度最高,其3項誤差指標(biāo)分別為0.49個百分點、0.50%和0.72個百分點。
(3)最優(yōu)ARIMA模型和最優(yōu)RBF模型的權(quán)重組合模型預(yù)測表明,溫度預(yù)測模型總體預(yù)測效果排序為ARIMA-RBF>ARIMA>RBF,濕度預(yù)測模型總體預(yù)測效果排序為ARIMA-RBF>RBF>ARIMA。溫度ARIMA-RBF模型預(yù)測結(jié)果MAE、MAPE和RMSE分別為1.04℃、2.95%、1.21℃;濕度ARIMA-RBF模型3項誤差指標(biāo)分別為0.35個百分點、0.36%和0.55個百分點。
本研究發(fā)現(xiàn),15~25d樣本集的ARIMA溫度模型預(yù)測結(jié)果與實際值較為接近,其對溫度最高時段和最低時段的預(yù)測結(jié)果也較為理想,表明溫度具有明顯的時間序列特征,其受到自身歷史值的影響較為明顯,這與田東等[5]認(rèn)為溫室溫度與自身歷史溫度數(shù)據(jù)有較大關(guān)聯(lián),以及徐映梅等[12]認(rèn)為ARIMA模型在預(yù)測簡單時間序列數(shù)據(jù)更具優(yōu)勢的觀點類似。隨著樣本集天數(shù)的逐漸減少,ARIMA模型溫度預(yù)測結(jié)果的3項誤差逐漸增大,表明較多的訓(xùn)練數(shù)據(jù)更有利于捕捉溫度時間序列的數(shù)據(jù)特征。ARIMA濕度模型在濕度最低時段具有較為明顯的偏差,表明濕度的非線性變化特征更為明顯,而ARIMA模型對非線性關(guān)系的挖掘較欠缺[10],其并不能準(zhǔn)確地刻畫非線性特征,因此預(yù)測誤差偏大。
前人研究表明,神經(jīng)網(wǎng)絡(luò)法受輸入?yún)?shù)、樣本選擇的影響很大[14]。本研究發(fā)現(xiàn),輸入變量B1(濕度、光照強度)和C(光照強度)的溫度RBF預(yù)測模型優(yōu)于輸入變量A(溫度、濕度、光照強度)模型,輸入變量A和C的濕度RBF預(yù)測模型優(yōu)于輸入向量B2(溫度和光照強度)模型。說明輸入變量溫度、濕度和光照強度間相互耦合的復(fù)雜關(guān)系會對預(yù)測效果產(chǎn)生影響,模型訓(xùn)練時需要對輸入?yún)?shù)進(jìn)行篩選[15],具有較多維度輸入數(shù)據(jù)特征的神經(jīng)網(wǎng)絡(luò)不一定占優(yōu)勢[16]??傮w上,輸入變量B1的20d樣本集模型的溫度預(yù)測以及輸入變量A的25d樣本集模型的濕度預(yù)測精度最高,表明訓(xùn)練數(shù)據(jù)較多,模型泛化能力更好。已有研究表明,樣本集與測試集相似性越高,越有利于提高預(yù)測精度[9];本研究的溫濕度預(yù)測最佳樣本集結(jié)果說明,預(yù)測日溫、濕度可能分別與前20d、前25d的樣本集相似度較高,表明以1個月為時間跨度對溫濕度進(jìn)行建??赡鼙容^合理,這與田東等[5]設(shè)定的建模周期類似。
RBF模型對低溫階段預(yù)測較差和低濕階段預(yù)測較佳,印證了ARIMA模型中對于溫度的線性特征和濕度的非線性特征的判斷;這與程俊等[11]認(rèn)為,擅長捕捉非線性特征的神經(jīng)網(wǎng)絡(luò),對具有線性特征的時間序列可能存在過度擬合,繼而導(dǎo)致預(yù)測結(jié)果不夠精確的觀點一致。預(yù)測誤差統(tǒng)計結(jié)果表明,濕度RBF模型的RMSE較ARIMA模型低,但MAE和MAPE均比后者高,表明濕度可能受到溫光濕以外的非線性因素影響較大。溫室內(nèi)部水肥灌溉系統(tǒng)的運行可能對濕度產(chǎn)生了較大的影響,Jung等[3]的研究也得出了類似的結(jié)論。本研究僅利用室內(nèi)溫光濕數(shù)據(jù),探討其對溫濕度變化的影響,暫未考慮室外環(huán)境及調(diào)控措施與溫濕度變化的關(guān)聯(lián)性。為進(jìn)一步提高預(yù)測性能,后期需要補充灌溉歷史等相關(guān)數(shù)據(jù)進(jìn)行模型的再次擬合與篩選。
權(quán)重組合模型是以預(yù)測誤差平方和最小為目標(biāo)函數(shù)的權(quán)重系數(shù)最優(yōu)解計算方法,該模型通過適當(dāng)?shù)募訖?quán)平均形式得出預(yù)測結(jié)果,綜合利用了各種單項預(yù)測模型所提供的信息,充分考慮了預(yù)測目標(biāo)的不同數(shù)據(jù)特征,因此,可以降低信息的不完備性,從而能夠更加有效地提高預(yù)測精度[17?18]。溫室溫濕度數(shù)據(jù)具有線性的趨勢性和季節(jié)性特征;同時受到周圍環(huán)境參數(shù)的影響,具有非線性特征[6]。本研究結(jié)果表明,ARIMA-RBF模型通過ARIMA、RBF模型分別對線性和非線性數(shù)據(jù)特征的提取,能夠更好地擬合溫室環(huán)境影響因子與溫濕度之間的關(guān)系,總體預(yù)測效果更加理想,泛化性能更好,與溫室內(nèi)實際溫濕度較為接近,能夠更好地評估溫室溫濕度狀態(tài)??紤]到預(yù)測過程類似,本研究僅展示了7月的預(yù)測結(jié)果,針對其他月份的溫室環(huán)境數(shù)據(jù),可以利用本研究提出的預(yù)測方法分別訓(xùn)練不同的模型,以達(dá)到預(yù)期的效果。本研究提出的組合預(yù)測模型權(quán)重系數(shù)在預(yù)測各個時期是固定不變的,然而針對單一ARIMA和RBF模型,其在不同時刻預(yù)測精度并不固定,因此,針對單一預(yù)測模型在各個預(yù)測時期的擬合精度高低進(jìn)行有序賦權(quán)的變權(quán)組合預(yù)測模型[19]還有待于進(jìn)一步研究。
[1] 蔡淑芳,吳寶意,雷錦桂.基于光溫效應(yīng)的大白菜生理特性及營養(yǎng)品質(zhì)動態(tài)模擬效果[J].中國農(nóng)業(yè)氣象,2021, 42(1):34-43.
Cai S F,Wu B Y,Lei J G.Dynamic simulation effect of physiological characteristics and nutritional quality of Chinese cabbage based on light and temperature function[J].Chinese Journal of Agrometeorology,2021,42 (1):34-43.(in Chinese)
[2] 牟雙.日光溫室氣溫預(yù)測及頂部通風(fēng)調(diào)控貝葉斯模型[D].沈陽:沈陽農(nóng)業(yè)大學(xué),2018.
Mou S.Bays model of solar greenhouse temperature prediction and roof ventilation regulation[D].Shenyang: Shenyang Agricultural University,2018. (in Chinese)
[3] Jung D H,Kim H S,Jhin C,et al.Time-serial analysis of deep neural network models for prediction of climatic conditions inside a greenhouse[J].Computers and Electronics in Agriculture,2020,173:1-11.
[4] 韋婷婷,楊再強,王琳,等.玻璃溫室和塑料大棚內(nèi)逐時氣溫模擬模型[J].中國農(nóng)業(yè)氣象,2018,39(10):644-655.
Wei T T,Yang Z Q,Wang L,et al.Simulation model of hourly air temperature inside glass greenhouse and plastic greenhouse[J].Chinese Journal of Agrometeorology,2018, 39(10):644-655.(in Chinese)
[5] 田東,韋鑫化,王悅,等.基于MA-ARIMA-GASVR 的食用菌溫室溫度預(yù)測[J].農(nóng)業(yè)工程學(xué)報,2020,36(3):190-197.
Tian D,Wei X H,Wang Y,et al.Prediction of temperature in edible fungi greenhouse based on MA-ARIMA-GASVR [J].Transactions of the CSAE,2020,36(3):190-197.(in Chinese)
[6] 趙全明,宋子濤,李奇峰,等.基于CNN-GRU的菇房多點溫濕度預(yù)測方法研究[J].農(nóng)業(yè)機械學(xué)報,2020,51(9):294-303.
Zhao Q M,Song Z T,Li Q F,et al.Multi-point prediction of temperature and humidity of mushroom based on CNN-GRU[J].Transactions of the Chinese Society for Agricultural Machinery,2020,51(9):294-303.(in Chinese)
[7] 于學(xué)儒.日光溫室關(guān)鍵環(huán)境因子變化規(guī)律與監(jiān)控系統(tǒng)研究[D].泰安:山東農(nóng)業(yè)大學(xué),2019.
Yu X R.Study on change regulation of key environmental factors and monitoring and control system in solar greenhouse[D].Tai’an:Shandong Agricultural University, 2019.(in Chinese)
[8] 張坤鰲,趙凱.基于改進(jìn)CFA PSO-RBF神經(jīng)網(wǎng)絡(luò)的溫室溫度預(yù)測研究[J].計算機應(yīng)用與軟件,2020,37(6):95-99.
Zhang K A,Zhao K.Greenhouse temperature prediction based on improved CFA PSO-RBF neural network[J]. Computer Applications and Software,2020,37(6):95-99.(in Chinese)
[9] 陳昕,唐湘璐,李想,等.二次聚類與神經(jīng)網(wǎng)絡(luò)結(jié)合的日光溫室溫度二步預(yù)測方法[J].農(nóng)業(yè)機械學(xué)報,2017,48 (S1):353-358.
Chen X,Tang X L,Li X,et al.Two-steps prediction method of temperature in solar greenhouse based on twice cluster analysis and neural network[J].Transactions of the Chinese Society for Agricultural Machinery,2017,48(S1): 353-358. (in Chinese)
[10] 劉春紅,楊亮,鄧河,等.基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)的豬舍氨氣濃度預(yù)測[J].中國環(huán)境科學(xué),2019,39(6):2320-2327.
Liu C H,Yang L,Deng H,et al.Prediction of ammonia concentration in piggery based on ARIMA and BP neural network[J].China Environmental Science,2019,39(6):2320- 2327.(in Chinese)
[11] 程俊.基于ARIMA-LSTM 混合模型的機械傳動件制造企業(yè)銷售預(yù)測方法研究與應(yīng)用[D].成都:電子科技大學(xué),2018.
Cheng J.Research and application of sales forecasting method for mechanical transmission parts manufacturing enterprises based on ARIMA-LSTM hybrid model[D]. Chengdu:University of Electronic Science and Technology of China,2018.(in Chinese)
[12] 徐映梅,陳堯.季節(jié)ARIMA模型與LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測的比較[J].統(tǒng)計與決策,2021(2):46-50.
Xu Y M,Chen Y.Comparison between seasonal ARIMA model and LSTM neural network forecast[J].Statistics and Decision,2021(2):46-50.(in Chinese)
[13] 關(guān)鵬,焦玉勇,段新勝.基于RBF神經(jīng)網(wǎng)絡(luò)的土體導(dǎo)熱系數(shù)非線性預(yù)測[J].太陽能學(xué)報,2021,42(3):171-178.
Guan P,Jiao Y Y,Duan X S.Non-liner prediction of soil thermal conductivity based on RBF neural network[J].Acta Energiae Solaris Sinica,2021,42(3):171-178.(in Chinese)
[14] 林海濤,蔣傳文,任博強,等.基于模糊聚類的風(fēng)速短期組合預(yù)測[J].華東電力,2010,38(2):295-299.
Lin H T,Jiang C W,Ren B Q,et al.Short term combined prediction of wind speed based on fuzzy clustering[J].East China Electric Power,2010,38(2):295-299.(in Chinese)
[15] 楊雷,張寶鳳,朱均超,等.基于PCA-PSO-LSSVM 的溫室大棚溫度預(yù)測方法[J].傳感器與微系統(tǒng),2018,37(7):52-55.
Yang L,Zhang B F,Zhu J C,et al.Temperature prediction method of greenhouse based on PCA-PSO-LSSVM [J].Transducer and Microsystem Technologies,2018,37 (7):52-55.(in Chinese)
[16] 趙琦琳,邱飛,楊健.NARX神經(jīng)網(wǎng)絡(luò)模型在昆明市環(huán)境空氣質(zhì)量預(yù)測中的應(yīng)用[J].中國環(huán)境監(jiān)測,2019,35(3):42-48.
Zhao Q L,Qiu F,Yang J.Application of NARX neural network model in environmental air quality prediction in Kunming[J].Environmental Monitoring in China,2019, 35(3):42-48.(in Chinese)
[17] 施佳.基于ARIMA -BP組合模型的某餐飲O2O企業(yè)訂單預(yù)測研究[D].北京:北京交通大學(xué),2018.
Shi J.Research on the order forecast of a restaurant O2O enterprise based on the ARIMA-BP combination model[D]. Beijing: Beijing Jiaotong University,2018.(in Chinese)
[18] 王冬冬.基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)模型的重慶市GDP實證分析[D].桂林:廣西師范大學(xué),2019.
Wang D D.Empirical analysis of Chongqing GDP based on ARIMA and BP Neural Network Model[D].Guilin: Guangxi Normal University,2019.(in Chinese)
[19] 錢超.高速公路ETC數(shù)據(jù)挖掘研究與應(yīng)用[D].西安:長安大學(xué),2013.
Qian C.Research and application of data mining on expressway ETC system[D].Xi’an:Chang’an University, 2013.(in Chinese)
Greenhouse Temperature and Humidity Prediction Models Based on Linear and Nonlinear Coupling Methods
CAI Shu-fang, LIN Ying-zhi, WU Bao-yi, ZHENG Dong-hai, LEI Jin-gui
(Institute of Digital Agriculture, Fujian Academy of Agricultural Sciences, Fuzhou 350003, China)
In order to provide reference for vegetable growth management and environmental optimization regulation, the dynamic changes of greenhouse temperature and humidity were predicted by using ARIMA model and RBF neural network. In this study, the data from July 28 to 29 were taken as the validation set, and the data from the previous 5 to 25 days were taken as the sample set. Three input variables were set to explore the temperature and humidity model prediction effects. Based on the measured data of air temperature, relative humidity and light intensity in the vegetable greenhouse, and according to the difference in the predictive ability of ARIMA model and RBF neural network for linear and nonlinear problems, temperature and humidity prediction models based on weight combination of ARIMA and RBF neural network were constructed. The results showed that the temperature and humidity in the greenhouse had more obvious linear and nonlinear variation characteristics, respectively, and the single models with better prediction effects were the ARIMA model and the RBF model. The optimal single temperature model was the model ARIMA(0,1,1)(1,1,1)24with 25 days sample set. The optimal single humidity model was the RBF model (3-6-2) with 25 days sample set and input variable A (temperature, humidity and light intensity). Compared with the optimal single models, the ARIMA-RBF neural network weight combination model had higher prediction accuracy and better stability. The MAE, MAPE and RMSE were 1.04℃, 2.95%, 1.21℃for the optimal temperature combination model and 0.35 percentage point, 0.36%, 0.55 percentage point for the optimal humidity combination model. The weight combination model gives full play to the ability of single models to process data from different characteristics through an appropriate weighting strategy, and can better evaluate the temperature and humidity status in the greenhouse, which provides a reference for establishing a more universal greenhouse environmental factor model.
Greenhouse; Temperature; Humidity; Model; ARIMA;RBF
10.3969/j.issn.1000-6362.2022.07.002
蔡淑芳,林營志,吳寶意,等.利用線性和非線性耦合方式建立溫室溫濕度預(yù)測模型[J].中國農(nóng)業(yè)氣象,2022,43(7):527-537
2021?09?28
福建省自然科學(xué)基金項目(2020J011377);福建省科協(xié)項目(閩科協(xié)學(xué)〔2021〕9號);福建省農(nóng)業(yè)科學(xué)院項目(CXTD2021013-1)
雷錦桂,研究員,研究方向為數(shù)字農(nóng)業(yè),E-mail: 71906244@qq.com
蔡淑芳,E-mail: csf2019@qq.com