李衣菲,陶桂香,毛 欣,衣淑娟
(黑龍江八一農(nóng)墾大學(xué) 工程學(xué)院,黑龍江 大慶 163319)
稻谷是世界主要糧食作物。 我國(guó)是世界上最大的水稻生產(chǎn)國(guó)。 據(jù)《國(guó)家統(tǒng)計(jì)局關(guān)于2018 年糧食產(chǎn)量的公告》:2018 年,我國(guó)水稻總產(chǎn)量 2.1 億 t,單位面積產(chǎn)量 7027kg·hm-2[1],居世界第一。 同年,黑龍江水稻總產(chǎn)量2685.5 萬(wàn) t,單位面積產(chǎn)量 7096.5kg·hm-2,占全國(guó)水稻產(chǎn)量的 12.7%[2]。 目前,黑龍江省水稻多采用移栽種植方式,緩苗時(shí)間短,易于管理。水稻的移栽的前期工作包括催芽、播種、育秧等工序。為保證移栽時(shí)秧苗準(zhǔn)、勻、齊,育秧前可用缽盤精量播種裝置進(jìn)行精量播種。 水稻缽盤精量播種裝置的充種部件是缽盤精量播種裝置的關(guān)鍵部件[3],充種質(zhì)量的優(yōu)劣,直接影響播種的合格率與芽種的損傷率。 影響水稻缽盤精量播種裝置充種性能有缽盤型孔直徑、厚度,投種高度等因素。 由于充種過(guò)程各個(gè)因素之間存在復(fù)雜的交互作用,簡(jiǎn)單的數(shù)學(xué)解析式不能表達(dá)水稻充種過(guò)程各參數(shù)對(duì)播種性能指標(biāo)的影響規(guī)律。
RBF 是一種有效的徑向基神經(jīng)網(wǎng)絡(luò)構(gòu)造方法,遵從局部逼近原則,可處理系統(tǒng)內(nèi)的難以解析的規(guī)律,實(shí)現(xiàn)非線性模型的預(yù)測(cè)。 與BP 神經(jīng)網(wǎng)絡(luò)相比,RBF 具有較快的學(xué)習(xí)收斂速度[4-5]。 PLS 偏最小二乘法是一種新型的多元統(tǒng)計(jì)數(shù)據(jù)分析方法,將高維數(shù)據(jù)空間投影到相對(duì)應(yīng)低維空間,找到自變量與因變量的特征向量的一元線性回歸關(guān)系,去除無(wú)意噪聲。 將RBF 網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)與PLS 回歸方法的優(yōu)勢(shì)結(jié)合起來(lái),用PLS 方法提出數(shù)據(jù)集的主成分[6-7],來(lái)構(gòu)建RBF 網(wǎng)絡(luò)模型,減少了數(shù)據(jù)多重相關(guān)的影響及學(xué)習(xí)次數(shù),具有較優(yōu)的泛化能力[8]。RBF-PLS模型于20 世紀(jì)90 年代被提出,廣泛應(yīng)用在識(shí)別、預(yù)測(cè)等方面,利用神經(jīng)網(wǎng)絡(luò)解決語(yǔ)音識(shí)別、圖像識(shí)別等認(rèn)知類任務(wù)[9],對(duì)多變量混沌時(shí)間序列進(jìn)行的預(yù)測(cè)研究[10]。
本研究在以型孔直徑、型孔厚度、種箱速度、稻種含水率、刷種高度為試驗(yàn)因素的二次回歸正交充種性能試驗(yàn)研究基礎(chǔ)上[11],利用RBF-PLS 網(wǎng)絡(luò),對(duì)試驗(yàn)結(jié)果進(jìn)行預(yù)測(cè),得到充種合格率及芽種損傷率的擬合曲線圖、誤差曲線圖,并驗(yàn)證預(yù)測(cè)結(jié)果準(zhǔn)確性,為對(duì)其他農(nóng)業(yè)作業(yè)環(huán)節(jié)的預(yù)測(cè)研究提供參考。
試驗(yàn)材料為黑龍江省常用水稻品種墾鑒3 號(hào),含水率24.6%,芽長(zhǎng)1~2mm。試驗(yàn)設(shè)備為型孔翻版式水稻缽盤精量播種機(jī)充種部件,主要由種箱、型孔板、刷種輪、翻板、清種舌等組成[2]。
試驗(yàn)及驗(yàn)證試驗(yàn)均在黑龍江八一農(nóng)墾大學(xué)工程學(xué)院播種實(shí)驗(yàn)室水稻缽盤精量播種試驗(yàn)臺(tái)上進(jìn)行。 具體試驗(yàn)步驟為:(1)啟動(dòng)交流電機(jī),使種箱行走至充種緩沖區(qū);將缽育秧盤固定于型孔板下方,微調(diào)秧盤位置,保證型孔中心與秧盤每穴中心大致對(duì)齊。(2)閉合種箱擋板,閉合翻板,倒入稻種,準(zhǔn)備試驗(yàn)。(3)調(diào)節(jié)變頻器參數(shù),待電機(jī)穩(wěn)定運(yùn)行,開始試驗(yàn)。種箱做往復(fù)運(yùn)動(dòng),打開擋板,稻種在重力及刷種輪帶動(dòng)下下落進(jìn)入型孔[2];種箱往復(fù)運(yùn)動(dòng)一次為一周期,一個(gè)試驗(yàn)周期結(jié)束,停止種箱運(yùn)動(dòng),打開翻板,稻種落入秧盤,充種過(guò)程結(jié)束。每組試驗(yàn)重復(fù)3 次。稻種落入型孔方式有多種[12],可通過(guò)人工查數(shù)方式記錄,記錄合格率、損傷率等性能指標(biāo)。建立RBF-PLS 算法構(gòu)建系統(tǒng)屬性模型,以試驗(yàn)因素為訓(xùn)練樣本,以評(píng)判指標(biāo)為輸出參數(shù),對(duì)所有數(shù)據(jù)進(jìn)行歸一化處理,輸入27 組歸一化后的訓(xùn)練樣本,利用Matlab 進(jìn)行結(jié)果預(yù)測(cè)[13],預(yù)測(cè)結(jié)束對(duì)數(shù)據(jù)進(jìn)行反歸一化處理,得到擬合曲線及誤差曲線圖。選取具有差異的10 組數(shù)據(jù)導(dǎo)入已建模型中,得到預(yù)測(cè)結(jié)果。 選取相同數(shù)據(jù),在充種裝置上進(jìn)行驗(yàn)證試驗(yàn),驗(yàn)證方案見(jiàn)表3,分析對(duì)比預(yù)測(cè)結(jié)果與試驗(yàn)結(jié)果,判斷預(yù)測(cè)結(jié)果準(zhǔn)確性。
圖1 充種結(jié)構(gòu)示意圖Figure 1 Schematic diagram of filling structure
本研究以二次回歸正交試驗(yàn)方案為預(yù)測(cè)試驗(yàn)方案,對(duì)型孔直徑、型孔厚度、種箱速度、稻種含水率、刷種高度五因素(表1)進(jìn)行27 組預(yù)測(cè)試驗(yàn)[11],得到每組試驗(yàn)評(píng)判指標(biāo)合格率與損傷率的數(shù)值(表2),歸一化處理結(jié)果見(jiàn)表3。
表1 因素水平編碼Table 1 Actors and levels
表2 二次回歸正交設(shè)計(jì)方案及結(jié)果Table 2 Quadratic orthogonal rotation combination design programmes and outcomes
表3 歸一化結(jié)果Table 3 Normalized results
RBF 是一種單隱層前饋神經(jīng)網(wǎng)絡(luò),包括輸入層、單隱層、輸出層[14],拓?fù)浣Y(jié)構(gòu)如圖2。 該網(wǎng)絡(luò)以高斯函數(shù)作為基函數(shù),隱層元素算法如式(1)[15]:
式中:x 為n 維輸入向量;ci為初始化隱藏層各神經(jīng)元的中心參數(shù);i 為隱含層第i 個(gè)神經(jīng)元的寬度向量;m 為隱含層神經(jīng)元總個(gè)數(shù);‖x-ci‖為歐氏范數(shù),表征向量x 與中心參數(shù)之間的正長(zhǎng)度。
隱層是連接輸入層與輸出層的橋梁,該層間接實(shí)現(xiàn)了從輸入向量x→輸出向量y 的非線性映射[16]。 最終輸出方程為:
圖2 RBF 網(wǎng)絡(luò)結(jié)構(gòu)Figure 2 RBF network structure
式中:ωik為連接權(quán)值;φi(X)為傳遞函數(shù)。
PLS 法是通過(guò)同時(shí)剔除自變量矩陣X 和因變量矩陣Y 中的非有用信息,利用回歸、主成分分析等統(tǒng)計(jì)方法,重新構(gòu)造系統(tǒng)信息排列組合方式、適用于樣本個(gè)數(shù)少于自變量個(gè)數(shù)的一種回歸模型。 PLS 法不受自變量相關(guān)性影響,可獲得最佳信息匹配函數(shù)。
設(shè)自變量矩陣 X={x1,x2,…,xp},因變量矩陣 Y={y1,y2,…,yq}。 分別在矩陣 X 與矩陣 Y 中提取出成分 t1和 u1(t1是數(shù)據(jù)列向量的線性組合,u1是標(biāo)簽列向量的線性組合[17],t1和u1應(yīng)盡可能大地?cái)y帶變異信息,且二者協(xié)方差應(yīng)達(dá)到最大,即轉(zhuǎn)變?yōu)榍蠼庾顑?yōu)結(jié)果問(wèn)題)。提取第一個(gè)t1和u1成分后,模型實(shí)施X 對(duì)t1的回歸以及Y 對(duì)u1的回歸[18]。 如果回歸方程精度可靠,則終止算法;反之,將利用X 被t1解釋后的殘余信息以及Y 被t2解釋后的殘余信息進(jìn)行第二輪的成分提取[19]。 如此往復(fù),直到精度可靠。 迭代后的回歸模型如式(3):
ρk=ωkβk,k=(1,2,…,r),其中:ωk為第 k 次迭代的單位向量;βk為第 k 次迭代的參數(shù)向量;r 為數(shù)據(jù)陣包含成分?jǐn)?shù)。
通過(guò)對(duì)RBF-PLS 網(wǎng)絡(luò)結(jié)構(gòu)模型建立,既保留了徑向基函數(shù)的網(wǎng)絡(luò)結(jié)構(gòu),又反映出自變量與因變量的對(duì)應(yīng)關(guān)系,是一種簡(jiǎn)單的網(wǎng)絡(luò)回歸模型[20]。RBF 可實(shí)現(xiàn)可調(diào)參數(shù)至網(wǎng)絡(luò)輸出的線性轉(zhuǎn)化,但需求解權(quán)值參數(shù)。有學(xué)者曾使用最小二乘法求解參數(shù),但最小二乘法增大回歸系統(tǒng)估計(jì)值方差、泛化能力弱、模型敏感,改變樣本集中個(gè)別數(shù)據(jù),參數(shù)便有較大差異。 因此,學(xué)者逐步利用偏最小二乘法求得模型參數(shù),該方法不僅具有較優(yōu)泛化能力,還可提高模型精度與穩(wěn)定性,減少學(xué)習(xí)的次數(shù)及降低多重相關(guān)的影響。在水稻缽盤精量播種裝置充種性能試驗(yàn)中,將型孔直徑、型孔厚度、種箱速度、稻種含水率、刷種高度五項(xiàng)數(shù)據(jù)設(shè)為訓(xùn)練樣本[11],輸入向量X 為m×5 維矩陣;將合格率、損傷率設(shè)為輸出參數(shù),輸出向量Y 為m×2 維矩陣。具體算法步驟為:(1)將27 組試驗(yàn)數(shù)據(jù)作為訓(xùn)練樣本,對(duì)于樣本集進(jìn)行RBF-PLS 網(wǎng)絡(luò)構(gòu)建,得到RBF-PLS 網(wǎng)絡(luò)的泛化模型。 (2)將得到的網(wǎng)絡(luò)對(duì)集合U中的樣本進(jìn)行泛化,設(shè)立精度閾值e1,目的是防止提取過(guò)多的主成分而產(chǎn)生過(guò)擬合現(xiàn)象。 計(jì)算泛化的均方根誤差rms,當(dāng)rms<e1時(shí),停止提取主成分。 (3)將得到的網(wǎng)絡(luò)對(duì)整個(gè)數(shù)據(jù)集X 中訓(xùn)練數(shù)據(jù)進(jìn)行泛化,設(shè)立精度閾值e2,當(dāng)泛化的均方根誤差rmsnT 小于e2時(shí)停止增加RBF 網(wǎng)絡(luò)中的隱節(jié)點(diǎn)[21]。設(shè)立精度閾值e2的目的是防止產(chǎn)生過(guò)擬合的現(xiàn)象。 (4)如果 rmsnT>e2,則重復(fù)步驟(1)~(3)。 如果 rmsnT<e2,算法結(jié)束。 針對(duì)本研究試驗(yàn),設(shè)定 e1=e2=0.05。 利用Matlab,繪制試驗(yàn)數(shù)據(jù)點(diǎn)的預(yù)測(cè)值曲線及誤差曲線。 以27 組二次正交旋轉(zhuǎn)為建?;A(chǔ)數(shù)據(jù),獲得充種合格率與芽種損傷率擬合曲線與誤差曲線。 由圖3 和圖4 可知, 任一次充種試驗(yàn), 所獲結(jié)果真實(shí)值與利用RBF-PLS 建立的預(yù)測(cè)模型的預(yù)測(cè)值值差異較小。隨“0 水平”試驗(yàn)次數(shù)增加,合格率變化趨勢(shì)逐步平穩(wěn),為95%;損傷率不斷減小,趨于0.35%。
圖3 充種合格率擬合及誤差曲線Figure 3 Filling qualified rate and error curve fitting
(1)預(yù)測(cè)樣本。 預(yù)測(cè)樣本見(jiàn)表 4。 (2)預(yù)測(cè)程序。 將表 4 中 10 組數(shù)據(jù)導(dǎo)入訓(xùn)練好的 RBF-PLS 網(wǎng)絡(luò),程序?yàn)椋簃n=tramnmx(m,minp,maxp);n=sim(net_1,mn);nn=postmnmx(n,mint,maxt)。 (3)結(jié)果預(yù)測(cè)(nn)。 運(yùn)用 Matlab 仿真得出10 組預(yù)測(cè)試驗(yàn)樣本的合格率與損傷率:
可得,第5 組數(shù)據(jù)充種合格率最高為97.7%、損傷率較低為0.29%。
依據(jù)1.2 試驗(yàn)方法進(jìn)行10 組驗(yàn)證試驗(yàn),試驗(yàn)設(shè)計(jì)見(jiàn)表4,結(jié)果見(jiàn)表5。 由表5 可知,組5 充種合格率最高為97.14%,損傷率較低為 0.29%。 組 2、組 3、組 6 充種合格率較低,原因?yàn)椋航M 2 型孔直徑過(guò)大、厚度過(guò)厚,種箱速度較高,每穴囊種個(gè)數(shù)高于應(yīng)囊基數(shù),充種合格率較低;組3 含水率過(guò)高,芽種粘結(jié)力較大,種箱速度較高,充種不充分;組6 充種速度過(guò)快,充種不充分。 其余6 組受試驗(yàn)條件、隨機(jī)誤差或機(jī)器震動(dòng)等因素影響,充種合格率有波動(dòng),充種合格率最低為67.5%。 組8、組9、組10 芽種損傷率過(guò)高,原因?yàn)樾涂字睆健⒑穸容^小,且種箱運(yùn)動(dòng)速度過(guò)快,有“磕種”現(xiàn)象存在。
通過(guò)將試驗(yàn)結(jié)果與預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析, 得到誤差值如表6。 由表6 可知, 充種合格率最大誤差為2.0%, 最小誤差為 0.31%, 平均誤差為 0.864%; 損傷率最大誤差為 0.69%, 最小誤差為 0.02%, 平均誤差為0.035%。 誤差在評(píng)價(jià)標(biāo)準(zhǔn)允許的范圍之內(nèi),預(yù)測(cè)較準(zhǔn)確。
表4 待預(yù)測(cè)數(shù)據(jù)點(diǎn)Table 4 Group forecast input data
表5 驗(yàn)證試驗(yàn)結(jié)果Table 5 Verification test results
表6 試驗(yàn)結(jié)果與預(yù)測(cè)結(jié)果誤差值Table 6 Error of test results and prediction results
在農(nóng)業(yè)生產(chǎn)過(guò)程中,神經(jīng)網(wǎng)絡(luò)模型多用于作物產(chǎn)量、病蟲害的預(yù)測(cè)[22-23],但對(duì)農(nóng)業(yè)播種相關(guān)作業(yè)過(guò)程的性能預(yù)測(cè)較少。因此,全面了解各種網(wǎng)絡(luò)優(yōu)缺點(diǎn),理清建模思路與原理,將網(wǎng)絡(luò)預(yù)測(cè)功能推廣至其它作物,如谷子、糜子等小籽粒穴播充種性能的預(yù)測(cè),或其他農(nóng)業(yè)生物質(zhì)生長(zhǎng)過(guò)程的預(yù)測(cè),如作物生物量、種子發(fā)芽率、芽種出苗率、土壤特定元素含量的預(yù)測(cè)等[24-27]。神經(jīng)網(wǎng)絡(luò)的種類諸多,如BP 神經(jīng)網(wǎng)絡(luò)、RBF 神經(jīng)網(wǎng)絡(luò)及各類編碼機(jī)等。與BP 神經(jīng)網(wǎng)絡(luò)相比,RBF 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)結(jié)構(gòu)更簡(jiǎn)單、收斂速度更快、局部逼近能力更強(qiáng)。 并通過(guò)與PLS 算法的結(jié)合,可有效的減少運(yùn)算節(jié)點(diǎn)及數(shù)據(jù)節(jié)點(diǎn)個(gè)數(shù),使充種模型的建立更加簡(jiǎn)潔精準(zhǔn)。使用RBF-PLS 方式的建模預(yù)測(cè),模型簡(jiǎn)單,誤差率較低,可以進(jìn)行推廣使用。
通過(guò)研究中充種合格率與芽種損傷率擬合曲線可得,因數(shù)水平編碼雖不斷變化,但合格率與漏播率實(shí)際數(shù)值與RBF-PLS 網(wǎng)絡(luò)模型誤差較小,為0.37%和0.035%。當(dāng)因素的水平值為“0 水平”附近時(shí),充種合格率與芽種損傷率擬合曲線數(shù)值趨于穩(wěn)定,為95%和0.35%。利用構(gòu)建的RBF-PLS 網(wǎng)絡(luò)模型對(duì)合格率與損傷率預(yù)測(cè),得到當(dāng)型孔直徑為11mm,型孔厚度為4mm、種箱速度為0.4m·s-1,稻種含水率為23%、刷種高度為3mm 時(shí),充種合格率最高為97.7%,損傷率較低為0.29%。 對(duì)模型進(jìn)行充種性能臺(tái)架試驗(yàn),得到驗(yàn)證試驗(yàn)結(jié)果與預(yù)測(cè)結(jié)果差別不大,合格率為97.14%,損傷率0.29%。 誤差在評(píng)價(jià)標(biāo)準(zhǔn)允許的范圍之內(nèi),預(yù)測(cè)較準(zhǔn)確。