馮文康,梁忠偉,劉曉初,謝鑫成,趙 傳,蕭金瑞
(1.廣州大學(xué)機(jī)械與電氣工程學(xué)院,廣州 510006;2.廣州大學(xué)廣東省太陽能智能灌溉裝備科技創(chuàng)新中心,廣州 510006;3.廣東工業(yè)大學(xué)機(jī)電工程學(xué)院,廣州 510006)
1.1.1 土壤樣本采樣和質(zhì)地測定
土壤樣品采集地點(diǎn)在嶺南地區(qū)廣東省廣州市(22°26′~23°56′N,112°57′~114°3′E),地處亞熱帶沿海,屬海洋性亞熱帶季風(fēng)氣候,是中國光、熱和水資源最豐富的地區(qū)之一,年平均氣溫22.3℃,年降雨量約為1 720 mm,雨熱同期,氣候適宜,土壤肥沃,農(nóng)產(chǎn)品豐富。廣州的番禺區(qū)、南沙區(qū)、黃埔區(qū)等各區(qū)的50個采樣地點(diǎn)在圖1中標(biāo)記,每個采樣點(diǎn)采集20個樣品,共1 000個樣品,每個樣品取250 g±10%,在去除地表存在的所有植被后,使用標(biāo)準(zhǔn)泥鏟從休耕農(nóng)田的土壤表層(0~15 cm)收集樣本,保持樣品之間距離d(d>200 m),以確保采集樣品之間合理的獨(dú)立性,采樣點(diǎn)有水稻田、菜園、旱田、甘蔗地、芭蕉地。樣品被收集在有標(biāo)簽的密封袋里,然后運(yùn)回廣州大學(xué)-廣東省太陽能智能灌溉裝備科技創(chuàng)新中心實(shí)驗(yàn)室進(jìn)行處理[18]。在實(shí)驗(yàn)分析前,所有樣品在光照強(qiáng)度1.5×104Lux,風(fēng)速16 m/s條件下24 h風(fēng)干,研磨后通過孔徑為2 mm的篩網(wǎng),得到篩選樣本。土壤是砂粒、粉砂和黏粒的混合物,而土壤類型是按照其砂粒(0.05~2 mm)、粉粒(0.002~0.05 mm)和黏粒(<0.002 mm)所占百分比不同而定義的。土壤顆粒采用比重法[19]測定,計(jì)算出顆粒在土壤樣本的占比。美國農(nóng)業(yè)部土壤質(zhì)地分類標(biāo)準(zhǔn)[20]采用三角坐標(biāo)圖解法。等邊三角形的三條邊分別代表黏粒、粉粒及砂粒的含量(%),對土壤質(zhì)地類型進(jìn)行分類。如圖2中紅點(diǎn)A位于粉壤土區(qū)域,其中砂粒5%、粉砂70%和黏粒25%。
圖1 土壤采樣點(diǎn)的地理位置Fig.1 Geographical location of soil sampling points
圖2 美國土壤質(zhì)地分類三角坐標(biāo)圖Fig.2 Triangular coordinates of USDA soil texture classification
1.1.2 土壤圖像采樣
在土壤圖像采集中,照明條件極大影響成像任務(wù)的質(zhì)量,為了減小自然光亮度等其他因素的影響,設(shè)計(jì)并制作了一體化的圖像采集裝置[21],如圖3所示,具體包括:成像盒(12 cm×8 cm×5 cm)、相機(jī)、方形支架(4 cm×4 cm×2 cm)、直流電源適配器、照明LED燈泡(2 W,12 V)以及變光開關(guān)控制器;其中,成像盒為長方體,頂部有圓形窗口,圓形窗口用于放置相機(jī),盒體內(nèi)壁均涂為黑色;所述相機(jī)放置在盒體的圓形窗口上,用于為土壤樣本進(jìn)行拍照;方形支架位于盒體底部,用于固定土壤樣本;照明LED燈泡位于盒體內(nèi)部,照明燈由白色LED條組成,LED條水平黏貼于盒體的內(nèi)壁,用于為土壤樣本進(jìn)行拍照時提供補(bǔ)光;開關(guān)控制器位于盒體外側(cè),與照明LED燈電連,用于控制照明LED燈的亮度,在對土壤樣本進(jìn)行拍照時提供100 lm和200 lm等強(qiáng)度光;直流電源適配器(輸出電壓12 V,電流500 mA)與LED燈連接,位于盒體外部,用于為照明LED燈供電。
圖3 土壤樣本圖像采集裝置Fig.3 Image acquisition device
在本文中,紋理特征和顏色特征作為土壤圖像分析的特征[22,23]。紋理是反映土壤圖像的一種顯著性特征,紋理特征提取由Haralick特征局部二值模式計(jì)算得來,采用統(tǒng)計(jì)類中的haralick特征和局部二值模式(Local binary pattern,LBP)對土壤圖像紋理特征提取。Haralick特征算法被用于紋理量化圖像表面結(jié)構(gòu)組織[24]。紋理特征由Haralick特征使用4個灰度共生矩陣[22-25]來計(jì)算總共13個紋理特征向量,土壤圖像像素之間相鄰從左到右h=0°、左對角線h=45°、上到下h=90°和右對角線h=135°計(jì)算出4個矩陣,根據(jù)4個矩陣計(jì)算其13個統(tǒng)計(jì)量,可有效消除土壤圖片旋轉(zhuǎn)帶來的不同結(jié)果。
局部二值模式(LBP)算法[25]是計(jì)算土壤圖像紋理特征的方法,如圖4(a)所示土壤照片像素圖,本文選用圓形領(lǐng)域的LBP算子,16個像素采樣點(diǎn),每個圓的像素點(diǎn)半徑設(shè)置為2,圖4(b)是土壤圖像處理后的紋理效果圖。在中心的像素點(diǎn),與相鄰的8個像素進(jìn)行比較,若周圍的像素值大于中心像素標(biāo)為1,否則標(biāo)為0;如在3×3領(lǐng)域內(nèi)的8個點(diǎn)可產(chǎn)生8位二進(jìn)制,即是該中心像素的LBP值,圖4(c)是LBP直方圖統(tǒng)計(jì)出的26個特征向量。
圖4 LBP處理后土壤圖像Fig.4 Soil image after LBP treatment
顏色特征是土壤圖像的一個重要特征,由顏色直方圖[26]和Hu矩[27]特征組合。Hu矩是具有平移、旋轉(zhuǎn)和尺度不變性的土壤圖像的顏色特征,利用圖像變換的常量中心矩計(jì)算出Hu矩,用7維特征向量表示。這組矩的前6個Hu矩特征對平移、縮放、旋轉(zhuǎn)和反射是不變的,而第7個Hu矩的符號因土壤圖像反射而改變。
顏色直方圖是圖像廣泛采用的顏色特征,特別適于描述那些難以進(jìn)行自動分割的圖像。因此本文選用HSV直方圖作為土壤圖像的顏色特征,將圖像的RGB顏色空間轉(zhuǎn)換為HSV分量并計(jì)算顏色直方圖的數(shù)值,然后統(tǒng)計(jì)H、S、V 3個通道的直方圖并進(jìn)行歸一化,歸一化后將3個維度的直方圖數(shù)據(jù)進(jìn)行拼接,每個通道256個維度特征,共256×6組數(shù)據(jù),然后縮放到512個維度特征。
脂肪酸(fatty acid)是油脂(甘油三酯)的主要組成單元[1],其結(jié)構(gòu)是末端含有羧基的長碳?xì)滏湥话愀鶕?jù)碳鏈的飽和程度分為飽和脂肪酸和不飽和脂肪酸,極少數(shù)特殊油脂的脂肪酸可能含有羥基、環(huán)氧基等。是自然界中最常見的有機(jī)物之一,廣泛存在于動植物或微生物等的油脂中。在日常生活中,脂肪酸產(chǎn)品被廣泛用于化妝品、洗滌劑、肥皂、工業(yè)脂肪酸鹽、涂料、油漆、橡膠等領(lǐng)域,不愧為油脂工業(yè)的3大中間體之首[2]。脂肪酸羧基的反應(yīng)最常見的自然是中和皂化成鹽等,在上篇已經(jīng)講述[3],這里主要講述羧酸的酯化、酰鹵化、酸酐化、過氧化、脫羧等反應(yīng),由于a-H的活性是受到羧酸的影響,故該反應(yīng)也放在本文中稍加講解。
圖5是基于CNN-RF模型結(jié)合3種組合(顏色特征、紋理特征、顏色特征+紋理特征)方法對土壤樣本的黏粒、粉粒和砂粒百分比進(jìn)行回歸預(yù)測,519個顏色特征和39個紋理特征累積產(chǎn)生總共558個全局特征。這些全局特征與CNN提取的512維特征一起輸入RF中,土壤質(zhì)地類型是由砂粒、粉粒和黏粒的不同含量比例確定。
圖5 基于CNN-RF模型結(jié)合圖像特征方法Fig.5 Image feature method based on CNN-RF model
為對土壤質(zhì)地圖像進(jìn)行可靠識別,考慮到平臺計(jì)算能力和圖像清晰度運(yùn)算要求準(zhǔn)則,圖像分辨率采用256×256像素可以有效滿足土壤質(zhì)地圖像計(jì)算速度和信息表達(dá)清晰度等多項(xiàng)要求。因此該研究將采集獲得的土壤質(zhì)地圖片調(diào)整到256×256像素分辨率,輸入到CNN-RF模型中。模型中第一個卷積塊和第二個卷積塊的卷積層的通道數(shù)分別為48和128,第三個卷積層的通道數(shù)為192,第三個卷積塊中卷積層的通道數(shù)為128。除第一個卷積層的卷積核大小為11×11外,其余卷積核大小均為3×3。卷積塊處理完后得到輸入圖像的高維特征,將其展平送入到線性塊中得到512維的特征向量。其中線性塊中Dropout層的概率參數(shù)取0.9,第一個線性層中全連接層為4 608維度,第2個線性層中全連接層為512維度,通過隨機(jī)森林(500決策樹)輸出并對土壤樣本中的黏粒、粉粒和砂粒百分比含量進(jìn)行回歸預(yù)測。
由于傳統(tǒng)CNN方法有許多不同的預(yù)訓(xùn)練結(jié)構(gòu),這些結(jié)構(gòu)被標(biāo)記數(shù)據(jù)成功訓(xùn)練,如1 000個不同的類組成的Image Net。由于這類網(wǎng)絡(luò)提取的特征是針對特定數(shù)據(jù)進(jìn)行分類的,因此這類網(wǎng)絡(luò)結(jié)構(gòu)不能直接用于土壤圖像的分類。另外,Softmax作為卷積神經(jīng)網(wǎng)絡(luò)分類器同時會導(dǎo)致泛化能力不足的問題。綜合上述問題,本文結(jié)合卷積神經(jīng)網(wǎng)絡(luò)與隨機(jī)森林的算法模型。通過CNN提取512維特征,這些特征要與機(jī)器學(xué)習(xí)提取的特征輸入到RF中,在土壤樣本圖片上,既要預(yù)測土壤質(zhì)地,黏粒、粉粒和砂粒的百分含量,還要根據(jù)這些進(jìn)行土壤質(zhì)地分類。所以既有回歸預(yù)測也有分類,故選用RF進(jìn)行分類[28]。機(jī)器學(xué)習(xí)算法提取出來的558×1與CNN提取出來的特征一起輸入到RF模型分類器。算法流程見圖6。回歸預(yù)測圖像中砂粒、粉粒和黏粒的百分比進(jìn)而進(jìn)行土壤質(zhì)地分類。得到土壤質(zhì)地預(yù)測混淆矩陣,來驗(yàn)證模型的可靠性、準(zhǔn)確性。
圖6 結(jié)合機(jī)器學(xué)習(xí)算法的CNN-RF模型Fig.6 CNN-RF model combined with machine learning algorithm
平均絕對誤差(MAE)和均方根誤差(RMSE)相當(dāng)于L1范數(shù)和L2范數(shù),評估預(yù)測和真實(shí)的接近程度,其值越小越好。判定系數(shù)(R2),其取值范圍[0,1],越接近于1越好。
土壤是由黏粒、粉粒和砂粒不同含量比例混合而成,由3個預(yù)測值通過土壤質(zhì)地三角圖,得到黏土、粉黏土、壤砂土、砂黏壤土、砂黏土、砂壤土、粉壤土、粉黏壤土、黏壤土、壤土、砂土和粉土等土壤類型。提取混淆矩陣來評估土壤質(zhì)地識別性能。這個矩陣中的值代表了的提出模型識別的實(shí)際土壤種類。主對角線上的數(shù)值表明樣品的分類正確,而非對角元素上的數(shù)值表明樣品的分類錯誤。通過使用混淆矩陣推導(dǎo)出幾個統(tǒng)計(jì)指標(biāo)如下所示。
準(zhǔn)確度(Accuracy)是表示所有樣本中完全預(yù)測對的占比,精密度(Precision)是所有預(yù)測為正確的樣本中,實(shí)際為正確的樣本的占比,靈敏度(Sensitivity)是所有正確例中預(yù)測為正確例占比,特異性(Specificity)是所有不正確類中預(yù)測為不正確類占比,AUC(Area Under Curve)曲線(AUC curves)是靈敏度與特異性和的一半,用來評估給定算法的性能,AUC的值接近于1越好。靈敏度參數(shù)表示模型如何檢測正確樣本,特異性參數(shù)表示模型如何檢測不正確樣本,準(zhǔn)確性參數(shù)定義了如何同時識別不正確和正確樣本。當(dāng)前兩個參數(shù)增大時,模型精度提高,當(dāng)前兩個參數(shù)減小時,精度減小。
式中:TP表示樣本為正確并正確預(yù)測;FP表明樣本呈正確,但預(yù)測錯誤;TN代表的是錯誤樣本,但分類正確;FN描述的樣本是不正確的,但不正確的預(yù)測。
本文實(shí)驗(yàn)采用70%的土壤質(zhì)地識別模型數(shù)據(jù)作為測試集訓(xùn)練,另外30%的數(shù)據(jù)作為訓(xùn)練集測試。該模型采用端對端的方式進(jìn)行訓(xùn)練和測試,使用Adam優(yōu)化器,學(xué)習(xí)率為0.001。具體的訓(xùn)練步驟為:①初始化模型參數(shù);②將訓(xùn)練數(shù)據(jù)輸入到模型中并得到512維的輸出結(jié)果;③512維數(shù)據(jù)輸入到隨機(jī)森林中得到預(yù)測的損失;④通過優(yōu)化器反向傳播更新模型的參數(shù);⑤重復(fù)上述②~④的步驟,直到第200輪結(jié)束。圖7為CNN-RF模型對土壤圖像的訓(xùn)練和測試的損失函數(shù),損失值顯示了在訓(xùn)練過程中為每個圖像所做的誤差的總和,以找到最佳的權(quán)值作為模型參數(shù)。從圖7可以看出,由于該函數(shù)在訓(xùn)練集和測試集上都呈下降趨勢,CNN-RF模型經(jīng)過了良好的訓(xùn)練,并收斂為正確的聚類分類。這個模型是收斂的,這對于CNN-RF土壤質(zhì)地識別模型來說是符合邏輯的,當(dāng)這個代價函數(shù)最小化到其最小值時,就可以實(shí)現(xiàn)準(zhǔn)確的分類。
圖7 CNN-RF土壤質(zhì)地識別模型進(jìn)行訓(xùn)練和測試數(shù)據(jù)的損失函數(shù)Fig.7 Loss function of CNN-RF soil texture recognition model training and test data
CNN-RF模型預(yù)測黏粒、粉粒和砂粒的土壤識別驗(yàn)證數(shù)據(jù)統(tǒng)計(jì),該模型依然使用的3種組合特征(顏色特征、紋理特征、顏色特征+紋理特征),如表1所示。預(yù)測砂粒MAE值為3.39,RMSE值為3.73,R2值為0.99;粉粒MAE值為3.51,RMSE值為3.81,R2值為0.98;黏粒MAE值為3.41,RMSE值為3.77,R2值為0.99。MAE值和RMSE值越小,R2越接近于1,模型性能更優(yōu)。從結(jié)果可知,MAE值和RMSE值更小,R2更接近于1,CNN-RF模型(顏色+紋理特征模型)性能更好。
表1 不同圖像特征的CNN-RF模型Tab.1 CNN-RF models with different image features
圖8是CNN-RF土壤質(zhì)地識別模型的判定系數(shù)R2圖;預(yù)測黏粒、粉粒和砂粒的R2分別是0.99、0.98和0.99。由此可知,CNN-RF模型的R2接近于1,性能優(yōu)良。
圖8 CNN-RF模型預(yù)測性能對比Fig.8 Comparison of prediction performance between RF and CNN-RF models
土壤的黏粒、粉粒和砂粒的真實(shí)值和預(yù)測值對比圖,由圖9可知,CNN-RF模型的預(yù)測值與真實(shí)值存在差異性較小,如序號10~50的樣品之間,進(jìn)一步說明CNN-RF模型性能優(yōu)良。
圖9 CNN-RF模型的預(yù)測土壤黏粒、粉粒和砂粒含量Fig.9 Prediction of soil clay,silt and sand content by CNN-RF model
圖10是CNN-RF模型得出的結(jié)果?;煜仃囷@示土壤圖像的預(yù)測分布。圖中矩陣的主對角線上顏色加深的元素表示預(yù)測值與實(shí)際值相等?;煜仃囎鳛橐环N結(jié)果可視化工具,可以得到更高級的分類指標(biāo):Accuracy(精確度),Precision(精密度),Specificity(特異性),Sensitivity(靈敏度),AUC曲線。以上指標(biāo)可以用來驗(yàn)證CNN-RF算法性能。
圖10 CNN-RF土壤質(zhì)地預(yù)測混淆矩陣Fig.10 CNN-RF soil texture prediction confusion matrix
表2是CNN-RF模型對土壤圖像識別的各種性能統(tǒng)計(jì)結(jié)果??芍狢NN-RF模型識別準(zhǔn)確度為99.43%,精密度為96.66%,靈敏度為96.78%,特異性為99.69%,AUC曲線為98.23%。結(jié)果表明,這些參數(shù)都接近100%,該CNN-RF土壤質(zhì)地識別模型性能較優(yōu)。
表2 CNN-RF模型預(yù)測土壤質(zhì)地類型的性能結(jié)果 %Tab.2 Performance results of CNN-RF model for predicting soil texture types
土壤是由黏粒、粉粒和砂粒組成。對采集的土壤圖像進(jìn)行灰度化、去噪處理。面向土壤圖像中提取其顏色特征和紋理特征。通過土壤圖像中局部二值模式(LBP)與Haralick特征計(jì)算出土壤圖像的紋理特征;并將圖像的RGB顏色空間轉(zhuǎn)換為HSV分量計(jì)算出土壤的顏色特征;卷積神經(jīng)網(wǎng)絡(luò)(CNN)和隨機(jī)森林(RF)算法相結(jié)合為CNN-RF模型,基于CNNRF模型結(jié)合3種組合(顏色特征、紋理特征、顆粒特征+顏色特征)方法對土壤樣本中的黏粒、粉粒和砂粒百分含量進(jìn)行回歸預(yù)測。
CNN-RF模型與其他傳統(tǒng)機(jī)器學(xué)習(xí)性能對比,VGG16-RF模型預(yù)測砂粒的MAE值為3.37,RMSE值為3.87,R2值為0.96,粉粒的MAE值為3.58,RMSE值為3.98,R2值為0.96,黏粒的MAE值為3.57,RMSE值為3.81,R2值為0.97(見表3)。VGG16的網(wǎng)絡(luò)相對于本研究的網(wǎng)絡(luò)更深,能夠容納的特征量更多,本應(yīng)該具有更良好的性能,但在測試時指標(biāo)卻低于簡單的網(wǎng)絡(luò)。是因?yàn)閂GG網(wǎng)絡(luò)由于參數(shù)量更多,導(dǎo)致在訓(xùn)練集出現(xiàn)了過擬合的現(xiàn)象,從而影響了測試集的指標(biāo)結(jié)果;RF模型預(yù)測砂粒的MAE值為3.58,RMSE值為4.35,R2值為0.96,預(yù) 測粉 粒 的MAE值 為3.73,RMSE值 為4.40,R2值 為0.85,預(yù) 測黏 粒 的MAE值 為3.63,RMSE值 為4.61,R2值 為0.97;KNN模型預(yù)測砂粒的MAE值為3.76,RMSE值為4.61,R2值為0.94,預(yù)測粉粒的MAE值為3.79,RMSE值為4.63,R2值為0.84,預(yù)測砂粒的MAE值為4.06,RMSE值為4.62,R2值為0.94。而CNN-RF土壤質(zhì)地識別模型(顏色特征+紋理特征)的性能是最優(yōu),預(yù)測砂粒MAE值為3.39,RMSE值為3.73,R2值為0.99;粉粒MAE值為3.51,RMSE值為3.81,R2值為0.98;黏粒MAE值為3.41,RMSE值為3.77,R2值為0.99。與傳統(tǒng)的機(jī)器學(xué)習(xí)算法相比,CNN之所以能有更好的表現(xiàn),是因?yàn)樗梢詮母顚哟紊系玫接筛鞣N邊、線、角組成的圖像,并捕捉圖像的內(nèi)容??芍狢NN-RF模型(顏色+紋理特征)性能更好。
表3 CNN-RF模型性能與其他模型性能的對比Tab.3 Performance comparison between CNN-RF model and other models
本文對廣州的番禺區(qū)、增城區(qū)、黃埔區(qū)等不同區(qū)域進(jìn)行1 000個土壤樣本采樣,提取土壤圖像中的顏色特征和紋理特征,通過CNN-RF模型進(jìn)行土壤黏粒、粉粒和砂粒含量預(yù)測,根據(jù)土壤質(zhì)地三角圖實(shí)現(xiàn)了土壤質(zhì)地的高效精準(zhǔn)識別。通過該模型采集總數(shù)據(jù)中700個數(shù)據(jù)用于訓(xùn)練,另外300個用于土壤質(zhì)地識別模型測試,每個訓(xùn)練過程使用200個訓(xùn)練周期。CNN-RF模型預(yù)測黏粒、粉粒和砂粒的土壤識別驗(yàn)證數(shù)據(jù)統(tǒng)計(jì),該模型模型使用3種組合(顏色特征、紋理特征、顏色特征+紋理特征),獲得準(zhǔn)確度、精密度、靈敏度、特異性、AUC曲線下面積等重要統(tǒng)計(jì)參數(shù)分別為99.43%、96.66%、96.78%、99.69%、98.23%。通過與類似算法進(jìn)行比較,可看出本文提出的CNN-RF土壤質(zhì)地識別模型(顏色特征+紋理特征)在關(guān)鍵性能指標(biāo)上最優(yōu),為廣州嶺南丘陵土壤的耕作和農(nóng)作物質(zhì)量提升提供可靠技術(shù)支撐。