盧澤如,蔣舜堯,熊勤學(xué),邱先進(jìn),周子堯,楊 權(quán)
(長(zhǎng)江大學(xué)農(nóng)學(xué)院,湖北 荊州 434025)
目前國(guó)內(nèi)外對(duì)稻谷品種檢測(cè)方法主要包括苯酚染色法、幼苗鑒別法和分子標(biāo)記法等[1],這些方法檢測(cè)成本高、鑒定周期長(zhǎng)、檢測(cè)效果差、檢測(cè)結(jié)果一致性不好。隨著計(jì)算機(jī)技術(shù)和圖像處理技術(shù)的迅速發(fā)展,特別是人工智能、大數(shù)據(jù)和云計(jì)算的出現(xiàn)為機(jī)器視覺技術(shù)對(duì)稻谷品種進(jìn)行快速、高效分類識(shí)別提供了技術(shù)條件。Macalalad 等[2]運(yùn)用圖像識(shí)別技術(shù)提取稻谷的面積、周長(zhǎng)、扁率等形態(tài)學(xué)差異特征值后,運(yùn)用最小距離法準(zhǔn)確從圖像中識(shí)別3 種稻谷品種;黃星奕等[3]介紹了一種把圖像的顏色特征和形狀特征結(jié)合起來進(jìn)行稻谷品種識(shí)別的新方法;熊利榮等[4]利用Bayes 判別法建立了秈稻、糯稻、粳稻3 大類的類別模型和9 個(gè)稻谷種子的品種模型,模型判別效果顯著;呂一波等[5]在對(duì)955 個(gè)玉米顆粒圖像研究的基礎(chǔ)上,探討了用自然光和白熾燈照射下獲取的彩色模型來識(shí)別、分割玉米圖像的可行性,提出用直徑和圓形度參數(shù)來表征玉米的幾何特征;宋韜等[6]以表示玉米子粒輪廓的個(gè)體特征參數(shù)作為輸入信號(hào),用神經(jīng)網(wǎng)絡(luò)方法進(jìn)行玉米形態(tài)識(shí)別研究,對(duì)粒完整及粒破損的玉米子粒識(shí)別試驗(yàn)顯示,正確率為93%。盡管相關(guān)研究對(duì)農(nóng)作物品種和方法進(jìn)行了探究,但面對(duì)全國(guó)5 萬多個(gè)稻谷品種[7],只有建立稻谷品種特征庫,才能運(yùn)用云技術(shù)和圖像識(shí)別技術(shù)開展稻谷品種快速區(qū)分工作,稻谷品種形態(tài)學(xué)差異特征值的確立是建立稻谷品種特征庫的前提[8]。本研究運(yùn)用圖像識(shí)別技術(shù)提取31 個(gè)水稻品種的41 種形態(tài)學(xué)特征值,再利用統(tǒng)計(jì)分析方法,尋找出能區(qū)分稻谷品種差異的形態(tài)學(xué)特征值,以期為稻谷品種形態(tài)學(xué)檢測(cè)打下基礎(chǔ)。
供分析的稻谷品種有31 個(gè),每個(gè)品種有稻粒20~50 粒,品種間的形狀與顏色有一定差異,其名稱及圖片見表1。
表1 供分析的稻谷品種及圖片
1)掃描圖像。將稻谷連同調(diào)色板放在掃描儀上,設(shè)定掃描分辨率為180 dpi,掃描成jpg 格式的圖像。
2)圖像校正。將圖像在Image Pro Plus 軟件中打開,根據(jù)掃描分辨率和calibration->spatial 功能設(shè)置圖像空間分辨率;運(yùn)用calibration->intensity 結(jié)合調(diào)色板中RGB 值進(jìn)行色彩校正。
3)圖像識(shí)別。運(yùn)用measure->count/size 功能對(duì)圖像中稻谷進(jìn)行識(shí)別,識(shí)別方式選擇Automatic Dark Objects,如果稻谷有相連現(xiàn)象,用auot split 功能將它們分開。
4)稻谷特征量提取。在軟件中選取所有測(cè)定內(nèi)容,點(diǎn)擊measure 鍵,并選取提取41 種形態(tài)學(xué)特征值參數(shù)[9](表2),其中31 個(gè)表征幾何特征參數(shù),10 個(gè)表征顏色特征參數(shù),沒有選取表征位置特征的參數(shù)。
表2 特征量及釋義
5)稻谷特征量導(dǎo)出。選擇軟件中的導(dǎo)出功能,將提取的41 種形態(tài)學(xué)特征值導(dǎo)至Excel 軟件中供統(tǒng)計(jì)分析。
采用判別分析方法對(duì)稻谷形態(tài)學(xué)特征值進(jìn)行篩選。31 個(gè)品種按0~30 編號(hào),然后在SPSS 軟件中打開,在判別分析方法中選取因子逐步引入剔除方法,總樣本數(shù)為1 290。
采用聚類方法對(duì)稻谷形態(tài)學(xué)特征值統(tǒng)計(jì)分析。將每個(gè)稻谷品種所有特征值進(jìn)行平均,然后在SPSS軟件中打開,選取系統(tǒng)聚類分析方法,引入因子為前面選定的特征值,輸出中要求輸出分類圖。
設(shè)不同的引入最小偏F值和剔除最大偏F值,觀察分類結(jié)果的準(zhǔn)確率,隨著引入最小偏F值和剔除最大偏F值的增加(每次增加0.5),其入選的因子減少,回代準(zhǔn)確率開始為73.0%,逐步下降。當(dāng)引入最小偏F值為8 和剔除最大偏F值為6 時(shí),入選因子為9 個(gè),其回代準(zhǔn)確率為62.8%;以后再增加F值,入選因子為和回代準(zhǔn)確率不變,至引入最小偏F值為23 和剔除最大偏F值為21 時(shí),入選因子為6 個(gè),其回代準(zhǔn)確率為43.3%。綜合上述分析,以入選因子少、回代準(zhǔn)確率損失不大為原則,選取引入最小偏F值為8 和剔除最大偏F值為6 作為判別分析引入因子的原則,確定了9 個(gè)因子為表征稻谷品種差異的形態(tài)學(xué)特征值,分別是Aspect(最長(zhǎng)軸與最短軸比率)、Density(max)(最 大強(qiáng)度)、Area(面積)、Density(green)(綠光強(qiáng)度)、Axis(minor)(短軸長(zhǎng)度)、Density(mean)(強(qiáng)度均值)、Density(blue)(藍(lán)光強(qiáng)度)、Axis(major)(長(zhǎng)軸長(zhǎng)度)、Density(std.dev。)(強(qiáng)度標(biāo)準(zhǔn)差)。這9 個(gè)因子中表示幾何形狀的有4 個(gè),分別為Aspect、Area、Axis(minor)和Axis(major);表示顏色的有5 個(gè),分別為Density(max)、Density(green)、Density(mean)、Density(blue)和Density(std.dev.)。說明稻谷品種的差異主要表現(xiàn)在幾何形狀上,如稻谷有短圓、細(xì)長(zhǎng)、雙尖等特征,在顏色上有淡黃色、深黃色等。
分別用稻谷品種形態(tài)學(xué)41 個(gè)特征值和選取的9個(gè)差異特征值,采用SPSS 軟件的系統(tǒng)聚類分析方法,分別對(duì)31 個(gè)稻谷品種進(jìn)行分類,其分類結(jié)果一致(圖1),說明這9 個(gè)差異特征值能代表41 個(gè)特征值,能反映稻谷品種之間的差異。由圖1 可知,把31種水稻品種分為5 類,分別是淡黃色短圓型、淡黃色長(zhǎng)扁型、深黃色長(zhǎng)扁型、深黃色短圓型和深黃色雙尖型,由于沒有這31 個(gè)品種的分類信息,不清楚分類結(jié)果與其品種屬性是否存在內(nèi)存聯(lián)系。
圖1 31 個(gè)稻谷品種的聚類分布
本研究成功提取了能反映稻谷品種差異的9 個(gè)特征值,分別為表示幾何形狀的Aspect、Area、Axis(minor)、Axis(major)4 個(gè)特征值和表示顏色的Density(max)、Density(green)、Density(mean)、Density(blue)、Density(std.dev)5 個(gè)特征值,對(duì)31 個(gè)稻谷品種進(jìn)行了聚類分析。
由于沒有稻谷品種的其他信息,沒有對(duì)特征值與稻谷生物學(xué)性狀進(jìn)行分析,作物表型是作物品種內(nèi)在特征的表現(xiàn),這也是需要進(jìn)一步研究的方向。