文/王孝宇
特約編輯:艾 華
【導(dǎo)讀】本文基于粒子群優(yōu)化后的支持向量機(jī)技術(shù),通過(guò)MATLAB R2017b平臺(tái)提取柑桔葉片的形態(tài)、顏色、紋理等8個(gè)特征參數(shù),建立了可以對(duì)大雅柑、愛媛38號(hào)和晚熟血橙進(jìn)行分類的模型。該模型的識(shí)別準(zhǔn)確率為93.33%,預(yù)測(cè)一份樣本的時(shí)間約為0.514 s。試驗(yàn)結(jié)果表明,該模型能夠快速準(zhǔn)確地對(duì)各類柑桔葉片進(jìn)行分類,為柑桔分類機(jī)的研究提供了決策依據(jù)。
我國(guó)是柑桔的重要原產(chǎn)地之一,柑桔資源豐富,優(yōu)良品種繁多,柑桔味甘酸、性涼,入肺、胃經(jīng);具有順氣、止咳、健胃、化痰、消腫、止痛、疏肝理氣等多種功效,所以是很好的中藥材[1-2]。不同柑桔品種由于受遺傳特征影響,生長(zhǎng)期間的外觀形狀也有差異。傳統(tǒng)的柑桔品種識(shí)別方法是借助植株顏色和紋理等外觀特征進(jìn)行判斷,勞動(dòng)強(qiáng)度大,長(zhǎng)時(shí)間的識(shí)別容易產(chǎn)生視覺疲勞,很難滿足快速識(shí)別的要求[3]。因此,利用圖像處理技術(shù)快速準(zhǔn)確識(shí)別不同柑桔品種的方法成為最新的研究方向。
圖像處理技術(shù)已廣泛應(yīng)用于植物生產(chǎn)管理和品種識(shí)別中,如田間雜草識(shí)別[4-5]、病蟲害識(shí)別[6-7]、葡萄品種識(shí)別[8-9]、柑桔質(zhì)量檢測(cè)與分級(jí)[10]等。基于柑桔植株的特征提取來(lái)識(shí)別柑桔品種的研究未見報(bào)道。由于柑桔葉片中包含大量用來(lái)區(qū)分不同品種的外觀特征信息,且存活時(shí)間長(zhǎng),易于采集[11]。本研究在柑桔基地隨機(jī)采集了3個(gè)品種的葉片,每個(gè)品種分別采集50片葉片,隨機(jī)選取30片葉作為研究對(duì)象。以電腦、相機(jī)、光源等搭建硬件采集系統(tǒng),分別對(duì)每張柑桔葉片進(jìn)行圖像采集。然后基于MATLAB R2017b平臺(tái)提取顏色、紋理共8個(gè)特征參數(shù),利用粒子群優(yōu)化算法的支持向量機(jī)建立模型進(jìn)行品種識(shí)別,并對(duì)識(shí)別結(jié)果進(jìn)行分析。
1.1 供試材料 在某柑桔苗基地隨機(jī)采集采用常規(guī)方法栽培的3個(gè)品種的柑桔苗葉片,1#品種大雅柑、2#品種愛媛38號(hào)、3#品種晚熟血橙。采集時(shí)間為2018年4月25日。
1.2 圖像采集 每個(gè)品種分別采集30張圖片(見圖1)。在特制的有燈光的密閉箱體中,用相機(jī)拍攝葉片。燈箱的規(guī)格(長(zhǎng)×寬×高)為30 cm×15 cm×25 cm。箱體用黑色棉布遮擋,防止外界光線干擾;箱體中部偏下放置4 mm的雙面毛玻璃載物臺(tái);箱體底部的照明光源為4只30 W的日光燈管,頂部固定相機(jī)。一共采集90幅圖片,按照1∶4的比例,隨機(jī)選擇4份作為訓(xùn)練集,1份作為預(yù)測(cè)集。本研究硬件實(shí)驗(yàn)環(huán)境為:Win7專業(yè)版64位操作系統(tǒng),惠普i5處理器,CPU為3.10GHz,6G運(yùn)行內(nèi)存。圖片的格式為JPG。軟件環(huán)境為MATLAB R2017b。采集圖像的硬件系統(tǒng)如圖2。
1.3 特征提取 利用MATLAB軟件平臺(tái)分別提取了葉片顏色、紋理等8個(gè)外觀特征(見表1)。將提取的特征寫入MAT文件中。
圖1 柑桔苗葉片圖像
1.4 支持向量機(jī)(SVM)由Vapnik與其領(lǐng)導(dǎo)的貝爾實(shí)驗(yàn)室研究小組根據(jù)統(tǒng)計(jì)學(xué)理論中的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則提出,它是一種新的機(jī)器學(xué)習(xí)技術(shù),可用于模式分類和非線性回歸[12],其主要思想是建立一個(gè)分類超平面作為決策曲面,使得正例和反例的隔離邊緣被最大化[13-14]。支持向量機(jī)最大優(yōu)勢(shì)是在小樣本情況下,也能得到識(shí)別效果。
1.5 粒子群優(yōu)化算法(PSO)的支持向量機(jī)。粒子群優(yōu)化算法是由美國(guó)社會(huì)心理學(xué)家James Kennedy和電工程學(xué)博士Russell Eberhart于1995年共同提出的,它是通過(guò)群體中粒子間的合作與競(jìng)爭(zhēng)產(chǎn)生的群體智能指導(dǎo)優(yōu)化搜索[12]。在實(shí)際應(yīng)用中,為了獲取精確度更高的SVM分類器,則需要對(duì)SVM建模的各個(gè)參數(shù)進(jìn)行優(yōu)化調(diào)整。本文利用PSO算法,針對(duì)SVM建模過(guò)程的參數(shù)取值進(jìn)行優(yōu)化調(diào)整,獲得較為精確、分類效果較好的分類器?;诹W尤簝?yōu)化算法的支持向量機(jī)實(shí)現(xiàn)步驟[15-17]如下:
(1)首先從獲取樣本向量集中篩選出支持向量構(gòu)成樣本訓(xùn)練集Y。
(2)利用樣本訓(xùn)練集Y中的每個(gè)支持向量可以獲得一組SVM分類器的參數(shù)組成一個(gè)粒子,從而組建粒子種群X。
(3)初始化獲得粒子種群X和速度,包括設(shè)定粒子群的初始參數(shù)c1,c2,初始速度矩陣V以及每個(gè)初始粒子個(gè)體最優(yōu)位置pi和全局最優(yōu)位置pg。
(4)選取函數(shù)作為粒子群的適應(yīng)度函數(shù),對(duì)粒子群中各個(gè)粒子的適應(yīng)度定標(biāo)。
圖2 采集圖像的硬件系統(tǒng)
表1 軟件提取的柑桔葉片特征
(5)根據(jù)所獲得粒子的適應(yīng)度函數(shù)值調(diào)整粒子個(gè)體最優(yōu)位置pi和全局最優(yōu)位置pg。
(6)根據(jù)前述(1)(2)對(duì)粒子的狀態(tài)進(jìn)行更新,從而獲得一組新的SVM分類器的參數(shù)。
(7)當(dāng)?shù)螖?shù)達(dá)到所要求的最大迭代次數(shù)或獲得滿足要求的粒子適應(yīng)函數(shù)值時(shí),終止迭代,輸出最優(yōu)解,否則返回第(4)步繼續(xù)運(yùn)算,直到達(dá)到最大迭代的次數(shù)或獲得滿足要求的粒子適應(yīng)值為止。
2.1 支持向量機(jī)。對(duì)測(cè)試集的90份柑桔葉片樣本進(jìn)行測(cè)試,預(yù)測(cè)的結(jié)果如圖3。建立的模型可以百分之百地準(zhǔn)確預(yù)測(cè)出大雅柑 (類別標(biāo)簽為“1”)和愛媛38號(hào)(類別標(biāo)簽為“2”)。但是該模型幾乎無(wú)法區(qū)分愛媛38號(hào)和晚熟血橙 (類別標(biāo)簽為“3”),只能準(zhǔn)確地預(yù)測(cè)出2份晚熟血橙,而將剩下的8份樣本都預(yù)測(cè)成了愛媛38號(hào)。因此,該模型不太實(shí)用。
2.2 粒子群算法優(yōu)化后的支持向量機(jī)。由于僅僅基于支持向量機(jī)技術(shù)不能很好地預(yù)測(cè)柑桔葉片樣本的種類。因此考慮通過(guò)粒子群算法優(yōu)化支持向量機(jī)的參數(shù)后,建立模型。粒子群算法優(yōu)化支持向量機(jī)參數(shù)的進(jìn)化曲線如圖4。粒子群進(jìn)化曲線中最佳適應(yīng)度在93%附近,各代平均適應(yīng)度在70%附近上下波動(dòng),各代最佳適應(yīng)度在最佳適應(yīng)度和各代平均適應(yīng)度之間波動(dòng),主要靠近最佳適應(yīng)度。
粒子群優(yōu)化算法優(yōu)化支持向量機(jī)后,建立的模型預(yù)測(cè)結(jié)果如圖5。該模型能夠百分之百準(zhǔn)確地識(shí)別出大雅柑。將1份愛媛38號(hào)樣本錯(cuò)誤地預(yù)測(cè)為晚熟血橙,將1份晚熟血橙樣本錯(cuò)誤地預(yù)測(cè)為愛媛38號(hào)。該模型的準(zhǔn)確率為93.33%,預(yù)測(cè)一份樣本的時(shí)間約為0.514 s。本文針對(duì)傳統(tǒng)的支持向量分類器和粒子群優(yōu)化的支持向量機(jī)分類器做了對(duì)比分析(見表2)。實(shí)驗(yàn)結(jié)果表明,粒子群優(yōu)化的模型能快速準(zhǔn)確地區(qū)分3類柑桔葉片樣本,可應(yīng)用于實(shí)際中。
本研究在柑桔基地隨機(jī)采集了3個(gè)品種的葉片,基于MATLAB R2017b平臺(tái)提取顏色、紋理等8個(gè)特征參數(shù),利用本文提出的粒子群優(yōu)化后的支持向量機(jī)技術(shù),建立了可以對(duì)大雅柑、愛媛38號(hào)和晚熟血橙進(jìn)行分類的模型。該模型的準(zhǔn)確率為93.33%,預(yù)測(cè)一份樣本的時(shí)間約為0.514 s。結(jié)果表明,該模型能夠快速準(zhǔn)確地對(duì)各類柑桔葉片進(jìn)行分類,為柑桔分類機(jī)的研究提供了決策依據(jù)。本文使用的樣本較少,共90份。在今后的研究中如果增加樣本,可能會(huì)提高模型的準(zhǔn)確率。本文只對(duì)大雅柑、愛媛38號(hào)和晚熟血橙這3類樣本的分類進(jìn)行了試驗(yàn),在今后的研究中,如果增加柑桔葉片樣本的種類,更能擴(kuò)大它的應(yīng)用范圍。
圖3 基于SVM建立模型的柑桔品種預(yù)測(cè)結(jié)果
圖4 粒子群進(jìn)化曲線
圖5 基于PSO優(yōu)化SVM建立模型的柑桔品種預(yù)測(cè)結(jié)果
表2 兩種算法對(duì)比
[1] 趙祖華,華琦孜,李陶桂,等.廣西全州縣柑橘種植的氣候適宜性分析及區(qū)劃[J].安徽農(nóng)業(yè)科學(xué).2013,41(35):13496-13497
[2] 張?chǎng)┚?,張正桂,劉永忠,?3種常見草種對(duì)桔園雜草控制能力及對(duì)柑桔根系分布的影響[J].中國(guó)南方果樹,2018,47(1):22-24,29
[3] 莊珍珍,祝詩(shī)平,孫雪劍,等.基于機(jī)器視覺的煙葉自動(dòng)分組方法[J].西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,41(4):122-129
[4] 紀(jì)壽文,王榮本,陳佳娟,等.應(yīng)用計(jì)算機(jī)圖像處理技術(shù)識(shí)別玉米苗期田間雜草的研究[J].農(nóng)業(yè)工程學(xué)報(bào),2001,17(2):154-156
[5] 劉振恒.應(yīng)用圖像處理技術(shù)識(shí)別田間雜草方法的研究[D].哈爾濱:東北農(nóng)業(yè)大學(xué),2004
[6] 陳 麗,王蘭英.概率神經(jīng)網(wǎng)絡(luò)在玉米葉部病害識(shí)別中的應(yīng)用[J].農(nóng)機(jī)化研究,2011,33(6):145-148
[7] 汪京京,張 武,劉連忠,等.農(nóng)作物病蟲害圖像識(shí)別技術(shù)的研究綜述 [J].計(jì)算機(jī)工程與科學(xué),2014,36(7):1363-1370
[8] 孫宏杰.基于葉片圖像分析的葡萄品種識(shí)別方法研究[D].楊凌:西北農(nóng)林科技大學(xué),2014
[9] 宋 真,蔡 騁,顏永豐.基于葉片形態(tài)特征的葡萄品種自動(dòng)識(shí)別[J].計(jì)算機(jī)仿真,2012,29(3):307-310
[10] 敖 勤,徐桂珍.一種基于機(jī)器視覺的柑橘表面質(zhì)量檢測(cè)方法[J].科技傳播,2014(4):141-142
[11] 鄧立苗,馬文杰.基于支持向量機(jī)的玉米葉片品種識(shí)別[J].江蘇農(nóng)業(yè)科學(xué),2014,42(6):372-374
[12] 張 艷.基于粒子群優(yōu)化支持向量機(jī)的變壓器故障診斷和預(yù)測(cè)[D].成都:西華大學(xué),2011
[13]MATLAB中文論壇.MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2010:4
[14]AdelAbusitta,MartineBellaiche,MichelDagenais.AnSVM-based framework fordetecting DoS attacks invirtualized clouds under changing environment[J].Journal of Cloud Computing:Advances,SystemsandApplications,2018,7:9
[15] HOUShourong,ZHOUYujie,LIUHongming,etal.ExploitingSupport Vector Machine Algorithm to Break the Secret Key[J].RADIOENGINEERING,2018,27(1):289-298
[16] 谷文成,柴寶仁,滕艷平.基于粒子群優(yōu)化算法的支持向量機(jī)研究[J].北京理工大學(xué)學(xué)報(bào),2014,34(7):705-709
[17] 潘 泓,李曉兵,金立左,等.一種基于二值粒子群優(yōu)化和支持向量機(jī)的目標(biāo)檢測(cè)算法 [J].電子與信息學(xué)報(bào),2011,33(1):117-121