梁培生++孫輝+++張國政++方璦++周二杰
doi:10.15889/j.issn.1002-1302.2016.10.124
摘要:為探究快速、無損進(jìn)行蠶蛹雌雄分類的可行性,利用機(jī)器視覺技術(shù)對蠶蛹圖像進(jìn)行獲取,應(yīng)用主成分分析法結(jié)合BP人工神經(jīng)網(wǎng)絡(luò)方法進(jìn)行分析識別。首先,對所得圖像進(jìn)行灰度化、濾波去噪、二值化、特征提取等預(yù)處理,再應(yīng)用主成分分析法得到包含蠶蛹88.94%特征信息的4個主成分,將其作為BP神經(jīng)網(wǎng)絡(luò)的輸入變量,對應(yīng)的蠶蛹性別作為輸出。建立1個BP神經(jīng)網(wǎng)絡(luò)的識別模型,該模型對于蠶蛹分類的準(zhǔn)確率達(dá)到98%,符合我國農(nóng)業(yè)部桑蠶行業(yè)的標(biāo)準(zhǔn)。機(jī)器視覺結(jié)合主成分分析和BP神經(jīng)網(wǎng)絡(luò)的方法能夠準(zhǔn)確進(jìn)行蠶蛹分類,對實際生產(chǎn)具有積極的指導(dǎo)意義。
關(guān)鍵詞:機(jī)器視覺;蠶蛹;主成分分析;BP神經(jīng)網(wǎng)絡(luò);分類
中圖分類號: TP391.41;S126文獻(xiàn)標(biāo)志碼: A文章編號:1002-1302(2016)10-0428-03
收稿日期:2015-09-06
基金項目:國家科技支撐計劃(編號:2011BAD33B04)。
作者簡介:梁培生(1964—),男,廣西蒼梧人,副研究員,主要從事蠶業(yè)機(jī)械與裝備研究。E-mail:305141797@qq.com。桑蠶養(yǎng)殖是我國的傳統(tǒng)行業(yè),也是中國重要的歷史文化產(chǎn)業(yè)。為了最大限度地提高桑蠶業(yè)的經(jīng)濟(jì)價值及產(chǎn)品附加值,在實際生產(chǎn)中通常要將雌雄蠶繭分類使用。目前,蠶種場及相關(guān)生產(chǎn)企業(yè)往往在家蠶化蛹后的幾天內(nèi)手工進(jìn)行雌雄蠶蛹分類鑒別工作,此方法不僅耗費大量人工成本,且因工人主觀因素及技術(shù)程度的不同導(dǎo)致識別準(zhǔn)確率不高,實際過程中還可能對蠶蛹造成傷害。近年來,關(guān)于蠶繭的無損檢測法主要有近紅外光譜技術(shù)、X射線成像技術(shù)等,但由于檢測設(shè)備價格昂貴、檢測精度及檢測環(huán)境要求等原因均未得到推廣。
不同性別的蠶蛹其身體形態(tài)、紋理特征有較大差異,人工識別是基于這些差異特性而進(jìn)行的,因此可運(yùn)用識別蠶蛹圖像的方式達(dá)到目的。通過試驗設(shè)備獲得蠶蛹圖像,對蠶蛹的形態(tài)特征、紋理特征進(jìn)行提取并轉(zhuǎn)化為數(shù)據(jù)信息,利用主成分分析和神經(jīng)網(wǎng)絡(luò)的方式進(jìn)行識別。
1設(shè)備與材料
1.1試驗設(shè)備
采用MER-125-30UM型工業(yè)攝像機(jī)(北京大恒圖像公司)進(jìn)行圖像采集。采用自行設(shè)計的采集試驗平臺,包括環(huán)形光源、透明的PVC材料輸送帶、簡易暗箱等。采用DELL的I5計算機(jī)主機(jī),采用Matlab 12.0作為軟件支持設(shè)備進(jìn)行圖像預(yù)處理、分析、模型建立、識別等。以上設(shè)備經(jīng)過性能測試,均符合試驗條件。
1.2樣品
供試的150粒蠶蛹樣品均由中國農(nóng)業(yè)科學(xué)院蠶業(yè)研究所提供,其中雌雄蠶蛹各75粒。蠶蛹為同一品種在飼養(yǎng)條件基本一致的情況下培育,蠶蛹所處時期為化蛾期的前3~4 d,此時蠶蛹的形態(tài)特征未發(fā)生改變,且蠶蛹的紋理特征最為明顯,利于對特征數(shù)據(jù)的準(zhǔn)確提取。
2原理與方法
對工業(yè)攝像機(jī)采集得到的圖像進(jìn)行圖像預(yù)處理和圖像形狀、紋理特征的提取,然后應(yīng)用主成分分析對原始數(shù)據(jù)進(jìn)行預(yù)處理,得到低維的主成分變量,作為BP神經(jīng)網(wǎng)絡(luò)的輸入變量。利用建立的BP神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)對數(shù)據(jù)的分析和識別。
2.1圖像預(yù)處理及特征提取
通過設(shè)計的試驗平臺及試驗設(shè)備采集蠶蛹圖像,由于采集過程中受到設(shè)備、光線等條件的干擾,會產(chǎn)生一定的噪聲,影響圖像質(zhì)量。通過對圖像的預(yù)處理可去除圖像的干擾及不必要的背景信息,獲取高質(zhì)量的目標(biāo)圖像。主要的預(yù)處理措施有圖像的灰度化、濾波去噪、直方圖均衡化、邊緣提取、圖像分割、二值化、形態(tài)學(xué)處理等(圖1)。
經(jīng)過預(yù)處理后,圖像的質(zhì)量得到提高,為圖像的特征提取做好準(zhǔn)備。試驗共提取了150幅圖像的周長、面積、偏心率、圓度、對比度、能量、逆差距、相關(guān)性、熵等9個信息量,為試驗準(zhǔn)備了充足的數(shù)據(jù)。
2.2主成分分析法
主成分分析是一種常用且重要的多元統(tǒng)計分析方法,該方法通過對相關(guān)范圍內(nèi)的數(shù)據(jù)結(jié)構(gòu)內(nèi)在關(guān)系進(jìn)行分析研究,以方差最大化為原則,以多指標(biāo)數(shù)據(jù)轉(zhuǎn)化成較少數(shù)量的相互獨立且能表示原數(shù)據(jù)大部分信息的變量為目的,對原始蠶蛹圖像所包含的信息量進(jìn)行線性擬合,從而得到較低維數(shù)的變量,取代原始高維數(shù)據(jù)變量。在實際試驗應(yīng)用中通常取前幾個主成分,不僅能達(dá)到數(shù)據(jù)降維的目的,同時也利于數(shù)據(jù)的觀察,一般推薦T值(各主成分的累積貢獻(xiàn)率)應(yīng)大于80%。該T值可用較少數(shù)量的不相關(guān)主成分表示原始數(shù)據(jù),減少了數(shù)據(jù)的交叉及信息冗余;同時,通過對原始數(shù)據(jù)自身相關(guān)性進(jìn)行分析來確定各分量權(quán)重,基于數(shù)據(jù)的內(nèi)在結(jié)構(gòu)關(guān)系,不需要人為確定,使試驗結(jié)果更加公正、合理化且具有說服力。
2.3BP神經(jīng)網(wǎng)絡(luò)
誤差反向傳播網(wǎng)絡(luò)(back-propagation network,BP)是人工神經(jīng)網(wǎng)絡(luò)的一種,是一種按誤差逆?zhèn)鞑ニ惴ㄔ瓌t進(jìn)行訓(xùn)練的多層前饋網(wǎng)絡(luò),實現(xiàn)輸入、輸出變量之間的高度非線性映射關(guān)系。BP神經(jīng)網(wǎng)絡(luò)包括輸入層、隱含層、輸出層,同層之間相互獨立,數(shù)據(jù)信息前向傳播(圖2)。該網(wǎng)絡(luò)的學(xué)習(xí)規(guī)則為最速下降法,然后通過數(shù)據(jù)的反向傳播來調(diào)整神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的各權(quán)重及偏置量,達(dá)到數(shù)據(jù)的誤差平方和最小的目的,使網(wǎng)絡(luò)的輸出值逼近期望值,誤差滿足學(xué)習(xí)要求才結(jié)束。近年來,BP神經(jīng)網(wǎng)絡(luò)的應(yīng)用在分類、預(yù)測等方面表現(xiàn)出優(yōu)越性,本研究在蠶蛹分類中進(jìn)行試驗探討。
3結(jié)果與分析
3.1主成分提取
利用主成分分析方法對蠶蛹圖像提取出的數(shù)據(jù)進(jìn)行優(yōu)化,即輸入各蠶蛹圖像的特征數(shù)據(jù),計算出其數(shù)據(jù)的特征矩陣以及各主因子載荷矩陣,然后選取合適的主成分矩陣,將二者組合得到的新向量作為BP神經(jīng)網(wǎng)絡(luò)的輸入向量。主成分分析不僅能夠降低神經(jīng)網(wǎng)絡(luò)的復(fù)雜程度,對提高網(wǎng)絡(luò)模型的收斂速度和識別率也有較好作用。
蠶蛹圖像經(jīng)過預(yù)處理及特征提取后,將提取到的蠶蛹圖像周長、面積、偏心率、圓度、對比度、能量、逆差距、相關(guān)性、熵等9個信息量作為原始數(shù)據(jù)。運(yùn)用主成分分析的方法進(jìn)行降維處理之后,在保證主成分的累積貢獻(xiàn)率不低于80%的情況下,提取前4個主成分作為BP神經(jīng)網(wǎng)絡(luò)的輸入變量,由此得到圖像原始數(shù)據(jù)的特征值(表1)。
根據(jù)試驗的精度及識別準(zhǔn)確率要求,本試驗取前4個較大的特征值,分別為5.261 3、1.280 3、0.929 4、0.533 1,此時累積貢獻(xiàn)率達(dá)到88.935%。根據(jù)特征向量與原始數(shù)據(jù)組合形成的新向量,即分析后得到的主成分。每個圖像樣本的9
個信息量經(jīng)主成分分析后化簡為4個輸入變量。
3.2BP神經(jīng)網(wǎng)絡(luò)
根據(jù)主成分分析結(jié)果(表1),選取前4個主成分即可表示蠶蛹圖像的主要信息,使圖像數(shù)據(jù)由原來的150×9減少至150×4,大幅降低了運(yùn)算量。建立相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型,進(jìn)行蠶蛹雌雄分類的訓(xùn)練和預(yù)測。將數(shù)據(jù)樣本分為訓(xùn)練集和測試集,分別從雌雄蠶蛹中隨機(jī)選取各50個樣本用來建立模型,剩余的50粒蠶蛹用來預(yù)測結(jié)果。
利用Matlab 12.0軟件編寫程序,對輸入變量進(jìn)行數(shù)據(jù)歸一化操作,并建立BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)。經(jīng)過多次試驗對比分析,在輸入層為4層、輸出層為2層、系統(tǒng)允許誤差為0001、學(xué)習(xí)速率為0.05、慣性系數(shù)為0.8、最大迭代次數(shù)為 1 000 次時,驗證當(dāng)神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元數(shù)目為8時,該神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)較為簡單,且收斂速度快、精度高。選取 4-8-2的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練和識別驗證,其中隱含層傳輸函數(shù)為非線性的tansig型函數(shù),輸出層的隱含函數(shù)為純線性的purelin型函數(shù)。
3.3PCA-BP模型預(yù)測
將經(jīng)過降低維數(shù)處理的預(yù)測樣本主成分?jǐn)?shù)據(jù)在訓(xùn)練好的預(yù)測模型中進(jìn)行驗證,并利用網(wǎng)絡(luò)的識別結(jié)果與蠶蛹的真實性別進(jìn)行對比。由模型生成的神經(jīng)網(wǎng)絡(luò)回歸圖(圖3)可知,模型的歸一化系數(shù)均大于99.5%,即驗證網(wǎng)絡(luò)預(yù)測識別建立的模型對蠶蛹性別的識別較為成功。
一般來說,神經(jīng)網(wǎng)絡(luò)的性能優(yōu)劣主要由其泛化能力來評價。對測試樣本的驗證分析表明,該網(wǎng)絡(luò)模型具有很強(qiáng)的泛化能力,能夠較為真實地反映輸入與輸出之間的關(guān)系。由圖4可知,神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練收斂曲線在迭代次數(shù)為112時達(dá)到要求。檢測結(jié)果(表2)顯示,50粒蠶蛹的識別準(zhǔn)確率達(dá)到98%。結(jié)果表明,本方法所建立的PCA-BP神經(jīng)網(wǎng)絡(luò)模型能夠較為準(zhǔn)確地對蠶蛹性別進(jìn)行分類識別。
4結(jié)論
利用機(jī)器視覺技術(shù)獲取蠶蛹圖像,經(jīng)圖像處理得到了蠶蛹的形態(tài)及紋理特征,結(jié)合主成分分析法和BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立了蠶蛹的雌雄識別模型,對蠶蛹進(jìn)行分類識別研究。由對測試集的驗證結(jié)果可知,蠶蛹的識別準(zhǔn)確率達(dá)到了98%,但仍存在一定的誤判率。BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練及網(wǎng)絡(luò)記憶仍存在不穩(wěn)定性,有待進(jìn)一步研究。
機(jī)器視覺結(jié)合主成分分析和BP神經(jīng)網(wǎng)絡(luò)的方法,對蠶蛹的識別分類具有很好的作用,為蠶蛹雌雄識別分類提供了一種新途徑,對桑蠶業(yè)具有重要的經(jīng)濟(jì)和實用價值。
參考文獻(xiàn):
[1]劉敬全,于振誠,崔玉梅,等. 家蠶熒光繭色判性蠶品種熒光、春玉的育成及其一代雜交種的選配[J]. 蠶業(yè)科學(xué),1996,22(3):155-159.
[2]王茜蒨,黃志文,劉凱,等. 基于主成分分析和人工神經(jīng)網(wǎng)絡(luò)的激光誘導(dǎo)擊穿光譜塑料分類識別方法研究[J]. 光譜學(xué)與光譜分析,2012,32(12):3179-3182.
[3]Jin T M,Wu X Q,Pan S Y,et al. Distinguishing sex of silkworm chrysalis in cocoon by NIR with fiber optics[J]. Acta Agriculturae Boreali-Sinica,1994,9:35-37.
[4]吳江,黃富榮,黃才歡,等. 近紅外光譜結(jié)合主成分分析和BP神經(jīng)網(wǎng)絡(luò)的轉(zhuǎn)基因大豆無損鑒別研究[J]. 光譜學(xué)與光譜分析,2013,33(6):1537-1541.
[5]李玉品,陳斌,顏輝,等. 近紅外光譜分析法在蠶繭性別鑒定上的應(yīng)用[J]. 江蘇農(nóng)業(yè)科學(xué),2009(1):237-239.
[6]Chen Q S,Zhao J W,F(xiàn)ang C H,et al. Feasibility study on identification of green,black and Oolong teas using near-infrared reflectance spectroscopy based on support vector machine(SVM)[J]. Spectrochimica Acta,Part a,2007,66(3):568-574.
[7]蔡健榮,劉兵,李永平,等. X射線成像技術(shù)判別蠶繭性別[J]. 農(nóng)業(yè)工程學(xué)報,2012,28(8):275-279.
[8]楊丹,趙海濱,龍哲,等. MATLAB圖像處理[M]. 北京:清華大學(xué)出版社,2013.
[9]MATLAB中文論壇. MATLAB神經(jīng)網(wǎng)絡(luò)30個案例分析[M]. 北京:北京航空航天大學(xué)出版社,2010.
[10]馬嘯,袁洪福,宋春風(fēng),等. 衰減全反射紅外光譜法快速分類和識別多種食用油的方法[J]. 光譜學(xué)與光譜分析,2015,35(7):1879-1884.
[11]岳田利,彭幫柱,袁亞宏,等. 基于主成分分析法的蘋果酒香氣質(zhì)量評價模型的構(gòu)建[J]. 農(nóng)業(yè)工程學(xué)報,2007,23(6):223-227.
[12]Zhang J H,Qi L J,Ji R H,et al. Cotton diseases identification based on rough sets and BP neural network[J]. Transactions of the Chinese Society of Agricultural Engineering,2012,28(7):161-167.