劉廣強,盧煥達,余心杰,舒振宇
(1.太原科技大學電子信息工程學院,太原 030024;2.浙江大學寧波理工學院,浙江 寧波 315100)
基于壓縮感知理論的葡萄干分類研究
劉廣強1,盧煥達2,余心杰2,舒振宇2
(1.太原科技大學電子信息工程學院,太原 030024;2.浙江大學寧波理工學院,浙江 寧波 315100)
為實現(xiàn)機器視覺準確判別葡萄干品種,提出了一種基于壓縮感知理論(Compressed Sensing,CS)的葡萄干品種分類方法。以3種葡萄干為研究對象,并提取葡萄干圖像的形態(tài)、顏色和紋理特征參數(shù),得到葡萄干訓練樣本的數(shù)據(jù)詞典矩陣。壓縮感知理論分類算法首先利用由葡萄干圖像特征參數(shù)組成的數(shù)據(jù)詞典矩陣對每一個葡萄干測試樣本進行稀疏性表示,得到稀疏向量。然后利用稀疏向量對葡萄干測試樣本進行重構(gòu),并計算重構(gòu)樣本與測試樣本之間的殘差,最后通過比較殘差的大小來確定測試樣本的類別。將提出的方法與最小二乘法支持向量機(Least squares support vector machine,LSSVM)和BP(Back Propagation)網(wǎng)絡的識別結(jié)果做了對比和分析。試驗結(jié)果表明,基于壓縮感知理論的分類方法對于3個葡萄干品種的綜合分類準確率為99.17%,獲得了最好的分類效果。
圖像處理;特征提取;壓縮感知;稀疏表示;葡萄干分類
新疆吐魯番是中國葡萄的重要生產(chǎn)基地。新疆葡萄甲天下,尤其以吐魯番的葡萄最富盛名,吐魯番位于新疆天山東部山間盆地,那里種植葡萄面積達50萬畝,其葡萄年產(chǎn)量50萬噸,擁有的葡萄品種100余種,吐魯番的葡萄干產(chǎn)量更是占據(jù)了全國的四成還多,新疆的葡萄干產(chǎn)自吐魯番地區(qū)。新疆葡萄干根據(jù)選用葡萄種類的不同可分為:無核白、特級綠、無核綠香妃、無核玫瑰香妃、無核紅香妃、王中王、馬奶子、男人香、玫瑰香、金皇后、香妃紅、黑加侖、沙漠王、巧克力、哈密王等。傳統(tǒng)的葡萄干品種鑒別主要依靠觀測和品嘗,該方法不僅花費大量人力,而且對葡萄干品種分選的質(zhì)量和效率也不高。
近年來,基于計算機視覺技術在農(nóng)產(chǎn)品籽粒品種分類以及生物雌性識別中顯示出客觀的優(yōu)越性[1-6]。唐晶磊等[4]提出一種基于BP神經(jīng)網(wǎng)絡的葡萄干分級技術的研究,該方法基于葡萄干圖像的顏色特性和形狀特性建立了葡萄干分級檢測模型。龔攀等[5]提出了一種基于計算機視覺的蠶蛹識別方法。通過研究雌雄蠶蛹圖像的信息,發(fā)現(xiàn)其尾部紋理特征和形體特征等信息可作為識別雌雄蠶蛹的特征。展慧等[6]提出了一種基于機器視覺的板栗分級檢測方法。文中根據(jù)板栗圖像提取紋理特征參數(shù)和顏色特征參數(shù)作為識別不同級別板栗的特征。
壓縮感知理論是由Candes E J[7]、Romberg J[8]、Tao T[9]和Donoho D L[10]等科學家于2004年提出的。壓縮感知,又稱壓縮傳感,該理論一經(jīng)提出,就引起學術界和工業(yè)界的廣泛關注。它在模式識別、圖像處理、信號處理、視頻信號壓縮、信息論、無線通信等領域受到高度關注。另外,壓縮感知理論在農(nóng)產(chǎn)品分類識別中的應用也顯示出它一定的優(yōu)勢,與傳統(tǒng)的智能分類算法相比,基于壓縮感知理論的分類方法具有更高的準確性。
圖像含有豐富的內(nèi)容,從葡萄干圖像中提取的形態(tài)特征參數(shù)、顏色特征參數(shù)和紋理特征參數(shù)可以有效的對葡萄干圖像進行分類識別。本文選取3個葡萄干品種作為研究對象,品種一為新疆哈密王、品種二為新疆無核白、品種三為新疆王中王,通過提取其圖像的形態(tài)特征參數(shù)、顏色特征參數(shù)以及紋理特征參數(shù),利用壓縮感知理論方法進行葡萄干品種分類,為葡萄干品種分類識別提供一種新的方法。葡萄干樣本情況如表1所示。
表1 葡萄干樣本情況表Tab.1 Table of raisins samples
圖1 識別系統(tǒng)流程圖Fig.1 The identification system flowchart
文中識別系統(tǒng)的流程如圖1所示。所有的實驗數(shù)據(jù)采集采用如圖2所示的計算機視覺系統(tǒng),該系統(tǒng)包括由兩個白色LED燈組成的光源、一臺計算機和一個佳能EOS60D型數(shù)碼單反相機。為保證拍攝角度、高度及焦距的一致性,相機由三腳架固定后定角度、定高度及定焦距拍攝,采集的葡萄干圖像以JPG格式進行存儲。拍攝完成后由USB數(shù)據(jù)線將采集的葡萄干圖像直接傳至計算機進行保存。
圖2 計算機視覺系統(tǒng)Fig.2 Computer vision system
2.1 圖像預處理
在采集葡萄干圖像時由于受到周圍燈光、灰塵雜質(zhì)以及其他因素的影響,會對采集的葡萄干數(shù)字圖像產(chǎn)生一定的噪聲干擾。因此,在對采集的葡萄干圖像進行特征提取時,首先需要將采集的葡萄干圖像進行預處理以消除噪聲對葡萄干圖像產(chǎn)生的影響。本文利用MATLAB對采集的所有葡萄干圖像進行去噪、去背景、灰度化、二值化、邊緣檢測、圖像分割等預處理[11-12]操作。預處理后的葡萄干圖像效果如圖3所示。
圖3 預處理后的葡萄干圖像Fig.3 Raisins image after preprocessing
2.2 形態(tài)特征
對計算機圖像識別系統(tǒng)而言,被識別對象的形態(tài)特征是一個賴以識別的重要特征。本文選用圖像常用的形態(tài)特征:面積、周長、圓度、矩形度和伸長度作為葡萄干圖像的形態(tài)特征參數(shù)[13]。然后由這5個形態(tài)特征參數(shù)構(gòu)成葡萄干圖像的形態(tài)特征向量。
2.3 顏色特征
葡萄干顏色特征是基于葡萄干數(shù)字圖像分割出的每個顏色分量的灰度直方圖的分析。我們可以從標準直方圖[14]提取顏色特征,直方圖的定義如式(1)所示:
其中l(wèi)表示葡萄干圖像總的灰度級數(shù),ni表示葡萄干圖像中具有灰度級i的像素的個數(shù),i表示葡萄干圖像每個像素的灰度級,N表示一幅葡萄干圖像總的像素數(shù)。公式描述的是葡萄干圖像中具有灰度級i的像素出現(xiàn)的頻率。葡萄干RGB圖像3個顏色分量的直方圖如4所示。
圖4 葡萄干RGB圖像三個分量的直方圖Fig.4 Histogram of 3-channel RGB image of raisins
一般不直接將葡萄干圖像的每個顏色分量的灰度直方圖作為葡萄干圖像特征,在此定義以下顏色特征系數(shù)來反映葡萄干圖像的顏色特征。
其中μ表示均值,σ2表示方差,μ1表示歪斜度,μ2表示峰態(tài),μ3表示能量。
本文由MATLAB獲取葡萄干圖像的彩色空間中紅(R)、綠(G)、藍(B)顏色分量后,分別統(tǒng)計R、G、B分量中的μ、σ2、μ1、μ2和μ3共15個顏色特征系數(shù)構(gòu)成葡萄干圖像的顏色特征向量[15]。
2.4 紋理特征
灰度共生矩陣[16]被定義為從灰度為i的像素點離開某個固定位置關系的像素點上的灰度為j的概率?;叶裙采仃囉肏δ表示:
式(17)中,L表示圖像的灰度級,其中i,j表示兩個像素的灰度。
為了方便分析,矩陣中的元素用概率值表示,即將矩陣中的各元素Hδ(i,j)除以各元素之和S,得到各元素都小于1的歸一化δ(i,j),即:
紋理特征是圖像重要的特征之一。從灰度共生矩陣抽取出的主要紋理特征參數(shù)有以下幾種。
其中φ1表示二階矩,φ2表示對比度,φ3表示相關,φ4表示熵。μ4、μ5、σ21、σ22分別定義為:
文中取二階矩、熵、對比度、相關的均值和標準差共8個參數(shù)作為葡萄干圖像的紋理特征[17]。然后由這8個紋理特征參數(shù)構(gòu)成葡萄干圖像的紋理特征向量。部分葡萄干樣本紋理特征數(shù)據(jù)如表2所示。
3.1 壓縮感知理論
壓縮感知理論分類算法是近年來出現(xiàn)的一種新的模式識別算法?;粲锏龋?7]探索壓縮感知理論在蘋果病害識別中的應用,有效的對蘋果病害進行識別。進而基于壓縮感知理論的分類算法在諸多分類識別問題上得到廣泛的應用并取得成功。
表2 部分葡萄干樣本紋理特征數(shù)據(jù)Tab.2 Texture feature data of partial raisins samples
考慮實域上某個有限長一維離散時間信號X,若存在某組正交變換基φ,使得式(17)成立[18],則X稱φ在上K是稀疏的。
式中:X為有限長一維離散時間信號,X∈Rn×1;φ為正交變換基,也稱為稀疏矩陣,φ∈Rn×n;y為X在稀疏矩陣φ上的稀疏表示系數(shù),即稀疏向量,y中只有K個元素不為0,y∈Rn×1;n為信號維數(shù)。
在此基礎上,可以用一個與稀疏矩陣不相關的矩陣Ψ對信號X進行線性測量,使得式(18)成立。
式中:Ψ為觀測矩陣,Ψ∈Rm×n;z為觀測向量,z∈Rm×1,其中m<n;式(18)為欠定方程,無法從z求解出信號X.由壓縮感知理論知[19-20],可以通過求解最優(yōu)l0范數(shù)來解決這個問題,即:
然而式(19)求解是個NP問題,求解非常困難。壓縮感知的研究理論表明[19-20],在y足夠稀疏的情況下,式(19)的解等價于l1范數(shù)意義下的最優(yōu)化問題的解,即:
此時式(20)為一個凸優(yōu)化問題,可以方便的利用匹配追蹤法、內(nèi)點法、梯度投影法等成熟算法進行求解[21-22]。
3.2 壓縮感知理論的葡萄干分類
分類識別問題是通過對若干已知類別的樣本集進行訓練,然后建立分類模型,從而利用分類模型判斷測試樣本所屬的具體類別。具體步驟如下:
假設有k類葡萄干,第i類葡萄干有ni個訓練樣本。則第i類的ni個樣本的特征數(shù)據(jù)可以組成如下矩陣:
則k類葡萄干所有的訓練樣本數(shù)據(jù)可以組成如下數(shù)據(jù)詞典矩陣:
其中n=n1+n2+nk.
對于任意一個未知分類的葡萄干測試樣本W(wǎng)∈Rm,如果數(shù)據(jù)詞典矩陣充分完備,該測試樣本可以由A中數(shù)據(jù)線性表示,即:
其中Q∈Rn.當m<n時,方程W=AQ為欠定方程,其解不是唯一的。由壓縮感知理論知,可以利用式(20)進行求解。
通過解式(23)求得葡萄干測試樣本W(wǎng)∈Rm的稀疏向量.進而對任意的i(1≤i≤k),可以定義葡萄干測試樣本W(wǎng)∈Rm的第i個重構(gòu)樣本:
其中δi(Q)∈Rn是一個新的與第i類有關的系數(shù)向量。具體而言,除了保留Q中與第i類有關的系數(shù)外,令其它系數(shù)全部為零。這樣,可以得到k個重構(gòu)樣本.分別計算葡萄干測試樣本W(wǎng)與重構(gòu)樣本之間的殘差,并確定使殘差達到最小的類別為葡萄干測試樣本所屬的分類,即:
選取3類不同品種的葡萄干樣本,每類葡萄干隨機選取160粒作為訓練樣本。通過選取5個形態(tài)特征、15個顏色特征和8個紋理特征共28個參數(shù)構(gòu)成葡萄干圖像特征向量,并由此構(gòu)成維的數(shù)據(jù)詞典矩陣。另外,每種葡萄干各選取40粒樣本作為測試樣本,共120粒。將這120粒測試樣本進行編號,第1類葡萄干測試樣本編號為1-40,第1類葡萄干測試樣本編號為41-80,第3類葡萄干測試樣本編號為81-120.
測試樣本的識別結(jié)果如圖5所示,橫坐標表示測試樣本編號,縱坐標表示每個測試樣本的類別。從圖5中可以看到,第1類和第2類測試樣本的實際類別和識別分類結(jié)果完全重合,分類準確率為100%;而在第3類測試樣本中一個被錯分到第2類,分類準確率為97.5%;3類測試樣本的平均識別率達到99.17%.
圖5 測試樣本的識別結(jié)果Fig.5 The identification results of test samples
為進一步驗證壓縮感知分類方法的有效性,我們還將本文方法與最小二乘支持向量機(least squares support vector machine,LSSVM)方法[23]和BP(back propagation)網(wǎng)絡方法[24]進行比較。試驗程序在MATLAB 7.0環(huán)境下編寫運行。不同分類方法的試驗結(jié)果如表3所示。
表3 不同分類方法的試驗結(jié)果Tab.3 Experimental results of different classification methods
從表3可以看出,在第一類葡萄干分類中,壓縮感知理論(CS)方法的識別準確率與LSSVM方法和BP方法中的識別準確率相同;在第二類葡萄干的分類中,CS方法的識別準確率高于LSSVM方法;在第三類葡萄干分類中,CS方法的識別準確率高于BP網(wǎng)絡方法??傮w上,CS方法的識別準確率為99.17%,LSSVM方法的識別準確率為96.67%,BP網(wǎng)絡方法的識別準確率為95.83%.因此,基于壓縮感知理論(CS)方法的綜合識別準確率高于其他兩種分類算法。
本文研究基于壓縮感知理論的葡萄干分類問題。對新疆哈密王、新疆無核白、新疆王中王等3種具有不同形態(tài)特征、顏色特征和紋理特征的葡萄干品種的試驗結(jié)果顯示,基于壓縮感知理論(CS)分類方法的綜合準確率達到99.17%.本文提出的方法對葡萄干品種分類識別進行了有益的嘗試,研究結(jié)果對生物雌雄識別以及其他農(nóng)作物籽粒的分類也具有一定的參考價值。
[1]任憲忠,馬小愚.農(nóng)產(chǎn)品粒形識別研究進展及其在工程中應用現(xiàn)狀[J].農(nóng)業(yè)工程學報,2004,20(3):276-280.
[2]應義斌,饒秀勤,趙勻.機器視覺技術在農(nóng)產(chǎn)品品質(zhì)自動識別中的應用研究進展[J].農(nóng)業(yè)工程學報,2000(3):4-8.
[3]劉燕德,應義斌,成芳.機器視覺技術在種子純度檢驗中的應用[J].農(nóng)業(yè)機械學報,2003,34(5):161-163.
[4]唐晶磊,景旭,何東健.基于BP神經(jīng)網(wǎng)絡的葡萄干分級技術的研究[J].農(nóng)機化研究,2007(11):51-53.
[5]龔攀,李光林.基于計算機視覺的蠶蛹性別識別應用研究[J].農(nóng)機化研究,2014(1):206-209.
[6]展慧,李小昱,王為,等.基于機器視覺的板栗分級檢測方法[J].農(nóng)業(yè)工程學報,2010(4):327-331.
[7]CANDèS E.Copressive samples principles[C]∥Proceedings of the Internation Congress of Mathermaticians.Madrid,Spain,2006,3:1433-1452.
[8]CANDèS E,ROMBERG J,TAO T.Robust uncertainty principles:Exact signal reconstruction from highly incomplete frequency information[J].IEEE Transactions on Information Theory,2006,52(2):489-509.
[9]DONOHO D L.Compressed sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306.
[10]CANDèS E,TAO T.Near-optimal signal recovery from random projections:universal encoding strategies[J].IEEE Transactions on Information Theory,2006,52(12):5406-5425.
[11]王愛玲,葉明生,鄧秋香.MATLAB R2007圖像處理技術與應用[M].北京:電子工業(yè)出版社,2008.
[12]張強,王正林.精通MATLAB圖像處理[M].北京:電子工業(yè)出版社,2012.
[13]YU X,LIU K,WW D,et al.Raisin quality classification using least squares support vector machine(LSSVM)based on combined color and texture features[J].Food and Bioprocess Technology,2012,5(5):1552-1563.
[14]郭依正.基于多特征融合的醫(yī)學圖像識別研究[D].鎮(zhèn)江:江蘇大學,2007.
[15]韓仲志,匡桂娟,劉元永,等.基于形態(tài)和顏色特征的花生品質(zhì)檢測方法[J].花生學報,2007,36(4):18-21.
[16]胡小鋒,趙輝.Visual C++/MATLAB圖像處理與識別實用案例精選[M].北京:人民郵電出版社,2004.
[17]霍迎秋,唐晶磊,尹秀珍,等.基于壓縮感知理論的蘋果病害識別方法[J].農(nóng)業(yè)機械學報,2013,44(10):227-232.
[18]石光明,劉丹華,高大化,等.壓縮感知理論及其研究進展[J].電子學報,2009(5):1071-1081.
[19]TSAIG Y,DONOHO D L.Extensions of compressed sensing[J].Signal processing,2006,86(3):549-571.
[20]OLSHAUSEN B A,F(xiàn)IELD D J.Sparse coding with an overcomplete basis set:A strategy employed by V1[J].Vision research,1997,37(23):3311-3325.
[21]CANDèS E,ROMBERG J,TAO T.Stable signal recovery from incomplete and inaccurate measurements[J].Communications on Pure and Applied Mathematics,2006,59(8):1207-1223.
[22]DONOHO D L.For most large underdetermined systems of linear equations the minimal l1-norm solution is also the sparsest solution[J].Communications on Pure and Applied Mathematics,2006,59(6):797-829.
[23]COMAK E,POLAT K,GüNES S,et al.A new medical decision making system:Least square support vector machine(LSSVM) with fuzzy weighting pre-processing[J].Expert Systems with Applications,2007,32(2):409-414.
[24]BISHOP C M.Neural Networks for Pattern Recognition[M].New York:Oxford university press,1995.
Raisin Classification Based on Compressed Sensing
LIU Guang-qiang1,LU Huan-da2,YU Xin-jie2,SHU Zhen-yu2
(1.School of Electronic Information Engineering,Taiyuan University of Science and Technology,Taiyuan 030024,China;2.Ningbo Institute of Technology,Zhejiang University,Zhejiang Ningbo 315100,China)
A classification method based on Compressed Sensing was proposed for discriminating the varieties of Raisin precisely.Three kinds of Raisins were investigated,and the shape,color and texture feature parameters of the Raisins image were extracted,and then,the data dictionary matrix was got.Firstly,this classification process was to represent the test samples of Raisins image by the matrix of data dictionary and to obtain the sparse vector.Secondly,the residuals were calculated between the reconstructed samples and the test samples by making use of the sparse vector to reconstruct the test samples of Raisins image.Finally,the classification of test samples were determined by comparing the sizes of residuals.In this study,the classification results on the proposed method were analyzed and compared with those of Least Squares Support Vector Machine(LSSVM)and BP network.Experimental results demonstrated that the overall classification accuracy of Compressed Sensing method is 99.17%,which has the best classification effect among three methods.
image processing,feature extraction,compressed sensing,sparse representation,raisin classification
TP391.4
A
10.3969/j.issn.1673-2057.2015.02.001
1673-2057(2015)02-0081-06
2014-11-05
國家自然科學基金(31402352);國家星火計劃(2012GA701012);浙江省自然科學基金(LY13F020018);浙江省教育廳一般科技項目(Y201432753);寧波市自然科學基金(2014A610185)
劉廣強(1988-),男,碩士研究生,主要研究方向為模式識別與智能信息處理研究;通訊作者:盧煥達,講師,E-mail:huandalu@163.com