梁詩華+林毅鑫+何金成
摘要:提出了一種基于支持向量機(jī)(C-SVM)區(qū)分整精米和碎米的方法,首先對大米圖像進(jìn)行閾值分割、平滑處理等圖像預(yù)處理,并根據(jù)大米的粒形特點(diǎn),提取米粒的面積、周長等6個形態(tài)特征,利用Orange Canvas數(shù)據(jù)挖掘軟件對C-SVM中核函數(shù)參數(shù)進(jìn)行預(yù)判,最終選擇線性核函數(shù)的C-SVM作為分類器進(jìn)行分類。對8組大米樣本圖像進(jìn)行碎米測試,可達(dá)到較好的分類效果。試驗結(jié)果表明,線性核函數(shù)的支持向量機(jī)對精整米與碎米識別分類準(zhǔn)確率為95.6%。
關(guān)鍵詞:碎米;特征提?。籓range Canvas;C-SVM
中圖分類號:TS212;TP391.4 文獻(xiàn)標(biāo)識碼:A 文章編號:0439-8114(2016)20-5368-04
DOI:10.14088/j.cnki.issn0439-8114.2016.20.051
Abstract: A method based on support vector machine(C-SVM) to distinguishbetween head rice and broken rice was proposed. Firstly,it did the image threshold segmentation,then proceeded the smooth processing. And according to the characteristics of rice grain shape,extracted six morphological characteristics such as area,perimeter and so on. Then using Orange Canvas data mining software to predict kernel function parameter. Finally,linear kernel function was selected as classifier.Eight groups of broken rice samples had been tested,which achieved a preferable classification result. The test results showed that linear of SVM can identify head rice and broken rice with classification accuracy at 95.6%.
Key words: broken rice;feature extraction;Orange Canvas;C-SVM
碎米含量是稻米加工品質(zhì)好壞的重要評價指標(biāo)之一,也是稻米分級的重要依據(jù),且與稻米加工企業(yè)的經(jīng)濟(jì)效益密切相關(guān)[1]。人工檢測碎米需耗費(fèi)很多時間,操作復(fù)雜,且易受到人為因素的影響。碎米分為大碎米和小碎米,碎米在國家標(biāo)準(zhǔn)GB1354-2009中定義:留存在直徑2.0 mm圓孔篩上,不足正常整米2/3的碎粒為大碎米;通過直徑2.0 mm圓孔篩,留存在直徑1.0 mm圓孔篩上的碎粒為小碎米[2]。利用機(jī)器視覺對碎米檢測已經(jīng)成為了未來的發(fā)展趨勢,國內(nèi)外許多學(xué)者已進(jìn)行了一些相關(guān)的研究,多采用是通過面積、周長或長軸長度等特征進(jìn)行判別。毋桂萍等[3]和戴丹[4]利用大米子粒長軸計算碎米。王大溪等[5]比較分析了長軸和面積特征識別碎米算法,提出了面積特征在粳米識別中取得較好的效果。孫翠萍[6]與方華等[7]利用面積特征對碎米進(jìn)行檢測。崔雯雯[8]建立貝葉斯逐步判別、概率神經(jīng)網(wǎng)絡(luò)判別兩種碎米模型,得出神經(jīng)網(wǎng)絡(luò)判別碎米,正確率高。萬鵬等[9]利用BP神經(jīng)網(wǎng)絡(luò)檢測碎米,對碎米識別準(zhǔn)確率為92.09%。Harpreet等[10]選擇支持向量機(jī)的徑向基核函數(shù)進(jìn)行碎米識別,識別準(zhǔn)確率高于86%。
本研究結(jié)合大米粒形特點(diǎn)提取米粒的面積、周長、長、寬、長寬比及圓度6個特征參數(shù),比較分析支持向量機(jī)常見4種核函數(shù)對碎米識別檢測的預(yù)測準(zhǔn)確度,為后續(xù)碎米檢測提供基礎(chǔ)。
1 材料
1.1 試驗材料
試驗用大米為江西省岱寶山產(chǎn)的軟丁優(yōu)米,按照國家標(biāo)準(zhǔn)(GB1354-2009)中的碎米分法分為整精米、大碎米、小碎米。
1.2 試驗設(shè)備
以相機(jī)獲取的米粒圖像,易受到光照的影響,且不同環(huán)境光源下所得到影響差異較大,相比之下,以掃描儀獲取的圖像較為穩(wěn)定。本研究選擇掃描儀作為原始圖像獲取的裝置。采用300 dpi進(jìn)行灰度掃描,圖像以JPG格式進(jìn)行存儲。操作系統(tǒng)為Windows XP,以Qt5.5.1為開發(fā)工具,借助Opencv3.0進(jìn)行圖像處理和分析。
為了防止米粒發(fā)生粘連、重疊的問題,本研究使用置米盤將米粒進(jìn)行分開,置米盤如圖1所示。
2 計算機(jī)視覺碎米檢測方法
碎米檢測流程如圖2所示。
2.1 圖像處理
圖3a為采集的樣品圖像。為了將目標(biāo)與背景進(jìn)行分割,同時也為后續(xù)特征提取,需要將大米圖像進(jìn)行分割去除背景,本研究運(yùn)用Otsu算法設(shè)定最優(yōu)閾值,將圖像分為背景和目標(biāo)兩個部分,從而將大米從背景中分割出來(圖3b),再將其進(jìn)行二值化處理。為了能夠消除圖像的噪聲,對大米圖像進(jìn)行中值濾波(圖3c),濾波后圖像輪廓清晰,顆粒狀噪聲得到很好抑制,最后利用canny算法提取大米輪廓,為后續(xù)大米特征提取奠定基礎(chǔ)如圖3d所示。
2.2 特征提取
大米的粒形取決于面積、周長、長、寬、長寬比及圓度6個幾何特征參數(shù)[11],特征參數(shù)見表1。
3 分類算法
3.1 支持向量機(jī)
支持向量機(jī)(Support Vector Machines,SVM)是建立在統(tǒng)計學(xué)習(xí)理論基礎(chǔ)上的機(jī)器學(xué)習(xí)算法,主要解決小樣本、非線性及高維模式識別問題,其基本思想是通過核函數(shù)將數(shù)據(jù)從原始特征空間映射到高維特征空間,來實現(xiàn)最優(yōu)分類超平面,并用此超平面實現(xiàn)對未知樣本的判斷[12]。
SVM常用的核函數(shù)有:
同時,SVM中重要參數(shù)是懲罰因子C,會對試驗結(jié)果造成一定程度的影響,其值越小,分類錯誤率越小,反正越大[13]。
3.2 算法評價與指標(biāo)
本研究利用分類模型評估標(biāo)準(zhǔn)—混淆矩陣(Confusion matrix)進(jìn)行準(zhǔn)確性分析,并采用正確率(Accurate,ACC)、命中率(Precision,P)、召回率(Recall,R)及F1度量(Recall和Precision的調(diào)和平均數(shù))4個計算指標(biāo)對結(jié)果進(jìn)行評價。指標(biāo)計算式(5)~式(8)所示:
式中,TP表示正確預(yù)測到正例的數(shù)量,TN表示正確預(yù)測到負(fù)例的數(shù)量,F(xiàn)P表示負(fù)例預(yù)測到正例的數(shù)量,F(xiàn)N表示正例預(yù)測到負(fù)例的數(shù)量。ACC是表示評估分類器好壞的指標(biāo),正確率越高,分類器越好。
命中率是精確度的度量,是指分類模型判為正的所有樣本中有多少是真正的正樣本,而召回率覆蓋面的度量,是所有正樣本有多少被分類模型判為正樣本。F1是將命中率和召回率的方法組合到一個度量上的指標(biāo),其賦予命中率和召回率相等的權(quán)重。本研究將用上述指標(biāo)進(jìn)行對分類模型的判斷,其值越大,表示分類效果越好。
3.3 核函數(shù)的確定及參數(shù)選擇
本研究是利用Orange Canvas數(shù)據(jù)挖掘軟件先對核函數(shù)進(jìn)行預(yù)判,預(yù)判結(jié)果見表2。本研究最終選擇用線性核函數(shù)作為SVM的核函數(shù)建立識別模型,并經(jīng)試驗選擇模型參數(shù)C=1,其分類效果最佳。
4 檢測結(jié)果與分析
4.1 數(shù)據(jù)處理與分析
為了證實所提取的大米特征能反映大米的真實信息,采用主成分分析方法對所提取的特征值進(jìn)行分析。大米粒形特征值的標(biāo)準(zhǔn)偏差、各特征值的貢獻(xiàn)率以及累計貢獻(xiàn)率見表3。從表3可知,所提取的大米特征參數(shù)基本上能夠反映大米粒形的全部信息。
4.2 檢測結(jié)果與分析
本研究以國家標(biāo)準(zhǔn),進(jìn)行對整精米、大碎米、小碎米進(jìn)行區(qū)分,各選取粒數(shù)100粒,作為樣本的訓(xùn)練樣本,另外再取8組作為測試樣本進(jìn)行識別,識別結(jié)果見表4所示。從表4可看出,采用圖像處理技術(shù)及SVM方法,正確率為95.6%,能達(dá)到較好的分類效果,整精米、大碎米以及小碎米的命中率分別為99.5%、63.6%和82.3%,而召回率分別為96.5%、94.9%和66.6%。F1值則分別為98%、76.1%和73.6%。說明利用SVM進(jìn)行整精米和碎米的識別是可行的。但有時整精米有時會被誤判為大碎米,導(dǎo)致其F1值下降,同理,小碎米有時也會被誤判為大碎米,使F1值下降,原因在于:一方面,碎米在國家標(biāo)準(zhǔn)的定義是完整米長度的2/3,而SVM是根據(jù)給定的訓(xùn)練樣本進(jìn)行自行分類;另一方面,米粒的受生長環(huán)境的影響,造成本身的形狀扭曲,使其粒形寬度小于正常粒形寬度,誤判為小碎米。
5 結(jié)論
本研究使用平板掃描儀獲取大米粒形圖像,并利用SVM的方法,對碎米進(jìn)行了識別研究。
1)采用SVM的Linear對整精米和碎米的分類正確率達(dá)到95.6%,相比Harpreet學(xué)者選擇SVM的RBF進(jìn)行碎米識別,效果更佳顯著。
2)豐富了大米圖像識別研究,為大米外部品質(zhì)識別提供了客觀可行的方法。同時,研究中主要采用了南方具有代表性的大米品種,具有很好的科研價值。
3)該裝置具有良好的擴(kuò)展性,中國稻米種類繁多,利用SVM可以對不同品種進(jìn)行廣泛的取樣與試驗,但是目前本研究只針對一種粒形的大米進(jìn)行研究,還需要對不同類型和品種展開試驗研究及算法等進(jìn)一步校正和完善。
參考文獻(xiàn):
[1] 周顯青.稻谷精深加工技術(shù)[M].北京:化學(xué)工業(yè)出版社,2006.
[2] GB1354-2009,大米[S].
[3] 毋桂萍,沈二波,楊紅衛(wèi).圖像處理法在大米碎米率檢測中的精度分析[J].中國糧油學(xué)報,2009,24(10):94-97.
[4] 戴 丹.粘連大米的碎米率檢測技術(shù)研究[J].農(nóng)機(jī)化研究,2015(2):222-225.
[5] 王大溪,盧嘉敏,胡 波.粳米分級中基于面積特征的碎米識別算法[J].安徽農(nóng)業(yè)科學(xué),2010,38(29):16536-16537.
[6] 孫翠萍.基于機(jī)器視覺的大米自動分級算法的研究[D].南寧:廣西工學(xué)院,2010.
[7] 方 華,孫翠霞,胡 波.針對子粒連接的碎米檢測算法的研究[J].農(nóng)機(jī)化研究,2010(11):53-56.
[8] 崔雯雯.基于圖像處理的大米品質(zhì)檢測系統(tǒng)研究[D].長春:吉林大學(xué),2015.
[9] 萬 鵬,孫 瑜,孫永海.基于計算機(jī)視覺的大米粒形識別方法[J].吉林大學(xué)學(xué)報(工學(xué)版),2008(2):489-493.
[10] HARPREET K,BALJIT S. Classification and grading rice using Multi-Class SVM[J].International Journal of Scientific and Research Publications,2013,3(4):1-4.
[11] 袁佐云,牛興和,劉傳云.基于最小外接矩陣的稻米粒形檢測方法糧食與飼料工業(yè)[J].糧食與飼料工業(yè),2006(9):7-8.
[12] 梁 龍,房桂干,吳 珽,等.基于支持向量機(jī)的近紅外特征變量選擇算法用于樹種快速識別[J].分析測試學(xué)報,2016(1):101-106.
[13] RUIXI Y,ZHU LI,GUAN X H,et al. An SVM-based machine learning methed forac-curate internet traffic classification[J].Information Systems Frontiers,2010(12):149-156.