国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于BPSO和SVM的煙葉近紅外有用特征光譜選擇

2015-03-10 03:24趙海東申金媛劉潤杰劉劍君穆曉敏
物理實驗 2015年6期
關(guān)鍵詞:適應(yīng)度分類器煙葉

李 航,趙海東,申金媛,劉潤杰,劉劍君,穆曉敏

(1. 鄭州大學 信息工程學院,河南 鄭州 450001;2.鄭州市煙草專賣局,河南 鄭州 450006)

?

基于BPSO和SVM的煙葉近紅外有用特征光譜選擇

李 航1,趙海東1,申金媛1,劉潤杰1,劉劍君2,穆曉敏1

(1. 鄭州大學 信息工程學院,河南 鄭州 450001;2.鄭州市煙草專賣局,河南 鄭州 450006)

為提高基于近紅外光譜識別煙葉等級的效率,利用BPSO聯(lián)合SVM對原始光譜數(shù)據(jù)進行有用特征光譜選擇. 利用BPSO將對分級影響不好或沒有影響的特征剔除,采用SVM對煙葉的等級進行識別. 結(jié)果表明:BPSO選擇的最佳特征光譜可減少特征光譜的數(shù)目,提高煙葉的正確分級率. 對于相同的光譜范圍,采樣間隔越大,經(jīng)過特征光譜選擇后,原始光譜數(shù)據(jù)數(shù)目減少的比例越大. 此外,有用特征光譜的選擇可以有效地減少光譜數(shù)據(jù)的采集量,減少了分級模型的計算復雜度,提高煙葉分級的速度.

近紅外光譜;BPSO;支持向量機;煙葉分級

1 引 言

煙葉的近紅外光譜幾乎包含煙葉化學成分的所有含氫基團,可以映射煙葉的內(nèi)部化學成分. 因此,很多學者通過光譜數(shù)據(jù)構(gòu)建模型,對煙葉的化學成分和含量進行了研究分析[1-2]. 張建平等[3]利用近紅外光譜實現(xiàn)煙葉的產(chǎn)地和部位識別,從煙葉粉碎、篩選、壓制等制作過程中提取樣本,從樣本中獲取光譜,光譜數(shù)據(jù)不能反映煙葉的厚度信息,不能用于煙葉實時無損的智能分級. 章英等[4]依據(jù)近紅外光譜數(shù)據(jù)用最近鄰判別分析方法實現(xiàn)了煙葉的自動分組. 申金媛等[5-6]依據(jù)紅外光譜運用概率神經(jīng)網(wǎng)絡(luò)、徑向基網(wǎng)絡(luò)等實現(xiàn)煙葉的自動分級.

光譜分辨率越高越能反映煙葉內(nèi)部的信息,相應(yīng)的儀器精確度要求也就越高,采集的成本也就越高,獲得的煙葉特征也就越多,光譜間的相關(guān)性就越大. 原始光譜數(shù)據(jù)中可能包含與煙葉分級不相關(guān)的特征,對近紅外光譜特征的提取就變得相當重要. 光譜有效特征的提取方法有小波分解[7]、主成分分析[8]、獨立成分分析[9]等,這些方法不能減少光譜數(shù)據(jù)的采集,而且每次分級時還首先需要對數(shù)據(jù)做相應(yīng)的處理,額外增加的時間有可能比數(shù)據(jù)處理后所減少的分級時間還多,適得其反. 基于聚類分析[10]的方法可以將對分級影響不太好的數(shù)據(jù)有效地剔除掉,減少了原始數(shù)據(jù)的采集. 基于同樣的考慮,本文提出基于BPSO對原始的光譜數(shù)據(jù)進行特征光譜篩選,通過BPSO的方法從眾多優(yōu)化過的粒子中選擇出最好的1組粒子,即“最佳特征組合”作為最后的有用特征光譜,本文采用具有良好推廣能力的SVM分類器對煙葉進行分級.

2 特征選擇及分級原理

2.1 BPSO原理

粒子群算法(PSO)是最初由Kennedy博士與Eberhart博士提出的進化算法,其概念來源于鳥類尋找食物行為的研究[11],可以用來解決系統(tǒng)優(yōu)化的問題. 隨機選取1組解為系統(tǒng)初始解,通過進化迭代尋找最優(yōu)解. 假設(shè)在搜索空間為α維中,由β個粒子組成的種群X=(x1,…,xi,…,xβ)T,其中第i個粒子的位置為xi=(xi1,xi2,…,xiα)T,其飛行速度為vi=(vi1,vi2,…,viα)T,該粒子當前得到的最優(yōu)解為pi=(pi1,pi2,…,piα)T,整個種群當前的最優(yōu)解pg=(pg1,pg2,…,pgα)T. 其迭代過程為

(1)

(2)

其中:i=1,2,…,β表示種群規(guī)模;d=1,2,…,α表示粒子群算法解的搜索空間;t為當前進化代數(shù);r1與r2為均勻分布在[0, 1]之間的隨機數(shù);c1與c2為學習因子,通常取c1=c2=2;pid為個體極值,pgd為種群極值;w為正數(shù),稱為慣性權(quán)重,其值描述為粒子保持上一代速度的權(quán)重.

BPSO為二進制粒子群,將每一維的xid,pid,pgd限制為0或者1. 對于速度vid不做該限制,用速度的sigmoid函數(shù)表示位置狀態(tài)改變可能性,BPSO模型中,更新速度為(1)式,位置的更新為

(3)

其中sigmoid型函數(shù)為

(4)

2.2 BPSO有用特征光譜選擇

煙葉的近紅外光譜數(shù)據(jù)具有“線性不可分、維數(shù)高”的特征. 在依據(jù)煙葉光譜進行分級時,構(gòu)建分級模型比較復雜并且會出現(xiàn)分級耗時長且難以實現(xiàn)實時分級. 刪減不利于分級的光譜(煙葉特征),降低數(shù)據(jù)維數(shù),提取有利于分級的特征(有用特征光譜)變得非常必要.

BPSO運用于煙葉的光譜特征選擇時,每個粒子對應(yīng)1種光譜特征的組合. 對光譜進行特征選擇時,粒子的每維對應(yīng)1個波長,粒子的某維取值為1時,表示這個光譜的特征被選中在特征集中;取值為0時,表示這一維特征沒有被選中. 根據(jù)每維對應(yīng)的取值,可以確定對應(yīng)的光譜是否為有用特征.

初始隨機選擇β個粒子,迭代M次,共產(chǎn)生βM個粒子,從中選擇最佳粒子P(對應(yīng)于適應(yīng)度值最大的粒子),據(jù)此得到最佳特征光譜組合(剔除粒子中為0的光譜). 每個粒子的適應(yīng)度值由適應(yīng)度函數(shù)決定,適應(yīng)度函數(shù)通常與所采用的分級模型有關(guān),根據(jù)粒子的適應(yīng)度值確定分級分類器的樣本輸入模式,利用訓練樣本建立分級模型,不同的粒子建立的分級模型不同,能夠正確識別樣本的數(shù)目也不同,即分類器的正確分級率不同. 本文將樣本的正確分級率定義為粒子的適應(yīng)度函數(shù),與粒子相對應(yīng)的分類器的正確分級率為該粒子的適應(yīng)度值. 適應(yīng)度值越高,粒子包含的特征越有用;把適應(yīng)度值最高的粒子定義為最佳特征組合,所對應(yīng)的光譜組合為最佳特征光譜. 本文采用SVM作為煙葉分級分類器,SVM網(wǎng)絡(luò)輸出的分類準確率作為評價該粒子優(yōu)劣的適應(yīng)度函數(shù).

2.3 SVM分類器

支持向量機是處理高維數(shù)據(jù)實現(xiàn)小樣本多分類的方法,在建立分類器時,不僅僅考慮經(jīng)驗風險最小,而且考慮結(jié)構(gòu)風險最小,具有優(yōu)秀的推廣能力. 核心思想是將向量映射到較高維空間里,在高維空間上構(gòu)造最優(yōu)超平面,使不同類別樣本的間隔最大. 本文首先將輸入模式通過線性核函數(shù)實現(xiàn)向量的高維映射,然后在高維空間建立線性分類器,所采用的線性分類器的判決函數(shù)為

g(x)=sgn ∑ni=1αidiK(xi,x)+b,

其中K(xi,x)為核函數(shù),完成輸入樣本的高維映射;xi是訓練樣本的支持向量,x為待分類的樣本,di取值為1或-1,對應(yīng)輸入樣本的正確類型.

SVM是兩分類器,如果要進行多分類,則需要多個分類器組合完成. 有2種方法可以實現(xiàn)多分類, 第一種是采用樹杈結(jié)構(gòu)如圖1(a)所示, 每次將1個級別分離出來,N分類則需要建立N-1個SVM二分類器. 如第一級分類器,將A1類和其他類分為2種類型,輸出1為A1類,分類結(jié)束,輸出-1則為其他類,進行第二個分類器分類,第二個分類器則將A2類和剩余其他類分開,以此類推. 如果輸入的樣本屬于第N-1類或第N類,則需要通過所有N-1個分類器才能得到最后的分類結(jié)果.

(a)樹杈式SVM分類器

(b)全并行投票式分類器圖1 2種分類器

第二個構(gòu)成方法如圖1(b)所示,首先每2類建立1個SVM分類器,N類則需要建立N(N-1)/2個SVM分類器,然后將前級SVM分類器的輸出給予正確的標簽,最后根據(jù)標簽由投票表決器決定輸出類型.

3 實現(xiàn)結(jié)果及分析

煙葉樣本來源于鄭州市煙草公司(共642片),其中XL組163片、XF組173片、CF組84片、CL組103片、BF組119片. 采用島津公司生產(chǎn)的UV-3600型號分光光度計采集每片煙葉波長范圍為1 500 ~2 400 nm,采集不同采樣間隔的反射光譜. 為了減小基線漂移帶來的誤差,對數(shù)據(jù)進行下面預處理:

yi=xi-min (xi)max (xi)-min (xi) ,

(5)

其中xi為預處理前的反射光譜數(shù)據(jù).

X2L和C2L預處理前后煙葉反射光譜如圖2所示. 由圖2得知,光譜數(shù)據(jù)在1 400 nm處存在較大吸峰,2 500 nm后波動范圍很大. 選取1 500~2 400 nm光譜之間數(shù)據(jù)作為實驗數(shù)據(jù).

分別將采樣間隔為2,4,6,8,10 nm 煙葉反射光譜的數(shù)據(jù)作為初始數(shù)據(jù),基于BPSO聯(lián)合SVM分類器進行特征光譜選擇. 初始隨機選擇20個粒子,利用這20個粒子確定相應(yīng)的樣本輸入模式,然后通過訓練樣本建立20個SVM分類器,本文選擇投票式結(jié)構(gòu)分類器. 根據(jù)測試樣本的正確分級率確定每個粒子的適應(yīng)度值,粒子的每次迭代遵循式(1)和(3), 迭代50次,共產(chǎn)生1 000個粒子,從中選擇最佳粒子P(對應(yīng)于適應(yīng)度值最大的粒子),據(jù)此得到最佳特征光譜的組合(剔除粒子中為0的光譜).

選擇642片中的一半左右的樣本作為訓練樣本,其余的作為測試樣本. 特征選擇前后分級的吻合率、特征數(shù)目和分級耗時如表1所示. 表中的吻合率為測試樣本的正確分級率.

(b)X2L級別預處理后的反射光譜

(c)C2L級別的原始反射光譜

(d)C2L級別預處理后的反射光譜

間隔/nm吻合率/% 特征數(shù)目 分級耗時/s 前后前后前后293.994.14512250.400.131492.793.42261150.150.099692.492.9151790.120.045892.490.0113580.090.0371088.889.091500.060.033

從表1可以得出:

1)用BPSO方法選擇的最優(yōu)光譜特征的分級準確率比原始全光譜數(shù)據(jù)情況下有一定的提高(除間隔8 nm時). 所以從正確分級率來看基于BPSO進行光譜數(shù)據(jù)的有用特征選擇是正確可行的.

2)從SVM分級消耗時間來看,隨著光譜特征數(shù)目的減少,SVM網(wǎng)絡(luò)所需要分級的時間也減少,少則短1/3,多則短2/3.

3)不論原始數(shù)據(jù)采用多大間隔,在不影響正確分級率的前提下,利用BPSO都可剔除近一半的數(shù)據(jù). 原始數(shù)據(jù)越多,可剔除的比例越大.

4 結(jié)論與展望

通過以上工作可以得出以下結(jié)論:

1)煙葉近紅外光譜可以作為煙葉自動分級的特征;

2)投票式SVM分類器是一個很不錯煙葉分級模型;

3)利用BPSO可以選擇對分級有用的光譜,選擇后的光譜數(shù)據(jù)減少近一半,不僅可以減少SVM的分級計算量,使得分級占用時間減少1/3以上,而且可以有效地減少光譜的采集時間. 當采用的設(shè)備為串行獲取光譜數(shù)據(jù)時,減少數(shù)據(jù)采集量可極大地提高煙葉的分級效率,從而使得對煙葉的實時分級有了實用的可能.

還有很多其他的特征選擇方法和分級方法,煙葉的圖像特征主要包括有寬度、長度、長寬比、周長、面積、破損率、圓形度及RGB和HSI分量. 試想可以融合煙葉的圖像特征和光譜特征,兩者相結(jié)合盡可能的選擇出不影響正確分級率的最少特征數(shù)目,以及同時考慮正確分級率和分級速度的分級模型,為設(shè)計可實用的煙葉自動分級設(shè)備奠定基礎(chǔ).

[1] 王東丹,秦西云,趙立紅,等. 應(yīng)用近紅外光譜技術(shù)分析煙絲總糖和還原糖的研究[J]. 分析實驗室,2007,26(5):30-32.

[2] 杜閱光,崔登科,程小東,等. 聲光可調(diào)近紅外光譜技術(shù)用于打葉復烤片煙化學成分[J]. 紅外技術(shù),2012,34(10):614-618.

[3] 張建平,陳江華,束茹欣,等. 近紅外信息用于煙葉風格識別及卷煙配方研究的初步探索[J]. 中國煙草學報,2007,13(5):1-5.

[4] 章英,賀立源. 基于近紅外光譜的烤煙煙葉自動分組方法[J]. 農(nóng)業(yè)工程學報,2011,27(4):350-354.

[5] 張樂明,申金媛,劉劍君,等. 概率神經(jīng)網(wǎng)絡(luò)在煙葉自動分級中的運用[J]. 農(nóng)機化研究,2011(12):32-35.

[6] 彭丹青,申金媛,劉劍君,等. 基于徑向基網(wǎng)絡(luò)的煙葉光譜分級[J]. 農(nóng)機化研究,2009(10):15-18.

[7] 田高友,袁洪福,劉慧穎,等. 小波變換在近紅外光譜分析中的應(yīng)用進展[J]. 光譜學與光譜分析,2003,23(6):1111-1114.

[8] 郭文川,王銘海,岳絨. 基于近紅外漫反射光譜的損傷獼猴桃早期識別[J]. 農(nóng)機機械學報,2013,44(2):142-146.

[9] 侯振雨,王偉,蔡文生,等. 基于獨立成分的局部建模方法及其在近紅外光譜分析中的應(yīng)用研究[J]. 計算機與應(yīng)用化學,2006,23(3):224-226.

[10] 趙海東,申金媛,劉潤杰,等. 基于聚類的煙葉近紅外光譜有效特征的篩選方法[J]. 紅外技術(shù),2013,35(10):659-664.

[11] Kennedy J, Eberhart R. Particle swarm optimization [A]. Proceedings of IEEE International Conference on Neural Networks [C]. Perth, Australia, 1995:1942-1948.

[責任編輯:任德香]

Screening the effective features in the near-infrared spectroscopy of tobacco leaf based on BPSO and SVM

LI Hang1, ZHAO Hai-dong1, SHEN Jin-yuan1,

LIU Run-jie1, LIU Jian-jun2, MU Xiao-min1(1. School of Information Engineering, Zhengzhou University, Zhengzhou 450001, China;2. Zhengzhou City Tobacco Monopoly Bureau, Zhengzhou 450006, China)

To improve the classification efficiency of tobacco leaves based on near-infrared spectroscopy, the BPSO and SVM methods were applied to screening the effective features from the original spectra. The BPSO method was used to get rid of some features that had bad effect or no effect on the classification, and then the levels of the tobacco leaves were recognized by SVM. The experimental results showed that BPSO method could greatly reduce the number of characteristic spectral data and improve the recognition efficiency. For the same spectrum range, after screening, large sampling interval could reduce the numbers of characteristic spectral data. Moreover BPSO could effectively reduce the size of spectrum data collection and the computational complexity of the hierarchical model, thus greatly improve the classification speed.

near-infrared spectrum; BPSO; SVM; tobacco grade

2015-01-07;修改日期:2015-04-11

河南省煙草公司科技計劃項目(No.M201335)

李 航(1989-),男,河南開封人,鄭州大學信息工程學院2014級碩士研究生,研究方向為近紅外光譜分析和圖像處理.

指導教師:申金媛(1966-),女,山西晉中人,鄭州大學信息工程學院教授,博士,研究方向為數(shù)字圖像處理、光電信號與信息處理及應(yīng)用、模式識別.

TN219

A

1005-4642(2015)06-0008-05

猜你喜歡
適應(yīng)度分類器煙葉
改進的自適應(yīng)復制、交叉和突變遺傳算法
關(guān)于新形勢下煙葉生產(chǎn)可持續(xù)發(fā)展的思考
一種基于改進適應(yīng)度的多機器人協(xié)作策略
煙葉主要真菌病害的發(fā)生與防治
基于實例的強分類器快速集成方法
加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
基于空調(diào)導風板成型工藝的Kriging模型適應(yīng)度研究
一種降低造紙法再造煙葉平滑度的方法
一種基于置換的組合分類器剪枝方法
万载县| 九江县| 凉城县| 宁都县| 松阳县| 宁波市| 海门市| 固安县| 忻州市| 东城区| 台州市| 观塘区| 沈丘县| 台中市| 含山县| 夏津县| 阿勒泰市| 南岸区| 吉木乃县| 三明市| 兴宁市| 濮阳市| 河南省| 靖西县| 封开县| 鄄城县| 衡南县| 邵武市| 冀州市| 威宁| 阳江市| 沛县| 门源| 柘城县| 延边| 鄢陵县| 仁布县| 扎鲁特旗| 阳山县| 平舆县| 康马县|