吳雪
摘 要: 為了提高圖像分類的效果,考慮當(dāng)前方法準(zhǔn)確實(shí)現(xiàn)圖像分類的難題,提出粒子群優(yōu)化算法選擇特征的運(yùn)動(dòng)圖像分類方法。對當(dāng)前運(yùn)動(dòng)圖像分類方法的研究現(xiàn)狀進(jìn)行分析,提取不同類型的圖像,并采用粒子群優(yōu)化算法選擇最優(yōu)特征,組成特征向量,將特征向量機(jī)作為神經(jīng)網(wǎng)絡(luò)的輸入,實(shí)現(xiàn)運(yùn)動(dòng)圖像的分類。采用具體圖像分類實(shí)驗(yàn)進(jìn)行驗(yàn)證,結(jié)果表明,該方法可以描述不同運(yùn)動(dòng)圖像的類別信息,縮小圖像的分類誤差,避免其他圖像分類方法的缺陷,提高了圖像的整體分類正確率。
關(guān)鍵詞: 運(yùn)動(dòng)圖像; 特征選擇; 粒子群算法; 圖像分類
中圖分類號: TN911.73?34; TP317.4 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)17?0047?04
Moving image classification based on particle swarm optimization
algorithm selecting features
WU Xue
(Wuhan Institute of Technology, Wuhan 430205, China)
Abstract: In order to improve the effect of image classification and realize the accurate image classification, a moving image classification method based on particle swarm optimization algorithm selecting features is proposed. The current research status of the moving image classification methods is analyzed to extract the images of different types. The particle swarm optimization algorithm is used to select the optimal feature to compose the feature vector. The feature vector machine is taken as the input of neural network to classify the moving images. The classification experiments of specific images were adopted to make verification. The experimental results show that the method can describe the categories information of different moving images, reduce the classification error of the images, avoid the defects of other image classification methods, and improve the overall image classification accuracy.
Keywords: moving image; feature selection; particle swarm optimization algorithm; image classification
0 引 言
隨著計(jì)算機(jī)圖像處理技術(shù)和數(shù)碼技術(shù)的不斷發(fā)展,在現(xiàn)實(shí)生活中產(chǎn)生了大量的運(yùn)動(dòng)圖像[1]。對運(yùn)動(dòng)圖像進(jìn)行快速檢索可以便于圖像管理,而圖像分類是圖像管理的基礎(chǔ),建立性能良好的運(yùn)動(dòng)圖像分類方法具有十分重要和現(xiàn)實(shí)的意義,因此圖像分類問題引起了人們的高度關(guān)注[2?3]。
最原始的運(yùn)動(dòng)圖像分類主要通過手工方式進(jìn)行,當(dāng)圖像數(shù)量比較少時(shí),該方法可以獲得比較理想的圖像分類效果,當(dāng)圖像數(shù)量比較大時(shí),分類速度慢、費(fèi)時(shí),給海量圖像管理帶來了困難[4]。隨著自動(dòng)化技術(shù)的不斷發(fā)展,人們開始采用計(jì)算機(jī)進(jìn)行運(yùn)動(dòng)圖像自動(dòng)分類,節(jié)省了大量的人力,分類速度明顯加快[5]。運(yùn)動(dòng)圖像自動(dòng)分類首先要提取一定數(shù)量、能夠描述圖像內(nèi)容的特征,然后根據(jù)特征對圖像樣本進(jìn)行處理,采用一定的方法建立運(yùn)動(dòng)圖像分類器,實(shí)現(xiàn)運(yùn)動(dòng)圖像的分類,因此特征直接影響著圖像分類結(jié)果的好壞。當(dāng)前運(yùn)動(dòng)圖像特征主要有紋理、顏色、邊緣等特征,每一種特征對每一類圖像的分類結(jié)果作用是不相同的,它們之間的差異明顯[6?7]。單一特征提供的圖像內(nèi)容信息十分有限,為了更好地實(shí)現(xiàn)運(yùn)動(dòng)圖像分類,人們盡可能多的提取運(yùn)動(dòng)圖像特征,然而特征之間具有一定的相關(guān)性,即經(jīng)常所說的信息冗余,信息冗余對圖像分類速度產(chǎn)生不利影響,有時(shí)對圖像分類的正確率也會(huì)產(chǎn)生負(fù)面影響,影響圖像分類的整體性能[8?9]。有學(xué)者提出對圖像特征進(jìn)行降維處理的思想,如主成分分析、判別分析,有效降低了圖像特征的維數(shù),加快了圖像的分類速度,但只是對圖像進(jìn)行融合,特征對圖像分類結(jié)果的貢獻(xiàn)沒有很好的表示出來,有學(xué)者采用遺傳算法、粒子群算法對運(yùn)動(dòng)圖像特征進(jìn)行選擇,它們沒有破壞圖像特征的原始意義,圖像分類結(jié)果的可解釋性好,然而它們也存在一定的不足,運(yùn)動(dòng)圖像分類結(jié)果有待改善[10?12]。
為了提高圖像分類的效果,考慮當(dāng)前方法無法準(zhǔn)確實(shí)現(xiàn)圖像分類的難題,提出粒子群優(yōu)化算法(PSO)選擇特征的運(yùn)動(dòng)圖像分類方法,結(jié)果表明,該方法減少了圖像的分類誤差,提高了圖像的整體分類正確率,可以滿足運(yùn)動(dòng)圖像自動(dòng)管理的需要。
1 粒子群優(yōu)化算法選擇特征的運(yùn)動(dòng)圖像分類原理
基于PSO算法的運(yùn)動(dòng)圖像分類原理為:首先采集運(yùn)動(dòng)圖像,并提取不同類型的特征;然后采用粒子群算法對最重要的特征進(jìn)行搜索,選擇最重要的特征組成特征向量;最后采用神經(jīng)網(wǎng)絡(luò)建立圖像分類器進(jìn)行圖像分類,如圖1所示。endprint
2 粒子群優(yōu)化算法選擇特征的運(yùn)動(dòng)圖像分類方法
2.1 提取圖像特征
要進(jìn)行圖像分類建模,首先要提取有效圖像特征,當(dāng)前特征主要有顏色、紋理和邊緣,不同特征提取方法可以獲得不同的特征向量和特征維數(shù),而且可以產(chǎn)生不同的圖像分類結(jié)果。
2.1.1 提取顏色矩特征
當(dāng)前顏色特征有很多,如顏色集、顏色聚合向量等,它們均需要對圖像進(jìn)行量化處理,使圖像分類的錯(cuò)誤率相當(dāng)高,而且忽略了圖像像素間的內(nèi)在聯(lián)系。顏色矩(color moments)將圖像顏色分布用矩來描述,重要信息常存于低階矩中,可以通過一階矩、二階矩描述顏色分布。不同運(yùn)動(dòng)圖像的顏色矩特征如表1所示。
2.1.2 提取紋理特征
紋理特征是圖像中最常見的一種特征,Gabor濾波具有良好的選擇性,能夠描述圖像的空間特征,為此采用Gabor變換提取圖像的紋理特征。Gabor濾波器的函數(shù)表示為:
(1)
式中:和為Gabor濾波器的方向和尺度;為高斯窗的寬度率;為最大采樣頻率;為采樣步長;為圖像位置;表示求二范數(shù)。
將運(yùn)動(dòng)圖像和濾波器進(jìn)行卷積操作,可以產(chǎn)生不同尺度和不同的濾波結(jié)果,圖像特征可以描述為:
(2)
運(yùn)動(dòng)圖像經(jīng)過Gabor處理后,每個(gè)像素點(diǎn)產(chǎn)生40個(gè)幅值,它們組成一個(gè)向量,即運(yùn)動(dòng)圖像的紋理特征向量。
提取運(yùn)動(dòng)圖像的顏色、紋理特征后,為運(yùn)動(dòng)圖像自動(dòng)分類提供了基礎(chǔ),然而運(yùn)動(dòng)圖像特征數(shù)量大,而且具有一定的冗余信息,因此選擇粒子群算法對運(yùn)動(dòng)圖像進(jìn)行選擇。
2.2 粒子群優(yōu)化算法的特征選擇
粒子群優(yōu)化算法是模擬鳥群覓食的智能優(yōu)化算法,每個(gè)粒子空間中不斷調(diào)整位置,移動(dòng)方式如圖2所示。
粒子飛行過程中,利用下式估計(jì)下次飛行的向量值:
(3)
(4)
式中:為粒子;為的速度;為的當(dāng)前最優(yōu)解;為粒子種群的最優(yōu)解;為隨機(jī)數(shù);為加權(quán)系數(shù)。
通過粒子群算法對運(yùn)動(dòng)圖像特征進(jìn)行搜索和選擇,找到最優(yōu)的運(yùn)動(dòng)圖像特征,減少分類器的特征向量維數(shù)。
2.3 神經(jīng)網(wǎng)絡(luò)的圖像分類器
BP神經(jīng)網(wǎng)絡(luò)是一種誤差反向傳播的神經(jīng)網(wǎng)絡(luò),函數(shù)逼近能力非常強(qiáng)大,基本結(jié)構(gòu)如圖3所示。
BP神經(jīng)網(wǎng)絡(luò)的運(yùn)動(dòng)圖像分類步驟如下:
(1) 采集運(yùn)動(dòng)圖像樣本數(shù)據(jù),并進(jìn)行相應(yīng)的預(yù)處理,如去噪等。
(2) 顏色特征和紋理特征的量綱和類型不同,為了避免量綱對運(yùn)動(dòng)圖像的干擾,具體進(jìn)行如下操作:
(5)
(3) 將運(yùn)動(dòng)圖像特征選擇轉(zhuǎn)化為一個(gè)優(yōu)化問題,并建立相應(yīng)的數(shù)學(xué)模型,采用粒子群算法求解該數(shù)學(xué)模型的解,即運(yùn)動(dòng)圖像特征的最佳子特征。
(4) 根據(jù)最佳子特征確定BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),通過BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練,建立運(yùn)動(dòng)圖像分類器,對運(yùn)動(dòng)圖像進(jìn)行分類并輸出分類結(jié)果。
3 運(yùn)動(dòng)圖像分類實(shí)驗(yàn)及結(jié)果分析
為了分析粒子群算法選擇特征的運(yùn)動(dòng)圖像分類性能,選擇網(wǎng)球、足球、排球、乒乓球、羽毛球共5類運(yùn)動(dòng)圖像,它們的樣本數(shù)如表2所示。
選擇PCA選擇特征、原始特征、遺傳算法選擇特征(GA)的圖像分類方法進(jìn)行對比實(shí)驗(yàn),以選擇分類正確率(%)、平均訓(xùn)練時(shí)間(s)進(jìn)行評價(jià)。運(yùn)動(dòng)圖像的分類正確率和訓(xùn)練時(shí)間如圖4,圖5所示。
對圖4,圖5的運(yùn)動(dòng)圖像分類結(jié)果進(jìn)行分析,可知:
(1) 在所有方法中,原始特征的運(yùn)動(dòng)圖像分類方法的分類效果最差,這是因?yàn)轭伾图y理特征簡單組合在一起,特征的維數(shù)相當(dāng)高,分類器的結(jié)構(gòu)復(fù)雜,訓(xùn)練時(shí)間增加,而且特征之間有一定的相關(guān)性,使得特征對圖像分類結(jié)果產(chǎn)生干擾,運(yùn)動(dòng)圖像分類的誤分率增加,運(yùn)動(dòng)圖像的分類速度慢,無法滿足運(yùn)動(dòng)圖像管理的實(shí)際應(yīng)用要求。
(2) 相對PCA方法,基于PSO算法的運(yùn)動(dòng)圖像分類正確率得到提高,這是因?yàn)镻SO算法對圖像特征進(jìn)行搜索和選擇,可以獲得更優(yōu)的運(yùn)動(dòng)圖像特征,而PCA只能選擇運(yùn)動(dòng)圖像的線性特征,會(huì)丟失對運(yùn)動(dòng)圖像分類結(jié)果十分重要的非線性特征,構(gòu)建的運(yùn)動(dòng)圖像分類器效果不太理想,雖然圖像分類的速度得到了改善,但實(shí)際應(yīng)用價(jià)值低。
(3) 相對于GA的運(yùn)動(dòng)圖像分類方法,PSO算法的運(yùn)動(dòng)圖像分類結(jié)果的誤分率減少,得到了更高的運(yùn)動(dòng)圖像分類正確率,這是因?yàn)镻SO算法的搜索能力要強(qiáng)于GA,得到了更優(yōu)的特征,可以更加有效地描述圖像內(nèi)容信息,建立了整體更優(yōu)的圖像分類器,而且圖像分類的訓(xùn)練時(shí)間更少,提高了圖像分類效率。
4 結(jié) 語
圖像分類廣泛應(yīng)用于圖像管理中,對圖像進(jìn)行準(zhǔn)確分類,可以提高圖像管理效率,獲得更優(yōu)的實(shí)際應(yīng)用價(jià)值。為了解決當(dāng)前圖像分類方法的局限性,本文提出粒子群優(yōu)化算法選擇特征的運(yùn)動(dòng)圖像分類方法,該方法不僅獲得了更高的正確率,同時(shí)加快了運(yùn)動(dòng)圖像的分類速度,更好地滿足了運(yùn)動(dòng)圖像的實(shí)際應(yīng)用需要。
參考文獻(xiàn)
[1] LU D, WENG Q. A survey of image classification methods and techniques for improving classification performance [J]. International journal of remote sensing, 2007, 28(5): 823?870.
[2] CHEN Y X, WANG J Z. Image categorization by learning and reasoning with regions [J]. Journal of machine learning research, 2004, 5(8): 913?939.endprint
[3] ZHAO G, PIETIKAINEN M. Dynamic texture recognition using local binary patterns with an application to facial expressions [J]. IEEE transactions on pattern analysis and machine intelligence, 2007, 27(6): 915?928.
[4] ZHANG B C, GAO Y S, ZHAO S Q, et al. Local derivative pattern versus local binary pattern: face recognition with high?order local pattern descriptor [J]. IEEE transactions on image processing, 2010, 19(2): 533?544
[5] JIANG Shuhong, CHEN Bingfa. Method of image retrieval based on integrating low level feature with relevance feedback [J]. Machine building and automation, 2009, 38(3): 51?53.
[6] 戴修斌,張輝,舒華忠,等.基于正交矩模糊和仿射混合不變量的圖像識別算法[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,41(1):52?57.
[7] 張剛,馬宗民.一種采用Gabor小波的紋理特征提取方法[J].中國圖象圖形學(xué)報(bào),2010,15(2):247?254.
[8] 祝軍,趙杰煜,董振宇.融合顯著信息的層次特征學(xué)習(xí)圖像分類[J].計(jì)算機(jī)研究與發(fā)展,2014,51(9):1919?1928.
[9] 倪鵬,黃蔚,呂巍,等.基于Zernike矩特征的FCM?RBF神經(jīng)網(wǎng)絡(luò)圖像分類器[J].吉林大學(xué)學(xué)報(bào)(理學(xué)版),2014,52(6):1284?1288.
[10] 謝文蘭,石躍祥,肖平.應(yīng)用BP神經(jīng)網(wǎng)絡(luò)對自然圖像分類[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(2):163?166.
[11] 付巖,王耀威,王偉強(qiáng),等.SVM用于基于內(nèi)容的自然圖像分類和檢索[J].計(jì)算機(jī)學(xué)報(bào),2003,26(10):1261?1265.
[12] 朱飛,王興起.基于SIFT 算法的體育類圖像分類與應(yīng)用研究[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(10):231?234.endprint