摘要:判別函數(shù)法是找分界線的一種算法,其結(jié)果就是提供一個確定的分界線方程,這個方程就是判別函數(shù),因此判別函數(shù)描述了各類之間的分界線的具體形式。該文主要是基于判別函數(shù)模型,對圖像分類問題進行了研究,通過實例說明分類方法的有效性和可行性。實驗結(jié)果表明判別函數(shù)模型具有一定的實際應(yīng)用價值,在圖像分類問題上,判別函數(shù)方法性能良好,分類準(zhǔn)確和高效,最后利用利用MATLAB圖形用戶界面(GUI)方法,設(shè)計了良好的人機交互系統(tǒng)的主界面。
關(guān)鍵詞:判別函數(shù);圖像分類;MATLABGUI
中圖分類號:TP311 文獻標(biāo)識碼:A 文章編號:1009-3044(2012)33-8018-03
圖像分類本身是一個具有重要應(yīng)用價值的研究課題,它是分類問題的子問題,是圖像挖掘和分類挖掘技術(shù)的結(jié)合點。判別函數(shù)理論是處理不完備、不確定信息的一種有效的數(shù)學(xué)方法,將判別函數(shù)理論應(yīng)用于分類問題的研究是判別函數(shù)理論應(yīng)用研究的一個重要方向,該文正是嘗試將判別函數(shù)理論應(yīng)用于圖像分類研究之中,在此基礎(chǔ)上實現(xiàn)了對兩類圖像的分類器設(shè)計。
MATLAB是當(dāng)前最流行的、功能強大的高效率的數(shù)值計算的可視化科技應(yīng)用軟件和編程語言之一。其特有的圖形用戶界面開發(fā)環(huán)境(GraphicalUserInterfacesDevelopmenEnvronment,簡稱GUIDE)大大簡化了人機交互界面程序的開發(fā)過程。
1判別函數(shù)理論簡介
模式識別分類問題是提取待識別對象的某方面的特征,根據(jù)觀察值建立識別對象的訓(xùn)練集,訓(xùn)練集中樣本點的類別已知,基于這些條件建立適當(dāng)?shù)呐袆e函數(shù),并使用已有的樣本來估計判別函數(shù)的未知參數(shù),最后用判別函數(shù)對待測樣本的類別進行判別。
1.1判別函數(shù)概念
由于一個模式通過某種變換映射為一個特征向量后,該特征向量可以理解為特征空間的一個點,在特征空間中,屬于一個類的點集,總是在某種程度上與輸入另一個類的點的集合相分離,各個類之間確定可分離的。因此,如果能夠找到一個分離函數(shù)(線性或非線性函數(shù)),把不同類別的點集分開,則分類任務(wù)就解決了。判別函數(shù)法不依賴于條件概率密度的知識,可以理解為通過幾何方法,把特征向量分解為對應(yīng)于不同類別的子空間。而且呈線性的分離函數(shù),將使計算簡化。找分界線的方法就是判別函數(shù)法,判別函數(shù)法的結(jié)果就是要提供一個確定的分界線方程,這個分界線方程叫做判別函數(shù),因此判別函數(shù)描述了各類之間的分界線的具體形式。
1.2判別函數(shù)的類型
判別函數(shù)法按照分界函數(shù)的形式可以劃分為現(xiàn)行判別函數(shù)和非線性判別函數(shù)兩大類。現(xiàn)行判別函數(shù)由于涉及的數(shù)學(xué)方法較為簡單,在計算機上容易實現(xiàn),故在模式識別中被廣泛應(yīng)用。但是在模式識別中僅僅有線性分類器是不夠的。在模式識別中的許多問題中,由于線性判別函數(shù)有其一定的局限性,它并不能提供理想的識別效果,必須借助于非線性的分類器。而且,有些較為簡單的非線性分類器,對于某些模式識別問題的解決,顯得簡單,效果又好。
1.3線性判別函數(shù)
模式識別中用以對模式進行分類的一種最簡單的判別函數(shù)。在特征空間中,通過學(xué)習(xí),不同的類別可以得到不同的判別函數(shù),比較不同類別的判別函數(shù)值大小,就可以進行分類。對于特征空間中的每個特征向量x,可以計算相應(yīng)于各個決策區(qū)的判別函數(shù)[gi(x),i=1,2,…,m],用判別函數(shù)進行分類的方法就是:若對所有的i均有[gi(x)≥gj(x)],則把x分為第j類,記成r(x)=j(luò)。對于線性判別函數(shù),[gi(x)]的函數(shù)形式為
[gi(x)=wi0+wi1x1+wi2x2+…+widxd]
式中x1,x2,…,xd是輸入模式特征向量的各個分量,Wi0,Wi1,…,Wid組成與第i類對應(yīng)的權(quán)向量,它們的大小反映與它們對應(yīng)的特征向量的各個分量在確定第i類判別函數(shù)值的重要程度。
特征空間中分別與第i類、第j類相對應(yīng)的區(qū)域之間的決策邊界形式為
對于一個兩類分類器,可以計算g(x)=g2(x)-g1(x)。若g(x)≥0,則r(x)=2,相應(yīng)于決策區(qū)R2。若g(x)<0,則r(x)=1,相應(yīng)于決策區(qū)R1。這一結(jié)果可寫成
2圖像分類識別系統(tǒng)實現(xiàn)
2.1顏色空間與量化
顏色空間有很多類型,常見的有HSV顏色空間、RGB顏色空間等,其中HSV顏色空間更接近人的視覺特性,其中包括色調(diào)H(Hue)、飽和度S(Saturation)和亮度V(Value)。在以圖像內(nèi)容為條件的圖像識別中,HSV顏色空間比RGB顏色空間更適合辨別。根據(jù)人眼的識別能力,顏色大致分為9種:紅、黃、綠、青、藍、紫、黑、灰和白,根據(jù)這9種顏色基本可以描繪一幅圖像。因此,由這9種顏色可確定圖像的主顏色特征,其具體量化方法詳見參考文獻[5]。
2.2圖像分塊主色的實現(xiàn)
該文對識別圖像做4*4的劃分,得到16個子圖像。對每個子圖像進行像素顏色統(tǒng)計,取數(shù)值最高的顏色為主顏色,這樣就得到識別圖像對應(yīng)的16個主顏色特征向量。此種方法突出每個子圖像顏色的空間關(guān)系,適用于顏色特征固定的分類問題,但對顏色變化明顯的圖像效果一般。
2.3主要MATLAB程序
3圖形用戶界面
MATLAB的GUIDE功能提供了便捷的軟件界面設(shè)計工具箱,利用此工具箱可設(shè)計出形象直觀的人機交互界面。圖像識別系統(tǒng)界面主要內(nèi)容是各個空間的回調(diào)函數(shù),利用回調(diào)函數(shù)可執(zhí)行相應(yīng)控件的功能,下面以菜單“線性函數(shù)”下的“獎懲算法”按鈕為例,給出其回調(diào)函數(shù)的Callback的語句
在MATLAB提示符下輸入系統(tǒng)名“PDHS”命令,啟動如圖1所示的系統(tǒng)主界面,用戶可用其中的載入圖像按鈕載入待識別的圖像,在菜單項中選擇“線性函數(shù)”的“獎懲算法”選項按鈕,系統(tǒng)就可顯示待識別圖像的類別,顏色矩陣,分類時間等信息。
4總結(jié)
該文介紹了利用MATLAB軟件開發(fā)基于判別函數(shù)的圖像分類系統(tǒng)的方法和步驟,選取了模式識別中常用的基于判別函數(shù)的算法,實現(xiàn)了對兩類圖像的分類問題。利用MATLAB圖形用戶界面(GUI)方法,設(shè)計了良好的人機交互系統(tǒng)的主界面,最后給出了實際例子的程序運行結(jié)果,對推動模式識別理論在圖像分類問題實踐中的應(yīng)用和普及,具有實際意義。軟件系統(tǒng)的性能還需要進一步提高,進一步工作包括增加聚類分析等算法,實現(xiàn)對三類及多類的圖像識別問題。
參考文獻:
[1]楊淑瑩.模式識別與智能計算—MALAB技術(shù)實現(xiàn)[M].北京:電子工業(yè)出版社,2008:67-78.
[2]陳垚光,王玲.精通MATLABGUI設(shè)計[M].北京:電子工業(yè)出版社,2007:21-34.
[3]王家文.MATLAB7.6圖形圖像處理[M].北京:國防工業(yè)出版社,2008:78-100.
[4]余芳.基于顏色特征的圖像檢索技術(shù)研究[D].中國石油大學(xué),2007.
[5]徐擇峰,陳世鴻.一種統(tǒng)一的文本與圖像分類算法[J].武漢大學(xué)學(xué)報:理學(xué)版,2004,50(1):79-82.