蔡德明 孫宇 馬濤 許蘭東 吉林大學(xué)軟件學(xué)院
精細(xì)圖像分類方法的研究
蔡德明 孫宇 馬濤 許蘭東 吉林大學(xué)軟件學(xué)院
隨著計(jì)算機(jī)技術(shù),人工智能技術(shù)的飛速發(fā)展,人們的需求也在隨著技術(shù)的提高而渴望得到提升,因此模式分類技術(shù)的發(fā)展顯得尤為重要,但目前的專家和學(xué)者都把主要研究內(nèi)容聚焦在基本層的分類上,而很少在從屬層分類上進(jìn)行研究,即對(duì)具有相同基本層屬性的圖像,或具有相似視覺的圖像進(jìn)行分類,也就是對(duì)圖像進(jìn)行精細(xì)分類。
精細(xì)分類 機(jī)器學(xué)習(xí) 圖像分類器
精細(xì)圖像分類方法是近年來新興起的前沿研究方向,此項(xiàng)目對(duì)生物學(xué),生態(tài)學(xué),地質(zhì)學(xué)等多個(gè)領(lǐng)域的發(fā)展有著很大的促進(jìn)作用。目前國外相關(guān)研究已經(jīng)發(fā)展到一定階段,但國內(nèi)進(jìn)度相對(duì)緩慢。該項(xiàng)目旨在在原有數(shù)據(jù)庫的基礎(chǔ)上,對(duì)噪聲,光照等因素進(jìn)行處理,設(shè)計(jì)高效準(zhǔn)確的分類器。隨著工業(yè)技術(shù)的逐步提高,精細(xì)圖像分類技術(shù)定會(huì)成為圖像分類的焦點(diǎn)。
圖像的采集過程中會(huì)受到采集設(shè)備、光照、噪聲和背景環(huán)境等影響,這些不利因素可能對(duì)提取圖像中的關(guān)鍵元素產(chǎn)生一定的阻礙作用。為改善圖像的質(zhì)量,首先要對(duì)圖像進(jìn)行預(yù)處理。主要有兩種基本思路:
(1)圖像的增強(qiáng):不考慮次要信息對(duì)圖像產(chǎn)生的降質(zhì)影響,只對(duì)圖像中我們感興趣的特征進(jìn)行有選擇的突出,而相對(duì)衰減其他信息,從而提高圖像的可讀性。
(2)圖像的復(fù)原:針對(duì)圖像的降質(zhì)原因,設(shè)法補(bǔ)償降質(zhì)的元素,使改善后的圖像盡可能接近原始圖像。
圖像需要在很多方面進(jìn)行預(yù)處理,這里我們主要探討光照和噪聲兩方面:
(1)基于光照因素的預(yù)處理:人眼感受到的亮度與進(jìn)入人眼的光強(qiáng)度成對(duì)數(shù)關(guān)系,對(duì)數(shù)變換后的圖像感覺柔和,符合人類的視覺特點(diǎn)。對(duì)數(shù)變換使圖像低灰度范圍的值進(jìn)行擴(kuò)展,高灰度范圍的值進(jìn)行壓縮,對(duì)光照不足的圖像有很好的補(bǔ)償作用,但對(duì)光照過強(qiáng)圖像卻無能為力,而指數(shù)變換則對(duì)過亮圖像可以進(jìn)行光照補(bǔ)償。
(2)基于噪聲因素的預(yù)處理:目前為止圖像去噪的方法有很多,但是大多數(shù)方法都是基于二階微分的推導(dǎo),但是經(jīng)過長時(shí)間的實(shí)驗(yàn)可以看出此方法有很多局限性,會(huì)使得圖像出現(xiàn)視覺呆板的效果,且容易出現(xiàn)偽邊緣,因此我們這次嘗試新的方法。通過大量的數(shù)據(jù)證明,采用四階微分偏導(dǎo)可以改善這種缺陷,并且對(duì)圖像的去噪處理也可以做到很好的效果。去噪處理完成的圖像可以達(dá)到更加自然逼真的效果。
圖像信息的表示是精細(xì)圖像分類的關(guān)鍵,因?yàn)榫?xì)圖像在形狀上和視覺感上都極其的相似,因此對(duì)其進(jìn)行精細(xì)的分類無疑是很嚴(yán)峻的挑戰(zhàn)。由于基于碼本和詞典的表示方法會(huì)對(duì)圖像的關(guān)鍵信息造成缺失的問題,而釋文解釋的方法雖然很好的解決了這類問題,但人工成本過高,所以我們采用另一種模板匹配的方法來表示圖像。
主要思路為:首先從選取的樣圖中以隨機(jī)生成的方式產(chǎn)生模板,將要分類的圖像與模板進(jìn)行匹配,抽取出匹配成功的關(guān)鍵點(diǎn),圖像與模板的匹配程度可以表示為很多種形式,在這里我們采用形狀特征和顏色特征的兩種形式來表示,在每個(gè)特征圖中進(jìn)行選取匹配程度最大的特征向量,將多組特征向量組合在一起構(gòu)成目標(biāo)圖像,不同特征向量表示可以采用融合策略進(jìn)行有效融合,共同表示圖像信息
分類器設(shè)計(jì)是精細(xì)圖像分類的最后一個(gè)環(huán)節(jié),也是至關(guān)重要的環(huán)節(jié)。分類器設(shè)計(jì)的好壞,將直接決定最終的分類結(jié)果。由于我們擬采用隨機(jī)生成大量模板訓(xùn)練并分類精細(xì)圖像,因而會(huì)存在模板局部交疊,信息冗余或不具判別性等風(fēng)險(xiǎn),訓(xùn)練的分類器也很有可能遭遇過擬合問題。為此,我們擬采用具有很好穩(wěn)定性的Bagging算法設(shè)計(jì)分類器(bagging是一種用來提高學(xué)習(xí)算法準(zhǔn)確度的方法,這種方法通過構(gòu)造一個(gè)預(yù)測(cè)函數(shù)系列,然后以一定的方式將它們組合成一個(gè)預(yù)測(cè)函數(shù)。Bagging要求“不穩(wěn)定”(不穩(wěn)定是指數(shù)據(jù)集的小的變動(dòng)能夠使得分類結(jié)果的顯著的變動(dòng))的分類方法)。Bagging算法具有如下優(yōu)點(diǎn):
(1)訓(xùn)練集是隨機(jī)的,各訓(xùn)練集是獨(dú)立的;
(2)每個(gè)預(yù)測(cè)函數(shù)(即弱假設(shè))沒有權(quán)重;
(3)各個(gè)預(yù)測(cè)函數(shù)可以并行生成,通過并行訓(xùn)練節(jié)省大量時(shí)間;
(4)一般情況下,Bagging方法總是可以改善學(xué)習(xí)系統(tǒng)的性能。
具體目標(biāo)函數(shù)如下:
其中W1,W2…Wp為特征集權(quán)重,l()中為代價(jià)損失函數(shù),N為訓(xùn)練樣本個(gè)數(shù),xi為第i幅圖像的特征向量表示,yi為類標(biāo)簽,P為Bagging算法包含的分類器個(gè)數(shù),α和β為正則化參數(shù),分別控制特征集權(quán)重的稀疏性和正交性。
目前,精細(xì)圖像分類的研究已成為國際上的熱點(diǎn)課題之一。隨著計(jì)算機(jī)、人工智能等新技術(shù)的不斷突破和創(chuàng)新,以及人們需求的不斷增長,準(zhǔn)確、高效、魯棒的精細(xì)圖像分類技術(shù)將對(duì)上述學(xué)科領(lǐng)域和人們生產(chǎn)生活發(fā)揮越來越重要的作用。
[1]席偉.基于判別函數(shù)算法的圖像分類器設(shè)計(jì)[J].電腦知識(shí)與技術(shù),2012,8(33):8018-8020+8032.[2017-08-31].
[2]謝曉東.面向花卉圖像的精細(xì)圖像分類研究[D].廈門大學(xué),2014.
[3]吳會(huì)寧.基于內(nèi)容的花卉圖像檢索算法研究[D].揚(yáng)州大學(xué),2014.