曹攀+董洪偉
摘要:針對(duì)復(fù)雜場(chǎng)景中難以標(biāo)注對(duì)象輪廓的問(wèn)題,提出一種基于支持向量機(jī)的場(chǎng)景標(biāo)注方法。首先采用結(jié)構(gòu)森林法生成邊緣概率,再運(yùn)用分水嶺算法將邊緣概率轉(zhuǎn)化成初始圖像塊。為避免過(guò)分分割,減少訓(xùn)練開(kāi)支,利用UCM算法并選取適當(dāng)?shù)拈撝堤岣邎D像塊對(duì)輪廓的精確度,最后通過(guò)支持向量機(jī)訓(xùn)練分割的圖像塊進(jìn)行場(chǎng)景標(biāo)注。實(shí)驗(yàn)表明,在處理復(fù)雜的戶外場(chǎng)景標(biāo)注時(shí),基于支持向量機(jī)的場(chǎng)景標(biāo)注方法在像素精確度上表現(xiàn)良好,在對(duì)象輪廓上標(biāo)注效果較好。
關(guān)鍵詞:對(duì)象輪廓;分水嶺;支持向量機(jī);場(chǎng)景標(biāo)注
DOIDOI:10.11907/rjdk.171167
中圖分類號(hào):TP301
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2017)006-0015-04
0 引言
在計(jì)算機(jī)視覺(jué)領(lǐng)域,場(chǎng)景標(biāo)注[1]作為圖像分析的一個(gè)重要環(huán)節(jié)受到廣泛關(guān)注。場(chǎng)景標(biāo)注的主要任務(wù)是識(shí)別圖像中每個(gè)像素所屬類別。由于圖像常會(huì)受到不同光照強(qiáng)度、對(duì)象遮擋以及對(duì)象種類繁多和復(fù)雜的場(chǎng)景問(wèn)題,導(dǎo)致像素標(biāo)注錯(cuò)誤,無(wú)法很好地標(biāo)注對(duì)象輪廓,最終導(dǎo)致場(chǎng)景標(biāo)注效果不理想。因此,如何有效提取圖像中對(duì)象的整體信息,描述圖像對(duì)象輪廓,一直都是值得研究的問(wèn)題。
當(dāng)前的場(chǎng)景標(biāo)注方法是直接在圖像像素的基礎(chǔ)上訓(xùn)練模型,而單純?cè)谙袼厣嫌?xùn)練模型很難描述對(duì)象輪廓,從而使場(chǎng)景標(biāo)注難以獲得理想效果。基于此,本文提出一種基于支持向量機(jī)的場(chǎng)景標(biāo)注方法SVM-SLM(Scene labeling method based on support vector machine),通過(guò)訓(xùn)練圖像塊,有效解決了基于圖像中對(duì)象輪廓的描述問(wèn)題,在像素精確度上也有良好表現(xiàn)。
2 SVM-SLM方法描述
傳統(tǒng)的基于像素訓(xùn)練的場(chǎng)景標(biāo)注模型無(wú)法描述對(duì)象輪廓,會(huì)出現(xiàn)預(yù)測(cè)對(duì)象丟失和對(duì)象不完整的問(wèn)題,從而影響像素精度。文獻(xiàn)[2]、[ 3]、[4]研究的場(chǎng)景標(biāo)注方法時(shí)間開(kāi)銷過(guò)大,并且精確度不高。針對(duì)以上問(wèn)題本文提出了SVM-SLM方法,具體步驟如下:①采用結(jié)構(gòu)森林方法[5]生成圖像的邊緣概率圖;②將上述生成的邊緣概率圖用分水嶺方法將圖像劃分為初始圖像塊;③為防止分水嶺方法過(guò)度分割并且減少接下來(lái)的訓(xùn)練開(kāi)支,通過(guò)UCM算法選取閾值,優(yōu)化圖像塊;④對(duì)圖像塊提取特征,利用支持向量機(jī)訓(xùn)練圖像塊得到場(chǎng)景標(biāo)注結(jié)果,并實(shí)現(xiàn)具有良好精確度及輪廓效果的場(chǎng)景標(biāo)注方法。
3 生成圖像塊
邊緣檢測(cè)是計(jì)算機(jī)視覺(jué)系統(tǒng)中的一個(gè)重要環(huán)節(jié),包括對(duì)象檢測(cè)[6]、目標(biāo)預(yù)測(cè)[7-8]以及場(chǎng)景分析[9]。邊緣形狀是目標(biāo)對(duì)象幾何形態(tài)描述的重要表現(xiàn)內(nèi)容,圖像中對(duì)象的輪廓往往來(lái)自于圖像的邊緣信息,所以有效提取圖像邊緣信息方法是關(guān)鍵。
傳統(tǒng)的水平集模型需把輪廓曲線演化的能量方程轉(zhuǎn)化為微分方程,進(jìn)而借助梯度下降法求得方程最優(yōu)解。這一過(guò)程不僅耗時(shí),而且導(dǎo)致計(jì)算結(jié)果不穩(wěn)定。考慮到一般圖像塊對(duì)圖像的局部特征表現(xiàn)效果很好,本文利用圖像塊對(duì)邊緣學(xué)習(xí)能力很強(qiáng)的特點(diǎn),提出結(jié)構(gòu)森林[5]與分水嶺相結(jié)合的方法。首先利用結(jié)構(gòu)森林的學(xué)習(xí)方法建立隨機(jī)決策森林,學(xué)習(xí)每個(gè)像素的邊緣概率,生成邊緣概率圖,此過(guò)程不但解決了耗時(shí)問(wèn)題還取得了良好的邊緣檢測(cè)效果;再將邊緣概率帶入分水嶺方法生成初始圖像塊,得到包含輪廓信息的初始圖像塊,效果如圖2所示(彩圖見(jiàn)封二)。圖2(a)和圖2(d)測(cè)試為圖像,圖2(b)和圖2(e)為對(duì)應(yīng)的邊緣概率圖,圖2(c)和圖2(f)為初始圖像塊。
4 訓(xùn)練SVM模型
傳統(tǒng)的像素訓(xùn)練無(wú)法保留圖像中對(duì)象的輪廓信息,訓(xùn)練時(shí)單純對(duì)像素提取特征,忽略了像素之間的局部空間信息,不能很好表達(dá)圖像中像素之間的區(qū)域結(jié)構(gòu)信息。本文通過(guò)對(duì)帶有對(duì)象輪廓信息的圖像塊進(jìn)行訓(xùn)練,在進(jìn)行語(yǔ)義標(biāo)注的同時(shí)保留了對(duì)象輪廓信息。
采用核描述、核匹配方法,通過(guò)2*2網(wǎng)格模型提取像素的紋理特征、顏色特征和梯度特征,對(duì)應(yīng)于同一圖像塊的像素特征加權(quán)合并為圖像塊特征。隨機(jī)提取10塊圖像塊生成特征圖,利用支持向量機(jī)算法對(duì)圖像塊進(jìn)行訓(xùn)練,如圖4所示。
5 實(shí)驗(yàn)結(jié)果及分析
為了驗(yàn)證方法的有效性,圖像數(shù)據(jù)集采用Stanford Background數(shù)據(jù)庫(kù)[11],數(shù)據(jù)庫(kù)共715幅復(fù)雜的戶外場(chǎng)景圖片,每張圖像大小為320×240像素,附有標(biāo)注好的正確語(yǔ)義圖片。每個(gè)像素劃分為一類,共8個(gè)類別,總計(jì)5 491萬(wàn)多像素標(biāo)記樣本,類別分別為天空、樹(shù)、馬路、草地、水、建筑物、山脈和前景對(duì)象。
實(shí)驗(yàn)隨機(jī)提取五組訓(xùn)練集和測(cè)試集依次帶入公共圖像塊閾值[0.1,0.2,0.3,0.4,0.5]進(jìn)行評(píng)估,每組訓(xùn)練集提取572個(gè)圖片,運(yùn)用本文方法分割成若干圖像塊,平均每組圖片被分割成5萬(wàn)多塊圖像塊,運(yùn)用支持向量機(jī)對(duì)這些圖像塊進(jìn)行訓(xùn)練。用剩余143個(gè)圖片作為測(cè)試集,平均分割成1萬(wàn)多個(gè)圖像塊進(jìn)行測(cè)試,并對(duì)每個(gè)像素進(jìn)行語(yǔ)義標(biāo)注。實(shí)驗(yàn)效果如圖5所示(彩圖見(jiàn)封二)。圖5(a)為部分測(cè)試圖像,圖5(b)為數(shù)據(jù)庫(kù)正確標(biāo)注圖像,圖5(c)為本文方法的場(chǎng)景標(biāo)注圖像,圖5(d)為標(biāo)注失準(zhǔn)圖,標(biāo)注錯(cuò)誤的像素呈黑色,正確的為白色。圖5下方8個(gè)色塊分別代表8個(gè)不同的類別。
利用結(jié)構(gòu)森林生成邊緣概率圖,將圖像邊緣作為對(duì)象輪廓候選區(qū),提高了場(chǎng)景標(biāo)注對(duì)對(duì)象輪廓的標(biāo)注能力。再通過(guò)UCM算法優(yōu)化圖像塊,最終場(chǎng)景標(biāo)注結(jié)果如圖6所示。圖6表明,本文方法在人物、車輛、動(dòng)物等重要的前景對(duì)象輪廓細(xì)節(jié)上有較好的描述。
6 結(jié)語(yǔ)
場(chǎng)景標(biāo)注是計(jì)算機(jī)視覺(jué)技術(shù)的關(guān)鍵步驟。針對(duì)像素訓(xùn)練模型容易忽略圖像空間結(jié)構(gòu)信息,無(wú)法描述對(duì)象輪廓的問(wèn)題,提出一種基于支持向量機(jī)的場(chǎng)景標(biāo)注方法。通過(guò)結(jié)構(gòu)森林/UCM生成圖像塊,構(gòu)建支持向量機(jī)模型,訓(xùn)練得到場(chǎng)景標(biāo)注結(jié)果。實(shí)驗(yàn)表明該方法較好地描述了圖像中的對(duì)象輪廓,獲得了良好的精確度和標(biāo)注效果。但是,由于特征描述采用核描述提取特征,對(duì)部分圖像塊不能有效提取特征,導(dǎo)致部分圖像塊標(biāo)注不正確,影響了總體精確度。下一步的工作目標(biāo)是提高有效特征的提取,以獲取更高的精確度及場(chǎng)景標(biāo)注效果。