国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于判別子字典學(xué)習(xí)的圖像分類優(yōu)化方法

2021-12-01 05:26:06鐘佳瑩呂文濤
關(guān)鍵詞:訓(xùn)練樣本字典類別

趙 雅,鐘佳瑩,呂文濤

(浙江理工大學(xué) 信息學(xué)院,杭州 310018)

0 引言

歷年來,判別字典學(xué)習(xí)算法在處理視覺跟蹤、計(jì)算機(jī)視覺和圖像處理等各個(gè)領(lǐng)域都有著廣泛的應(yīng)用。文獻(xiàn)[1]提出了一種通過共享特征的、具有特征結(jié)構(gòu)的字典學(xué)習(xí)算法,針對每一類樣本進(jìn)行字典學(xué)習(xí),并對字典進(jìn)行聚類,從而將同一學(xué)習(xí)字典下相關(guān)聯(lián)的數(shù)據(jù)點(diǎn)聚集在一起。文獻(xiàn)[2]將原始數(shù)據(jù)的局部關(guān)系,整合到基本字典學(xué)習(xí)框架中。DDL(Discriminant Dictionary Learning,判別字典學(xué)習(xí))算法模型,考慮了類內(nèi)局部信息和類間特征模糊性。由于判別字典學(xué)習(xí)依賴于預(yù)先設(shè)置的系數(shù)矩陣的初始值和樣本數(shù)量,因此該方法不建議直接應(yīng)用于類間特征模糊度較大的圖像目標(biāo)。

基于以上描述,本文在文獻(xiàn)[3]的基礎(chǔ)上,改進(jìn)并提出了基于判別子字典學(xué)習(xí)的圖像分類優(yōu)化方法。在目標(biāo)函數(shù)的基礎(chǔ)上,構(gòu)造一個(gè)子字典的低秩約束項(xiàng)、標(biāo)簽信息約束項(xiàng)和拉普拉斯矩陣正則化項(xiàng)。針對每一類圖像,學(xué)習(xí)其對應(yīng)的特定字典,使字典中包含該類別的特定原子,規(guī)避不同子字典之間原子的相關(guān)性。通過標(biāo)簽信息約束項(xiàng),將大系數(shù)集中在某一類別的特定原子上,加強(qiáng)判別能力。同時(shí)將原始樣本映射到一個(gè)新的空間中,使同一類別的相鄰點(diǎn)彼此靠近,增強(qiáng)子字典對同類樣本的重構(gòu)能力。為了提高分類的準(zhǔn)確率和規(guī)避特征圖像的字典中的重復(fù)原子,在分類過程中引入重建殘差,通過重建殘差估計(jì)測試樣本的類別標(biāo)簽,提高字典的判別能力,得到算法的分類準(zhǔn)確率。

1 本文算法

1.1 字典學(xué)習(xí)模型構(gòu)建

設(shè)DC =[d1,…,dK]∈Rn×K表示第C類樣本的學(xué)習(xí)字典,表示第C類訓(xùn)練樣本。在提出的快速低秩的判別子字典學(xué)習(xí)算法[3]的基礎(chǔ)上,加強(qiáng)子字典的約束重構(gòu)能力,結(jié)合樣本的標(biāo)簽信息提出以下目標(biāo)函數(shù):

1.2 標(biāo)簽矩陣

針對不同類別的樣本,為了提高字典的判別能力,通過標(biāo)簽矩陣使大系數(shù)主要集中在同一類別的原子上,盡可能地保留同一類樣本的標(biāo)簽屬性并減少其它類別原子產(chǎn)生的誤差影響,如圖1 所示。定義一個(gè)標(biāo)簽矩陣Hc∈RK×K,標(biāo)簽矩陣的系數(shù)可定義為:

圖1 標(biāo)簽矩陣示意圖Fig.1 Schematic diagram of label matrix

其中,Hc(m,n)表示相應(yīng)向量的第(m,n)個(gè)分量。

1.3 拉普拉斯正則化矩陣

對于目標(biāo)函數(shù)中的拉普拉斯組正則化項(xiàng),由于有C個(gè)不同類別的樣本,因此構(gòu)建圖時(shí),將屬于同一類別的樣本對應(yīng)的頂點(diǎn)相互靠近并兩兩相連,構(gòu)成一個(gè)緊密相連子圖,從而形成C個(gè)互不相連的子圖。已知訓(xùn)練樣本和稀疏編碼矩陣可以由一個(gè)N個(gè)點(diǎn)組成的直線來表示訓(xùn)練樣本中第K個(gè)元素的圖映射[1]:

可以得到拉普拉斯映射中圖的總間距:

則式(4)可以表示為:

綜上,對于第C類樣本,本節(jié)所提出的目標(biāo)函數(shù)可以表示為:

2 算法求解

由于目標(biāo)函數(shù)現(xiàn)在是非凸函數(shù),因此通過迭代逐步更新字典和稀疏表示矩陣來求解。本文分別從訓(xùn)練過程與測試過程上對算法進(jìn)行分析。

2.1 訓(xùn)練過程

針對第C類樣本,首先初始化學(xué)習(xí)字典和稀疏表示矩陣。隨機(jī)初始化學(xué)習(xí)字典,在訓(xùn)練樣本Zc中隨機(jī)選取K個(gè)樣本作為初始字典的原子。由基礎(chǔ)的字典學(xué)習(xí)目標(biāo)函數(shù)得到初始化的稀疏表示矩陣:

然后,固定字典,更新稀疏表示矩陣。由式(6)可以得到第C類樣本的稀疏表示矩陣Vc:

對第C類樣本逐個(gè)更新稀疏表示矩陣,即

可以得到的解析解:

固定稀疏表示矩陣,逐列更新子字典。即第C類樣本對應(yīng)的字典求解公式為:

為了充分利用已經(jīng)更新的字典,選擇按原子依次更新字典,則式(11)可以改為:

對上式求解,可以得到

2.2 測試過程

理想情況下,所獲得的稀疏編碼向量中的原子,除了與zi所屬類別相關(guān)的原子外,其它原子應(yīng)為0。因此,針對這種情況,定義一個(gè)選擇算子δi(),使獲得的算子元素除了所屬類標(biāo)簽的原子外,其余全部為0。對測試樣本在這一子類上計(jì)算重建殘差:

由于有C個(gè)子字典,因此測試樣本zc可以得到C個(gè)重建殘差,對每個(gè)重建殘差進(jìn)行判斷,該測試樣本的最佳類別就是其最小殘差所對應(yīng)的類別的歸屬類:

綜上,基于子分類的判別字典學(xué)習(xí)圖像分類優(yōu)化算法步驟如下:

(1)輸入訓(xùn)練樣本Z =[Z1,…,ZC]以及參數(shù)λ、β、γ、η;

(2)計(jì)算:通過式(17)初始化。

(3)固定字典:通過式(10)逐列更新稀疏表示系數(shù);

(4)固定稀疏表示系數(shù):通過式(13)逐列更新字典;

(5)重復(fù)步驟3 和步驟4,直到算法收斂或達(dá)到所設(shè)定的迭代次數(shù);

(6)輸出學(xué)習(xí)字典Dlen。

3 實(shí)驗(yàn)結(jié)果與分析

本節(jié)將提出的新算法與多種方法進(jìn)行比較。所有算法均基于Matlab R2016b 進(jìn)行編寫,并在聯(lián)想天翼的windows 7 系統(tǒng)中運(yùn)行,具有3.20-GHz Intel Core i5-6500 CPU 和4.0GB 內(nèi)存。

(1)ExtendedYaleB 數(shù)據(jù)集[4]:由來自38 個(gè)人在64 種照明條件下的2 440張人臉圖像組成。每類圖像約有64 張,圖像尺寸設(shè)置為192×168。選取每類的32 張圖像作為訓(xùn)練集,剩余圖像作為測試集。通過交叉驗(yàn)證獲得參數(shù),見表2。為了確保算法的準(zhǔn)確性,選取10 次實(shí)驗(yàn)結(jié)果的平均值,作為最終準(zhǔn)確率,其結(jié)果見表3。由此可見,本文所提算法具有更好的精度,且高于文獻(xiàn)[3]的算法準(zhǔn)確率。

表2 不同數(shù)據(jù)集的參數(shù)設(shè)置Tab.2 Parameter settings on different databases

(2)Caltech 101 數(shù)據(jù)集[5]:由來自101 個(gè)對象類別和一個(gè)背景類別的9 144 幅圖像組成。每類圖像的張數(shù)不等,類別包含蝴蝶、美洲獅、美洲駝、人臉、手風(fēng)琴、海豚等目標(biāo)。該數(shù)據(jù)集中各類樣本之間不僅千差萬別,同類樣本內(nèi)也在形狀上各有差異,該數(shù)據(jù)集具有較高的復(fù)雜性。針對該情況,本文實(shí)驗(yàn)選取了6 類圖片,每類圖像中選用32 張、64 張和80張進(jìn)行訓(xùn)練,類別的剩余圖片進(jìn)行測試。

實(shí)驗(yàn)首先對每類圖片進(jìn)行特征提取,從16×16色塊中提取篩選描述符,這些色塊使用步長為6 的網(wǎng)格進(jìn)行密集采樣;然后基于提取的具有3x1、1、2x2 和4x4 網(wǎng)格的篩分特征提取空間金字塔特征[6]。采用標(biāo)準(zhǔn)的k 均值聚類訓(xùn)練,用于空間金字塔的碼本,其中k =1 024。最后,PCA 將空間金字塔特征從21 504維縮減為3 000個(gè)維度。由表3 可見本文所提算法較其他算法獲得了更好的性能。

(3)天池布匹疵點(diǎn)數(shù)據(jù)集:由32 類不同疵點(diǎn)共1 996張圖像組成。每類圖像張數(shù)不等,分別有擦洞、吊經(jīng)、污漬、粗紗、破邊等多種類別。將天池布匹疵點(diǎn)圖像分為正常圖像與疵點(diǎn)圖像兩種類別,選取每類200 張圖像作為訓(xùn)練樣本,剩余圖像作為測試樣本。圖像尺寸均調(diào)整為256×256。在特征提取階段,為了獲得更準(zhǔn)確的特征信息,將疵點(diǎn)圖像等分為16×16 的圖像塊。對每個(gè)圖像塊進(jìn)行LBP 算子子分類,然后對每個(gè)窗口提取GLCM 和HOG 特征,將所有圖像塊的特征組成該圖像的特征向量,用來表示該圖像的特征信息。以這種方法,使每個(gè)圖像的特征信息以不同的結(jié)果多次出現(xiàn)在特征向量中。實(shí)驗(yàn)結(jié)果見表3,本文的算法精度同樣取得了明顯的提升。

表3 不同數(shù)據(jù)集的分類準(zhǔn)確率Tab.3 Classification accuracy on different databases

4 結(jié)束語

在本文中,研究了一個(gè)基于判別子字典學(xué)習(xí)的圖像分類優(yōu)化方法,主要針對如何減少類間模糊和類內(nèi)差異的問題。通過拉普拉斯正則化矩陣、標(biāo)簽信息矩陣和字典約束項(xiàng),設(shè)計(jì)特定于每個(gè)子類的字典,使子字典中包含該類別的特定原子,減弱不同子字典之間原子的相關(guān)性,放大該類別特定原子的系數(shù),將樣本的類別標(biāo)簽信息和空間幾何結(jié)構(gòu)整合到字典學(xué)習(xí)的目標(biāo)函數(shù)中,從而增加子字典的判別重構(gòu)能力。同時(shí),本文在3 個(gè)不同的圖像數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),證明了該方法的可靠性。后續(xù)工作可以結(jié)合特定圖像的特征提取方法,在圖像分類、紋理識別等方面做進(jìn)一步研究。

猜你喜歡
訓(xùn)練樣本字典類別
開心字典
家教世界(2023年28期)2023-11-14 10:13:50
開心字典
家教世界(2023年25期)2023-10-09 02:11:56
人工智能
寬帶光譜成像系統(tǒng)最優(yōu)訓(xùn)練樣本選擇方法研究
融合原始樣本和虛擬樣本的人臉識別算法
我是小字典
基于稀疏重構(gòu)的機(jī)載雷達(dá)訓(xùn)練樣本挑選方法
正版字典
讀者(2016年14期)2016-06-29 17:25:50
服務(wù)類別
新校長(2016年8期)2016-01-10 06:43:59
論類別股東會
商事法論集(2014年1期)2014-06-27 01:20:42
盐池县| 遂平县| 云南省| 保靖县| 驻马店市| 安图县| 武威市| 德昌县| 巩义市| 博爱县| 徐水县| 沂南县| 麦盖提县| 安新县| 阜宁县| 郴州市| 泽库县| 鸡东县| 鲁甸县| 托里县| 忻城县| 民县| 饶平县| 苍梧县| 临武县| 营口市| 肃南| 若尔盖县| 沂水县| 偏关县| 丰顺县| 曲阳县| 潜江市| 保德县| 防城港市| 凌源市| 商河县| 广平县| 荣成市| 五河县| 海丰县|