曹蒙蒙,李新葉,范月坤
(華北電力大學電子與通信工程系,河北保定 071003)
車輛識別是智能交通系統(tǒng)的重要研究內(nèi)容。隨著汽車數(shù)量的增加,汽車假牌、套牌等現(xiàn)象越來越多。這就對車輛識別研究提出更高的要求,即在識別車牌號碼的同時也要識別出車型,若要確定車牌與車型的一致性,即鑒別是否為套牌車輛。因此,基于交通圖像的車標識別因其在公共安全中的重要意義受到越來越多的關(guān)注。關(guān)于車輛類型的研究,現(xiàn)在主要集中在識別大型貨車、中型汽車、小型轎車的范圍[1-2]。對車輛所屬的具體車型進行識別難度較大,對于車輛品牌的識別,有些采用車的前臉作為研究對象進行車型識別[3],但由于詳盡車型的車臉特征不突出,因此識別率低。通常采用車標識別的方法來實現(xiàn)。
目前國內(nèi)外學者已在車標識別方面進行了相關(guān)的研究,例如文獻[4]使用模版匹配的方法進行車標識別,文獻[5]中采用模版匹配進行粗識別然后采用特征進行二次識別,文獻[6]提出了基于 Hu不變矩的識別方法,文獻[7]利用獨立成分分析提取車標的特征然后采用模糊支持向量機實現(xiàn)車標分類,D.F.Llorca等人提取車標的HOG特征并采用支持向量機進行車標識別[8]。
然而,由于許多非理想條件(天氣,反光、車輛運動、車輛表面污損等),導致采集到的車標圖像不理想,而上述方法沒有考慮到圖像本身質(zhì)量差帶來識別率低的問題。由于陰影、反光、遮擋、污損等原因使得實際獲取的圖像低秩結(jié)構(gòu)被破壞,影響分類性能。文獻[9~10]對矩陣的低秩恢復進行了研究。針對車標識別中圖像質(zhì)量不理想的情況,本文提出將判別低秩矩陣恢復的思想應(yīng)用于車標識別,通過向字典學習的目標函數(shù)中添加一個理想編碼的正則項,將類別標簽信息納入字典學習的過程,使得學習到的用于稀疏表示的字典具有良好的重構(gòu)性和判別力,同時學習一個低秩投影矩陣將測試樣本投影到相應(yīng)的底層子空間來去除測試樣本中可能的破壞,然后利用基于最小重建誤差的稀疏表示進行車標識別。
近年來,以信號重構(gòu)誤差最小化為目標、約束表示系數(shù)的稀疏性的稀疏表示模型,以其強大的信號表示能力被廣泛應(yīng)用于信號處理與模式識別中。Wright等人[11]稀疏表示分類應(yīng)用于人臉識別中。其核心思想是尋找測試樣本在字典中最稀疏的原子表示,即用最少數(shù)目訓練樣本的線性組合來表示測試樣本。假定有k類樣本,每一類樣本包含n個訓練樣本,用矩陣D=[D1,D2,…,Dk]表示原始的訓練樣本,其中 Di表示第i 類訓練樣本 Di=[Di,1,Di,2,…,Di,n],Di,j表示第 i類中第j個樣本的特征向量。y表示測試樣本,對測試樣本進行稀疏表示分類步驟如下:
(1)編碼階段。通過l1范數(shù)最小化在字典A上對y進行稀疏編碼
其中,γ是一個正數(shù),為一個標量。
(2)分類階段。通過式(2)進行分類
由于陰影、反光、遮擋等的影響,實際獲取的車標圖像低秩結(jié)構(gòu)被破壞,影響分類性能。因此,有效地從具有噪聲的圖像中恢復低秩車標子空間,即去除樣本中由于遮擋、光照等因素而產(chǎn)生的嚴重誤差,是提高識別效果的關(guān)鍵。從損壞的訓練圖像樣本中恢復一個干凈的字典用于稀疏表示就要用到低秩矩陣恢復(LRR)。由于最基本的低秩矩陣恢復算法[12]不具有判別性,并不適合分類識別。為更好地進行分類,向字典學習的目標函數(shù)中添加一個理想編碼的正則項,將類別標簽信息納入字典學習的過程,使得判別低秩矩陣恢復的用于稀疏表示分類的字典具有判別性。
給定一個由類車標樣本組成的數(shù)據(jù)矩陣X=[X1,X2,…,XN],其中 Xi對應(yīng)第 i類樣本,X 可能包含噪聲。低秩矩陣恢復可將X分解為一個低秩的部分DZ和稀疏的噪聲部分E,即X=DZ+E。對于字典D,數(shù)據(jù)矩陣X的最優(yōu)表示矩陣Z應(yīng)該是分塊對角矩陣
字典 D=[D1,D2,…,DN]包含 N 個子字典,其中Di對應(yīng)于第 i類。令 Zi=[Zi,1,Zi,2,…,Zi,N]為 Xi在字典D中的表示系數(shù)。為獲得一個低秩且稀疏的數(shù)據(jù)表示,每個類i應(yīng)該能被其子字典較好地表示,即Xi=DiZi,i+Ei,而 Zi,j為其在子字典 Dj(i≠j)的系數(shù),其幾乎為0。假設(shè) Q 為最理想的表示系數(shù),Q=[q1,q2,…,qT]∈RK×T,這里 qi為樣本 xi的表示系數(shù),它的形式為[0…1,1,1,…]t∈Rk,其中 K 為字典的尺寸,T 為總樣本數(shù)。假定xi屬于第L類,則其在子字典DL上的系數(shù)全部為1,在其他子字典上的系數(shù)全部為0。例如假定字典 D=[d1,d2,…,d6]即字典有 6 個原子,數(shù)據(jù)矩陣為 X=[X1,X2,X3]即包含3 類樣本,若第一類 X1包含3 個樣本 x1,x2,x3,第二類 X2包含兩個樣本 x4,x5,第三類 X3包含 4 個樣本 x6,x7,x3,x9,則 D 有 3 個子字典,每個字典有兩個原子。則Q表示為
由以上的定義,基于標簽信息為訓練樣本構(gòu)造一個塊對角形式的矩陣Q。添加正則項將結(jié)構(gòu)化信息融入到字典訓練中。則字典學習的目標函數(shù)便可寫為
其中,λ和β分別控制噪聲矩陣E和表示系數(shù)矩陣Z的稀疏性;α為調(diào)整因子控制正則項分別代表矩陣的核范數(shù)和l1范數(shù)。本文采用自適應(yīng)罰項線性化交替方向法(LADMAP)[13]解決上述目標函數(shù)的優(yōu)化問題。在解決上述優(yōu)化問題時引入輔助變量W使目標函數(shù)可分,則目標函數(shù)(5)可寫為
根據(jù)LADMAP來求解Z和E那么增強的拉格朗日函數(shù)可寫為
通過每次固定其他兩個,更新Z,W,E其中一個變量來進行函數(shù)優(yōu)化
算法1 低秩矩陣恢復優(yōu)化算法。
輸入:數(shù)據(jù)X字典D,參數(shù)λ,β和α。
輸出:Z,E,W。
初始化:Z0=W0=E0=Y01=Y02=0,β=1.1,ε=10-7,μmax=1030執(zhí)行以下循環(huán)直到滿足停止條件(not converged,Z≤maxIter Z)。
通過式(8)固定W、E更新Z
通過式(9)固定Z、E更新W
通過式(10)固定Z、W更新E
更新乘子
更新μ:
μ =min(μmax,ρμ)
check the convergence conditions:
end while
經(jīng)過判別低秩矩陣恢復后的訓練樣本可分為兩部分,即糾正后的樣本和稀疏誤差。糾正后的樣本作為字典進行稀疏表示,比原始的訓練樣本具有更強的判別力和重構(gòu)性能力。
通過上述判別低秩矩陣恢復可以得到一個具有良好重構(gòu)性和判別力的干凈的車標稀疏表示字典,但是通常采集到待識別的車標也同樣存在噪聲。文獻[14]提出,學習一個低秩投影矩陣,通過將測試樣本投影到相應(yīng)的底層子空間來糾正低秩結(jié)構(gòu)被破壞的測試樣本。因此,文中假設(shè)P是一個低秩投影矩陣,其將數(shù)據(jù)X投影到相應(yīng)的底層子空間,產(chǎn)生低秩子空間恢復結(jié)果為PX??赏ㄟ^解決以下優(yōu)化問題來獲得映射矩陣P
假定P*是上述問題的最優(yōu)解,分別計算P*X和X-P*X便可得到樣本X的主要成分和誤差部分。上述目標函數(shù)的最優(yōu)解為P*=YX+,其中X+是X的偽逆矩陣。偽逆矩陣定義為X+=V∑-1UT,這里X是V∑UT的瘦形奇異值分解(skinny SVD)。
由以上分析可知,有效地從具有噪聲的訓練圖像中恢復車標,即去除訓練樣本中遮擋、光照,污損等嚴重誤差,同時對訓練樣本進行低秩矩陣恢復得到干凈的測試樣本,是稀疏表示分類算法更具魯棒性的關(guān)鍵。本文提出的基于判別低秩子空間恢復的稀疏表示車標識別算法步驟如下:
(1)將所有訓練樣本的特征向量組合成訓練樣本集X,測試樣本的特征向量為y。
(2)本文中選擇訓練樣本矩陣作為初始字典進行低秩矩陣恢復。則目標函數(shù)可寫為
對目標函數(shù)(12)采用LADMAP方法進行優(yōu)化后得到最優(yōu)的低秩矩陣Z*和誤差矩陣E*。從而獲得低秩矩陣恢復后的訓練樣本XZ,將其用于后面稀疏表示的字典。
(3)根據(jù)式(11)計算最優(yōu)低秩映射矩陣P*,將測試樣本y通過yp=P*y投射到其相應(yīng)的子空間,從而得到干凈的測試樣本yp。
(4)在低秩矩陣恢復后用于稀疏表示的字典和測試樣本yp分別進行PCA降維。然后根據(jù)式(1)進行稀疏表示,得到稀疏表示系數(shù)α^i。
(5)根據(jù)式(2),測試樣本y被識別為重構(gòu)誤差最小的那一類。
實驗采用的數(shù)據(jù)庫由大眾、現(xiàn)代、奧迪等20類樣本組成,每類樣本包含60個車標圖像,這些圖像一部分源自于數(shù)據(jù)庫Medialab LPR Database,一部分為路口交通拍攝圖片分的車標圖像,包括一些傾斜、殘缺、模糊、遮擋等非理想情況下的車標圖像,圖像全部歸一化為50×50,圖1為部分車標樣本。
圖1 部分車標樣本
將本文算法與文獻[6,8]中傳統(tǒng)的SRC算法進行對比試驗,實驗中參數(shù) λ=16,β=15,α=500,γ=0.15,分類結(jié)果如表1所示。
表1 不同算法的識別率比較
實驗時,采用主成分分析的方法對糾正后的訓練樣本和測試樣本分別進行特征降維,為測試不同特征維數(shù)對實驗性能的影響,分別選擇維數(shù) d=30、80、130、180、230、280進行實驗。圖3為選取不同的特征維數(shù)時,本文方法與SRC方法對比的識別結(jié)果??煽闯觯谂袆e低秩矩陣恢復的稀疏表示算法明顯優(yōu)于SRC識別方法。同時,如圖2所示在維數(shù)d=230時取得了較好的識別結(jié)果。
圖2 不同算法的特征維數(shù)與識別率關(guān)系曲線
為測試不同的訓練樣本數(shù)對識別結(jié)果的影響,每類中分別隨機選擇 5、10、15、20、25、30 幅圖像作為訓練樣本,剩余圖像用于測試,采用隨機選擇訓練樣本的方式可以保證實驗結(jié)果不依賴于某種特定的訓練數(shù)據(jù)選擇。實驗結(jié)果如表2所示。
表2 不同訓練樣本數(shù)時的識別率
為更加直觀,采用文獻[7~8]與SRC的方法作為基準,與本文方法進行比較。圖3給出了幾種識別方法在不同數(shù)量的訓練樣本時的識別率變化曲線。如圖3所示,相對于其他分類算法,無論從每類樣本中隨機選擇多少幅圖像用來訓練,本文算法都取得了較好的識別結(jié)果。
圖3 不同算法訓練樣本數(shù)與識別率曲線
車標識別是一個具有廣闊前景,并具有挑戰(zhàn)性的課題。由于交通圖像的采集受到外界環(huán)境、遮擋以及污損等因素的影響,實際獲取的車標圖像較少表現(xiàn)出低秩結(jié)構(gòu),影響分類性能。針對該問題,本文提出基于判別低秩矩陣恢復的稀疏表示車標識別方法,通過在低秩矩陣恢復的目標函數(shù)中添加正則項,將類別標簽信息納入字典學習過程,學習得到一個有判別力的字典對訓練樣本進行低秩矩陣恢復,同時學習一個低秩投影矩陣將測試樣本投影到相應(yīng)底層子空間,來去除測試樣本中的錯誤,最后在此基礎(chǔ)上利用稀疏表示分類方法進行分類判別,實驗結(jié)果表明,該方法有較好的識別結(jié)果。
[1]唐朝霞,俞揚信,張粵.基于粒子群算法和云模型的車型識別[J].微電子學與計算機,2013,30(11):80 -83.
[2]華莉琴,許維,王拓,等.采用改進的尺度不變特征轉(zhuǎn)換及多視角模型對車型識別[J].西安交通大學學報,2013,47(4):92-99.
[3]張小琴,趙池航,沙月進,等.基于HOG特征及支持向量機的車輛品牌識別方法[J].東南大學學報:自然科學版,2013,43(A02):410 -413.
[4]曹剛.運動車輛識別技術(shù)研究[D].成都:四川大學,2004.
[5]羅彬,游志勝,曹剛.基于邊緣直方圖的快速汽車標志識別方法[J].計算機應(yīng)用研究,2004,21(6):150 -151.
[6]劉嘉敏,路昆.基于Hu不變矩的車標識別[J].科技信息:學術(shù)研究,2008(1):464 -466.
[7]孫娟紅,李文舉,馮宇,等.基于獨立成分分析和模糊支持向量機的車標識別新方法[J].微型機與應(yīng)用,2011,30(13):32-35.
[8]Llorca D F,Arroyo R.Vehicle logo recognition in traffic images using HOGfeatures and SVM[C].Hague:2013 16th International IEEE Conference on Intelligent Transportation Systems-(ITSC),2013:2229-2234.
[9]Wright J,Li X,Ma Y,et al.Robust principal component analysis?[J].Journal of the ACM(JACM),2011,58(3):11.
[10]Chen CF,Wei CP,Wang Y CF.Low -rank matrix recovery with structural incoherence for robust face recognition[C].Portland,OR:2012 IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2012:2618 -2625.
[11]Wright J,Yang A Y,Ma Y,et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(2):210 -227.
[12]Liu G,Lin Z,Yan S,et al.Robust recovery of subspace structures by low -rank representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(1):171-184.
[13]Zhuang L,Gao H,Lin Z,et al.Non - negative low rank and sparse graph for semi- supervised learning[C].Providence,RI:2012 IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2012:2328 -2335.
[14]Bao B K,Liu G,Xu C.Inductive robust principal component analysis[J].IEEE Transactions on Image Processing,2012,21(8):3794-3800.