曹宇軒劉真
摘 要:為了加強(qiáng)對(duì)民航機(jī)場(chǎng)游客行李包的有效管理,減少人工查找相關(guān)行李箱的工作量,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于顏色特征的行李箱檢索系統(tǒng)。充分利用圖像的顏色特征,設(shè)計(jì)不同的特征匹配算法,實(shí)現(xiàn)了按照顏色特征檢索行李箱的功能。實(shí)驗(yàn)證明,該系統(tǒng)具有功能全面、操作簡(jiǎn)單、安全可靠等特點(diǎn),具有一定的推廣價(jià)值。
關(guān)鍵詞關(guān)鍵詞:民航;行李箱;顏色特征;圖像檢索
DOIDOI:10.11907/rjdk.162058
中圖分類號(hào):TP319
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào)文章編號(hào):16727800(2016)011007105
0 引言
社會(huì)經(jīng)濟(jì)的繁榮促進(jìn)了民航行業(yè)的快速發(fā)展,客運(yùn)量的增加使得托運(yùn)行李箱的數(shù)量也急劇增加,如何有效管理和監(jiān)控眾多行李箱成為各航空公司亟需解決的問(wèn)題。目前,不正常行李的查找主要依靠對(duì)行李箱上所掛條形碼進(jìn)行掃描記錄。然而針對(duì)一些特殊情況,如條形碼丟失、條形碼錯(cuò)誤等,這種傳統(tǒng)的查找方式就無(wú)法發(fā)揮作用。此時(shí),行李箱的外觀特征就成為了找尋不正常行李箱的主要依據(jù)。因此有必要將研究方向轉(zhuǎn)移到行李箱的圖像內(nèi)容上,即通過(guò)行李箱圖像本身的內(nèi)容如顏色等特征進(jìn)行檢索,輸入相似行李箱圖像之后,在監(jiān)控系統(tǒng)中查找對(duì)應(yīng)行李箱的視頻截圖或與存儲(chǔ)在行李庫(kù)房中的無(wú)人認(rèn)領(lǐng)行李作比對(duì),從而跟蹤其去向,完成管理和查找操作。
1 圖像特征提取
基于顏色特征的行李箱檢索系統(tǒng),是基于內(nèi)容的圖像檢索系統(tǒng)的一種,即通過(guò)分析研究圖像包含的顏色信息,通過(guò)一定的特征方法進(jìn)行表示,然后設(shè)計(jì)匹配算法進(jìn)行相似度匹配的檢索系統(tǒng)。只有首先準(zhǔn)確地將圖像信息提取出來(lái),再設(shè)計(jì)出精確的匹配算法,才能實(shí)現(xiàn)預(yù)期的效果。由此可見(jiàn),圖像特征提取算法是本文基于顏色特征的行李箱檢索系統(tǒng)的核心技術(shù)。
1.1 顏色特征模型
RGB模型是計(jì)算機(jī)中最常用的顏色模型,由于其簡(jiǎn)單并且與人眼的結(jié)構(gòu)特性密切相關(guān),所以是目前使用最為廣泛的顏色模型[1]。根據(jù)人眼的結(jié)構(gòu)特點(diǎn),所有顏色都可以看作是3個(gè)基本顏色即紅、綠、藍(lán)的組合。為了建立標(biāo)準(zhǔn),1931年國(guó)際照明委員會(huì)(CIE)規(guī)定了700nm、546.1nm、435.8nm為紅、綠、藍(lán)這3種顏色的標(biāo)準(zhǔn)波長(zhǎng)。以 r、g、b 3個(gè)參數(shù)為三坐標(biāo),可以得到如圖1所示的一個(gè)單位立方體結(jié)構(gòu)描述的RGB 顏色模型(彩圖見(jiàn)封三,下同)。
本系統(tǒng)充分利用RGB顏色模型的特點(diǎn),使用其作為本系統(tǒng)的特征提取模型。
1.2 特征表述方法
對(duì)于一副圖像,若要得到它所包含的顏色特征,首先要采集它的信息,然后用適當(dāng)?shù)姆椒ㄟM(jìn)行表示,顏色特征表示對(duì)檢索結(jié)果有很大的影響。本系統(tǒng)采用循環(huán)方式,逐步采集圖像每一個(gè)點(diǎn)的R、G、B值,然后對(duì)R[0]~R[255],G[0]~G[255]和B[0]~B[255]的點(diǎn)的個(gè)數(shù)進(jìn)行統(tǒng)計(jì),再采用適當(dāng)算法來(lái)表示這些統(tǒng)計(jì)信息,主要有以下3種方法:統(tǒng)計(jì)直方圖、累計(jì)直方圖和分塊統(tǒng)計(jì)。
1.2.1 統(tǒng)計(jì)直方圖
圖像特征的統(tǒng)計(jì)直方圖[2]是一個(gè)1-D的離散函數(shù),它用來(lái)表示一副圖像之中,擁有某種特征值的點(diǎn)在整幅圖像中所占的比例,很顯然所有比例之和應(yīng)為1。以H向量為例,即有式(1):
H(k)=nkNk=0,1,255(1)
其中,nk代表具有特征值k的點(diǎn)的個(gè)數(shù),N為這幅圖像的點(diǎn)的個(gè)數(shù)。如圖2所示,(a)是圖像原圖,(b)是它所對(duì)應(yīng)的統(tǒng)計(jì)直方圖。
1.2.2 累計(jì)直方圖圖像特征的累計(jì)直方圖[2]也是一個(gè)1-D的離散函數(shù),表示到這個(gè)特征為止的之前所有向量占總數(shù)的比例。同樣以H向量為例,很顯然,H(255)= 1即有式(2):
式中符號(hào)與上文統(tǒng)計(jì)直方圖公式中的含義一致,圖3即為紅色行李箱圖像特征的累計(jì)直方圖。
1.2.3 分塊統(tǒng)計(jì)圖像的分塊統(tǒng)計(jì)方法是在上述兩種方法基礎(chǔ)上的改進(jìn),基于顏色內(nèi)容的圖像檢索雖然有較強(qiáng)的抵御旋轉(zhuǎn)、尺寸變換的魯棒性[3],但是對(duì)于圖像色彩的空間分布表示卻很差,經(jīng)常會(huì)出現(xiàn)圖像的直方圖相似而空間分布差別很大的情況,如圖4中(a)橫向圖和(b)交叉圖的直方圖完全一樣而實(shí)際圖像本身卻差別很大。
針對(duì)這種情況,研究者提出了分塊統(tǒng)計(jì)的概念,原理是將一幅圖像先進(jìn)行分割,然后分別統(tǒng)計(jì)每一塊的直方圖進(jìn)行對(duì)比分析,至于如何分塊以及每一塊賦予的權(quán)重,還需特別計(jì)算。通過(guò)分塊統(tǒng)計(jì),一定程度上解決了顏色特征對(duì)于空間分布的不足,但是不能從根本上解決問(wèn)題,這是顏色特征本身的缺陷。
統(tǒng)計(jì)直方圖比較適合顏色塊單一的圖像,相比之下,累計(jì)直方圖則更適合于真彩圖像[4],分塊統(tǒng)計(jì)彌補(bǔ)了顏色空間分布難以描述的缺點(diǎn)。由于時(shí)間有限,本文僅實(shí)現(xiàn)了統(tǒng)計(jì)直方圖和累計(jì)直方圖兩種方法,分塊統(tǒng)計(jì)是今后研究的方向。
2 特征匹配算法
基于文本的檢索方法是通過(guò)對(duì)文本進(jìn)行匹配來(lái)判斷是否相似,而基于內(nèi)容的圖像檢索則是通過(guò)計(jì)算示例圖像和數(shù)據(jù)庫(kù)中圖像在圖像特征上的相似度進(jìn)行判斷[5]。目前廣泛使用的是對(duì)圖像特征進(jìn)行數(shù)字化,即用數(shù)字表示一幅圖像的特征。通過(guò)數(shù)學(xué)公式設(shè)計(jì)匹配算法,計(jì)算出兩者之間的距離作為衡量圖像特征的相似度。本文在參考前人研究的基礎(chǔ)上,實(shí)現(xiàn)了以下幾種較為經(jīng)典的匹配算法。
2.1 Hausdorff距離算法
Hausdorff距離的作用是度量模板和目標(biāo)圖像之間邊緣的匹配程度。
設(shè)兩個(gè)有限點(diǎn)集A={a1,a2,...,ap}和B={b1,b2,...,bq},其中p和q分別為點(diǎn)集A與點(diǎn)集B的元素個(gè)數(shù)。則A、B間的Hausdorff 距離H(A,B)定義如式(3)所示:
2.2 歐氏距離算法
用HQ(k)表示關(guān)鍵圖的顏色特征直方圖,HD(k)表示已經(jīng)存儲(chǔ)的數(shù)據(jù)庫(kù)圖像D的顏色特征直方圖,則兩幅圖像之間的匹配值P(Q,D)用歐氏距離方法來(lái)計(jì)算[5]如式(6)所示:
2.3 加權(quán)的歐氏距離
用HQ(k)表示關(guān)鍵圖的顏色特征直方圖,HD(k)表示已經(jīng)存儲(chǔ)的數(shù)據(jù)庫(kù)圖像D的顏色特征直方圖,則兩圖像之間的匹配值P(Q,D)用加權(quán)的歐氏距離方法來(lái)計(jì)算如式(7)所示:
2.4 直方圖相交法
用HQ(k)表示關(guān)鍵圖的顏色特征統(tǒng)計(jì)直方圖,HD(k)表示已經(jīng)存儲(chǔ)的數(shù)據(jù)庫(kù)圖像D的顏色特征統(tǒng)計(jì)直方圖,則兩圖像之間的匹配值P(Q,D)用直方圖相交的方法來(lái)計(jì)算如式(8)所示:
2.5 絕對(duì)值法
用HQ(k)表示關(guān)鍵圖的顏色特征直方圖,HD(k)表示已經(jīng)存儲(chǔ)的數(shù)據(jù)庫(kù)圖像D的顏色特征直方圖,則兩圖像之間的匹配值P(Q,D)用絕對(duì)值的方法來(lái)計(jì)算用式(9)所示:
以上幾種匹配算法中:Hausdorff用于計(jì)算兩幅圖像邊緣之間的距離;歐氏距離計(jì)算量大,但是精度較高;加權(quán)的歐氏距離適合于顏色豐富的真彩圖像,因?yàn)楫?dāng)顏色比較單一時(shí),很多為0的點(diǎn)都被賦值為1,這樣就與原圖像的特征差距很大,如果采用歸一化直方圖,則Wk<1,即加權(quán)距離要小于歐氏距離;直方圖由于其本身特點(diǎn)而僅適用于統(tǒng)計(jì)直方圖,不適用于累計(jì)直方圖;絕對(duì)值方法是使用最多的方法,計(jì)算簡(jiǎn)單、運(yùn)行速度快。在本文中以上5種方法均已實(shí)現(xiàn)。
3 系統(tǒng)詳細(xì)設(shè)計(jì)
3.1 系統(tǒng)詳細(xì)結(jié)構(gòu)
系統(tǒng)功能分為3個(gè)主要模塊,分別為圖庫(kù)管理模塊、圖像匹配模塊和圖像存儲(chǔ)模塊。除了主要模塊以外,還設(shè)計(jì)了中間輸出模塊、時(shí)間統(tǒng)計(jì)模塊等輔助功能。系統(tǒng)流程如圖5所示。
3.2 主要模塊實(shí)現(xiàn)
3.2.1 圖庫(kù)管理模塊設(shè)計(jì)
圖庫(kù)管理模塊提供用戶對(duì)圖像庫(kù)的操作,包含以下操作:添加新的圖像庫(kù)、修改即有圖像庫(kù)、刪除現(xiàn)有圖像庫(kù)、將圖像庫(kù)設(shè)置為默認(rèn)檢索的庫(kù)、將新的圖像添加到既有圖像庫(kù)。
本系統(tǒng)實(shí)現(xiàn)了上述幾種功能,通過(guò)自定義的PicDb表來(lái)實(shí)現(xiàn)管理,圖6為“菜單—設(shè)置”里面的圖庫(kù)管理。
3.2.2 圖像匹配模塊
在本系統(tǒng)的設(shè)計(jì)過(guò)程中,考慮到對(duì)于真彩圖像的檢索匹配,特別設(shè)計(jì)兩種不同方式,即可以將所有圖像的R、G、B值相加為一個(gè)通道進(jìn)行匹配對(duì)比,也可以分別對(duì)R、G、B 3個(gè)通道進(jìn)行匹配分析。前者在處理一些較為簡(jiǎn)單的彩色圖像時(shí)效果較好,計(jì)算量少、耗費(fèi)時(shí)間較短;如果采用后者,匹配精度會(huì)提高,但同時(shí)大大增加計(jì)算量[6]。該選項(xiàng)在用戶界面上有所設(shè)計(jì),供用戶選擇。
3.2.3 圖像存儲(chǔ)模塊設(shè)計(jì)
由于對(duì)圖像特征的提取和匹配往往涉及大規(guī)模的點(diǎn)陣運(yùn)算,期間耗費(fèi)較多時(shí)間,這往往是用戶所不能容忍的,所以應(yīng)當(dāng)添加數(shù)據(jù)庫(kù)模塊以減少時(shí)間。本文將重點(diǎn)探討圖像特征的提取技術(shù)和存儲(chǔ)技術(shù)。
本系統(tǒng)設(shè)計(jì)的數(shù)據(jù)庫(kù)模塊用來(lái)存儲(chǔ)庫(kù)中的圖像信息,并非直接存儲(chǔ)圖像文件,而是將分析過(guò)的圖像特征值及其所在的路徑等相關(guān)信息存入數(shù)據(jù)庫(kù)。程序啟動(dòng)時(shí),會(huì)讀取數(shù)據(jù)庫(kù)中的用戶設(shè)置,根據(jù)用戶設(shè)置,系統(tǒng)可以找到默認(rèn)的圖像庫(kù),圖像庫(kù)里存儲(chǔ)著該圖像庫(kù)中圖像的所有信息,包括圖像的路徑、名稱、特征等。隨后系統(tǒng)根據(jù)圖像庫(kù)中的路徑找到此圖像庫(kù)里面所有圖像的特征值,通過(guò)解壓縮函數(shù)將信息還原成文中定義的節(jié)點(diǎn)結(jié)構(gòu),直接讀取進(jìn)行匹配,從而節(jié)省了大量分析時(shí)間。
在存取圖像特征時(shí),本文將特定數(shù)據(jù)結(jié)構(gòu)壓縮為字符串格式存儲(chǔ)在數(shù)據(jù)庫(kù)中,其中的協(xié)議由作者自定義,協(xié)議采用“#”字符分隔通道之間的數(shù)據(jù)值,在存儲(chǔ)階段進(jìn)行打包,讀取出來(lái)之后解包賦值。經(jīng)過(guò)系統(tǒng)測(cè)試發(fā)現(xiàn),在壓縮和解壓縮圖像特征時(shí)的用時(shí)占很小比例,而真正耗費(fèi)時(shí)間的為顏色特征的提取和特征匹配階段,因而在實(shí)際運(yùn)行時(shí)達(dá)到了預(yù)期效果。數(shù)據(jù)庫(kù)中存取圖像特征的表是PicFeature,結(jié)構(gòu)如表2所示。
通過(guò)DBOperate的一系列函數(shù),系統(tǒng)可以很方便地實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)的操作,從而為系統(tǒng)運(yùn)行提供了很大幫助,節(jié)省了大量時(shí)間。
4 實(shí)驗(yàn)結(jié)果分析
4.1 性能評(píng)價(jià)標(biāo)準(zhǔn)
基于顏色特征的行李箱檢索系統(tǒng)的性能可以通過(guò)查詢的準(zhǔn)確率來(lái)判斷,包括查全率和查準(zhǔn)率[7]。本文將基于這兩種標(biāo)準(zhǔn)對(duì)系統(tǒng)進(jìn)行評(píng)價(jià),如式(10)、式(11)描述。式中PR為查全率,P
4.2 系統(tǒng)測(cè)試
本系統(tǒng)的檢索圖庫(kù)包含50張不同顏色的行李箱圖像,按顏色分為5類,每類10幅圖像。實(shí)驗(yàn)測(cè)試階段綜合使用各種圖像特征表示方法和匹配算法,得出系統(tǒng)對(duì)于不同圖庫(kù)的查全率和查準(zhǔn)率。本文以藍(lán)色行李箱為例,測(cè)試效果如圖8所示。
統(tǒng)計(jì)不同顏色行李箱的查全率和查準(zhǔn)率,測(cè)試結(jié)果如表3所示。
通過(guò)上表發(fā)現(xiàn),各色行李箱的查全率和查準(zhǔn)率均在70%以上,即針對(duì)一般查詢具有較好效果,未來(lái)可以在繼續(xù)提高查全率和查準(zhǔn)率的基礎(chǔ)上進(jìn)一步優(yōu)化算法。
5 結(jié)語(yǔ)
本文針對(duì)民航不正常行李箱的管理查找問(wèn)題,提出了使用基于顏色特征的行李箱檢索系統(tǒng)的解決方案。對(duì)基于內(nèi)容的圖像檢索技術(shù)進(jìn)行了研究和探討,在分析目前一些基于圖像顏色特征的檢索算法的基礎(chǔ)上,重點(diǎn)分析了算法的優(yōu)點(diǎn)和不足,實(shí)現(xiàn)了一個(gè)基于顏色特征的行李箱檢索系統(tǒng)。本文對(duì)所實(shí)現(xiàn)的不同算法進(jìn)行了實(shí)現(xiàn)和測(cè)試比較,實(shí)驗(yàn)結(jié)果證明該系統(tǒng)功能全面、操作簡(jiǎn)單、查詢效果較好,可在實(shí)際中進(jìn)行推廣應(yīng)用。
參考文獻(xiàn):
[1] 王娟,孔兵,賈巧麗.基于顏色特征的圖像檢索技術(shù)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2011,20(7):160164.
[2] 劉德龍.基于顏色特征的圖像檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].武漢:華中師范大學(xué),2007.
[3] 黃仁,胡敏.綜合顏色空間特征和紋理特征的圖像檢索[J].計(jì)算機(jī)科學(xué),2014,41(6A):118121.
[4] 董蕊,王志巍,劉淑娟,等.基于統(tǒng)計(jì)直方圖的單幅圖像去霧算法[J].計(jì)算機(jī)應(yīng)用與軟件,2016,33(5):196199.
[5] 項(xiàng)立明.基于內(nèi)容的圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].軟件工程師,2015,18(12):3738.
[6] 翟劍鋒.基于多特征的圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2010.
[7] 王鵬.基于顏色特征的圖像檢索系統(tǒng)[D].西安:西安電子科技大學(xué),2012.
(責(zé)任編輯:孫 娟)