陳寧
什么是圖像識別
我們都知道圖像,在日常生活中也要接觸大量的圖像,圖像就是圖形和影像的總稱,我們通過眼睛所觀察到的一切都是圖像,那么,什么是圖像識別?什么又是圖像識別技術(shù)呢?
圖像識別又叫圖像再認(rèn),是指人們再次辨認(rèn)出某一圖形的過程,當(dāng)圖形信息刺激人體的感覺器官,人體通過記憶中存儲的信息與當(dāng)前的感官信息進(jìn)行對比加工,從而再次辨認(rèn)出這一圖形。人體具有極強(qiáng)的圖像識別能力,我們看下面幾張圖片:
圖1、2、3是圖形設(shè)計(jì)師們對字母A的美化設(shè)計(jì),雖然在顏色、形狀和大小上有較大差異,但人們都可以輕松的識別出它就是字母A;圖4、5、6從拍攝角度和光線上來說都是三張截然不同的圖像,但人們也可以很輕松的分辨出它就是同一個項(xiàng)鏈。人們不僅可以通過視覺識別出某一圖像,甚至圖像識別還可以不受感覺通道的限制。例如,當(dāng)別人在你背上寫字母A時,相信你依然能識別出這一字母來。
人體神秘而神奇,究竟人體是怎樣進(jìn)行圖像信息識別的呢?經(jīng)過科學(xué)家們多年的研究發(fā)現(xiàn),人體進(jìn)行圖像識別應(yīng)該是以圖像的主要特征為基礎(chǔ)的。每個圖像都有它的特征,如字母A有個尖,P有個圈、而Y的中心有個銳角等。對圖像識別時眼動的研究表明,視線總是集中在圖像的主要特征上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個特征轉(zhuǎn)到另一個特征上。由此可見,人體在圖像識別過程中,總是排除輸入的多余信息,抽出關(guān)鍵信息,同時將這些關(guān)鍵信息進(jìn)行整合,從而形成一個完整的知覺映像。
進(jìn)入21世紀(jì)以來,伴隨著科技的發(fā)展,人們變得越來越“懶”,以前必須要人類智能才能完成的圖像識別工作也希望由計(jì)算機(jī)來替代,“圖像識別技術(shù)”也由此而生。圖像識別技術(shù)是人工智能的一個重要領(lǐng)域,它借由計(jì)算機(jī)來完成圖像的識別功能。
圖像識別的模型主要有兩種——模板匹配模型和原型匹配模型。模板匹配模型強(qiáng)調(diào)當(dāng)前的刺激必須與大腦中的模板完全匹配,圖像才能被識別。例如字母A,如果在腦中有個A模板,字母A的大小、方位、形狀都與這個A模板完全一致,字母A才能被識別。這個模型簡單明了,但是它要求圖像與模板必須完全吻合,這就要求在模板庫設(shè)計(jì)時必須考慮所有的情況,這幾乎是無法實(shí)現(xiàn)的,因此這一模型僅適用于場景較為單一的圖像識別過程。
為了解決模板匹配的問題,人們提出了原型匹配模型,它將從圖像中提取出的“相似性”作為原型,拿它來檢驗(yàn)所要識別的圖像。仍以字母A為例,它記錄的原型是字母A的尖這一原型,所有具備尖這一特征的圖像都將被識別為A。這種模型更傾向于人類的思維模式,也能識別出情況更為較多、較復(fù)雜的圖像,因此稱為圖像識別技術(shù)的發(fā)展方向。
圖像識別技術(shù)在交通中的應(yīng)用
圖像識別作為人工智能的重要內(nèi)容,21世紀(jì)以來得到了巨大的發(fā)展,廣泛應(yīng)用于生產(chǎn)生活的各行各業(yè)中。在銀行和商業(yè)中,圖像識別技術(shù)用于識別支票和鈔票上的特殊數(shù)字和字符;在醫(yī)學(xué)上,圖像識別技術(shù)用于識別早期腫瘤、分析心電圖以及血小板計(jì)數(shù);在軍事中,圖像識別技術(shù)用于導(dǎo)彈的精確制導(dǎo);在地質(zhì)勘探中,圖像識別技術(shù)用于發(fā)現(xiàn)石油和天然氣可能存在的底層;在現(xiàn)代遙感技術(shù)中,圖像識別技術(shù)用于識別不同的自然資源。
近年來,伴隨著城市的飛速發(fā)展,城市內(nèi)人口急劇增加,汽車擁有量持續(xù)提高,由此引發(fā)了一系列的交通安全和交通擁堵問題。交通問題是涉及人、車、路的一個復(fù)雜的系統(tǒng)問題,它往往伴隨著海量數(shù)據(jù)的分析和處理。因此,近年來,圖像識別技術(shù)被廣泛應(yīng)用于交通運(yùn)輸領(lǐng)域,以提高交通管理者的工作效率,更好的解決城市交通問題。目前,圖像識別技術(shù)已經(jīng)廣泛應(yīng)用于交通違章監(jiān)測、交通擁堵檢測和交通信號燈識別等交通運(yùn)輸領(lǐng)域。
1. 交通違章監(jiān)測
相信每一個有駕駛經(jīng)驗(yàn)的人都會對道路上突然的閃光心存忌憚,沒錯,當(dāng)閃光燈亮起的時候,可能你又要去繳納罰單了。為了更好的保證道路的行車安全,這種先進(jìn)的電子監(jiān)測系統(tǒng),也就是我們俗稱的“電子警察”正被廣泛的應(yīng)用于抓拍“闖紅燈”、“超速”等交通違章行為中。當(dāng)“電子警察”采集到違章圖像后,通過PSTN網(wǎng)(公共交換電話網(wǎng))或Internet網(wǎng)送回交通監(jiān)控中心,由專業(yè)的處理軟件完成違章車輛圖像顯示、篩選、車牌號判讀、違章車輛圖文信息記錄以及資料管理和查詢等工作。其中,車牌號判讀便運(yùn)用了先進(jìn)的圖像識別技術(shù),那么,車牌號是如何被識別出來的呢?
車牌號判讀主要由圖像處理、車牌定位、字符切分和字符識別四部分組成。
圖像處理:將模擬圖像轉(zhuǎn)換為數(shù)字圖像,模擬圖像也就是空間連續(xù)的圖像,而數(shù)字圖像是空間離散的圖像,比如10000像素的圖像就是說圖像是由10000個點(diǎn)組成的,由于計(jì)算機(jī)只能識別數(shù)字圖像,所以我們首先便要將抓拍到的圖像轉(zhuǎn)換為數(shù)字圖像。
車牌定位:將數(shù)字圖像轉(zhuǎn)化為灰度圖像,也就是把彩色圖像轉(zhuǎn)換為黑白圖像,圖像的明暗變化由灰度值的大小決定。接著對灰度圖像進(jìn)行二值化分析,其目的是尋找一個合適的灰度值,把車牌照突出出來。然后用預(yù)存的車牌照特征與二值化分析后的圖像進(jìn)行比對,最終確定車牌照的位置。
字符切分:完成牌照區(qū)域的定位后,再將牌照區(qū)域分割成單個字符,然后進(jìn)行識別。字符分割一般采用垂直投影法,這是因?yàn)樽址诖怪狈较蛏系耐队皶谧址g取得一個局部的灰度最小值,易于將字符分割出來。
字符識別:字符識別可以采用前面所提及的兩種方法,基于模板匹配的方法和基于原型匹配的方法?;谀0迤ヅ涞姆椒ㄊ菍⒎指詈蟮淖址c字符數(shù)據(jù)庫中的所有模板進(jìn)行匹配,最后選最佳匹配作為結(jié)果。基于原型匹配的方法是先對字符進(jìn)行特征提取,用所獲得的特征來識別字符。
2. 在交通擁堵檢測中
當(dāng)我們乘坐小汽車或者公交車的時候,什么事情最讓我們心煩意亂呢?沒錯,就是堵車了。在發(fā)生擁堵的時候我們最希望誰出現(xiàn)?沒錯,就是偉大的交通警察,他們讓道路秩序井然有序,恢復(fù)暢通。那么可以在交通擁堵即將發(fā)生或已經(jīng)發(fā)生時迅速通知交警嗎?答案是肯定的,圖像識別技術(shù)就可以實(shí)現(xiàn)交通擁堵的自動檢測,及時通知交警進(jìn)行交通疏導(dǎo)。那么圖像識別技術(shù)是如何實(shí)現(xiàn)佳通擁堵的自動檢測的呢?
交通擁堵自動檢測主要由道路有效區(qū)域劃定和車流所占面積比例兩部分組成。
道路有效區(qū)域劃定:將車輛流區(qū)域和非車輛流區(qū)域進(jìn)行區(qū)分,車輛流區(qū)域是指路面本色的區(qū)域,它有灰度值變化較小的特點(diǎn),因此大多數(shù)雜點(diǎn)較少的路面都可以輕松的識別出來;非車輛流區(qū)域是指花壇、護(hù)欄等區(qū)域,它的灰度值變化較大,進(jìn)行區(qū)域劃定前后的圖像如圖8和圖9所示。
車流所占面積比例:車流所占面積比例的計(jì)算由邊緣像素統(tǒng)計(jì)、交通流區(qū)域計(jì)數(shù)和交通擁堵判別三個過程組成。邊緣像素統(tǒng)計(jì)是指在道路有效區(qū)域劃定的基礎(chǔ)上,在道路有效區(qū)域劃定的基礎(chǔ)上,統(tǒng)計(jì)所有灰度值劇烈變化的像素點(diǎn),即邊緣像素點(diǎn),這些灰度值劇烈變化的像素點(diǎn)實(shí)際上就是車道上行駛車輛的邊界點(diǎn);接著在交通流區(qū)域計(jì)數(shù)時對所有邊緣像素點(diǎn)進(jìn)行掃描,通過判斷當(dāng)前像素點(diǎn)與前后像素點(diǎn)的關(guān)系確定行駛車輛所占的區(qū)域;經(jīng)過上面兩個步驟后,就可以實(shí)時的計(jì)算出行駛車輛所占的區(qū)域面積與道路有效區(qū)域面積的比例,這一比例與交通工程師提供的擁堵值進(jìn)行比較,便可以輕松判別出交通擁堵的狀況。如圖10所示。
3. 在交通信號燈識別中
在世界上,大約有7%~8%的色盲、色弱患者,由于無法準(zhǔn)確快速的在交叉口判斷出交通信號燈信息,而給他們的日常出行帶來了不便,目前,以圖像識別技術(shù)為基礎(chǔ)的交通信號燈識別技術(shù)給他們的出行提供了幫助。那么,交通信號燈是如何被識別出來的呢?
交通信號燈的識別方法有兩種:一種是基于顏色分割的交通信號燈識別方法;另一種是基于形狀分割的交通信號燈識別方法。
基于顏色分割的交通信號燈識別方法:交通信號燈的顏色特征是最為凸顯的特征。我們也許都挺熟過RGB顏色空間,它是以紅、綠、藍(lán)三種基色來顯示彩色,雖然我們希望以不同的R、G、B值來識別不同的交通信號,但是這種方法是不實(shí)際的,因?yàn)镽、G、B三者之間的相關(guān)性較高,容易受光照、陰影等因素的影響,從而無法正確識別出紅、綠、黃三種交通信號。HIS顏色空間顏色空間是適合人類視覺特性的色彩模型,其中H表示色度、I表示強(qiáng)度、S表示飽和度,HIS空間模型H、I、S三者之間相關(guān)性較小,易于進(jìn)行顏色識別。因此,在基于顏色分割的交通信號燈識別中便采用將RGB顏色空間轉(zhuǎn)換為HIS空間,再根據(jù)H、I、S值的閾值范圍的方法來識別紅、綠、黃交通信號。
基于形狀分割的交通信號燈識別方法:交通信號燈在形狀上有個顯著的特征,即被一個黑色矩形框所包圍。根據(jù)信號燈設(shè)計(jì)規(guī)范,該矩形框有固定長寬比??衫迷撎卣?,將交通燈范圍提取出來。如下圖所示。
圖像識別技術(shù)在交通中的應(yīng)用展望
目前,圖像識別技術(shù)已經(jīng)在智能交通系統(tǒng)中獲得了成功的應(yīng)用,為交通違章監(jiān)控、交通路況檢測、交通標(biāo)志檢測等提供了新手段和新裝置,減少了人力勞動,提高了自動化程度。但是,由于道路狀況圖像受天氣、光照等因素影響較大,使得圖像識別技術(shù)在應(yīng)用時出現(xiàn)了可靠性、準(zhǔn)確性不能滿足工程要求等問題。隨著科技的發(fā)展,相信這些問題會逐步得到解決。圖像識別技術(shù)將在智能交通系統(tǒng)中發(fā)揮越來越重要的作用。