曾長雄
(岳陽職業(yè)技術(shù)學(xué)院信息工程學(xué)院,岳陽 湖南 414000)
智能圖像識(shí)別主要是使用計(jì)算機(jī)信息系統(tǒng),做好圖像的處理、分析及理解工作。目前,在此階段圖像識(shí)別主要使用在工業(yè)層面,通過計(jì)算機(jī)軟件對(duì)于設(shè)備捕捉的圖像進(jìn)行識(shí)別處理。與此同時(shí),還可通過智能圖像對(duì)遙感內(nèi)容進(jìn)行分類處理。這樣,不管識(shí)別對(duì)象發(fā)出怎樣的變化,計(jì)算機(jī)智能圖像識(shí)別技術(shù),都能抓住識(shí)別對(duì)象的本質(zhì)特點(diǎn),進(jìn)行有效的識(shí)別。
目前,在進(jìn)行計(jì)算機(jī)智能圖像識(shí)別技術(shù)探究過程中,它從傳統(tǒng)的文字識(shí)別,一直演變成現(xiàn)階段的數(shù)字圖像識(shí)別,歷經(jīng)幾十年的發(fā)展。文字識(shí)別主要起源于20 世紀(jì)50 年代,不僅包括數(shù)字、字母,還包括符號(hào)的識(shí)別,它的起源主要是從印刷文字識(shí)別,它的智能圖像識(shí)別技術(shù)主要是從印刷文字識(shí)別一直發(fā)展到手寫文字識(shí)別和模擬圖像。通常情況下,它能對(duì)大量的數(shù)字圖像進(jìn)行壓縮和儲(chǔ)存,在傳遞過程中也不會(huì)出現(xiàn)失真現(xiàn)象,但是,為了充分發(fā)揮計(jì)算機(jī)智能圖像識(shí)別技術(shù)的優(yōu)勢(shì),需要融合人工智能技術(shù)。在圖像識(shí)別過程中,需要從眾多信息中篩選有用信息,做好信息的處理,根據(jù)信息的特征進(jìn)行提取。對(duì)于所有的存儲(chǔ)圖像來說,計(jì)算機(jī)智能圖像識(shí)別技術(shù),能夠?qū)⒉煌愋偷男畔⑦M(jìn)行融合,推動(dòng)整個(gè)過程更加的方便快捷。與此同時(shí),它還能夠?qū)崿F(xiàn)圖像的有效壓縮,然后將其進(jìn)行整合,做好圖像分類處理工作,使得整個(gè)計(jì)算機(jī)智能圖像識(shí)別系統(tǒng)更加穩(wěn)定,能夠降低識(shí)別運(yùn)作存在的誤差,全面提高計(jì)算機(jī)信息系統(tǒng)的管理能力。這時(shí),需要對(duì)計(jì)算機(jī)智能圖像識(shí)別算法進(jìn)行研究,這能有效地解決系統(tǒng)出現(xiàn)的崩潰問題,在某種程度上來說,計(jì)算機(jī)幾乎所有的操作都是通過人工完成的,近年來隨著科學(xué),信息技術(shù)快速發(fā)展,計(jì)算機(jī)也取得突飛猛進(jìn)的進(jìn)步,這時(shí),程序員只需要在特定的程序中,對(duì)計(jì)算機(jī)的功能進(jìn)行設(shè)定,當(dāng)計(jì)算機(jī)開始作業(yè)以后,相關(guān)的操作人員需要展開操縱。發(fā)揮計(jì)算機(jī)智能圖像識(shí)別技術(shù)的作用,存儲(chǔ)在系統(tǒng)上的圖像信息,通過人為操作和檢驗(yàn),能有效解決實(shí)際操作存在的識(shí)別不全面問題。因此,在進(jìn)行計(jì)算機(jī)智能圖像識(shí)別技術(shù)研究過程中,應(yīng)該采取有效的方式提高智能圖像識(shí)別的可靠性和穩(wěn)定性[1]。
計(jì)算機(jī)智能圖像識(shí)別算法的本質(zhì)就是它能在瞬息萬變的圖像形態(tài)變化中,抓到圖像的內(nèi)在特征,進(jìn)而對(duì)圖像進(jìn)行有效識(shí)別,在圖像識(shí)別過程中,為了確保圖像的不變性,需要對(duì)不同的目標(biāo)對(duì)象進(jìn)行識(shí)別。目前,在圖像識(shí)別過程中,常見的算法有Hu 不變矩算法、DS 證據(jù)推理等等。Hu 不變矩算法是最早出現(xiàn)的智能圖像識(shí)別算法之一,起源于20 世紀(jì)60 年代初期,它是以圖像中的低階歸一化中心距非線性組合為主,形成了七個(gè)變量值。
對(duì)于數(shù)字圖像,離散狀態(tài)下,對(duì)于灰度分布為f(x,y)的圖像,f(x,y)的(p+q)階普通矩定義:
與此同時(shí),需要對(duì)(p+q)階中心矩進(jìn)行定義:
這時(shí),質(zhì)心坐標(biāo)為(x0,y0):
其中x0=m10/m00,y0=m01/m00,x0表示圖像灰度在水平方向上的灰度質(zhì)心,y0表示圖像灰度在垂直方向上的灰度質(zhì)心。
(p+q)階歸一化中心矩定義:yp q=μp q/μr00,其中,r=(p+q+2)/2,p+q=2,3,…L。
在某種程度上,Hu 不變矩算法主要是以圖像的二階中心和三階中心理論為依據(jù),以低階歸一化中心矩的非線性組合構(gòu)造七個(gè)不變矩(M1—M7),該7 個(gè)不變矩構(gòu)成一組高度濃縮的圖像特征量,在連續(xù)圖像下具有平移、灰度、尺度、旋轉(zhuǎn)不變性。當(dāng)圖片進(jìn)行連續(xù)的平移、縮放操作時(shí),它們的特征會(huì)保持不變[2]。
Hu 不變矩算法優(yōu)劣分析:在對(duì)圖像中物體的識(shí)別過程中,只有M1 和M2 不變性保持較好,其他幾個(gè)不變矩誤差較大。
Hu 不變矩使其在圖像識(shí)別的過程中,能減少待測(cè)圖像的大小歸一化與位置居中等預(yù)處理步驟,降低運(yùn)算成本,提高運(yùn)算速率,同時(shí)圖像識(shí)別準(zhǔn)確率高[3]。
Hu 不變矩一般用來識(shí)別圖像中大的物體,對(duì)于物體的形狀描述得比較好,圖像的紋理特征不能太復(fù)雜,像識(shí)別水果的形狀,或者對(duì)于車牌中的簡單字符的識(shí)別效果會(huì)相對(duì)好一些。
在計(jì)算機(jī)智能圖像識(shí)別過程中,為了實(shí)現(xiàn)多源信息處理,需要使用數(shù)據(jù)融合技術(shù)D-S 證據(jù)推理。主要是依托非空集合建立的,其中的幾何也稱之為辨別框架,通過框架對(duì)構(gòu)成的假想空間元素及進(jìn)行分析,做好信任指派函數(shù)及總信任度定義:
綜上,可以通過相關(guān)的組合規(guī)則得到兩個(gè)或者兩個(gè)以上的置信函數(shù)[4]。
將D-S 證據(jù)推理引入圖像識(shí)別中,通過灰度-相位共生矩陣法及灰度-梯度共生矩陣法得到圖像紋理特征參數(shù)并進(jìn)行D-S 信息融合,能較好包含圖像紋理信息,并能補(bǔ)充圖像單組特征參數(shù)識(shí)別的不足,圖像識(shí)別的準(zhǔn)確率提高,不確定性可降低[5-6]。
計(jì)算機(jī)智能圖像識(shí)別系統(tǒng)主要包括以下幾個(gè)方面的內(nèi)容:圖像壓縮處理、圖像預(yù)處理、特征識(shí)別、以及提起系統(tǒng)。預(yù)處理過程主要是為了提高圖像的識(shí)別性能,需要做好二值化、平滑去噪、以及灰度處理。圖像壓縮過程是為了方便圖像傳輸保存,在確保圖像可識(shí)別的前提之下,使用壓縮代碼將圖片中無用信息進(jìn)行刪除。一般情況下,壓縮代碼的種類多種多樣,這時(shí)需要根據(jù)圖像處理的實(shí)際情況,選擇合適的壓縮處理器。圖像特征提取識(shí)別過程要嚴(yán)格的控制圖像的顏色、形狀、紋理、特征等等。計(jì)算機(jī)智能圖像識(shí)別系統(tǒng),它是人工智能的重要研究方向,它為圖像有機(jī)識(shí)別提供有效的依據(jù)。在進(jìn)行圖像識(shí)別時(shí)需要在計(jì)算機(jī)信息系統(tǒng)中輸入可識(shí)別的圖像,然后通過計(jì)算機(jī)信息系統(tǒng)進(jìn)行圖像的匹配,按照?qǐng)D像的特點(diǎn)進(jìn)行分類。在具體的識(shí)別過程中,需要將預(yù)處理環(huán)節(jié)作為圖像的輸入點(diǎn),它也是圖像處理的鍵環(huán)節(jié)。將采集到的信息輸入到計(jì)算機(jī)信息系統(tǒng)中,這時(shí)需要做好圖像背景的分離工作。通過二值化對(duì)圖像進(jìn)行整體細(xì)化,保證系統(tǒng)后期處理的效率。在最大范圍內(nèi),提升圖像處理的準(zhǔn)確性[7-8]。
首先,計(jì)算機(jī)智能圖像識(shí)別系統(tǒng)他的信息量較大,通過計(jì)算機(jī)信息系統(tǒng)處理之后,能夠得到相關(guān)的二維信息,隨著二維信息的不斷增多,會(huì)導(dǎo)致計(jì)算機(jī)運(yùn)行性能下降,這樣會(huì)降低圖像識(shí)別度。其次,圖像識(shí)別系統(tǒng)準(zhǔn)確度高,和傳統(tǒng)的圖像處理技術(shù)相比,計(jì)算機(jī)智能圖像識(shí)別技術(shù)能對(duì)模擬圖像進(jìn)行數(shù)字轉(zhuǎn)換。一般情況下,像素基本都是低于32 位,如果超過32 位,不能對(duì)模擬圖像進(jìn)行有效處理,智能圖像識(shí)別技術(shù),能夠做好圖像信息關(guān)系的有機(jī)處理,全面提高存儲(chǔ)數(shù)據(jù)的完整性,從而得到高精準(zhǔn)度的圖像,滿足不同用戶的使用需求。最重要的一點(diǎn),使用智能圖像識(shí)別技術(shù),還能夠?qū)υ瓐D像進(jìn)行還原處理。最后,它的關(guān)聯(lián)性較強(qiáng),計(jì)算機(jī)信息系統(tǒng)在運(yùn)作過程中,主要是通過智能化進(jìn)行識(shí)別的,能夠?qū)Σ煌膱D像進(jìn)行分析。與此同時(shí),還需要考慮到圖像的壓縮成本,在為了獲取和圖像相關(guān)的信息,做好圖像特點(diǎn)的具體分類工作,尤其是在3D 圖像輸入時(shí),可能無法得到三維幾何圖像,這時(shí)需要對(duì)原圖像進(jìn)行重新測(cè)量。然而,使用智能圖像識(shí)別技術(shù),能有效地對(duì)3D 景物進(jìn)行還原。此外,它的靈活性較高,智能圖像識(shí)別在圖像處理過程中,能夠?qū)δ繕?biāo)圖像進(jìn)行放大,例如細(xì)胞圖、天體圖等等,可以通過數(shù)學(xué)的線性和非線性組合,全面提高信息的完整性,進(jìn)而提高圖像的清晰度[9]。
為了充分發(fā)揮計(jì)算機(jī)智能圖像識(shí)別算法技術(shù)的優(yōu)勢(shì),需要做好如下幾個(gè)方面的歸納。首先,需要進(jìn)行數(shù)據(jù)的采集和預(yù)處理。通常情況下,在具體的圖像識(shí)別過程中,不僅要考慮到外在因素,而且還需要考慮到圖像本身的特點(diǎn),對(duì)識(shí)別產(chǎn)生的影響。在圖像的具體輸入過程中,要確保提高獲取信息的準(zhǔn)確性。在進(jìn)行圖像識(shí)別之前,需要進(jìn)行圖像的預(yù)處理操作,這是最主要的步驟,能夠全面提高識(shí)別的可靠性。其次,邊緣提取。和圖像識(shí)別而言,圖像邊緣是有亮度、顏色,在某個(gè)方向上進(jìn)行變化組合形成的,圖像識(shí)別可以參考邊緣提取,因此最常使用的方式是空間梯度法、小波變換法等等,以上幾種方法都有自己的優(yōu)點(diǎn)和缺點(diǎn)。例如,空間梯度法在使用過程中,它的速度快,然而在提取過程中會(huì)受到其他外界因素的干擾,提取結(jié)果并不理想。小波變換法在進(jìn)行圖像數(shù)據(jù)提取過程中效果較好,然而它的速度過慢。因此,在對(duì)智能圖像識(shí)別技術(shù)具體分析時(shí),要確保提取速度,還要考慮到提取的結(jié)果。最后,需要進(jìn)行區(qū)域分割。在圖像基本識(shí)別過程中要考慮到顏色、灰度等等,這是進(jìn)行圖像識(shí)別的前提,在對(duì)目標(biāo)區(qū)域進(jìn)行整體分割時(shí),可以使用直接分割、間接分割、擴(kuò)充法等等,充分發(fā)揮分割的作用,結(jié)合實(shí)際情況進(jìn)行選擇。與此同時(shí),還需要進(jìn)行目標(biāo)定位。在進(jìn)行目標(biāo)定位過程中,它能對(duì)數(shù)據(jù)信息進(jìn)行采集,在具體的圖像定位過程中需要進(jìn)行圈定。在定位完成之后,考慮到目標(biāo)背景對(duì)定位產(chǎn)生的影響,因?yàn)楸尘暗膹?fù)雜度越高,定位的準(zhǔn)確率也就越低,所以在進(jìn)行定位時(shí),要考慮到邊緣構(gòu)建、顏色特點(diǎn)紋、理特征等等[10]。
計(jì)算機(jī)智能圖像識(shí)別技術(shù)憑借著自身較大的內(nèi)存空間,被廣泛使用在各個(gè)領(lǐng)域。與相同配置規(guī)格運(yùn)行系統(tǒng)的計(jì)算機(jī)相比,它具有較大的信息儲(chǔ)量,這為圖像特征系統(tǒng)存儲(chǔ)提供了有利的條件。除此之外,在計(jì)算機(jī)圖像識(shí)別過程中還可以選取特定的圖像,能有效地提升識(shí)別速率。