文/楊東寧 曾婷 朱延杰
(云南電網(wǎng)公司信息中心 云南省昆明市 65000)
如今計(jì)算機(jī)和信息技術(shù)在快速發(fā)展,圖像識(shí)別技術(shù)因此受到關(guān)注和重視。實(shí)際的發(fā)展過(guò)程中,圖像識(shí)別技術(shù)在不斷更新和進(jìn)步,被廣泛應(yīng)用于各個(gè)領(lǐng)域,比如產(chǎn)品安全、信息收集、醫(yī)療等領(lǐng)域進(jìn)行了應(yīng)用,同時(shí),對(duì)圖像識(shí)別技術(shù)越來(lái)越依賴。圖像識(shí)別技術(shù)是根據(jù)相應(yīng)目標(biāo),進(jìn)行處理計(jì)算機(jī)所捕獲的相應(yīng)系統(tǒng)前端的圖片信息,這里包括條碼、指紋等識(shí)別產(chǎn)生的信息,這項(xiàng)技術(shù)應(yīng)用非常廣泛,對(duì)讓人們的日常生活和工作安全性得到了有效保障。所以,進(jìn)行圖像識(shí)別技術(shù)的研究具有重要意義和作用。
圖像識(shí)別技術(shù)屬于人工智能領(lǐng)域,其發(fā)展過(guò)程包括文字識(shí)別、數(shù)字圖像處理和識(shí)別、物體識(shí)別等三個(gè)階段。圖像識(shí)別就是進(jìn)行圖像的處理和分析,進(jìn)而得到要研究和獲取的目標(biāo)。現(xiàn)在在圖像識(shí)別是應(yīng)用計(jì)算機(jī)對(duì)圖像實(shí)施分析和識(shí)別。隨著社會(huì)的發(fā)展,人類識(shí)別不能滿足社會(huì)的需求,于是計(jì)算機(jī)圖像識(shí)別技術(shù)開(kāi)始出現(xiàn)并廣泛應(yīng)用,能夠解決人類不能有效識(shí)別的信息,在各個(gè)領(lǐng)域都進(jìn)行了應(yīng)用。如圖1。
人的視覺(jué)效果是人的眼睛具有圖像識(shí)別能力,圖像位置、距離、角度等有變化時(shí),視覺(jué)感官會(huì)有變化,人的視網(wǎng)膜上會(huì)改變圖像的大小和形狀,但不改變?nèi)藢?duì)圖像的判斷。人工智能技術(shù)中,圖像識(shí)別是重要技術(shù),圖像識(shí)別原理和人眼睛識(shí)別圖像相類似,都是根據(jù)圖像特征進(jìn)行識(shí)別的[1]。圖像特征是進(jìn)行圖像識(shí)別的關(guān)鍵,比如字母A,其明顯特征是有一個(gè)尖角,而Y 的特點(diǎn)是圖形銳角、線段、鈍角組成的。結(jié)合這些特征信息,進(jìn)行識(shí)別信息捕捉,進(jìn)行圖像識(shí)別,并且,客觀的判斷圖像的性質(zhì)和內(nèi)涵。為了更好的模仿人眼識(shí)別圖像的原理,減少和人眼識(shí)別效果的差異,應(yīng)用相應(yīng)計(jì)算機(jī)程序,進(jìn)行模擬人眼識(shí)別圖像方式,得到相應(yīng)的圖像識(shí)別模型。在計(jì)算機(jī)進(jìn)行圖像特征捕捉時(shí),如果圖像特征和人眼識(shí)別記憶及感官判斷的圖像相匹配時(shí),就可以認(rèn)為識(shí)別圖像成功。
人工智能及科技信息的重要部分就是模式識(shí)別。模式識(shí)別就是應(yīng)用相應(yīng)方式進(jìn)行處理和分析所要進(jìn)行表示的事物或現(xiàn)象,進(jìn)而能夠進(jìn)行相應(yīng)事物或者現(xiàn)象的描述,同時(shí)實(shí)施辨認(rèn)和進(jìn)行分類等,這樣的過(guò)程就是模式識(shí)別。應(yīng)用計(jì)算機(jī)圖像識(shí)別技術(shù)實(shí)際就是進(jìn)行人類實(shí)施圖像識(shí)別過(guò)程的模擬,進(jìn)行圖像識(shí)別過(guò)程中,必須應(yīng)用模式識(shí)別。模式識(shí)別其實(shí)是人類的智能,可是,因?yàn)橛?jì)算機(jī)技術(shù)及人工智能的發(fā)展,人類的模式識(shí)別不能滿足人們社會(huì)生活需要,進(jìn)而人們開(kāi)始研究應(yīng)用計(jì)算機(jī)進(jìn)行人類模式識(shí)別的擴(kuò)展或者代替,于是產(chǎn)生了計(jì)算機(jī)模式識(shí)別。這是進(jìn)行數(shù)據(jù)信息合理分類和計(jì)算,是和數(shù)學(xué)及計(jì)算機(jī)技術(shù)關(guān)系密切的科學(xué),很多都應(yīng)用了統(tǒng)計(jì)和概率知識(shí),代替了部分人類大腦活動(dòng),甚至高于大腦。通常的模式識(shí)別有統(tǒng)計(jì)模式、句法模式、模糊模式等不同識(shí)別方式。
圖2
人工智能技術(shù)的不斷發(fā)展和進(jìn)步,產(chǎn)生和應(yīng)用了圖像識(shí)別技術(shù),進(jìn)行圖像識(shí)別中,利用計(jì)算機(jī)及信息技術(shù),模仿人眼圖像識(shí)別過(guò)程。具體人工智能技術(shù)中圖像識(shí)別過(guò)程有下面幾個(gè)環(huán)節(jié)。
(1)進(jìn)行數(shù)據(jù)信息的獲取。數(shù)據(jù)信息的獲取是進(jìn)行圖像識(shí)別的基礎(chǔ),把聲音、光等信號(hào)利用各種傳感器轉(zhuǎn)化為相應(yīng)電信號(hào),從而得到相應(yīng)的信息數(shù)據(jù),實(shí)施不同圖像特征區(qū)分,同時(shí)利用計(jì)算機(jī)存儲(chǔ)到數(shù)據(jù)庫(kù)當(dāng)中,以進(jìn)行后續(xù)圖像識(shí)別程序和步驟。
(2)進(jìn)行數(shù)據(jù)預(yù)處理,這個(gè)環(huán)節(jié)是對(duì)圖像實(shí)施去噪、平滑等操作處理,進(jìn)而使圖像的重要信息數(shù)據(jù)及特征更突出。
(3)進(jìn)行特征的選擇和抽取。這是圖像識(shí)別技術(shù)的重點(diǎn)和核心,尤其是識(shí)別模式當(dāng)中,有嚴(yán)格的特征要求,直接決定圖像識(shí)別的效果。也就是在不同圖像當(dāng)中進(jìn)行特征圖形的選擇,以使計(jì)算機(jī)進(jìn)行這些特殊圖形的記憶。
(4)進(jìn)行設(shè)計(jì)和決策分類。這個(gè)環(huán)節(jié)是最后環(huán)節(jié),設(shè)計(jì)分類器根據(jù)相應(yīng)程序進(jìn)行識(shí)別規(guī)則的合理制定,能夠按照相應(yīng)規(guī)律進(jìn)行圖像識(shí)別,并不是盲目、混亂的進(jìn)行識(shí)別,根據(jù)這種規(guī)則或規(guī)律實(shí)施識(shí)別,使相似圖像特征和種類更突出,讓圖像識(shí)別過(guò)程準(zhǔn)確辨識(shí)率更高,然后根據(jù)特殊特征的識(shí)別,進(jìn)行評(píng)價(jià)并對(duì)圖像目標(biāo)確認(rèn),進(jìn)而完成識(shí)別過(guò)程。如圖2。
人工智能中的圖像識(shí)別技術(shù),模式識(shí)別是利于相應(yīng)模型進(jìn)行有效識(shí)別,這種模式是利用和結(jié)合大量數(shù)據(jù)信息進(jìn)行分析研究,開(kāi)展相應(yīng)的圖像識(shí)別[3]。這是根據(jù)圖像識(shí)別技術(shù)的經(jīng)驗(yàn)建立和實(shí)施的,加上對(duì)圖像識(shí)別已經(jīng)具有的認(rèn)知,利用計(jì)算機(jī)計(jì)算技術(shù)進(jìn)行充分有效的計(jì)算,結(jié)合相應(yīng)的數(shù)學(xué)原理進(jìn)行推理,進(jìn)行圖像自動(dòng)識(shí)別。進(jìn)行具體實(shí)施識(shí)別時(shí),要進(jìn)行特征有效評(píng)價(jià)。這種模式通常分為學(xué)習(xí)和完成兩個(gè)步驟。其中的存儲(chǔ)是在學(xué)習(xí)環(huán)節(jié)中完成的,是采集圖像樣本、信息特征等進(jìn)行的,根據(jù)相應(yīng)的存儲(chǔ)功能所存儲(chǔ)的信息和數(shù)據(jù),對(duì)信息進(jìn)行合理分類和識(shí)別,通過(guò)相應(yīng)的分辨和分析,進(jìn)而完成合理規(guī)范的計(jì)算機(jī)程序,更好的識(shí)別相應(yīng)圖像。完成環(huán)節(jié)重點(diǎn)圖像的完全及和電腦當(dāng)中圖像模板的相符合,以此完成識(shí)別過(guò)程。在具體的應(yīng)用過(guò)程中,識(shí)別過(guò)程的計(jì)算機(jī)和人腦還是有很大差別的,可是應(yīng)用計(jì)算機(jī)識(shí)別過(guò)程中可以與以前的記憶中的特征、信息、數(shù)據(jù)等相結(jié)合,并實(shí)施逐一匹配,進(jìn)行最新圖像信息捕捉,如果根據(jù)既定規(guī)律能夠完全匹配,就表示對(duì)該圖像識(shí)別完成了。這種識(shí)別具有局限性,有些信息特征比較特殊,也會(huì)有識(shí)別錯(cuò)誤情況發(fā)生。
這是如今應(yīng)用比較多的圖像識(shí)別方式,這種圖像識(shí)別技術(shù)是把傳統(tǒng)圖像識(shí)別和現(xiàn)代神經(jīng)網(wǎng)絡(luò)算法有效結(jié)合,形成新識(shí)別形式。圖像識(shí)別技術(shù)屬于人工智能技術(shù),其中的神經(jīng)網(wǎng)絡(luò)是智能神經(jīng)網(wǎng)絡(luò),進(jìn)行人類及動(dòng)物神經(jīng)網(wǎng)絡(luò)模擬,實(shí)施神經(jīng)網(wǎng)絡(luò)分辨,進(jìn)行圖像識(shí)別算法,雖然增加了成本,也相對(duì)復(fù)雜,可是具有不可比擬的作用。在捕捉和提取了圖像特征后,可以映射到相應(yīng)的神經(jīng)網(wǎng)絡(luò)程序當(dāng)中,進(jìn)而全面準(zhǔn)確的對(duì)圖像進(jìn)行識(shí)別,并進(jìn)行識(shí)別和處理。比如交通管理系統(tǒng)當(dāng)中技術(shù)對(duì)智能監(jiān)控拍攝進(jìn)行識(shí)別,進(jìn)而進(jìn)行神經(jīng)網(wǎng)圖像識(shí)別,根據(jù)瞬間拍攝的圖像,實(shí)施迅速識(shí)別和車(chē)牌照分辨,這樣的應(yīng)用提高了交通管理智能化水平,同時(shí)也保證了有效的進(jìn)行交通監(jiān)督,促使車(chē)輛能夠遵章守紀(jì),提高安全性。如圖3。
這是高維形式,其具有的優(yōu)點(diǎn)是可以對(duì)分辨率比較低的圖像,并進(jìn)行有效準(zhǔn)確識(shí)別。因?yàn)檫@種技術(shù)能夠生成經(jīng)過(guò)非線性處理后,同時(shí)具有多維特征的信息數(shù)據(jù),開(kāi)始分析研究時(shí),會(huì)有大量的計(jì)算,對(duì)降維進(jìn)行分類,分別是非線性和線性,對(duì)其進(jìn)行比較,非線性降維形式更加簡(jiǎn)單,并且具有比較突出明顯的效果。比如,在進(jìn)行人臉識(shí)別時(shí),就是非線性降維形式有效應(yīng)用實(shí)現(xiàn)的,因?yàn)槿四槇D像處于高維空間會(huì)出現(xiàn)分布不均勻現(xiàn)象,對(duì)其突出信息特征不能有效獲取,可是應(yīng)用非線性降維形式,就可以對(duì)人臉識(shí)別度有效提高,從而增強(qiáng)了圖像識(shí)別的準(zhǔn)確性。如圖4。
圖3
圖4
綜上所述,隨著科學(xué)技術(shù)的進(jìn)步,人工智能中的圖像識(shí)別技術(shù)在很多領(lǐng)域廣泛應(yīng)用,受到社會(huì)各界的重視和歡迎,解決了人類生活的很多問(wèn)題,對(duì)社會(huì)安全性、工作準(zhǔn)確性、生活便捷性等都有重要作用和意義。所以,在將來(lái),會(huì)得到更快速度的發(fā)展,也會(huì)在更多的領(lǐng)域普及和應(yīng)用,給人們的生活和工作帶來(lái)方便,同時(shí)促進(jìn)社會(huì)經(jīng)濟(jì)的發(fā)展和進(jìn)步,實(shí)現(xiàn)智能化社會(huì)生活。