王鵬
摘要:針對(duì)人工智能的高速發(fā)展,充分優(yōu)化模式識(shí)別技術(shù)中算法,能夠達(dá)到較高的準(zhǔn)確率和高效率。本論文分析了模式識(shí)別中的圖形的變化和圖像壓縮處理算法。闡述人工智能中自相關(guān)算法。
關(guān)鍵詞:模式識(shí)別;自相關(guān)算法;圖像壓縮
模式識(shí)別是人類的一項(xiàng)基本能力,人們?cè)谌粘I钪薪?jīng)常做“模式識(shí)別”行為。模式是對(duì)對(duì)象的描述。而識(shí)別就是將一個(gè)對(duì)象分類到一個(gè)模式類中。因此,模式識(shí)別是一門涉及度量的描述或分類(識(shí)別)的科學(xué)?;旧?,模式識(shí)別是對(duì)一組過(guò)程或事件的區(qū)分或分類。要分類的事件集可以是一組物理對(duì)象或一組心理狀態(tài)。
自動(dòng)模式識(shí)別所涉及的過(guò)程包括從真實(shí)和模擬環(huán)境收集的數(shù)據(jù)中提取、識(shí)別、分類和描述模式。這些數(shù)據(jù)的實(shí)際例子包括波形、圖像、社會(huì)和經(jīng)濟(jì)系統(tǒng)產(chǎn)生的數(shù)據(jù)、動(dòng)植物的測(cè)量、物理和心理學(xué)實(shí)驗(yàn)的數(shù)據(jù)以及人口普查數(shù)據(jù)等等。在實(shí)踐中,模式識(shí)別是研究識(shí)別數(shù)據(jù)中模式的系統(tǒng)的操作和設(shè)計(jì)的研究領(lǐng)域。它包括判別分析、特征提取、錯(cuò)誤估計(jì)、聚類分析(統(tǒng)計(jì)模式識(shí)別)、語(yǔ)法推理和句法分析(句法模式識(shí)別)等子學(xué)科。重要的應(yīng)用領(lǐng)域是圖像分析、字符識(shí)別、語(yǔ)音分析、人機(jī)診斷、人員識(shí)別和工業(yè)檢測(cè)等。
在圖像處理技術(shù)方面,模式識(shí)別和圖像之間的這種聯(lián)系導(dǎo)致了與數(shù)字圖像處理,也就是使用計(jì)算機(jī)對(duì)圖像的一般操作上有很大的重疊。圖像處理技術(shù)是本研究的另一項(xiàng)核心技術(shù)。例如,當(dāng)我使用相機(jī)為管道流剪切圖片作為基礎(chǔ)數(shù)據(jù)收集時(shí),我應(yīng)該做的是對(duì)這些圖片進(jìn)行預(yù)處理。因此,這是一個(gè)重要的步驟。下面,我將介紹圖像形成、圖像預(yù)處理和分類圖像壓縮JPEG壓縮理論。
根據(jù)不同的應(yīng)用領(lǐng)域,存在一些常見(jiàn)的圖像格式:RGB、GIF、JPEG、JPEG2000和PSD格式。
■ RGB:理論上有256*256*256種顏色。像素是RGB圖像中的最小單
位。R、 G,B是圖像的紅、綠、藍(lán)的值。RGB圖像,有時(shí)稱為真彩色圖像,在MATLAB中存儲(chǔ)為m×n×3的數(shù)據(jù)數(shù)組,該數(shù)組定義每個(gè)像素的紅色、綠色和藍(lán)色分量。RGB圖像不使用調(diào)色板。每個(gè)像素的顏色由存儲(chǔ)在像素位置的每個(gè)顏色平面中的紅色、綠色和藍(lán)色強(qiáng)度的組合來(lái)確定。圖形文件格式將RGB圖像存儲(chǔ)為24位圖像,其中紅色、綠色和藍(lán)色分量各為8位。這將產(chǎn)生1600萬(wàn)種顏色。真實(shí)圖像復(fù)制的精確性導(dǎo)致了常用術(shù)語(yǔ)“真彩色圖像”。RGB數(shù)組可以是類,或。在類的RGB數(shù)組中,每個(gè)顏色分量的值介于0和1之間。顏色分量為(0,0,0)的像素顯示為黑色,顏色分量為(1,1,1)的像素顯示為白色。每個(gè)像素的三個(gè)顏色分量沿?cái)?shù)據(jù)數(shù)組的第三維存儲(chǔ)。例如,像素(10,5)的紅色、綠色和藍(lán)色分量分別存儲(chǔ)在和中。雙重的uint8公司uint16公司雙重的RGB(10,5,1)RGB(10,5,2)RGB(10,5,3)
■ GIF:圖形交換格式:壓縮率高,占用磁盤空間小。GIF由CompuServe開(kāi)發(fā),用于在線顯示圖像(1987年,在使用JPG和24位顏色之前,用于8位視頻板)。GIF使用索引顏色,僅限于256色調(diào)色板(下一頁(yè))。GIF對(duì)于舊的8位256色視頻板來(lái)說(shuō)是一個(gè)很好的匹配,但是對(duì)于今天的24位照片圖像來(lái)說(shuō),它是不合適的。GIF文件不存儲(chǔ)圖像的縮放分辨率ppi值,因此每次打印時(shí)都需要縮放。這對(duì)于屏幕或網(wǎng)絡(luò)圖像來(lái)說(shuō)并不重要。GIF文件格式是為CompuServe屏幕設(shè)計(jì)的,屏幕不會(huì)出于任何目的使用ppi。實(shí)際上,它在網(wǎng)頁(yè)中被廣泛使用。GIF的缺點(diǎn)是不能加載256色以上的圖像。
■ JPEG:JPEG是由聯(lián)合攝影專家組[14]開(kāi)發(fā)的圖像壓縮標(biāo)準(zhǔn)。JPEG是彩色圖像的有損壓縮技術(shù)。雖然它可以將文件大小減少到正常大小的5%,但在壓縮過(guò)程中會(huì)丟失一些細(xì)節(jié)。例如,1.37 MB的BMP文件可以壓縮為20.3 KB。但是,壓縮后的圖像無(wú)法恢復(fù)。更多詳情見(jiàn)第1.2.3節(jié)。
■ JPEG2000:JPEG2000是一種新的圖像編碼標(biāo)準(zhǔn),它為許多高端和新興的圖像應(yīng)用程序提供了至關(guān)重要的功能集。JPEG2000提供高壓縮,圖像質(zhì)量?jī)?yōu)于所有現(xiàn)有的標(biāo)準(zhǔn)編碼技術(shù)。JPEG2000壓縮圖像可以以最適合的分辨率發(fā)送到設(shè)備,而無(wú)需額外的存儲(chǔ)開(kāi)銷。在傳統(tǒng)的JPEG壓縮過(guò)程中經(jīng)常出現(xiàn)的鋸齒狀和塊狀像素化(由于圖片被分成塊)已經(jīng)消失了。JPEG2000基于最先進(jìn)的小波壓縮技術(shù)。它的壓縮比比JPEG高30%。JPEG2000支持有損壓縮和無(wú)損壓縮。
■ PSD:這是原生的Photoshop文件格式,可以在Elements或Photoshop中打開(kāi)。Photoshop文件不會(huì)被壓縮并保留Photoshop的所有功能。結(jié)構(gòu):PSD被組織成5個(gè)主要的數(shù)據(jù)段:頭段、3個(gè)信息塊和位圖數(shù)據(jù)。短標(biāo)頭始終包含8PPS的“簽名”,以及以下字段:位圖的寬度、高度和位深度。信息數(shù)據(jù)的第一塊稱為“顏色模式數(shù)據(jù)塊”。它以塊的長(zhǎng)度值開(kāi)頭。如果圖像有調(diào)色板,則它位于此處;下一個(gè)塊稱為“圖像資源塊”。與前一個(gè)塊一樣,它首先給出塊的長(zhǎng)度。
模式識(shí)別中的圖像自相關(guān)算法是一種重要的公式,該算法研究了自相關(guān)在模板匹配中的應(yīng)用,可以識(shí)別出兩幅圖像是否相同。因此,自相關(guān)是一種非常有效的圖像匹配方法。它對(duì)噪聲具有很強(qiáng)的糾錯(cuò)性,并且可以規(guī)范化以允許模式匹配獨(dú)立于圖像。自相關(guān)算法的程序代碼是基于公式實(shí)現(xiàn)的。
在數(shù)字信號(hào)處理理論中,相關(guān)是研究?jī)蓚€(gè)信號(hào)相似性的量化技術(shù)。兩個(gè)信號(hào)之間的相關(guān)性是一種標(biāo)準(zhǔn)的特征檢測(cè)方法,也是更復(fù)雜的一個(gè)組成部分技術(shù)。信號(hào)處理的教科書相關(guān)的介紹描述了卷積定理以及使用快速傅立葉在頻域中有效計(jì)算相關(guān)的可能性轉(zhuǎn)換。交叉性和自相關(guān)性是估計(jì)兩個(gè)序列相關(guān)程度的標(biāo)準(zhǔn)方法。開(kāi)發(fā)比較M和N的函數(shù),并測(cè)量M和N的相似性。給出:
在本文的研究中,需要探索的核心技術(shù)是圖像自相關(guān)匹配和模式識(shí)別。涉及的基本技術(shù)有圖像存儲(chǔ)、RGB模型、圖像處理方法、JPEG圖像壓縮、計(jì)算機(jī)圖形圖像的匹配。
參考文獻(xiàn)
[1] K.S.Fu, “Digital Pattern Recognition”, Second Corrected and Updated Edition, Springer-Verlag Berlin Heidelberg New York, 1980.
[2] R.A.VAUGHAN, “Pattern Recognition and Image Processing in Physics”, SUSSP, 1990.
[3] Sammon, Jr, J.W, 1970. An optimal discriminant plane, IEEE Trans, comput, (short notes), Vol. C-19, pp.826-829.
北京政法職業(yè)學(xué)院2020年度院級(jí)科研項(xiàng)目課題ky202016。
(北京政法職業(yè)學(xué)院)