張重,黃美艷,司統(tǒng)振,劉爽
[摘 要] 計算機視覺主要是利用一些機械設(shè)備代替人類完成對目標的跟蹤、檢測和分類等任務,是應用廣泛的一門綜合性學科。數(shù)字圖像處理是將圖像與數(shù)字進行相互轉(zhuǎn)化并且能夠被計算機識別,通過計算機對圖像進行操作的一門學科。計算機視覺是數(shù)字圖像處理課程的進一步延伸,將兩者融合在一起能夠讓學生熟練掌握理論知識,并進一步將知識遷移到計算機視覺學習上,使學生由淺入深學習,開闊視野。
[關(guān) 鍵 詞] 計算機視覺;數(shù)字圖像處理;課程融合
[中圖分類號] G642 [文獻標志碼] A [文章編號] 2096-0603(2018)10-0080-01
計算機視覺對三維重建、物體分類以及目標檢測等起著重要的作用。隨著技術(shù)的發(fā)展,應用計算機視覺的領(lǐng)域更加廣泛,其中包含了圖像的處理與圖像內(nèi)容理解。該技術(shù)主要是通過計算機軟件對圖像進行具體操作與分析,使計算機能夠分析理解。計算機視覺與數(shù)字圖像處理相融合,有利于使學生快速掌握圖像處理的基本原理和操作方法,能夠快速地把圖像理論應用到計算機視覺當中,達到理論知識與實際操作的有效結(jié)合。為此,我們以學習理論知識、進行軟件基本操作以及學習與計算機視覺有關(guān)知識點為主線進行敘述。
計算機視覺與數(shù)字圖像處理課程融合的研究方案主要包括下面幾個步驟:(1)學習數(shù)字圖像處理的相關(guān)知識,能夠讓學生快速入門;(2)理論結(jié)合實踐,利用MATLAB對圖像進行處理;(3)學習與計算機視覺相關(guān)的知識點,對圖像處理的知識點進行拓展。
一、數(shù)字圖像處理基本內(nèi)容的學習
數(shù)字圖像處理的本質(zhì)是對圖像像素點的處理,主要掌握三個方面,分別是通過對圖像進行空間、色彩、亮度的變化提高圖像的視覺質(zhì)量;把提取的圖像特征用于計算機分析,來研究圖像;圖像的編碼和壓縮用于圖像的分類存儲。掌握基本的數(shù)字圖像處理算法:圖像變換,如傅里葉變化;圖像保真壓縮;簡單的圖像分割算法;圖像描述,應用于對目標的二維描述向三維描述的發(fā)展;多種類型圖像識別算法。
在學生理解數(shù)字圖像處理的基本知識及常用的處理算法之后,為了證明圖像處理中的相關(guān)知識與計算機視覺的分類問題密切相關(guān),我們要求學生掌握Bag-of-words(BoW)結(jié)構(gòu)框架。學習BoW框架中包含的特征提取、聚類等操作,熟練掌握編碼和池化的算法以及如何進行分類等一系列完整的圖像處理和計算機識別過程。
二、利用MTALAB對圖像進行處理
利用MATLAB對圖像進行處理是書本知識與實踐相聯(lián)系的重要方式。把MATLAB應用在該領(lǐng)域,不僅能夠促進對理論的理解,更能提高學生的學習興趣。
(一)學習MATLAB基礎(chǔ)知識
了解MATLAB的工作區(qū)域、快捷鍵、工具箱和一些基本函數(shù),學會調(diào)試程序,設(shè)置斷點,改正程序的簡單錯誤等。
(二)在MATLAB中實現(xiàn)常用的圖像處理操作
利用MATLAB中的相關(guān)函數(shù)或者參考相關(guān)程序?qū)D像進行變換、分割等基本操作。通過實際動手操作和MATLAB形象化的展示讓學生更加深刻地掌握圖像處理的基本操作方法。
(三)在MATLAB下運行BoW代碼
首先在MATLAB下運行BoW代碼,學會設(shè)置路徑、單步運行、調(diào)用軟件包等操作。然后單步運行程序,并進入程序內(nèi)部查看重要函數(shù),了解圖像分類的基本原理并在這個過程中熟練應用MATLAB的快捷鍵。
三、學習計算機視覺的相關(guān)知識點
計算機視覺進一步延伸了圖像處理知識,我們從三個方面深入學習與該技術(shù)相關(guān)的知識點。首先,從圖像的邊緣檢測到圖像匹配再到圖像三維重建。圖像的邊緣檢測是圖像匹配的前提,通過邊緣檢測對圖像進行分割、特征提取,進一步進行圖像匹配,對匹配好的二維圖像進行三維重現(xiàn)。其次,從濾波器到卷積神經(jīng)網(wǎng)絡(luò)。濾波器在圖像處理中主要用于去噪,而在計算機視覺中用于卷積層的特征提取。最后,從直方圖到圖像內(nèi)容理解。直方圖體現(xiàn)圖像像素出現(xiàn)的頻數(shù),將直方圖生成思想用于圖像的表示,可以進一步加強學生對圖像內(nèi)容理解領(lǐng)域的了解。
四、結(jié)語
本文提出計算機視覺與圖像處理課程融合的研究方案,以學習理論知識、進行軟件基本操作以及學習與計算機視覺的相關(guān)知識點為主線引導學生循序漸進。從圖像處理的基本知識點延伸到計算機視覺的知識,拓寬了學生的知識面,極大地提高了學生的創(chuàng)新能力。
參考文獻:
A Krizhevsky,I Sutskever, GE Hinton.Imagenet classification with deep convolutional neural networks[J].International Conference on Neural Information Processing System,2012,60(2).