馬慧敏,黃金日,焦 俊,喬 焰,沈春山
(安徽農(nóng)業(yè)大學(xué) 信息與計(jì)算機(jī)學(xué)院,安徽 合肥 230036)
《數(shù)字圖像處理》是電子信息類專業(yè)重要的專業(yè)課。隨著信息、電子技術(shù)及人工智能的快速發(fā)展,數(shù)字圖像處理技術(shù)已被廣泛應(yīng)用于計(jì)算機(jī)視覺、模式識(shí)別、交通運(yùn)輸、醫(yī)學(xué)和國防軍事等各個(gè)領(lǐng)域,且在這些領(lǐng)域發(fā)揮著越來越重要的作用[1,2]。近年來,不僅本科、碩士研究生甚至博士研究生階段,有越來越多的專業(yè)開設(shè)數(shù)字圖像處理課程。安徽農(nóng)業(yè)大學(xué)電子信息類專業(yè)、物聯(lián)網(wǎng)工程專業(yè)、電氣工程專業(yè)都開設(shè)了《數(shù)字圖像處理》課程。雖然《數(shù)字圖像處理》課程是一門實(shí)踐性強(qiáng)、應(yīng)用非常廣的課程,教學(xué)實(shí)踐中我們卻發(fā)現(xiàn)學(xué)生普遍認(rèn)為該課程學(xué)起來枯燥難度大,缺乏學(xué)習(xí)興趣,對本課程往往心存畏懼,畢業(yè)后從事相關(guān)領(lǐng)域工作者較少。
目前,該課程知識(shí)點(diǎn)多且雜,理論課時(shí)設(shè)置偏少,一般32-40課時(shí),且大都沒有安排實(shí)驗(yàn)或?qū)嵺`學(xué)時(shí)。教學(xué)中,教師注重傳授分散的理論知識(shí)點(diǎn),學(xué)生幾乎沒有動(dòng)手操作的機(jī)會(huì),理論知識(shí)很難得到實(shí)踐操作和驗(yàn)證,學(xué)生也很難對數(shù)字圖像處理技術(shù)建立起一個(gè)完整的認(rèn)識(shí)和實(shí)踐體系。另外,《數(shù)字圖像處理》課程的理論算法要求學(xué)生具備較好的數(shù)學(xué)基礎(chǔ),如概率統(tǒng)計(jì),向量、矩陣和線性系統(tǒng)等方面的知識(shí),并具備一定的計(jì)算機(jī)編程能力。然而,應(yīng)用型本科院校的學(xué)生往往數(shù)學(xué)基礎(chǔ)不夠扎實(shí),不習(xí)慣從數(shù)學(xué)的角度對數(shù)字圖像處理算法進(jìn)行推理和學(xué)習(xí)。在學(xué)習(xí)的過程中,學(xué)生感覺本課程的內(nèi)容偏于深?yuàn)W。
為了解決上述問題,進(jìn)一步提高《數(shù)字圖像處理》課程的教學(xué)效果,以激發(fā)學(xué)生的興趣,增強(qiáng)學(xué)生的信心,提高學(xué)生在人工智能機(jī)器視覺領(lǐng)域的就業(yè)競爭力。我們從工程應(yīng)用出發(fā),計(jì)劃在創(chuàng)新實(shí)踐中結(jié)合《數(shù)字圖像處理》課程教學(xué)內(nèi)容引入案例或項(xiàng)目實(shí)施,通過精心選擇應(yīng)用實(shí)例,培養(yǎng)學(xué)生的學(xué)習(xí)興趣,結(jié)合教師的科研項(xiàng)目和學(xué)生競賽,對圖像處理算法進(jìn)行設(shè)計(jì)并實(shí)現(xiàn),以提高學(xué)生的動(dòng)手能力。使學(xué)生既能了解基本原理,又能從實(shí)踐項(xiàng)目中找到基本理論的落腳點(diǎn),可以做到真正的理論與實(shí)踐一體化,來提升課程的教學(xué)效果。
在教學(xué)過程中,《數(shù)字圖像處理》課程的教學(xué)內(nèi)容分為3個(gè)部分:概述部分、理論基礎(chǔ)部分和應(yīng)用基礎(chǔ)部分,內(nèi)容體系結(jié)構(gòu)如圖1所示。
圖1 《數(shù)字圖像處理》課程內(nèi)容結(jié)構(gòu)
1.概述部分:主要介紹數(shù)字圖像處理的發(fā)展歷史、研究內(nèi)容和基本概念,這一部分主要幫助學(xué)生了解該學(xué)科的發(fā)展方向及應(yīng)用領(lǐng)域,整體了解數(shù)字圖像處理的基礎(chǔ)理論和解決問題的思路框架,為學(xué)生解決問題做好鋪墊,激發(fā)學(xué)生的學(xué)習(xí)興趣。
2.數(shù)字圖像處理理論基礎(chǔ)部分:主要介紹數(shù)字圖像處理基礎(chǔ)的概念、基本運(yùn)算以及圖像變換,按照空間域處理(點(diǎn)處理、直方圖、代數(shù)運(yùn)算、幾何運(yùn)算)、頻域處理(傅里葉離散變換、濾波處理)和統(tǒng)計(jì)方法處理幾個(gè)方面來教學(xué)。
3.數(shù)字圖像處理應(yīng)用技術(shù)部分:這一部分包括圖像增強(qiáng)、圖像壓縮、圖像復(fù)原、圖像分割和特征提取等應(yīng)用技術(shù),重點(diǎn)講述應(yīng)用基礎(chǔ)理論和方法來解決實(shí)際問題。
從教學(xué)內(nèi)容中看,《數(shù)字圖像處理》課程內(nèi)容涉及到的理論和應(yīng)用知識(shí)點(diǎn)多,而且在實(shí)際應(yīng)用中這些知識(shí)點(diǎn)需要綜合應(yīng)用,進(jìn)行項(xiàng)目實(shí)踐對《數(shù)字圖像處理》課程知識(shí)點(diǎn)綜合應(yīng)用是很有必要和行之有效的教學(xué)方法。
本論文以“基于數(shù)字圖像處理的作物顆粒計(jì)數(shù)”創(chuàng)新實(shí)踐項(xiàng)目為例,講述項(xiàng)目的實(shí)施的過程、內(nèi)容及結(jié)果。
在現(xiàn)實(shí)環(huán)境中采集的圖片會(huì)受到噪聲、光照等原因的影響,給計(jì)數(shù)帶來了很大的麻煩,因此,圖像的預(yù)處理是作物顆粒計(jì)數(shù)的一個(gè)至關(guān)重要的環(huán)節(jié)。將采集到的原始作物顆粒圖片進(jìn)行灰度值處理、中值濾波、二值化、腐蝕、空洞填充、形態(tài)學(xué)開運(yùn)算等預(yù)處理,以便后期對作物顆粒進(jìn)行計(jì)數(shù)。
3.1.1 圖像采集
通過數(shù)碼相機(jī)采集大豆種子圖像,再上傳到計(jì)算機(jī)中進(jìn)行保存。分別采集了紫豆、黃豆、綠豆3種不同種子的混合圖像,采集到的4 張圖像如圖2所示。
圖2 采集到的豆類作物種子圖像
3.1.2 圖像灰度化處理
彩色圖像在一定的灰度化處理基礎(chǔ)上可以轉(zhuǎn)變?yōu)榛叶葓D像。圖像顏色和R、G、B
ωR、ωG、ωB分別為R、G、B權(quán)值,取不同的值而得到一定的灰度圖像。由于人眼對不同顏色的敏感度不同,綠色的最高,因此使ωR>ωG>ωB將得到更容易分辨的圖像。對比可知,ωR=0.299 、ωG=0.587、ωB=0.114 得到的灰度圖像效果最好[4]。通過以上方法處理所得結(jié)果如圖3所示。
圖3 加權(quán)平均值法灰度化結(jié)果
3.1.3 圖像降噪處理
中值濾波方法的主要特征表現(xiàn)為圖像的邊緣特征不會(huì)受到明顯的影響,其效果和鄰域的空間范圍等參數(shù)相關(guān),這種方法在濾波過程中可以抑制隨機(jī)噪聲而對圖像的邊緣沒有多少影響[5]。中值濾波的過程如下:
如果M為像素(x0,y0)的鄰域集合S(包含(x0,y0)),(x,y)表示M 中的元素,(fx,y)表示(x,y)點(diǎn)的灰度值,|M|表示集合M中元素的個(gè)數(shù),Sort 表示排序,則對(x,y)進(jìn)行平滑可表示為:
中值濾波處理后的圖像結(jié)果如圖4 所示,發(fā)現(xiàn)處理后圖像的噪聲明顯的減弱,且邊緣也沒有變模糊。
圖4 中值濾波降噪結(jié)果
3.1.4 圖像的二值化
二值圖像處理是對圖像的各個(gè)像素點(diǎn)進(jìn)行0或255 賦值,可以將圖片轉(zhuǎn)變?yōu)楹诎讏D像。采用閉合邊界和連通邊界確定出相關(guān)的區(qū)域從而更好地滿足二值化處理要求。在此處理過程中全部灰度級(jí)別不低于閾值的像素賦予灰度值為255,表示目標(biāo)物體,而小于此閾值的像素點(diǎn)都賦值灰度值為0,表示背景。本實(shí)踐的二值化處理方法使用了最大類間方差法(OTSU)。
OTSU 算法屬于一類常用的自適應(yīng)的閾值分法,其在確定閾值過程中要應(yīng)用到圖像的灰度特性,然后通過其對圖像劃分而分為目標(biāo)和背景,二者的類間差越大,則可以說明圖像的區(qū)分度越大,因此類間方差最大的分割可以取得更好的分割效果,確定出各閾值條件下分割的類間方差,最大的就是閾值。記前景點(diǎn)數(shù)占圖像的比例為w0,平均灰度為u0;背景點(diǎn)數(shù)占圖像比例為w1,平均灰度值為u1,這樣可以確定出等價(jià)的公式為[7]:
使用OTSU算法將以上的方法處理所得圖像二值化處理,所得結(jié)果如圖5 所示,作物種子顆粒在4幅圖像中基本都被識(shí)別為了目標(biāo)。
圖5 最大類間方差法二值化結(jié)果
3.1.5 區(qū)域填充及膨脹
二值化后要進(jìn)行集合的膨脹、求補(bǔ)處理,其中A表示一個(gè)非空集合,其子集的元素均是區(qū)域的8 聯(lián)通邊界點(diǎn)。然后從相關(guān)的邊界點(diǎn)開始,不斷地通過1 填充,直到全部填充結(jié)束。膨脹操作會(huì)使物體的邊界向外擴(kuò)張,而在圖像內(nèi)部有空洞情況下,可以將這些空洞填補(bǔ)。所得結(jié)果如圖6 所示,從圖中可以看出,之前處理后圖像產(chǎn)生孔洞,不方便后續(xù)的處理,膨脹處理后的4 副圖像的孔洞都已經(jīng)填充完好,效果良好。
圖6 膨脹處理結(jié)果
作物種子的計(jì)數(shù)是本次實(shí)踐的一個(gè)關(guān)鍵點(diǎn),采用區(qū)域生長法運(yùn)用迭代遞歸算法進(jìn)行實(shí)現(xiàn)的。區(qū)域生長是按照事先定義的生長準(zhǔn)則將一個(gè)像素或者子區(qū)域逐步聚合成一個(gè)完整獨(dú)立的連通區(qū)域過程。對于圖像感興趣目標(biāo)區(qū)域,然后根據(jù)相關(guān)算法將全部種子點(diǎn)鄰域內(nèi)滿足相似要求的像素合并得到種子群,這樣就可以確定出獨(dú)立連通區(qū)域的有效區(qū)域,不斷的生長,直到滿足生長停止條件。其中,相似性準(zhǔn)則在判斷過程中可以根據(jù)圖像的顏色等相關(guān)的信息進(jìn)行。方法的步驟是,先確定生長種子點(diǎn),接著建立相關(guān)的規(guī)定生長準(zhǔn)則,根據(jù)生長情況而設(shè)定生長停止條件[8]。使用區(qū)域生長法,本實(shí)踐分別從單一種子圖像和混合種子圖像進(jìn)行測試,得到了每組測試的結(jié)果。
3.2.1 單一品種豆類計(jì)數(shù)
對單一品種豆類種子圖像進(jìn)行計(jì)數(shù),得到的結(jié)果如圖7所示。測試計(jì)數(shù)與真實(shí)計(jì)數(shù)對比如表1所示??梢园l(fā)現(xiàn)圖7的第一幅和第二幅圖中種子沒有出現(xiàn)粘連的情況,這時(shí)種子的計(jì)數(shù)結(jié)果準(zhǔn)確 率高達(dá)100%;圖7的第三幅和第四幅圖中種子出現(xiàn) 了不少粘連的情況,這是種子的計(jì)數(shù)結(jié)果準(zhǔn)確率下降到了72.3%左右。
圖7 單一品種豆類計(jì)數(shù)結(jié)果
表1 單一品種豆類計(jì)數(shù)結(jié)果
3.2.2 混合種子計(jì)數(shù)
對混合種子進(jìn)行計(jì)數(shù),得到的圖像如圖8所示,測試計(jì)數(shù)與真實(shí)計(jì)數(shù)對比如表2所示??梢园l(fā)現(xiàn)圖8 第一幅和第二幅圖是由3 種大豆種子混合在一起且沒有粘連,準(zhǔn)確率高達(dá)100%。圖8 第三幅也是3種大豆種子混合在一起但是出現(xiàn)了部分粘連情況,準(zhǔn)確率降到了80.6%。
圖8 多品種豆類計(jì)數(shù)結(jié)果
表2 多品種豆類計(jì)數(shù)結(jié)果分析
《數(shù)字圖像處理課程》是一門基礎(chǔ)理論復(fù)雜抽象,實(shí)踐性強(qiáng)且應(yīng)用非常廣的課程,在當(dāng)下人工智能發(fā)展的形式下,更突顯了該門課程的實(shí)用性。目前該課程的教學(xué)普遍理論多,實(shí)踐少,在教學(xué)的過程中往往忽略了知識(shí)點(diǎn)之間的相互聯(lián)系,使得學(xué)生對《數(shù)字圖像處理》課程不能建立起一個(gè)完整的認(rèn)識(shí)體系。本文給出針對《數(shù)字圖像處理》課程知識(shí)點(diǎn)綜合應(yīng)用的創(chuàng)新實(shí)踐項(xiàng)目實(shí)施,以“基于數(shù)字圖像處理的作物顆粒計(jì)數(shù)”創(chuàng)新實(shí)踐項(xiàng)目為例,論述項(xiàng)目的實(shí)施的過程、內(nèi)容及結(jié)果,對學(xué)生綜合應(yīng)用《數(shù)字圖像處理》課程的專業(yè)知識(shí)處理實(shí)際問題有一定的指導(dǎo),也收獲良好的教學(xué)效果。