耿春云,郭顯久、2
(1.大連海洋大學(xué)信息工程學(xué)院,遼寧大連116023;2.遼寧省海洋信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,遼寧大連116023)
海洋微藻一方面可通過光合作用釋放出地球上絕大多數(shù)的氧氣,固定二氧化碳減少溫室效應(yīng);另一方面又是赤潮及水體富營養(yǎng)化等自然災(zāi)害的主要因素。海洋微藻也蘊(yùn)藏著極大的商業(yè)、生產(chǎn)、生活和環(huán)境價(jià)值,其微藻富含蛋白質(zhì)、脂肪和碳水化合物,某些種類還富含油料、微量元素和礦物質(zhì)等原料,不僅是人類未來重要的食品、工業(yè)原料,而且也可作為新型的再生能源與環(huán)境增值能源開發(fā)的重要原料[1-2],所以對(duì)微藻種類的鑒別越來越受到人們的關(guān)注。
傳統(tǒng)海洋微藻鑒別方法主要有形態(tài)分類法、化學(xué)分類法和分子生物學(xué)方法[3]。形態(tài)分類法即通過顯微鏡觀察活體或固定樣本的外部形態(tài)和結(jié)構(gòu)來確定其歸屬,但由于微藻形態(tài)和結(jié)構(gòu)復(fù)雜且不同物種間可能存在相似或同一物種中存在異形,所以鑒定的效率和準(zhǔn)確率都不高;化學(xué)分類法是以糖類、脂類、蛋白和核酸等化學(xué)分子為標(biāo)志,比較和闡述不同藻類之間的親緣及進(jìn)化關(guān)系,從而實(shí)現(xiàn)微藻的鑒定識(shí)別,這種方法要求鑒定者具有過硬的生物化學(xué)分析理論水平、化學(xué)物質(zhì)分離提取和儀器使用能力,極大地增加了鑒定的局限性和難度;分子生物學(xué)法是采用DNA測(cè)定技術(shù)進(jìn)行同源性比對(duì)及系統(tǒng)進(jìn)化樹分析確定微藻的種類。以上3種方法多涉及生物和化學(xué)方面的知識(shí),不僅增加了識(shí)別的難度,同時(shí)也不利于實(shí)現(xiàn)微藻鑒定和識(shí)別的自動(dòng)化。
利用海洋微藻顯微圖像進(jìn)行微藻自動(dòng)識(shí)別與分類的研究近年來發(fā)展很快,然而,大部分研究只局限于少數(shù)種類上,并且圖像中只有單個(gè)藻體的情況或只用來統(tǒng)計(jì)微藻個(gè)數(shù)[4-7]。本研究中,在不針對(duì)微藻種類的前提下,通過對(duì)在海域中隨機(jī)采集到的不同微藻混合的樣本圖像進(jìn)行預(yù)處理,提取微藻的形狀和紋理特征,利用仿生模式識(shí)別算法實(shí)現(xiàn)微藻的自動(dòng)識(shí)別,該方法不僅能夠識(shí)別不同種類的微藻,而且也能夠識(shí)別大小不同的相同品種的微藻。
在實(shí)際采集樣本圖像時(shí),往往得到的是海洋微藻的RGB圖像,由于RGB圖像包含顏色因子,實(shí)際提取特征過程較為復(fù)雜且信息量大,目標(biāo)信息不突出,不利于目標(biāo)與背景的分離,對(duì)目標(biāo)識(shí)別造成了困難,因此,必須對(duì)彩色圖像進(jìn)行灰度化和二值化處理。首先將彩色圖像轉(zhuǎn)化為256級(jí)灰度圖像,再將灰度圖像轉(zhuǎn)化為二值圖像。在二值圖像中,只有0和255兩個(gè)灰度值,0表示黑色像素,255表示白色像素。
彩色圖像轉(zhuǎn)換為灰度圖像的方法有很多[8-10],在多種方法中,考慮到系統(tǒng)的運(yùn)行速度和轉(zhuǎn)換失真等因素,本研究中選擇加權(quán)平均方法,實(shí)現(xiàn)從海洋微藻彩色圖像到灰度圖像的轉(zhuǎn)換,其轉(zhuǎn)換公式為
其中:I(x,y)表示灰度圖像的像素灰度值;R(x,y)、G(x,y)、B(x,y)分別表示彩色圖像 3 個(gè)顏色 (紅、綠、藍(lán))的分量值。轉(zhuǎn)換結(jié)果如圖1所示。
圖1 彩色圖像轉(zhuǎn)換為灰度圖像Fig.1 Transformation of color image into gray image
一般根據(jù)灰度圖像直方圖將灰度圖像轉(zhuǎn)化為二值圖像,有單閾值法和雙閾值法。由于微藻灰度圖像的直方圖[圖2-(a)]為標(biāo)準(zhǔn)的單峰圖像,所以在實(shí)際應(yīng)用中選用單閾值法將灰度圖像二值化。轉(zhuǎn)化算法為
其中:f(x,y)為二值圖像的像素值;I(x,y)為公式 (1)中得到的像素灰度值;T為根據(jù)灰度圖像的直方圖選定的閾值,即為灰度直方圖中灰度分布最大值處所對(duì)應(yīng)的灰度值。圖2為將灰度圖像轉(zhuǎn)化為二值圖像的結(jié)果 (為顯示效果,在這里采用反向顯示,即白變黑、黑變白)。
圖2 灰度圖像轉(zhuǎn)化為二值圖像Fig.2 Transformation of gray image into binary image
圖像中的特征是對(duì)圖像分析與識(shí)別的關(guān)鍵參數(shù),特征的選取及使用決定著圖像分析與識(shí)別的成敗,常用的圖像特征有顏色特征、形狀特征、紋理特征、空間關(guān)系特征等。
由于海洋微藻的半透明性降低了不同藻體細(xì)胞之間的顏色差距,而空間關(guān)系特征對(duì)圖像或目標(biāo)的旋轉(zhuǎn)、反轉(zhuǎn)、尺度的變化具有敏感性,因此,本研究中采用圖像的形狀特征和紋理特征對(duì)海洋微藻進(jìn)行識(shí)別與分類。
形狀特征一般包括圓度 (也稱豐滿度)和矩形度等。圓度為目標(biāo)圖像區(qū)域面積與其最小外接圓面積之比,矩形度為目標(biāo)區(qū)域面積與其最小外接矩形面積之比,在這里定義區(qū)域面積為某區(qū)域占有的黑像素個(gè)數(shù)??梢钥闯?,圓度與矩形度在定義和表示意義上是相似的,所以,本研究中僅提取了矩形度這一形狀特征值用于海洋微藻的識(shí)別。
形狀特征的矩形度定義如下:
其中:S1為目標(biāo)區(qū)域面積,即目標(biāo)占有的像素個(gè)數(shù);S2為目標(biāo)最小外接矩形所占的面積。
本研究中以曲周藻Pleurosigma pelagicum為例,計(jì)算矩形度的算法如下:
(1)遍歷圖像像素計(jì)算出目標(biāo)區(qū)域的面積S1,如圖3所示。
(2)從上、下、左、右4個(gè)方向分別掃描圖3所示的二值圖像,分別得到各個(gè)方向第一次遇到黑像素的坐標(biāo):y_top、y_bottom、x_left、x_right,如圖4所示。
(3)計(jì)算外接矩形面積,即
(4)由公式 (3)計(jì)算該藻的矩形度D。
圖3 曲周藻的二值圖像Fig.3 Binary image of alga Pleurosigma pelagicum
圖4 曲周藻最小外接矩形的掃描結(jié)果Fig.4 Minimal outer rectangle of alga Pleurosigma pelagicum
紋理是對(duì)圖像各像元灰度空間分布的一種描述,是圖像局部性質(zhì) (灰度分布函數(shù))的統(tǒng)計(jì)[11]。紋理特征不是基于像素點(diǎn)的特征,它需要在包含多個(gè)像素點(diǎn)的區(qū)域中進(jìn)行統(tǒng)計(jì)計(jì)算。在模式匹配中,這種區(qū)域性的特征具有較大的優(yōu)越性,不會(huì)由于局部的偏差而無法匹配成功。作為一種統(tǒng)計(jì)特征,紋理特征常具有旋轉(zhuǎn)不變性,并且對(duì)于噪聲有較強(qiáng)的抵抗能力。經(jīng)常使用的特征值有能量、熵、慣性矩、平穩(wěn)度、相關(guān)度等。所以,本研究中在提取紋理特征時(shí)首先利用二值圖像得到目標(biāo)區(qū)域的重心,再在灰度圖像中以重心為中心作矩形,計(jì)算矩形內(nèi)像素的紋理特征,以此作為待識(shí)別目標(biāo)的紋理特征,如圖5所示。
2.2.1 微藻圖像重心的計(jì)算 利用二值圖像計(jì)算目標(biāo)區(qū)域的重心,其計(jì)算公式[9]如下:
其中:Grayx(x,y)為所有像素點(diǎn)映射到x軸的像素值矩;Grayy(x,y)為所有像素點(diǎn)映射到y(tǒng)軸的像素值矩;Gray(x,y)為所有像素點(diǎn)映射到原點(diǎn)的像素值矩;(x,y)為像素在圖像中的坐標(biāo);gxy為y行x列像素點(diǎn)的像素值,在二值圖像中黑像素為0,白像素為1。
則目標(biāo)圖像的重心坐標(biāo)(Mx,My)為
2.2.2 微藻圖像紋理特征的提取 目前獲取圖像紋理特征的普遍方法為空間灰度層共現(xiàn)矩陣法[12]?;叶裙铂F(xiàn)矩陣是一個(gè)描述灰度圖像紋理分布統(tǒng)計(jì)規(guī)律的矩陣,其元素定義為:灰度圖像中θ方向上相隔d像元距離的一對(duì)像元,分別具有灰度層i和j的概率,記為 p(i,j|d,θ)。本研究中,設(shè) θ=0,d=5,得到共現(xiàn)矩陣,由共現(xiàn)矩陣得到以下紋理特征參數(shù):
(1)能量
(2)熵
(3)慣性矩
(4)相關(guān)度
式中,
(5)局部平穩(wěn)
傳統(tǒng)的模式識(shí)別過程大多是利用統(tǒng)計(jì)決策理論對(duì)有限類樣本進(jìn)行最優(yōu)分類,是以不同樣本在特征空間中的最佳劃分為目標(biāo)。而海洋微藻的模式識(shí)別是對(duì)混合圖片中的微藻進(jìn)行一個(gè)一個(gè)的“認(rèn)識(shí)”過程,不要求最佳劃分只要求正確識(shí)別,所以本研究中,利用王守覺[13]提出的仿生模式識(shí)別 (拓?fù)淠J阶R(shí)別)理論進(jìn)行識(shí)別。
仿生模式識(shí)別理論基于同源連續(xù)性原理,它認(rèn)為兩個(gè)同類事物之間存在一個(gè)漸變過程,在這個(gè)漸變過程中各事物都屬于同一類。所以仿生模式識(shí)別理論的實(shí)現(xiàn)過程就是計(jì)算待識(shí)別樣本到學(xué)習(xí)樣本所組成的特征空間距離的過程,距離最小的類即為待識(shí)別樣本所屬的類。
定義待識(shí)別類為X,特征空間中的已知類集合為P={p1,p2,…,pn},待識(shí)別X類到P中各類別的距離為D1,D2,…,Dn,并生成距離集合DH={D1,D2,…,Dn},其中最小距離定義為dHmin,那么問題就轉(zhuǎn)換為求DH中最小距離dHmin及其對(duì)應(yīng)的類別號(hào) i,即 (dHmin,i)=min(DH)[14]。
定義X到pi的距離Di的算法如下:
其中:D、E、H、I、C、L分別為矩形度、能量、熵、慣性矩、相關(guān)度和局部平穩(wěn)度特征值。
圖5 紋理特征值提取區(qū)域Fig.5 Extracting region of texture eigenvalue
為驗(yàn)證本算法,對(duì)在海域中隨機(jī)采集的不同形狀、大小、紋理的微藻混合圖像進(jìn)行自動(dòng)識(shí)別實(shí)驗(yàn)。實(shí)驗(yàn)用海洋微藻圖像樣本隨機(jī)采集于大連市黑石礁海域,使用Nikon Eclipse 5i型顯微鏡在10×100倍下拍攝圖像,如圖6所示,假設(shè)藻體未知,并以數(shù)字代碼表示每個(gè)藻體。
圖6 實(shí)驗(yàn)用微藻圖像樣本Fig.6 Samples of microalgae in the experiment
在圖6中,4張微藻的混合圖片中共存在7種微藻,其中1和2為1種,3和7為1種,4、5、6、8、9分別為5種。將這7種藻類分別用Ⅰ (1、2號(hào)藻)、Ⅱ (3、7號(hào)藻)、Ⅲ (4號(hào)藻)、Ⅳ (5號(hào)藻)、Ⅴ (6號(hào)藻)Ⅵ (8號(hào)藻)、Ⅶ (9號(hào)藻)代碼來表示,則7種藻類的特征空間值如表1所示。
表1 學(xué)習(xí)樣本獲得的特征值Tab.1 Microalgae eigenvalues from Fig.6
使用本研究中給出的仿生模式自動(dòng)識(shí)別方法求得圖6中9個(gè)微藻個(gè)體與表1中7種微藻類別的特征空間距離,如表2所示。
在表2中,橫向數(shù)值為圖6中每個(gè)藻體與7種不同藻類的特征空間距離,每個(gè)藻體與某藻種距離最近的數(shù)據(jù)已用黑體標(biāo)出。由圖6可知:藻體1、2為同種藻類,而表2中顯示第1行的藻體1和第2行的藻體2與Ⅰ的距離最近;同理,藻體3和藻體7同屬一類,而表2中顯示第3行的藻體3和第7行的藻體7與Ⅱ的距離最近。從表2中依次可看出,藻體4與Ⅲ的距離最近,藻體5與Ⅳ的距離最近,藻體6與Ⅴ的距離最近,藻體8與Ⅵ的距離最近,藻體9與Ⅶ的距離最近。由表2可以看出:藻體1、2屬于Ⅰ類,藻體3、7屬于Ⅱ類,藻體4屬于Ⅲ類,藻體5屬于Ⅳ類,藻體6屬于Ⅴ類,藻體8屬于Ⅵ類,藻體9屬于Ⅶ類,結(jié)果完全正確。
表2 待識(shí)別微藻與樣本微藻特征空間距離Tab.2 Feature space distances between identifying microalgae and microalga simples
本研究中,利用圖像技術(shù)研究了海洋微藻的自動(dòng)識(shí)別與分類方法,針對(duì)藻類個(gè)體間顏色差距不明顯、半透明等特點(diǎn),給出了以形狀及紋理方面的6個(gè)特征作為不同藻類識(shí)別的特征值,提出了利用仿生模式識(shí)別方法對(duì)海洋微藻圖像樣本進(jìn)行識(shí)別的技術(shù)路線,并對(duì)在形狀、大小、紋理等方面存在差距的微藻混合圖像進(jìn)行了識(shí)別實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,該方法可以正確地識(shí)別出混合圖像中的多個(gè)微藻,說明此方法在微藻圖像識(shí)別中是可行且有效的。但也存在一定的缺陷,即無法對(duì)存在部分重疊的藻體進(jìn)行識(shí)別與分類。今后作者將通過其他圖像處理技術(shù),如小波處理等頻域圖像處理方式,實(shí)現(xiàn)圖像的預(yù)處理及分割或增加新的特征項(xiàng),從而實(shí)現(xiàn)任意特殊情況下藻體的識(shí)別與分類,進(jìn)而擴(kuò)大本方法的適用范圍。
[1]Adamzak M,Bornscheuer U T,Bednarski W.The application of biotechnological methods for the synthesis of biodiese[J].European Journal of Lipid Science and Technology,2009,111(8):800-813.
[2]程奇,呂蓓,沈桂芳.能源微藻生產(chǎn)生物柴油的意義及其開發(fā)價(jià)值[C]//經(jīng)濟(jì)發(fā)展方式轉(zhuǎn)變與自主創(chuàng)新——第12屆中國科學(xué)技術(shù)協(xié)會(huì)年會(huì),2010.
[3]李雪梅,宮春光,安鑫龍.赤潮微藻的分類鑒定方法[J].河北漁業(yè),2011,63(12):58-59.
[4]駱巧琦,李雪松,梁君榮.基于形狀特征的硅藻顯微圖像自動(dòng)識(shí)別[J].廈門大學(xué)學(xué)報(bào):自然科學(xué)版,2011,50(4):690-696.
[5]汪振興,佘焱,姜建國.赤潮藻類圖像自動(dòng)識(shí)別的研究[J].海洋環(huán)境科學(xué),2007,26(1):42-44.
[6]Culverhouse P,Williams R,Reguera B,et al.Expert and machine discrimination of marine flora:a comparison of recognition accuracy of field collected phytoplankton[C]//IEEE International Conference on Visual Information Engineering,2003,7:177-181.
[7]鄭少平,謝杰鎮(zhèn),王博亮,等.基于形狀特征描述子的赤潮優(yōu)勢(shì)種識(shí)別研究[J].廈門大學(xué)學(xué)報(bào),2009,48(5):676-679.
[8]郭彥伶,彭進(jìn)業(yè),王大凱.改進(jìn)復(fù)原模型的彩色-灰度圖像變換方法[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(7):192-194.
[9]章衛(wèi)祥,周秉鋒.一種基于梯度域的彩色圖像轉(zhuǎn)灰度圖像的方法[J].影像技術(shù),2007(3):20-22.
[10]李貞培,李平,郭新宇,等.三種基于GDI+的圖像灰度化實(shí)現(xiàn)方法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2009,19(7):73-75.
[11]汪毅.基于數(shù)字圖像的藻類特征值提?。跠].大連:大連海洋大學(xué),2007.
[12]付信際,楊汝良,岳海霞.一種新的灰度共現(xiàn)矩陣特征提取算法[J].測(cè)試技術(shù)學(xué)報(bào),2005(3):310-314.
[13]王守覺.仿生模式識(shí)別(拓?fù)淠J阶R(shí)別)——一種模式識(shí)別新模型的理論與應(yīng)用[J].電子學(xué)報(bào),2002,30(10):1417-1420.
[14]翟懿奎,曾軍英.一種基于小波奇異值分解的仿生模式虹膜識(shí)別算法[J].電路與系統(tǒng)學(xué)報(bào),2012,17(2):43-48.