郭春鋒,姬光榮,鄭海永
(中國海洋大學(xué)信息科學(xué)與工程學(xué)院,山東 青島266100)
顯微觀察技術(shù)對于未知種群的生物識別及常見藻類的現(xiàn)場檢測方面仍具有較強(qiáng)的實(shí)用性[1],目前仍是海洋赤潮生物定性與定量研究的主要技術(shù)手段。Andrei C.Jalba等[2-3]運(yùn)用分水嶺方法,通過連通算子標(biāo)記,對ADIAC項目[4]硅藻庫進(jìn)行圖像分割,得到較好的分割效果;在此基礎(chǔ)上,又研究了基于數(shù)學(xué)形態(tài)學(xué)的多尺度方法,結(jié)合輪廓和紋理特征,進(jìn)行分類識別,識別率達(dá)到90%以上。高亞輝等[5-6]對浮游植物顯微圖像進(jìn)行了基于數(shù)學(xué)形態(tài)學(xué)和模糊算子的邊緣檢測研究;駱巧琦等[7]又提出了雙輪廓疊加法以提取11種硅藻圖像的輪廓,并用BP神經(jīng)網(wǎng)絡(luò)的方法對其進(jìn)行自動識別。Ivica Dimitrovski[8]等采用預(yù)測聚類樹(PCT)作為分類器對ADIAC的硅藻數(shù)據(jù)庫圖像進(jìn)行了多層次的分類,獲得了比較好的效果。但這些研究大多針對多類藻種只用一種目標(biāo)分割方法和一組特征集進(jìn)行圖像分割和特征提取,由于不同門類的藻種形態(tài)差異過大,所以對某些藻種難以進(jìn)行有效的分割并確切地描述其特征,而且其針對性太強(qiáng),不易推廣。本文通過對赤潮藻類細(xì)胞生物形態(tài)學(xué)細(xì)節(jié)特征進(jìn)行分析,發(fā)現(xiàn)角毛藻細(xì)胞主鏈上生有形態(tài)各異的角毛,跟其它藻種之間的差異較大,因此結(jié)合計算機(jī)圖像識別的特點(diǎn),以有無角毛、有無橫縱溝、有無尖頂刺作為分類依據(jù),設(shè)計了三級分類器,并建立樹狀判別體系,該研究提高了識別藻類細(xì)胞的準(zhǔn)確率。
通過對有害赤潮藻類細(xì)胞生物形態(tài)學(xué)細(xì)節(jié)特征和形狀特征的分析,建立了赤潮藻顯微圖像自動分類體系。分別對藻類細(xì)胞3種細(xì)節(jié)特征(有無角毛、橫縱溝、尖頂刺)進(jìn)行有效的自動提取,作為顯微圖像自動分類的重要判據(jù),進(jìn)而設(shè)計三級兩類分類器,建立樹狀判別體系,將大樣本集有效劃分為小樣本集,并針對不同的小樣本集進(jìn)行相應(yīng)的自動分類,然后進(jìn)一步提取全局形狀特征,從而得出識別結(jié)果。結(jié)合計算機(jī)圖像識別的特點(diǎn),設(shè)計有害赤潮顯微圖像自動識別流程(見圖1)。該流程主要包括以下步驟:
分類器Ⅰ 根據(jù)細(xì)胞有無角毛,對上傳圖像進(jìn)行第一級分類。對于赤潮藻顯微圖像,首先采用基于灰度方向角模型的細(xì)胞目標(biāo)提取算法;針對角毛藻細(xì)胞分叉較多,進(jìn)行基于形態(tài)學(xué)細(xì)化的骨架提取,
得到藻種細(xì)胞骨架的細(xì)節(jié)特征,將骨架的節(jié)點(diǎn)數(shù)目和端點(diǎn)數(shù)目多少作為是否為角毛藻的判據(jù)。對角毛藻類進(jìn)行分類識別,得到診斷結(jié)果;對無角毛類藻使用分類器Ⅱ繼續(xù)判別。
分類器Ⅱ 針對無角毛類藻,根據(jù)有無橫縱溝進(jìn)行第二級分類。對于無角毛類藻種,首先采用基于自動化閾值的最大輪廓細(xì)胞目標(biāo)提取算法;針對顯微圖像中橫縱溝區(qū)域與細(xì)胞主體景深不同,用基于約束標(biāo)記分水嶺變換進(jìn)行橫縱溝提取,獲得藻種細(xì)胞的橫縱溝細(xì)節(jié)描述,計算所提取橫縱溝與細(xì)胞的面積之比和橫縱溝區(qū)域質(zhì)心到細(xì)胞質(zhì)心距離與細(xì)胞最小外接矩形的長之比,將這2個比值的大小作為藻種有無橫縱溝的判據(jù)。對無角毛有橫縱溝類藻種進(jìn)行分類識別,得到診斷結(jié)果;對無角毛無橫縱溝類藻種使用分類器Ⅲ繼續(xù)判別。分類器Ⅲ 針對無角毛無橫縱溝類藻,根據(jù)有無尖頂刺進(jìn)行第三級分類。針對顯微圖像中尖頂刺較小并與細(xì)胞主體邊緣凸出相連,采用基于最佳結(jié)構(gòu)元的尖頂刺提取方法,獲得藻種細(xì)胞的尖頂刺細(xì)節(jié)描述,根據(jù)有無尖頂刺分為兩類。然后分別進(jìn)行分類識別,得到診斷結(jié)果。
圖1 有害赤潮顯微圖像識別詳細(xì)流程圖Fig.1 Detailed flow chart of the microscopic images recognition of Harmful Algal Blooms
分類識別方面,主要結(jié)合不同赤潮藻的生物形態(tài)學(xué)特征,在細(xì)胞目標(biāo)提取的基礎(chǔ)上進(jìn)行不變矩和形狀因子特征的提取和描述,形成特征樣本集;采用支持向量機(jī)對特征樣本集進(jìn)行訓(xùn)練,得到識別模型庫;將待識別樣本特征數(shù)據(jù)與相應(yīng)類別識別模型庫進(jìn)行模式識別,得到最終診斷結(jié)果。
由于角毛比較細(xì),與背景差別不大,因此選擇適用于角毛藻目標(biāo)提取的方法。首先對藻種細(xì)胞圖像進(jìn)行基于灰度方向角模型細(xì)胞目標(biāo)提?。?],然后利用骨架表征形狀的能力可以簡潔、直觀的描述角毛藻的不規(guī)則形狀,可以較好的保留角毛信息。對角毛藻細(xì)胞進(jìn)行基于形態(tài)學(xué)細(xì)化的骨架提取[10],得到藻種細(xì)胞骨架的細(xì)節(jié)特征。骨架提取方法的具體描述如下:
(1)對目標(biāo)圖像采用基于擊中-擊不中變換的形態(tài)學(xué)細(xì)化法進(jìn)行骨架提??;
(2)根據(jù)測度是否小于門限進(jìn)行修剪變換;
(3)提取節(jié)點(diǎn)集合junction_point和端點(diǎn)集合end_point,獲取節(jié)點(diǎn)和端點(diǎn)的數(shù)量,利用節(jié)點(diǎn)數(shù)大于5和端點(diǎn)數(shù)大于5作為區(qū)分是否為角毛藻的判據(jù)。
根據(jù)細(xì)胞有無角毛,分為角毛藻(類別①)和無角毛類藻。對角毛藻可以進(jìn)行分類識別,得到診斷結(jié)果;對無角毛類藻使用分類器Ⅱ繼續(xù)判別。
橫縱溝是單細(xì)胞赤潮藻的重要生物學(xué)細(xì)節(jié)特征,橫溝多位于細(xì)胞中央位置或中部略偏,將細(xì)胞分為上、下兩半,縱溝與橫溝相交并向上下延伸,有的可達(dá)細(xì)胞底部。針對無角毛類藻,采用基于自動化閾值的最大輪廓細(xì)胞目標(biāo)提取,然后進(jìn)行基于約束標(biāo)記的分水嶺變換橫縱溝提取,橫縱溝提取具體步驟如下:
2.2.1 灰度特征圖像構(gòu)建 使用灰度相容球體的方法,各特征灰度彼此間距大于R,即{d(ym,yn)>R,ym≠yn∈Y},依照主成分原則和灰度相容原則確定特征灰度值集合。對給定相容球體半徑R,將相容球體內(nèi)的灰度歸并,反復(fù)迭代結(jié)束得到原始圖像I的灰度特征集合,然后對原圖像進(jìn)行重構(gòu),得到灰度特征圖像Irep。
2.2.2 形態(tài)學(xué)梯度圖像求取 記形態(tài)學(xué)梯度g(x,y)為g(x,y)=f(x,y)S(x,y)-f(x,y)ΘS(x,y),其中S(x,y)為圖像f(x,y)的結(jié)構(gòu)元素。根據(jù)公式,得到圖像Irep的形態(tài)學(xué)梯度圖像g(Irep)。
2.2.3 標(biāo)記提取 用閾值法對梯度圖像g(Irep)進(jìn)行標(biāo)記提取,將大于閾值t的點(diǎn)標(biāo)記出來,得到一幅二值
2.2.4 標(biāo)記約束 利用特征灰度集合雖然消除了大部分的區(qū)域極值和噪聲,但是仍然存在一些無關(guān)的極小值點(diǎn),導(dǎo)致目標(biāo)被分割成許多細(xì)小區(qū)域。在進(jìn)行分水嶺變換之前對這些點(diǎn)進(jìn)行約束,就可以有效地避免過分割現(xiàn)象。本文定義了以下3個約束控制準(zhǔn)則:
(2)質(zhì)心位置約束:
2.2.5 極小值標(biāo)定 將執(zhí)行步驟2.2.4后得到的局部極小值點(diǎn)作為標(biāo)記點(diǎn)來修改梯度圖像,得到g′(Irep)。2.2.6分水嶺變換 最后進(jìn)行快速分水嶺變換,得到提取結(jié)果,示例為條紋環(huán)溝藻橫溝提取結(jié)果(見圖2)。
圖2 條紋環(huán)溝藻橫溝提取結(jié)果對比Fig.2 Gyrodinium instriatum sulcus extraction results contrast
根據(jù)細(xì)胞圖像有無橫縱溝分為2類。對(類別②)無角毛有橫縱溝的圖像可以進(jìn)行分類識別;對于無橫縱溝的使用分類器III繼續(xù)判別。
2.3.1 圖像位置歸一化 由于藻種圖像的主軸與x軸正向會存在一定夾角,通過計算目標(biāo)區(qū)域慣性主軸的方向與x軸正向的夾角,然后經(jīng)逆向旋轉(zhuǎn)變換擺正[11]。如圖3(a)所示,像素(x,y)對直線y=xtanθ的慣性矩為r2,r=xsinθ-ycosθ,若圖形上所有點(diǎn)到直線y=xtanθ的慣性矩最小,則圖形的慣性主軸為直線y=xtanθ。
圖3 位置歸一化Fig.3 Location normalization
如圖3(b)所示,若直線y=xtanθ′為細(xì)胞的慣性主軸。則慣性矩為為像素點(diǎn)個數(shù),由慣性矩最小求得
2.3.2 選取最佳結(jié)構(gòu)元 要使頂刺部位與細(xì)胞體完整的分離,結(jié)構(gòu)元素的大小必須等于頂刺著生位置橫截面寬度。將目標(biāo)位置歸一化后,在x軸方向上進(jìn)行等距采樣,計算并統(tǒng)計采樣點(diǎn)上的像素寬度[12]。設(shè)二為二值化后前景像素的灰度值。圖像第j列中目標(biāo)像素數(shù)目的度量值。
圖4 像素寬度直方圖及面積分布示意圖Fig.4 The histogram of pixel width and Area distribution diagram
如圖4所示,(a)為目標(biāo)圖像;(b)為像素寬度直方圖,L(ω)橫坐標(biāo)值為所有的像素寬度,縱坐標(biāo)值為采樣點(diǎn)數(shù)目,尖刺部位平均寬度為第一個紅圈標(biāo)明的脈沖處對應(yīng)的橫坐標(biāo)(ω=10),細(xì)胞體平均寬度為第二個紅圈標(biāo)明的脈沖處對應(yīng)的橫坐標(biāo)(ω=78);(c)為面積分布圖,縱坐標(biāo)表示為S(ω)=L(ω)×ω,目標(biāo)中具有最大面積的像素寬度即為紅圈標(biāo)明的脈沖處對應(yīng)的橫坐標(biāo)(ω=78)。
設(shè)像素寬度閾值ω′將S(ω)劃分為2個部分,若滿足
即面積積分比值在[T1,T2]時,可認(rèn)為頂刺區(qū)域存在,T1=0.000 5,T2=0.005為實(shí)驗中確定的閾值,并將滿足條件的閾值集合{ω′1,ω′2,…ω′k}作為結(jié)構(gòu)元素的估計尺寸集合,從中選擇滿足L(ω*)=max{L(ω′1),L(ω′2),…,L(ω′k)}的ω*作為最佳結(jié)構(gòu)元尺寸。
2.3.3 頂刺提取 尖頂刺著生連接部位寬度與細(xì)胞主體部分寬度是有很大差別的,用所選取的最佳結(jié)構(gòu)元大小進(jìn)行開運(yùn)算,然后用原圖像減去開運(yùn)算結(jié)果,就可獲得圖像中的凸出部位。
2.3.4 區(qū)域標(biāo)記 以小結(jié)構(gòu)元素做形態(tài)開運(yùn)算,去除孤立點(diǎn)及虛假區(qū)域;找到圖像中所有連通部分,標(biāo)記同一連通成分中所有像素點(diǎn),將面積最大的區(qū)域提取出來,即為頂刺區(qū)域。
根據(jù)有無角毛無尖頂刺分為2類(類別①、類別②)。然后進(jìn)行分類識別。
根據(jù)判別結(jié)果(①或②或③或④,最后只能有一種結(jié)果)結(jié)合不同赤潮藻的生物形態(tài)學(xué)特征,在細(xì)胞目標(biāo)提取的基礎(chǔ)上進(jìn)行12個不變矩和7個形狀因子特征的提取和描述,形成特征樣本集。采用一對一方法構(gòu)建多類別分類模型,選擇C-SVC 2類分類器和徑向基內(nèi)積核函數(shù)RBF構(gòu)成單元分類器。根據(jù)不同處理方法設(shè)置訓(xùn)練樣本集,標(biāo)志出已知樣本,將提取樣本特征作為訓(xùn)練樣本由支持向量機(jī)SVM進(jìn)行學(xué)習(xí),構(gòu)造出識別模型庫。將待識別樣本特征數(shù)據(jù)與相應(yīng)識別模型庫進(jìn)行分類,得到最終識別結(jié)果。
采用上述分類器思想對41種赤潮藻種、共3 600幅顯微圖像(其中訓(xùn)練樣本2 600幅,測試樣本1 000幅)進(jìn)行識別測試,根據(jù)以上分類方法分為4類,設(shè)置4類訓(xùn)練樣本分別對支持向量機(jī)進(jìn)行訓(xùn)練,然后對測試樣本1 000幅分類進(jìn)行測試,識別結(jié)果(見表1~4)。
表1 第①類藻識別結(jié)果Table 1 The recognition results of the first class Algae
表2 第②類藻識別結(jié)果Table 2 The recognition results of the second class Algae
表3 第③類藻識別結(jié)果Table 3 The recognition results of the third class Algae
表4 第④類藻識別結(jié)果Table 4 The recognition results of the fourth class Algae
對以上數(shù)據(jù)進(jìn)行統(tǒng)計分析,可以得知平均識別率為83.27%,去掉三級分類器的識別誤差(r1,r2,r3),實(shí)際識別率平均值為82.05%,達(dá)到了較好的識別效果。特別是對于反曲原甲藻、叉狀角藻和梭角藻的識別率達(dá)到88%以上,因為這些藻種形狀特征與其他藻種具有明顯差異。通過三級分類器將大樣本集合劃分為小樣本,減少了訓(xùn)練的時間,提高了識別準(zhǔn)確率。
通過對有害赤潮藻類細(xì)胞細(xì)節(jié)特征有無角毛、橫縱溝、尖頂刺的分析和提取,并利用這些細(xì)節(jié)特征作為分類的重要判據(jù),建立樹狀判別機(jī)制,設(shè)計了三級分類器,分別用于區(qū)分藻類細(xì)胞有無角毛、橫縱溝、尖頂刺;通過分類器分級判別出待識別藻種屬于哪類藻,然后再提取全局形狀特征進(jìn)一步細(xì)分,從而提高識別準(zhǔn)確率。
[1] 陳澤浦,劉堃.淺析赤潮災(zāi)害形成原因、危害與減災(zāi)工作 [J].中國漁業(yè)經(jīng)濟(jì),2010,28(1):60-65.
[2] Andrei C.Jalba,Michael H,et al.Roerdink,Morphological hattransform scale spaces and their use in pattern classification [J].Pattern Recognition,2004,37(5):901-915.
[3] Andrei C,Jalba A C,Wilkinson M H F,et al.Shape representation and recognition through morphological curvature scale spaces[J].Image Processing,2006,15(2):331-341.
[4] Buf H,Bayer M M.Automatic diatom identification[M].Singapore:World Scientific,2002.
[5] 陳成,楊晨暉,聶文,等.基于浮游植物圖像的模糊算子邊緣檢測算法 [J].計算機(jī)技術(shù)與發(fā)展,2009(3):22-24.
[6] 聶文,楊晨暉,陳成.基于數(shù)學(xué)形態(tài)學(xué)的海洋浮游植物邊緣檢測研究 [J].南京師范大學(xué)學(xué)報:工程技術(shù)版,2008(4):167-171.
[7] 駱巧琦,李雪松,梁君榮,等.基于形狀特征的硅藻顯微圖像自動識別 [J].廈門大學(xué)學(xué)報:自然科學(xué)版,2011,50(4):690-696.
[8] Ivica Dimitrovski,Dragi Kocev,Suzana Loskovska,et al.Hierarchical classification of diatom images using ensembles of predictive clustering trees[J].Ecological Informatics,2012,7:19-29.
[9] 姬光榮,鄭海永,王國宇,等.一種無角毛類赤潮藻顯微圖像目標(biāo)細(xì)胞提取方法[P].青島:中國海洋大學(xué),2010101155923,2010-03-02.
[10] 喬小燕.基于生物形態(tài)學(xué)的赤潮藻顯微圖像分割與特征提取研究 [D].青島:中國海洋大學(xué),2010
[11] Xu L,Jiang T,Xie J,et al.Red tide algae classification using SVM-SNP and semi-supervised FCM[C].[s.l.]:2nd International Conference on Education Technology and Computer(ICETC),2010,5(1):389-392.
[12] Tang X,Lin F,Andrew Remsen.Binary plankton image classification[J].IEEE Journal of Oceanic Engineering,2006,31(3):728-735.