鄒禮萍 羅 紅 李永彬
(1.遵義醫(yī)科大學(xué)醫(yī)學(xué)信息工程學(xué)院 遵義 563000)(2.貴州大學(xué)機(jī)械工程學(xué)院 貴陽(yáng) 550025)
卵巢癌是嚴(yán)重威脅婦女健康的惡性腫瘤之一,發(fā)病率僅次于宮頸癌,死亡率居各類婦科癌癥之首。由于早期無(wú)明顯特征和癥狀,難以發(fā)現(xiàn),出現(xiàn)癥狀時(shí)已是晚期,治愈率極低,因此早發(fā)現(xiàn)是治愈該病的關(guān)鍵。目前主要通過病理學(xué)檢查來(lái)早期識(shí)別和判斷,工作量大,可靠性低。近年來(lái),隨著數(shù)字圖像處理技術(shù)在臨床診斷中的應(yīng)用,大大提高了工作效率和可靠性,但由于癌細(xì)胞形態(tài)特征多變,細(xì)胞圖像背景復(fù)雜,使得細(xì)胞特征的提取成為了一個(gè)難題,多年來(lái)很多學(xué)者對(duì)該問題展開了深入的研究。利用先進(jìn)的計(jì)算機(jī)圖像處理技術(shù)對(duì)卵巢癌細(xì)胞圖片進(jìn)行圖像增強(qiáng),細(xì)胞分割等預(yù)處理,再結(jié)合病理專家的臨床經(jīng)驗(yàn)可做到早發(fā)現(xiàn)早治療,從而降低卵巢癌對(duì)女性生命健康的威脅,這是目前最有效的途徑。
多年來(lái),專家學(xué)者對(duì)細(xì)胞顯微圖像做了大量研究,細(xì)胞分割算法不斷在優(yōu)化[1~10],但在醫(yī)學(xué)方面還達(dá)不到精準(zhǔn)分割,還需要繼續(xù)研究。對(duì)李天鋼等[11]針對(duì)具有復(fù)雜紋理的胃癌細(xì)胞顯微圖像進(jìn)行檢測(cè),提出了基于多尺度小波變換的邊緣檢測(cè)方法,解決了傳統(tǒng)算法存在偽邊緣和方向性誤差的問題,提高了邊緣檢測(cè)的可信度。趙國(guó)超等[12]根據(jù)提取的38個(gè)細(xì)胞核特征組成的細(xì)胞樣本特征矢量,利用主成分分析方法對(duì)原始特征向量進(jìn)行降維處理,提出了一種強(qiáng)分類器集成算法,實(shí)現(xiàn)了癌細(xì)胞的分類識(shí)別。王云霞等[13]在通過對(duì)胃腺癌免疫組化細(xì)胞圖像進(jìn)行色度學(xué)分析并進(jìn)行粗分割,提出了基于改進(jìn)距離標(biāo)記的分水嶺分割算法,得到了較為準(zhǔn)確的細(xì)胞輪廓。歷謹(jǐn)?shù)龋?4]利用細(xì)胞分類方法并結(jié)合細(xì)胞形態(tài)學(xué)特征,完成了癌細(xì)胞的提取,但提取的精度有待提高。馬瑾等[15]應(yīng)用宮頸癌細(xì)胞圖像,建立了BP 神經(jīng)網(wǎng)絡(luò)模型,通過對(duì)模型的訓(xùn)練,使用人工神經(jīng)網(wǎng)絡(luò)模型的BP反向傳播誤差算法對(duì)細(xì)胞進(jìn)行分類,但是由于BP 算法在訓(xùn)練過程中不易得到最優(yōu)解,從而使得分類效果不佳。夏為為[16]等利用卷積神經(jīng)網(wǎng)絡(luò)的不同池化模型對(duì)宮頸癌細(xì)胞圖像進(jìn)行特征提取,分析了不同池化模型的特征提取方式以及對(duì)識(shí)別錯(cuò)誤率的影響,提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的算法,該算法降低了宮頸癌細(xì)胞圖像的識(shí)別錯(cuò)誤率,但最終效果有待提高。
以上方法雖然實(shí)現(xiàn)了對(duì)胃癌細(xì)胞、宮頸癌細(xì)胞等的分類和提取,但針對(duì)卵巢癌細(xì)胞來(lái)說其實(shí)用性較差,為了更加有效地識(shí)別卵巢癌細(xì)胞,更加準(zhǔn)確地提取卵巢癌細(xì)胞的輪廓特征,進(jìn)而能夠更加準(zhǔn)確地識(shí)別卵巢癌,本文提出了基于HSV分量聯(lián)合hessian 矩陣的卵巢癌細(xì)胞檢測(cè)算法,首先提取卵巢癌細(xì)胞圖像HSV 模型中的S 分量可以得到癌細(xì)胞的主要信息,同時(shí)去除部分噪聲的干擾;然后通過Hessian 矩陣對(duì)卵巢癌細(xì)胞進(jìn)行圖像增強(qiáng),使得細(xì)胞的局部特征更加凸顯,并結(jié)合自適應(yīng)迭代閾值算法完成圖像的分割;再根據(jù)形態(tài)學(xué)方法去除圖像中的干擾,最后運(yùn)用canny 算子實(shí)現(xiàn)細(xì)胞輪廓特征的提取。
HSV 顏色模型是根據(jù)顏色的直觀特性即色調(diào)(Hue)、飽和度(Saturation)、亮度(Value)而創(chuàng)建的一種顏色空間,也稱為六角椎體模型。色調(diào)H表示顏色所處的光譜顏色的位置,用來(lái)區(qū)分不同的顏色;飽和度S反應(yīng)顏色的純度,取值范圍為0-1,取值越大,飽和度越高,顏色越鮮艷,反之顏色越暗淡;亮度V 是指顏色表面的明亮程度,與光照強(qiáng)度之間沒有直接聯(lián)系。三個(gè)通道各有特點(diǎn),對(duì)于圖像的不同情況采用不同的通道來(lái)處理。如圖像是由于光照不同而造成視覺感知不同,采用V通道計(jì)算梯度可較好的提取對(duì)象邊緣;如圖像前景飽和度較高,背景飽和度較低則使用S 通道可獲得更好的效果;對(duì)風(fēng)格單一,顏色單一的圖像利用H通道效果更好。
HSV 模型是通過RGB 模型演變過來(lái)的,對(duì)應(yīng)的HSV模型中的分量可由RGB表示為
相對(duì)于RGB 模型而言,HSV 模型更符合人眼對(duì)光的感知特性,色調(diào)H、飽和度S、亮度V 三個(gè)分量獨(dú)立解耦[17],能夠更加準(zhǔn)確的量化圖像的顏色信息。卵巢癌細(xì)胞在HSV 模型中的三個(gè)分量圖如圖1 所示,對(duì)比三個(gè)分量圖可以發(fā)現(xiàn):圖(b)即H 分量圖較好地保留了細(xì)胞信息,但同時(shí)也把原始圖像的噪聲保留下來(lái),沒有去除噪聲的干擾,不利于后期對(duì)圖像的進(jìn)一步處理;圖(d)即V 分量圖雖然清除了大部分噪聲,但細(xì)胞信息保留不夠完整,也不利于后期特征的提取;圖(c)即S 分量圖很好地保留了細(xì)胞信息,同時(shí)去除了大部分噪聲,效果最好,因此使用S分量圖進(jìn)行后期分析和識(shí)別。
圖1 卵巢癌細(xì)胞的HSV顏色模型
圖像增強(qiáng)是通過各種算法強(qiáng)化圖像中感興趣的區(qū)域,抑制部分噪聲,增大圖像前景和背景特征差別的過程,使圖像信息量更加豐富,更容易判讀和識(shí)別。常用的方法有中值濾波、高斯濾波等,但傳統(tǒng)的濾波算法在平滑噪聲的同時(shí)會(huì)使細(xì)胞邊緣輪廓變得模糊,不利于進(jìn)一步提取,針對(duì)這一問題,提出了利用Hessian 矩陣求特征值,根據(jù)特征值之間的關(guān)系提取邊緣,凸顯細(xì)胞形態(tài)特征算法輪。
Hessian 矩陣是由多元函數(shù)的二階偏導(dǎo)數(shù)所組成的實(shí)對(duì)稱矩陣[18],常被用于醫(yī)學(xué)圖像中的細(xì)胞增強(qiáng)處理。如果需要判斷圖像中的像素點(diǎn)m 是否屬于卵巢癌細(xì)胞的輪廓區(qū)域,可通過泰勒展開式來(lái)表示圖像I 中像素點(diǎn)m 鄰域內(nèi)的圖像結(jié)構(gòu),數(shù)學(xué)表達(dá)式為
式中:?I(m)表示像 素 點(diǎn)m 的 梯 度 向 量,H(m)表示Hessian 矩陣。對(duì)于二維圖像I(x,y),像素點(diǎn)m 的Hessian 矩陣的數(shù)學(xué)表達(dá)式為
式中:Ixx,Ixy,Iyx,Iyy分別表示二維圖像I 在四個(gè)不同方向上的二階偏微分。
X方向上的二階偏微分:
Y方向上的二階偏微分:
X,Y方向上的二階偏微分:
計(jì)算矩陣的特征值λ1、λ2,并根據(jù)兩者之間的關(guān)系檢測(cè)圖中的細(xì)胞結(jié)構(gòu),并確定參數(shù)Rb和S,建立增強(qiáng)濾波函數(shù)區(qū)分背景與目標(biāo),其表達(dá)式為
β和c 可以調(diào)整Rb和S 的靈敏度。通過大量試驗(yàn)分析,取β和c分別為0.3、12。
Hessian 中通過構(gòu)建高斯函數(shù)線性模型,用于完成細(xì)胞輪廓特征提取,通過設(shè)計(jì)增強(qiáng)濾波函數(shù),將卵巢癌細(xì)胞圖像噪聲去除,從而達(dá)到圖像增強(qiáng)的目的,圖2(a)為卵巢癌細(xì)胞圖像利用Hessian 矩陣增強(qiáng)后的效果圖。
圖2 Hessian矩陣增強(qiáng)與閾值分割效果圖
由于增強(qiáng)后的卵巢癌細(xì)胞圖像中灰度等級(jí)較多,細(xì)胞與背景的界限不夠明顯,因此需要進(jìn)行圖像分割處理,常用的圖像分割算法有全局閾值法、最大類間方差法(OTSU)等,全局閾值法由于使用固定不變的閾值,因此實(shí)用性較差;最大類間方差法通過求取背景與目標(biāo)之間的最大類間方差值作為閾值對(duì)圖像進(jìn)行分割,針對(duì)灰度波動(dòng)較大,目標(biāo)輪廓清晰的圖像,分割效果較好,但運(yùn)用于邊緣較為模糊,背景較為復(fù)雜,細(xì)胞形態(tài)多變的卵巢癌細(xì)胞圖像的分割,會(huì)使得細(xì)胞信息丟失嚴(yán)重。針對(duì)卵巢癌細(xì)胞圖像中灰度分布不均,細(xì)胞形態(tài)多變的現(xiàn)象,提出了一種自適應(yīng)的閾值分割算法,具體計(jì)算流程如下:
1)為全局閾值T 確定一個(gè)初始估計(jì)值,計(jì)算出圖像中所有像素灰度的平均值,將該平均值作為圖像的初始閾值T。
2)以初始值T 為閾值分割圖像,將產(chǎn)生兩組像素I1和I2∶I1由灰度值小于平均值T 的所有像素組成,I2由灰度值大于T的所有像素組成。
3)分別計(jì)算像素I1、I2的平均灰度值average1和average2。
4)利用I1、I2的平均灰度值average1和average2,重新計(jì)算新的閾值,計(jì)算方法為
5)重復(fù)步驟2)到步驟4),直到迭代得到相鄰兩T 之間的差值小于設(shè)定的參數(shù)t為止。對(duì)卵巢癌細(xì)胞圖像自適應(yīng)迭代閾值分割算法的分割
效果如圖2(b)所示,從實(shí)驗(yàn)結(jié)果看出,分割效果較好,去除了背景的干擾,突出了細(xì)胞的結(jié)構(gòu)特征,保留了細(xì)胞的主要輪廓,但細(xì)胞內(nèi)部信息有所丟失,同時(shí)也帶入了很多細(xì)小的噪聲。針對(duì)該問題,通過形態(tài)學(xué)方法選取適當(dāng)?shù)慕Y(jié)構(gòu)元素進(jìn)行腐蝕膨脹運(yùn)算可以有效地去除噪聲,完善細(xì)胞的結(jié)構(gòu)。
圖像邊緣是圖像的基本特征之一,包含了圖像的大部分信息,邊緣檢測(cè)是獲取細(xì)胞形態(tài)特征的重要環(huán)節(jié),后續(xù)處理中會(huì)發(fā)揮重要作用,在對(duì)圖像邊緣檢測(cè)時(shí)先進(jìn)行圖像去噪和邊緣增強(qiáng),在采用某種算子進(jìn)行邊緣檢測(cè)。常用的邊緣檢測(cè)算法有roberts 算子、prewitt算子、sobel算子、log算子、canny算子等,這些算子都利用了圖像梯度的極大值,微分算子模板進(jìn)行卷積來(lái)提取圖像邊緣[10]。
roberts算子是由Lawrence Roberts 在1963年提出來(lái)的第一個(gè)邊緣檢測(cè)算子,是一階微分算子,它利用圖像垂直方向和水平方向的差分來(lái)逼近梯度,可以提取背景單一的圖像邊緣,roberts算子定位較精確,但是對(duì)噪聲比較敏感,不能控制噪聲對(duì)邊緣的影響。
prewitt算子是一階微分算子,采用了更加復(fù)雜的模板,利用像素點(diǎn)上下左右的灰度差在邊緣處達(dá)到極值來(lái)進(jìn)行邊緣檢測(cè),對(duì)于檢測(cè)水平或垂直方向的邊緣效果更好。
Sobel 算子是一階差分算子,利用快速卷積函數(shù)檢測(cè)圖像邊緣,由于Sobel 算子沒有嚴(yán)格遵循人的視覺生理特征,沒有基于圖像灰度進(jìn)行處理,通常提取的邊緣不夠完整,效果不盡如人意。
log 算子首先對(duì)圖像做高斯濾波,再求圖像拉普拉斯二階導(dǎo)數(shù),通過檢測(cè)濾波結(jié)果的零交叉提取圖像邊緣,是不依賴于邊緣方向的二階微分算子,定位精度高,但抗干擾能力不強(qiáng),
canny 算子是經(jīng)典的邊緣檢測(cè)算子,通過對(duì)原始數(shù)據(jù)與高斯平滑模板作卷積,再運(yùn)用4 個(gè)模板檢測(cè)水平、垂直、對(duì)角線方向的邊緣,最后使用滯后閾值避免了將沒有組成曲線的噪聲像素當(dāng)成邊緣,因此canny 算子具有低誤率、高定位精度和抑制虛假邊緣等優(yōu)點(diǎn),是所有算子中檢測(cè)效果最好的算法,而且能夠檢測(cè)出弱邊緣。
基于以上特點(diǎn),本文采用canny 算子對(duì)卵巢癌細(xì)胞圖像邊緣進(jìn)行檢測(cè),得到如圖3 所示的實(shí)驗(yàn)結(jié)果,從圖3 可以看出,所得細(xì)胞邊緣輪廓清晰,弱邊緣檢測(cè)效果明顯。
圖3 卵巢癌細(xì)胞圖像邊緣檢測(cè)效果圖
為了驗(yàn)證本文算法的效果,本文選取3 張不同時(shí)期的卵巢癌細(xì)胞圖像作為實(shí)驗(yàn)圖像,其尺寸統(tǒng)一為125×125 像素。算法的硬件運(yùn)行環(huán)境為華碩XY670ZD;處 理 器:AMD 銳 龍5 2500U;CPU@3.60GHz 3.30GHz;安裝內(nèi)存(RAM):8.0GB;采用軟件編程語(yǔ)言Matlab2015 工具進(jìn)行圖像處理實(shí)現(xiàn)算法,具體實(shí)驗(yàn)方法及步驟如下:
1)首先將卵巢癌細(xì)胞的RGB 圖像轉(zhuǎn)化為HSV顏色空間圖像,并提取飽和度S 分量,得到原圖的HSV顏色空間S分量圖;
2)利用Hessian 矩陣對(duì)圖像的S 分量進(jìn)行圖像增強(qiáng),去除了部分噪聲,使得細(xì)胞的形態(tài)特征變得更加凸顯;
3)利用自適應(yīng)迭代閾值對(duì)增強(qiáng)后的圖像進(jìn)行分割,得到二值圖像,但同時(shí)也給圖像帶入了大量干擾,通過形態(tài)學(xué)腐蝕膨脹運(yùn)算結(jié)合區(qū)域填充濾掉干擾;
4)最后運(yùn)用canny算子實(shí)現(xiàn)細(xì)胞輪廓特征的提取。
實(shí)驗(yàn)結(jié)果如圖4 所示,從實(shí)驗(yàn)結(jié)果可以看出,細(xì)胞輪廓清晰,細(xì)胞邊緣連續(xù),實(shí)驗(yàn)效果較好。
圖4 卵巢癌細(xì)胞邊緣提取效果圖
本文算法針對(duì)形狀多變、背景復(fù)雜的卵巢癌細(xì)胞圖像進(jìn)行了細(xì)胞輪廓特征提取算法的研究,實(shí)現(xiàn)利用HSV 顏色模型S分量分析細(xì)胞的形態(tài)特征,結(jié)合Hessian矩陣和自適應(yīng)迭代閾值分割算法濾除了圖中存在的部分噪聲,通過形態(tài)學(xué)方法結(jié)合canny邊緣檢測(cè)算子實(shí)現(xiàn)卵巢癌細(xì)胞輪廓特征提取,對(duì)細(xì)胞進(jìn)行分類識(shí)別。實(shí)驗(yàn)證明,本文算法取得了較好的效果,解決了邊界不連續(xù)的問題,極大地保留了細(xì)胞的邊緣特征,提高了檢測(cè)精度,進(jìn)而提高了對(duì)細(xì)胞進(jìn)行分類識(shí)別的準(zhǔn)確度。但該算法目前只能處理顏色較深,細(xì)胞間重疊較少的圖像,針對(duì)大面積擴(kuò)散的細(xì)胞切片圖像檢測(cè)效果不佳,在接下來(lái)的工作中,如何提高檢測(cè)算法的適用范圍和保留更多圖像細(xì)節(jié)信息,實(shí)現(xiàn)細(xì)胞重疊圖像的輪廓提取及分割是研究的重點(diǎn)。