張振宇,萬(wàn)丹丹
(河北大學(xué) 電子信息工程學(xué)院,河北 保定 071000)
甲狀腺結(jié)節(jié)在臨床中十分常見,通過高分辨超聲發(fā)現(xiàn),人群甲狀腺結(jié)節(jié)的患病率為19%~67%,其中,甲狀腺癌占5%~15%[1]。由于甲狀腺結(jié)節(jié)的發(fā)病原因未知,只有盡早地發(fā)現(xiàn)、確診,才能提高甲狀腺癌的治愈率。B超具有無(wú)創(chuàng)、動(dòng)態(tài)和廉價(jià)等特點(diǎn),已成為甲狀腺結(jié)節(jié)術(shù)前檢查的首選方法[2]。當(dāng)前,醫(yī)學(xué)圖像的臨床分析主要通過醫(yī)生對(duì)圖像的定性判別來完成。使用的特征和診斷標(biāo)準(zhǔn)不同,缺乏圖像特征的定量度量以及視覺感知上的差異,導(dǎo)致不同醫(yī)生對(duì)于同一病例的診斷結(jié)果存在差異。
超聲圖像的分類已被廣泛應(yīng)用于肝臟、乳腺等處的不同疾病的計(jì)算機(jī)輔助診斷中。但由于甲狀腺癌生物學(xué)特性多變,多源性多種性質(zhì)結(jié)節(jié)并存,從臨床表現(xiàn)和影像學(xué)特征上與良性病變常難以區(qū)別,使得普通超聲成像在甲狀腺疾病的診斷上價(jià)值有限,因此,目前針對(duì)超聲圖像的甲狀腺結(jié)節(jié)良惡性識(shí)別的研究也相對(duì)較少。此外,現(xiàn)在的多數(shù)圖像識(shí)別方法都是以神經(jīng)網(wǎng)絡(luò)作為分類器對(duì)圖像進(jìn)行分類,而且針對(duì)病灶特征的提取不全面,導(dǎo)致分類結(jié)果不甚理想。支持向量機(jī)(SVM)是統(tǒng)計(jì)學(xué)習(xí)理論最年輕、最實(shí)用的內(nèi)容,現(xiàn)已成為繼神經(jīng)網(wǎng)絡(luò)之后新的研究熱點(diǎn)。本文將臨床鑒別甲狀腺結(jié)節(jié)良惡性的依據(jù)進(jìn)行分類、量化,并選擇出類間距最大的5個(gè)向量作為支持向量機(jī)的輸入向量組合,對(duì)樣本進(jìn)行識(shí)別分類。
在臨床應(yīng)用中,醫(yī)生一般根據(jù)表1列出的特征來判別甲狀腺結(jié)節(jié)的惡性和良性[3]。由表1可知,惡性結(jié)節(jié)圖像和良性結(jié)節(jié)圖像在形狀、邊界、回聲和鈣化等特征上都存在不同,結(jié)節(jié)的良、惡性可以依據(jù)這些特征的差異區(qū)別開。
表1 甲狀腺結(jié)節(jié)良惡性鑒別點(diǎn)
本文中所用的病灶區(qū)域圖像均由醫(yī)學(xué)專家劃定,這樣可以近似認(rèn)為病灶區(qū)域圖像中心就是甲狀腺結(jié)節(jié)的中心。結(jié)節(jié)(無(wú)論良性或惡性)與正常組織的物理特性是有所不同的(如紋理、亮度等),所以它們的圖像與周圍正常組織的圖像也是不同的。利用這一特性,可以把結(jié)節(jié)輪廓提取出來。
1.2.1 形狀特征
良性結(jié)節(jié)的形狀主要是圓形、橢圓形,而惡性結(jié)節(jié)形狀往往是不規(guī)則的,因此,采用緊致度、不規(guī)則度分別對(duì)其進(jìn)行量化。
緊致度(Compactness)度量了結(jié)節(jié)輪廓形狀與其等價(jià)圓的相似程度,定義為等價(jià)圓與形狀周長(zhǎng)比的平方:
其中,A為結(jié)節(jié)區(qū)域面積,P為結(jié)節(jié)輪廓周長(zhǎng)。當(dāng)結(jié)節(jié)輪廓為圓時(shí),緊致度值為1,否則小于1。
不規(guī)則度 (Irregularity)用來度量結(jié)節(jié)形狀的不規(guī)則程度。首先將圓形視為規(guī)則形狀,然后比較結(jié)節(jié)形狀與圓之間的重合程度(差異程度),即:
此外,縱橫比 DWR(Depth-Width Ratio)也是臨床中甲狀腺結(jié)節(jié)超聲檢查常用的一個(gè)特征,它在一定程度上反映了結(jié)節(jié)的生長(zhǎng)情況,如果結(jié)節(jié)的縱橫比小于1,則結(jié)節(jié)的惡性程度相對(duì)較低??v橫比定義為結(jié)節(jié)的縱向長(zhǎng)度與橫向?qū)挾戎龋矗?/p>
1.2.2 邊界特征
惡性結(jié)節(jié)的邊界特征是不清晰的,可以是微小分葉的、有角的以及毛刺狀等。對(duì)結(jié)節(jié)邊緣的清晰程度,采用邊界上點(diǎn)的銳度(Acutance)進(jìn)行量化。
用一維高斯偏導(dǎo)核與結(jié)節(jié)邊界的垂直和水平坐標(biāo)進(jìn)行卷積,求取結(jié)節(jié)邊界上各點(diǎn)的法向方向。對(duì)于邊界上每一點(diǎn)P,設(shè)其法向方向上邊界內(nèi)、外與點(diǎn)P距離i的像素灰度分別為 g(i)、h(i)(i=1,2,…,10),定義 P點(diǎn)處的邊緣銳度為:
結(jié)節(jié)的整體邊緣銳度定義為邊界上所有點(diǎn)歸一化銳度的均值:
其中,dmax為結(jié)節(jié)邊界上各點(diǎn)銳度絕對(duì)值的最大值。銳度Acu的最大值為1。
1.2.3 邊緣特征
關(guān)于惡性結(jié)節(jié)的邊緣特征是有包膜和聲暈。邊緣特征的量化可以利用結(jié)節(jié)邊界鄰近區(qū)域的灰度分布進(jìn)行計(jì)算。采用半徑為12像素的圓盤結(jié)構(gòu)對(duì)結(jié)節(jié)區(qū)域上的二值圖像進(jìn)行腐蝕和膨脹操作,分別得到位于結(jié)節(jié)內(nèi)、外部的兩條帶狀區(qū)域。
設(shè)邊界內(nèi)、外帶狀區(qū)域內(nèi)像素個(gè)數(shù)分別為n1、n2,灰度均值分別為 u1、u2。用類間方差(Intervariance)度量結(jié)節(jié)鄰近邊界的內(nèi)、外區(qū)域之間灰度的統(tǒng)計(jì)差異:
InterVar越大,則結(jié)節(jié)邊界內(nèi)、外鄰近區(qū)域的灰度越可能存在統(tǒng)計(jì)意義上的差異。通過進(jìn)行歸一化處理,使其與灰度絕對(duì)值無(wú)關(guān),定義平均可分性(Average separability)為:
其中,TotalVar為邊界內(nèi)、外帶狀區(qū)域所有像素灰度的方差。平均可分性的最大值為1。
1.2.4 衰減特征
后方回聲采用衰減系數(shù)進(jìn)行量化。在結(jié)節(jié)區(qū)域后方灰度變化最大的方向上選取一個(gè)矩形區(qū)域,其高和寬與結(jié)節(jié)邊界框的高和寬相等。衰減系數(shù)AC(Attenuation Coefficient)定義為結(jié)節(jié)區(qū)域和其后方區(qū)域灰度均值的比值:
其中,utumor為結(jié)節(jié)區(qū)域灰度均值,upott為后方區(qū)域灰度均值。
1.2.5 回聲模式
內(nèi)部回聲可能有高回聲、等回聲、低回聲、混合回聲和無(wú)回聲等情況,回聲的高低是甲狀腺結(jié)節(jié)相對(duì)周圍組織的回聲強(qiáng)度而言的。可以采用相對(duì)亮度RB(Relative Brightness)進(jìn)行量化,即結(jié)節(jié)內(nèi)部區(qū)域灰度均值與結(jié)節(jié)外部區(qū)域的灰度均值之比:
RB在一定程度上與成像儀器和設(shè)置參數(shù)有關(guān)。
1.2.6 鈣化特征
在高頻超聲圖像上,鈣化可分為微鈣化(≤1 100 u的針尖樣強(qiáng)光點(diǎn))、粗鈣化(>1100 u的強(qiáng)光團(tuán))和弧形鈣化(腫塊表面弧形或環(huán)形強(qiáng)光帶后伴聲影)3種類型。經(jīng)臨床證實(shí),惡性組中鈣化檢出率明顯高于良性,而且大部分為微鈣化。針對(duì)此種特性,采用鈣化度(Calcification)進(jìn)行量化。
設(shè)鈣化≤1 100 u的強(qiáng)光點(diǎn)內(nèi)像素個(gè)數(shù)為v1,微鈣化點(diǎn)的個(gè)數(shù)為n,結(jié)節(jié)內(nèi)像素點(diǎn)總數(shù)為v,鈣化度定義為:
過腔的特征主要有音調(diào)的依附性、或0性(即可去過腔)、音樂材料的以主調(diào)和級(jí)音為主性、構(gòu)式的多樣性、音數(shù)的不定性、起音的眼位性、樂音進(jìn)行的級(jí)進(jìn)性、節(jié)奏的頓逗性等。下面僅以音調(diào)的依附性、音數(shù)的不定性、結(jié)構(gòu)的類型性和構(gòu)式的多樣性三點(diǎn)為例。
前面提取了緊致度、不規(guī)則度、縱橫比和銳度等9個(gè)特征,但不是所有的特征都能有效地用于后續(xù)的識(shí)別。特征選擇是為了能夠更好地對(duì)超聲圖像進(jìn)行分類,排除那些對(duì)圖像識(shí)別貢獻(xiàn)很小或沒有貢獻(xiàn)的特征,以達(dá)到減少運(yùn)算量、降低特征空間維數(shù)的目的。為了將良性結(jié)節(jié)和惡性結(jié)節(jié)的特征進(jìn)行直觀的對(duì)比,采用計(jì)算類間距的方法,統(tǒng)計(jì)各個(gè)特征量不同類別的均值和方差,并在此基礎(chǔ)上計(jì)算出類間距。對(duì)于某一個(gè)特征x而言,第i類和第j類類間距離D為:
其中,μxi為第 i類特征向量的均值,μxj為第 j類特征向量的均值,σxi為第 i類的特征向量的方差,σxj為第 j類的特征向量的方差。各類特征的類間距如表2所示。
表2 各特征的類間距
類間距D越大,則表示該特征對(duì)于分類識(shí)別的能力越強(qiáng)。由表2可以觀察到有5個(gè)特征的類間距大于1,分別是不規(guī)則度、衰減系數(shù)、縱橫比、緊致度和鈣化度,說明這5個(gè)特征對(duì)于甲狀腺結(jié)節(jié)的良惡性識(shí)別能力較強(qiáng)。其中,不規(guī)則度特征的類間距為1.954 7,表明結(jié)節(jié)不規(guī)則度是區(qū)分結(jié)節(jié)的良惡性最有效特征。本文提取不規(guī)則度、衰減系數(shù)、縱橫比、緊致度和鈣化度作為特征向量組合,對(duì)樣本進(jìn)行識(shí)別。
SVM是基于統(tǒng)計(jì)學(xué)習(xí)理論發(fā)展而來的一種新的機(jī)器學(xué)習(xí)方法[4]。其基本思想是:通過分析相關(guān)性找到空間映射函數(shù),將輸入向量映射到高維特征空間,在映射后的空間中尋找一個(gè)最優(yōu)的分界面(超平面)。在尋找最優(yōu)分界面時(shí),依據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,得到的最優(yōu)分界面不但能將兩類無(wú)錯(cuò)誤地分開,而且使兩類分類間隔(Margin)最大,并巧妙地利用原空間的核函數(shù)代替高維特征空間中的點(diǎn)積,避免了復(fù)雜計(jì)算。
SVM的分類算法如下:
設(shè)線性可分的訓(xùn)練樣本集為:
D維空間中分類分界面的方程為:
對(duì)式(13)進(jìn)行歸一化,使得訓(xùn)練樣本集滿足:
在此約束條件下對(duì)αi求解下列函數(shù)的最大值:
這是一個(gè)不等式約束下二次函數(shù)尋優(yōu)的問題,存在唯一解。容易證明,通常解中只有少部分αi不為零,則其對(duì)應(yīng)的樣本就是支持向量。求解上述問題后得到的最優(yōu)分界面分類函數(shù)為:
式(17)的求和實(shí)際上只對(duì)支持向量進(jìn)行,b是分類閾值,可用任意一個(gè)支持向量求得。
SVM的算法流程如圖1所示。
K(xi,xj)被稱為核函數(shù),SVM的基本核函數(shù)主要有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基函數(shù)和Sigmoid函數(shù):
線性核函數(shù):K(xi,xj)=xiTxj;
多項(xiàng)式核函數(shù):K(xi,xj)=(γxiTxj+r)d,γ>0;
徑向基函數(shù):K(xi,xj)=exp(-γ‖xi-xj‖2),γ>0;
Sigmoid 函數(shù):K(xi,xj)=tanh(γxiTxj+r)。
本文訓(xùn)練樣本共有70張圖像,其中惡性39張,良性31張。這些圖像來自20歲到45歲病人,采集的時(shí)間為2011年12月1日到2012年9月1日。這些圖像都是經(jīng)過醫(yī)院專家診斷且經(jīng)過術(shù)后病理證實(shí)的病例。所用的超聲診斷儀為Philips iU22及HDI 5000 Sono彩色超聲診斷儀,探頭頻率為7 MHz~12 MHz。由本文第二部分可知,提出的系統(tǒng)有調(diào)節(jié)參數(shù)C和核函數(shù)兩個(gè)參數(shù)需要確定,這兩個(gè)參數(shù)對(duì)分類精度至關(guān)重要。
為了確定使用何種核函數(shù),將樣本集分為兩組,分別用這4種核函數(shù)對(duì)訓(xùn)練樣本進(jìn)行學(xué)習(xí)分類。4種不同的核函數(shù)的分類識(shí)別結(jié)果如表3所示。
表3 使用不同核函數(shù)的分類結(jié)果
從表3可以看出,非線性的分類器(如多項(xiàng)式核函數(shù)和徑向基函數(shù)等核函數(shù))具有較高的準(zhǔn)確率,線性的分類器結(jié)果稍差,而Sigmoid函數(shù)由于不具有穩(wěn)定性,導(dǎo)致分類結(jié)果不很理想。其中,徑向基函數(shù)的識(shí)別準(zhǔn)確率最高,本篇選擇徑向基函數(shù)作為核函數(shù)進(jìn)行分類。
經(jīng)過驗(yàn)證,C=100,σ=0.5時(shí),診斷系統(tǒng)處于最佳狀態(tài)。
甲狀腺結(jié)節(jié)良惡性的診斷需要綜合運(yùn)用臨床、影像和病理學(xué)等知識(shí)和技術(shù)手段,早發(fā)現(xiàn)、早治療仍然是現(xiàn)階段有效提高惡性結(jié)節(jié)治愈率的主要措施。本文將各類特征進(jìn)行精確量化,選取緊致度、不規(guī)則度、縱橫比、衰減系數(shù)和鈣化度作為特征向量組,采用徑向基函數(shù)作為支持向量機(jī)的核函數(shù)進(jìn)行分類。該識(shí)別方法對(duì)甲狀腺結(jié)節(jié)超聲圖像具有較高的分類準(zhǔn)確性,準(zhǔn)確率達(dá)到91.25%,有望提高甲狀腺癌超聲早期診斷的準(zhǔn)確性。
[1]POLYZES S A,KITA M,AVRAMIDIS A.Thyroid nodules-stepwise diagnosis and management[J].HORMONES,2007,6(2):101-119.
[2]羅斌鈺,趙詠桔.超聲檢查在甲狀腺結(jié)節(jié)術(shù)前鑒別診斷中的作用——一項(xiàng)2890患者、4 165結(jié)節(jié)的超聲-病理分析[J].中華內(nèi)分泌代謝雜志,2010,26(4):282-284.
[3]呂珂,姜玉新,張縉熙,等.甲狀腺結(jié)節(jié)的超聲診斷研究[J].中華超聲影像學(xué)雜志,2003,12(5):285-288.
[4]張學(xué)工.關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J].自動(dòng)化學(xué)報(bào),2000,26(1):32-41.