(1.湖南師范大學(xué) 物理與信息科學(xué)學(xué)院,湖南 長沙 410081; 2.長沙師范學(xué)院 信息與工程系,湖南 長沙 410100)
高強度聚焦超聲(High Intensity Focused Ultrasound,HIFU)作為一種非侵入式病變組織治療新手段,是把高強度超聲的能量聚焦于靶區(qū),由于瞬間高溫效應(yīng)、瞬間化學(xué)效應(yīng)、機械效應(yīng)、聲化學(xué)等,致使腫瘤細胞蛋白質(zhì)發(fā)生變性而產(chǎn)生凝固性死亡,卻不損傷周圍正常細胞[1]。準(zhǔn)確地對HIFU輻照后的生物組織進行變性分類識別,是對HIFU治療效果評判的基礎(chǔ)[2]。
目前組織變性分類識別方法主要有基于成像技術(shù)和信號檢測兩種。Sun等人[3]提出多光譜光聲成像的生物組織變性評估方法。鄒孝等人[4]提出了B超圖像灰度和小波變換系數(shù)并結(jié)合BP神經(jīng)網(wǎng)絡(luò)監(jiān)測HIFU輻照生物組織變性識別。此外,明文[5]從信號處理方面提出了基于BP神經(jīng)網(wǎng)絡(luò)的HIFU輻照生物組織損傷分類識別方法,利用多參量構(gòu)成矢量矩陣輸入神經(jīng)網(wǎng)絡(luò),訓(xùn)練神經(jīng)網(wǎng)絡(luò)并對樣本進行損傷分類識別。然而,這些方法主要基于生物組織變性的某個參量,難以全面反映組織特性變化。
主元分析(Principal Component Analysis,PCA)是一種基于高斯統(tǒng)計假設(shè)的常用的特征提取方法,但它對非線性問題的處理效果通常不佳,而生物組織變性識別中各特征要素之間在本質(zhì)上是非線性關(guān)系。Scholkopf等提出的KPCA(核主元分析,Kernel PCA)在非線性特征提取方面優(yōu)于PCA。與SVM(支持向量機,Support Vector Machine)相比,F(xiàn)SVM(模糊支持向量機,F(xiàn)uzzy SVM)具有更高的分類準(zhǔn)確率[6]。本文對離體豬肉組織多個變性特征參量進行二次特征提取,以HIFU輻照后豬肉組織中的超聲回波信號特征為研究對象,提出了一種結(jié)合KPCA和FSVM各自優(yōu)勢的豬肉組織變性分類識別方法。
Kij=exp[-‖xi-xj‖2/(2σ2)]
(1)
y=(y1,y2,…,yq)T=UTφ(x)
(2)
通過求累計方差貢獻率最終決定KPCA主元特征數(shù)量。累計方差貢獻率定義為
(3)
模糊聚類(Fuzzy C-Means,FCM)的效果取決于最初聚類中心選擇,此外,初始值也對聚類性能有較大的影響。樣本模糊隸屬度的求解屬于局部搜索,易出現(xiàn)局部極值問題[8]。而粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)是一種全局尋優(yōu)方法,結(jié)合PSO全局尋優(yōu)和FCM局部尋優(yōu)來求解樣本的模糊隸屬度。將FCM獲取的聚類中心當(dāng)作初始參照中心,利用FCM計算模糊隸屬度,通過PSO搜尋最優(yōu)聚類中心。因此,關(guān)鍵是尋找最優(yōu)聚類中心。對聚類中心Ai(i=1,2,…,c)的任一粒子編碼定義如下:
xi=(ai1,ai2,…,aij,…,aic)
(4)
式中,aij為第i種聚類中的第j個聚類中心。針對FCM算法,最優(yōu)聚類即目標(biāo)函數(shù)值取最小時所對應(yīng)結(jié)果;PSO通常取適應(yīng)度的最大值所對應(yīng)的最優(yōu)解,適應(yīng)度函數(shù)如下定義[8]:
f=1/(JFCM(X;U,A)+1)
(5)
聚類效果越好,其JFCM(X;U,A)越小,個體的適應(yīng)度f越高,尋找粒子在每次迭代過程中的適應(yīng)度,尋找到該粒子當(dāng)前的最優(yōu)解就是個體極值,同時也可尋找到粒子群當(dāng)前的最優(yōu)解,也就是全局極值。PSO優(yōu)化FCM求解模糊隸屬度步驟如下:
(1) 初始化。設(shè)定學(xué)習(xí)因子c1、c2、最大迭代次數(shù)M、模糊因子m′、聚類類別數(shù)c、粒子種群規(guī)模n的初始值,初始迭代次數(shù)k=1,隨機選出c個樣本作為聚類中心集,確定粒子的開始速度,設(shè)定粒子的最大速度為Vmax,迭代終止閾值定為ε。
(2) 計算每一個粒子與聚類中心之間歐氏距離,然后計算粒子的隸屬度,可得隸屬度矩陣U,對聚類中心值進行更新。
(3) 對種群進行評估。依據(jù)適應(yīng)度函數(shù)f來計算每一個粒子的適應(yīng)值,得到個體的最優(yōu)值與全局的最優(yōu)值。
(4) 對每一個粒子所經(jīng)歷的個體的最優(yōu)值、全局的最優(yōu)值分別進行比較,若較好則替換目前個體的最優(yōu)值與全局的最優(yōu)值。
(5) 尋優(yōu)結(jié)束。若粒子完成最大迭代次數(shù)M或符合小于規(guī)定的閾值ε,則計算終止;否則將粒子的速度及位置進行更新,迭代數(shù)自加1,用最優(yōu)粒子的位置產(chǎn)生新的聚類中心,再轉(zhuǎn)至步驟(2)重新循環(huán)。輸出模糊隸屬度矩陣,獲得最終的模糊隸屬度。
(6)
式中,ω為權(quán)重向量;b為偏置;ξi為松弛變量;C為懲罰因子。將式(6)轉(zhuǎn)化為其對偶問題[8]:
(7)
求得拉格朗日乘子αi和偏置b,得到最優(yōu)分類超平面的決策函數(shù)(也稱分類器):
(8)
實驗系統(tǒng)主要由HIFU探頭、B超探頭、A/D信號采集卡、計算機控制系統(tǒng)等組成,如圖1所示。實驗所用的HIFU探頭頻率為1.391 MHz,焦距約為13 cm,輸出的最大功率為300 W。新鮮豬肉樣品放置在正對HIFU探頭下面的吸聲橡膠上。信號通過A/D采集卡送入計算機,通過改變HIFU劑量及輻照方式重復(fù)進行大量實驗。為確定組織是否發(fā)生變性,每次輻照實驗后都作組織切片驗證。
圖1 HIFU輻照組織回波信號提取實驗系統(tǒng)
分別提取能反映豬肉組織變性的時頻域特征[8-9]:回波能量、峭度、裕度、方差、回波功率譜積分、頻率方差、衰減系數(shù)、背向散射積分、樣本熵、模糊熵、shannon小波熵、對數(shù)能量小波熵、q內(nèi)積小波熵、小波時間熵、小波能量、EMD能量熵、EMD奇異熵等,建立混合域特征集。為提高FSVM分類器的分類能力,先對初始特征集作KPCA二次特征的提取。由于RCVC與核主元向量成正比,需選取合適特征向量維數(shù),防止增加冗余數(shù)據(jù);與此同時,為了保證豬肉組織變性識別準(zhǔn)確率,需要較高的累積貢獻率以保證數(shù)據(jù)的可靠性。按累計貢獻率大于95%的標(biāo)準(zhǔn),經(jīng)過多次取值實驗,當(dāng)標(biāo)準(zhǔn)差σ=86,前2個特征主元RCVC≥95%,如圖2所示。因此,核主元特征向量個數(shù)為2,將選出的前2個核主元特征向量作為FSVM訓(xùn)練樣本的特征向量。
圖2 KPCA核主元數(shù)與累積貢獻率的關(guān)系
針對FCM求解樣本模糊隸屬度時易陷入局部極值問題,利用PSO全局尋優(yōu)能力搜尋最優(yōu)聚類中心,結(jié)合PSO和FCM求解噪聲樣本較小的模糊隸屬度,降低異常點對最優(yōu)超平面選擇的影響。設(shè)置FSVM的最初參數(shù),用KPCA選取的前2個核主元特征向量訓(xùn)練FSVM分類器。將待測樣本的核主元特征向量輸送到訓(xùn)練好的FSVM分類器中,實現(xiàn)組織變性分類識別。組織變性識別流程圖如圖3所示。
圖3 基于KPCA-FSVM的組織變性識別流程圖
實驗選擇102例離體豬肉組織經(jīng)HIFU輻照產(chǎn)生的超聲散射回波信號作為FSVM的訓(xùn)練樣本,獲取FSVM最優(yōu)超平面。利用KPCA對回波信號進行特征參數(shù)二次提取,將提取的前2個特征輸入FSVM并對116例超聲輻照后的豬肉組織進行變性分類識別。這116例組織通過手工切片驗證得到60例變性樣本,56例未變性樣本。為了驗證提出的KPCA-FSVM組織變性識別方法的有效性,選取與KPCA二次混合域特征集提取的前2個特征呈非線性映射關(guān)系的衰減系數(shù)及背向散射積分特征,將其分別輸入FSVM中進行變性識別比較。
116例豬肉組織回波信號分別采用衰減系數(shù)、背向散射積分變性檢測結(jié)果,如圖4所示。針對KPCA二次特征提取的2個特征、衰減系數(shù)及背向散射積分的FSVM豬肉組織變性分類識別結(jié)果如表1所示。由表1可知,檢測樣本為116例,通過切片驗證變性的樣本數(shù)60例,未變性樣本數(shù)56例。變性識別率是待測樣本中判斷正確的變性樣本數(shù)與切片驗證所得的變性樣本數(shù)的比值;未變性識別率是待測樣本中判斷正確的未變性樣本數(shù)與切片驗證所得的未變性樣本數(shù)的比值。
圖4 116例豬肉組織變性識別的衰減系數(shù)及背向散射積分檢測結(jié)果
特征變性樣本未變性樣本數(shù)量誤判數(shù)量識別率/%數(shù)量誤判數(shù)量識別率/%總識別率/%衰減系數(shù)60690.056394.692.2背向散射積分60493.356492.993.1KPCA二次混合域特征提取的2個特征60296.756296.496.5
利用KPCA二次提取混合域特征集的前2個特征并用FSVM進行分類識別,其變性樣本識別率、未變性樣本識別率、總識別率分別高于衰減系數(shù)6.7%、1.8%、4.3%,高于背向散射積分3.4%、3.5%、3.4%。
由此可見,在相同條件下,本文提出的KPCA方法降低了輸入特征維數(shù),并保證輸出的特征能較好地反映組織特性并具有適合模式識別的可分性。通過KPCA二次提取混合域特征集的前2個特征,并運用FSVM對組織變性進行分類識別,獲得的總識別率超過了96%,KPCA二次提取混合域特征集相對單一特征能更準(zhǔn)確地檢測豬肉組織是否發(fā)生變性。
結(jié)合非平穩(wěn)信號處理方法,分別從時域和頻域取得反映組織變性的特征,并建立相應(yīng)的混合域特征集,該特征集可較全面、準(zhǔn)確地反映組織變性信息。利用KPCA對混合域特征集作二次特征提取,將特征集映射到一個較低維的特征空間,剔除那些對豬肉組織變性識別貢獻不大或不敏感的特征量,并提取出對組織變性敏感的特征,從而獲得數(shù)目少、敏感度高且分類錯誤率低的主要特征。綜合PSO、FCM及SVM 各自優(yōu)點構(gòu)建FSVM分類器,使傳統(tǒng)SVM具有更好的離體豬肉組織變性分類識別能力。對116例離體豬肉樣本在HIFU輻照后獲得的超聲回波信號進行特征提取并用KPCA-FSVM進行分類識別。結(jié)果表明,KPCA二次提取混合域特征集后的總識別率為96.5%,高于單一特征識別率。后續(xù)將進一步提高樣本數(shù)量并收集多種不同生物組織的樣本,使該分類識別方法具有可推廣性。