王婷,魏琪,吳格格,余楊,鄧又斌
橋本甲狀腺炎是甲狀腺最常見的炎性疾病,甲狀腺乳頭狀癌是最常見的甲狀腺惡性腫瘤病理類型,橋本甲狀腺炎合并甲狀腺乳頭狀癌已有廣泛報道[1-3]。橋本甲狀腺炎背景下的甲狀腺良、惡性結(jié)節(jié)超聲圖像表現(xiàn)不典型,容易造成漏診或誤診[4]。高頻超聲是診斷甲狀腺癌的首選影像學(xué)檢查方法,但是超聲診斷的準(zhǔn)確性高度依賴醫(yī)生的經(jīng)驗。紋理分析能夠從圖像中提取大量的定量信息,已被證明在多種腫瘤的鑒別診斷中具有良好的效能[5-6]。目前尚缺少橋本甲狀腺炎背景下甲狀腺結(jié)節(jié)二維超聲圖像紋理分析研究。筆者旨在探討基于二維超聲圖像的紋理分析鑒別橋本甲狀腺炎背景下甲狀腺結(jié)節(jié)良、惡性的價值。
圖1 橋本甲狀腺炎背景下結(jié)節(jié)性甲狀腺腫患者(良性)甲狀腺結(jié)節(jié)區(qū)域勾畫示意圖。 圖2 橋本甲狀腺炎背景下甲狀腺乳頭狀癌患者(惡性)甲狀腺結(jié)節(jié)區(qū)域勾畫示意圖。
1.研究對象
回顧性搜集2018年2月-8月本院符合以下條件的患者。納入標(biāo)準(zhǔn):①甲狀腺切除術(shù)后病理報告甲狀腺組織淋巴細(xì)胞浸潤,診斷為橋本甲狀腺炎;②甲狀腺切除術(shù)后甲狀腺結(jié)節(jié)有明確的病理診斷結(jié)果;③甲狀腺切除術(shù)前有且僅有一個目標(biāo)病灶接受超聲引導(dǎo)下細(xì)針穿刺,并留存有穿刺前超聲圖像資料。排除標(biāo)準(zhǔn):①圖像因為偽影等原因顯示不清;②甲狀腺結(jié)節(jié)超聲檢查前已行穿刺、射頻消融術(shù)、放療或化療;③伴發(fā)其他惡性腫瘤。本項回顧性研究不涉及患者重要隱私,使用相關(guān)數(shù)據(jù)進(jìn)行研究無需患者知情同意,本院倫理委員會同意對相關(guān)資料進(jìn)行研究(批號:2019S1233)。
2.儀器與方法
超聲檢查采用三星RS80A超聲儀,線陣探頭,頻率3~12 MHz,由一名具有五年工作經(jīng)驗的超聲醫(yī)生按照甲狀腺檢查規(guī)范進(jìn)行檢查,并針對擬進(jìn)行超聲引導(dǎo)下細(xì)針穿刺的目標(biāo)病灶存圖,留存病灶最大直徑切面的二維超聲圖像。外科醫(yī)生行甲狀腺切除術(shù)后,常規(guī)標(biāo)記目標(biāo)病灶的手術(shù)標(biāo)本,因此,病灶的二維超聲圖像與病理結(jié)果相對應(yīng)。
3.圖像分析
在不知曉病理結(jié)果的情況下,由2名(分別具有8年和10年甲狀腺疾病超聲診斷經(jīng)驗)醫(yī)師通過ITK-SNAPE軟件(版本3.8.0,http://www.itksnap.org)在二維超聲圖像上沿甲狀腺結(jié)節(jié)邊緣手工分割興趣區(qū)(圖1、2),通過組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)評估兩名醫(yī)生分割區(qū)域的一致性。
基于python(版本3.6.2,https://www.python.org)的pyradiomics包(版本2.2.0,https://github.com/Radiomics/pyradiomics)提取分割區(qū)域中的紋理特征[7],包括一階灰度(first order)、形狀(Shape)、灰度共生矩陣(gray level co-occurrence matrix,GLCM)、灰度相關(guān)矩陣(gray level dependence matrix,GLDM)、灰度行程矩陣(gray level run length matrix,GLRLM)、灰度區(qū)域大小矩陣(gray level size zone matrix,GLSZM)和鄰域灰度差分矩陣(neighbouring gray tone dependence matrix,NGTDM),共107個特征[8]。
4.統(tǒng)計學(xué)分析
統(tǒng)計分析采用R軟件(版本3.6.1,https://www.r-project.org)進(jìn)行。兩組特征之間的一致性通過ICC評估,ICC>0.80表示一致性良好。符合正態(tài)分布和不符合正態(tài)分布的特征分別采用獨立樣本t檢驗和Mann-WhitneyU檢驗。計數(shù)資料的比較采用卡方檢驗。通過5折交叉驗證的Lasso回歸分析方法篩選出區(qū)分甲狀腺結(jié)節(jié)良、惡性效能最好的紋理特征組合,并構(gòu)建診斷甲狀腺結(jié)節(jié)良、惡性的預(yù)測模型。采用受試者操作特征(receiver operator characteristic curve,ROC)曲線評價模型的診斷效能,ROC曲線的比較采用Delong檢驗。研究中均采用雙側(cè)檢驗,以P<0.05為差異有統(tǒng)計學(xué)意義。
1.患者一般臨床資料
每位患者只有一個病灶納入研究,總共有93名患者的93個病灶被納入研究,男15例,女78例,平均年齡47.99±11.58歲。根據(jù)甲狀腺結(jié)節(jié)標(biāo)本的組織病理學(xué)診斷結(jié)果分為:良性組45例,平均年齡50.58±11.14歲;惡性組48例,平均年齡45.56±11.56歲。良性組患者平均年齡高于惡性組,兩組患者性別差異無統(tǒng)計學(xué)意義(P均>0.05)(表1)。
表3 模型和部分紋理參數(shù)鑒別橋本甲狀腺炎背景下甲狀腺結(jié)節(jié)良、惡性的效能
表1 良性組與惡性組甲狀腺結(jié)節(jié)患者一般臨床資料比較
2.紋理特征篩選及建模
共提取107個紋理特征,ICC介于0.42~0.96,刪除ICC≤0.80的影像特征。一致性良好的特征經(jīng)t檢驗或Mann-WhitneyU檢驗分析,刪除在良、惡性組間差異無統(tǒng)計學(xué)意義的特征。最后通過Lasso回歸采用5折交叉驗證方式(圖3~5),篩選出3個非零系數(shù)的紋理特征,分別為GLRLM的長游程高灰度優(yōu)勢(long run high gray level emphasis,LRHGLE)、形狀的延伸率(Elongation)、NGTDM的粗糙度(Coarseness),并通過線性加權(quán)的方式構(gòu)建組學(xué)預(yù)測模型[9],截距、LRHGLE、延伸率、粗糙度對應(yīng)的系數(shù)分別是0.065、-0.155、0.146、0.066。
3.模型診斷效能評估
基于三個紋理特征構(gòu)建的模型鑒別良性和惡性甲狀腺結(jié)節(jié)的ROC曲線下面積為0.842(95% CI:0.764~0.920),敏感度為0.791(95% CI:0.667~0.896),特異度為0.778(95% CI:0.667~0.889),符合率為0.785(95% CI:0.688~0.863)。在良、惡性甲狀腺結(jié)節(jié)組間差異有統(tǒng)計學(xué)意義的3個紋理參數(shù)中,單獨用于鑒別良、惡性甲狀腺結(jié)節(jié),診斷效能最高的是LRHGLE,ROC曲線下面積為0.765(95% CI:0.670~0.860),低于模型的診斷效能(表2,圖5、6),差異具有統(tǒng)計學(xué)意義(P=0.035,DeLong檢驗)。
近年來,甲狀腺癌的發(fā)病率一直在迅速上升,甲狀腺癌中最常見的病理類型是甲狀腺乳頭狀癌,雖然其預(yù)后良好[10],但是甲狀腺切除術(shù)后,患者的生活質(zhì)量明顯下降[11]。這可能在一定程度上與甲狀腺切除術(shù)后的并發(fā)癥,如暫時性或永久性的喉返神經(jīng)麻痹、甲狀旁腺功能障礙等有關(guān)[12-13]。最近,甲狀腺癌的過度診斷已經(jīng)引起廣泛關(guān)注。橋本甲狀腺炎約占中國甲狀腺疾病患者的20%~25%,是最常見的甲狀腺炎性疾病,已有大量的研究報道了橋本甲狀腺炎和甲狀腺乳頭狀癌之間的密切關(guān)系[1-3,14-15],目前,橋本甲狀腺炎到底是甲狀腺癌的風(fēng)險因素還是保護(hù)因素尚有爭議,有待進(jìn)一步研究,但是橋本甲狀腺炎的存在會降低超聲診斷甲狀腺結(jié)節(jié)良、惡性的準(zhǔn)確性,也會降低超聲引導(dǎo)下細(xì)針穿刺的診斷效能[4,16]。這可能與橋本甲狀腺炎的假結(jié)節(jié)與甲狀腺癌存在一些相似的超聲表現(xiàn)以及橋本甲狀腺炎病變過程中成纖維細(xì)胞的增殖導(dǎo)致的超聲聲像圖的改變有關(guān)[4,17]。
甲狀腺超聲是甲狀腺結(jié)節(jié)的首選檢查方法,如何使用常規(guī)超聲準(zhǔn)確鑒別甲狀腺結(jié)節(jié)的良、惡性,避免漏診和不必要的甲狀腺切除術(shù)是急需解決的問題。目前的研究顯示低回聲、微鈣化和邊界不清是超聲診斷橋本甲狀腺炎背景下惡性結(jié)節(jié)最有價值的聲像圖指標(biāo)[18-20]。之前有學(xué)者就橋本甲狀腺炎背景下超聲鑒別甲狀腺良惡性結(jié)節(jié)的相關(guān)研究進(jìn)行綜述[4],多項研究結(jié)果表明[18,21],合并橋本甲狀腺炎時超聲診斷甲狀腺結(jié)節(jié)良、惡性的準(zhǔn)確性降低,分析表明由于橋本甲狀腺炎背景表現(xiàn)多樣,良性結(jié)節(jié)常無清晰邊界,惡性結(jié)節(jié)常有粗大鈣化及環(huán)狀鈣化這樣的良性指標(biāo),此外,橋本甲狀腺炎的炎癥和纖維化可能會對甲狀腺結(jié)節(jié)的生長方式造成影響,橋本甲狀腺炎背景下的良性結(jié)節(jié)縱橫比≥1的比例增高[21],這些因素都有可能造成誤診和漏診。還有學(xué)者報道,橋本甲狀腺炎的存在會導(dǎo)致超聲引導(dǎo)下細(xì)針穿刺診斷甲狀腺微小乳頭狀癌的假陰性率增高。
紋理分析可以提供大量的定量特征,反映腫瘤病灶的異質(zhì)性,已被證明在多種疾病的診斷和評估中取得了良好的應(yīng)用前景[22]。在甲狀腺癌的診斷方面,基于各種成像技術(shù)的影像組學(xué)研究已有大量文獻(xiàn)報道,均顯示基于圖像的定量分析技術(shù)可以預(yù)測甲狀腺結(jié)節(jié)的良、惡性,并且在某些方面的表現(xiàn)優(yōu)于影像學(xué)專家,例如預(yù)測甲狀腺癌頸部淋巴結(jié)轉(zhuǎn)移[23]。目前,基于二維超聲圖像的紋理分析是否可以預(yù)測橋本甲狀腺炎背景下甲狀腺結(jié)節(jié)的良、惡性的研究尚未見有文獻(xiàn)報道。本研究基于普通二維超聲圖像,從橋本甲狀腺炎背景下的甲狀腺結(jié)節(jié)中提取了107個紋理特征,通過Las-so回歸模型篩選出最具診斷效率的特征并構(gòu)建鑒別良、惡性甲狀腺結(jié)節(jié)的診斷模型。本研究最后篩選出GLRLM的長游程高灰度優(yōu)勢(病灶區(qū)域內(nèi)高亮度像素點的長距離聯(lián)合分布)、形狀的延伸率(病灶形狀的長軸和短軸的比值)、NGTDM的粗糙度(病灶區(qū)域內(nèi)像素亮度的空間變化率)三個特征構(gòu)建組學(xué)預(yù)測模型,該模型鑒別橋本甲狀腺炎背景下甲狀腺結(jié)節(jié)良、惡性的ROC曲線下面積為0.842,敏感度為79.1%,特異度為77.8%,符合率為78.5%,高于之前研究報道的橋本甲狀腺炎背景下甲狀腺結(jié)節(jié)術(shù)前超聲診斷的符合率(54.29%)[4]。這是因為本研究一方面基于紋理分析通過對圖像的深度挖掘,發(fā)現(xiàn)了潛在的肉眼不可見的信息,另一方面,筆者從大量紋理特征中篩選出的鑒別良惡性甲狀腺結(jié)節(jié)的最優(yōu)特征,在此基礎(chǔ)上構(gòu)建的預(yù)測模型能夠提供更好的診斷效能。
圖3 對紋理特征進(jìn)行五折交叉驗證的Lasso回歸分析,λ與模型效能變化過程。 圖4 鑒別良、惡性甲狀腺結(jié)節(jié)的最優(yōu)紋理特征的篩選過程。 圖5 模型預(yù)測結(jié)果條形圖。 圖6 組學(xué)預(yù)測模型與篩選出的三個紋理特征的ROC曲線。
本研究還存在一定局限性:首先,橋本甲狀腺炎背景下,病灶與背景甲狀腺組織分界欠清,在圖像分割時可能導(dǎo)致邊界不明確等問題,本研究中進(jìn)行人工手動勾畫ROI的超聲醫(yī)生具有8年的工作經(jīng)驗,并選取部分病例由另外一名具有10年工作經(jīng)驗的超聲醫(yī)生進(jìn)行組間一致性評估,盡量避免人為錯誤。其次,由于樣本量有限,未構(gòu)建驗證組進(jìn)行模型性能驗證,但是在特征篩選時采用5折交叉法進(jìn)行驗證,在一定程度上可以避免模型過度擬合[24]。然后,作為一項回顧性研究,本研究僅納入了進(jìn)行了甲狀腺切除術(shù)且甲狀腺結(jié)節(jié)在超聲圖像上完整顯示的病例,可能會導(dǎo)致選擇性偏倚。最后,因為樣本量不足,未將病例術(shù)前二維超聲數(shù)據(jù)按同樣的設(shè)計指標(biāo)統(tǒng)計分析,并與基于二維超聲圖像的紋理分析對比分析,在后續(xù)的研究中應(yīng)進(jìn)一步擴(kuò)大樣本量,對比分析兩種結(jié)果,客觀評價基于二維超聲圖像的紋理分析的優(yōu)勢與不足。綜上所述,基于二維超聲圖像的紋理分析可以鑒別橋本甲狀腺炎背景下甲狀腺結(jié)節(jié)的良、惡性,可以為臨床決策提供支持。