韓德笑 劉菲菲 吳 萌 崔廣和
濱州醫(yī)學(xué)院附屬醫(yī)院超聲醫(yī)學(xué)科,山東 濱州 256600
目前,隨著超聲高頻探頭的發(fā)展以及各種檢查技術(shù)水平的提高,甲狀腺結(jié)節(jié)的檢出率也逐漸增加[1]。其中,甲狀腺惡性結(jié)節(jié)多以乳頭狀癌(papillary thyroid carcinoma,PTC)為主,占75%~85%,而良性結(jié)節(jié)多以結(jié)節(jié)性甲狀腺腫(nodular goiter,NG)為主[2]。二維超聲常因兩者灰度特征重疊和診斷結(jié)果依賴操作者經(jīng)驗(yàn)而難以鑒別[3- 4]。甲狀腺乳頭狀癌是甲狀腺惡性腫瘤中最常見的一種,自2000 年至今其發(fā)病率迅速上升。據(jù)統(tǒng)計(jì),甲狀腺癌發(fā)病率已上升為女性惡性腫瘤發(fā)病率第5 位[5],其中PTC 占80%以上[6]。雖然PTC 的臨床過程發(fā)展緩慢,但是若不及時做出臨床治療,后期會有轉(zhuǎn)移的風(fēng)險(xiǎn),嚴(yán)重影響患者生命健康。因此,早期準(zhǔn)確鑒別甲狀腺結(jié)節(jié)的良惡性顯得尤為重要?,F(xiàn)階段,超聲檢查已成為甲狀腺疾病的首選重要檢查方法。但是普通的灰階成像及彩色多普勒成像雖能簡單、快捷地通過結(jié)節(jié)的邊緣、邊界以及內(nèi)部回聲等特征區(qū)分結(jié)節(jié)良惡性,但是單純應(yīng)用二維超聲聯(lián)合彩色多普勒超聲成像有一定的局限性,如遇到彌漫性甲狀腺疾病如橋本氏甲狀腺炎、亞急性甲狀腺炎等,會造成超聲圖像的特征重疊,使得診斷效能不足[4]。因此,現(xiàn)已開展了多種檢查新技術(shù)(彈性成像、超聲造影、人工智能)輔助診斷,形成了比較完善的多模態(tài)超聲檢查體系。本文將從各種超聲檢查新技術(shù)對于甲狀腺結(jié)節(jié)良惡性診斷的價值做出歸納總結(jié)。
超聲彈性成像技術(shù)是通過分析甲狀腺內(nèi)腫塊的硬度變化,從而輔助判斷腫塊的良惡性。臨床上常用的成像技術(shù)主要包括壓迫式彈性成像和剪切波彈性成像(shear wave elastography,SWE)。目前,超聲彈性成像技術(shù)在臨床上已得到廣泛應(yīng)用,如乳腺、肝臟和淋巴結(jié)等[7-10]。有研究表明應(yīng)用壓迫式彈性成像鑒別甲狀腺結(jié)節(jié)的靈敏度及特異度均為90%以上[11]。但是,該技術(shù)受操作者主觀影響較大,對于位置比較深、體積比較小的結(jié)節(jié)無法進(jìn)行準(zhǔn)確測量,因此臨床上常用SWE 進(jìn)行甲狀腺腫物的輔助診斷。
就目前研究現(xiàn)狀來看,已經(jīng)有不少學(xué)者對SWE應(yīng)用到甲狀腺腫物良惡性的鑒別做出了研究。趙彤等[12]研究發(fā)現(xiàn)二維超聲聯(lián)合SWE 可以降低TIRADS4 類結(jié)節(jié)的細(xì)針穿刺抽吸活組織檢查率(fineneedle aspiration biopsy,F(xiàn)NAB),診斷效能也大幅提高,減少了一些不必要的損傷。并且發(fā)現(xiàn)SWVmax為3.53 m/s(E=37.3 kPa)是鑒別TI-RADS4 類甲狀腺結(jié)節(jié)良惡性的最佳臨界值。
超聲造影技術(shù)是對患者靜脈輸注造影劑后,通過觀察甲狀腺內(nèi)目標(biāo)結(jié)節(jié)的造影劑充盈情況,以此反映結(jié)節(jié)內(nèi)微血流灌注,從而輔助判斷甲狀腺結(jié)節(jié)的良惡性[13]。目前,臨床上常用的超聲造影劑為Sonovue,它是一種純血池造影劑,不會滲透到血管外間隙,因此可以更好地反映出腫物的一般形態(tài)特點(diǎn)及血流灌注。
近年來,超聲造影判斷甲狀腺結(jié)節(jié)良惡性的研究已受到廣泛關(guān)注,該技術(shù)對甲狀腺惡性結(jié)節(jié)的增強(qiáng)模式和特點(diǎn)已得到認(rèn)可。既往研究認(rèn)為,良性結(jié)節(jié)多以等增強(qiáng)為主,惡性結(jié)節(jié)以低增強(qiáng)為主[14-15]。ZHANG 等[16]研究發(fā)現(xiàn)低增強(qiáng)可以作為結(jié)節(jié)良惡性較好的鑒別指標(biāo),診斷結(jié)節(jié)良惡性的準(zhǔn)確度約達(dá)89%。有研究[17-18]通過對甲狀腺結(jié)節(jié)進(jìn)行超聲造影檢查,發(fā)現(xiàn)甲狀腺惡性結(jié)節(jié)強(qiáng)化特點(diǎn)不一,多以低增強(qiáng)為主;而良性結(jié)節(jié)多為彌漫性增強(qiáng)、等增強(qiáng)。并且通過造影定量分析結(jié)節(jié)實(shí)性部分的峰值強(qiáng)度(peak intensity of solid part of nodule,PIM)、周邊甲狀腺組織峰值強(qiáng)度(peak intensity of peripheral thyroid tissue,PIT)以及兩者的比值(PIM/PIT)得出PIM/PIT以0.872 為臨界點(diǎn)鑒別甲狀腺結(jié)節(jié)良惡性時,其敏感性為79.2%,特異性為91.3%,說明PIM/PIT能更好地鑒別甲狀腺結(jié)節(jié)良惡性。雖然不少學(xué)者認(rèn)為,低增強(qiáng)、不均勻增強(qiáng)以及早消退是甲狀腺結(jié)節(jié)惡性征象的灌注特點(diǎn),但區(qū)分良惡性結(jié)節(jié)仍存在一定的重疊區(qū)域[19]。
基于大數(shù)據(jù)的多模態(tài)人工智能是一種診斷新技術(shù),是指從標(biāo)準(zhǔn)醫(yī)療圖像中高通量的提取和挖掘圖像定量特征,用于臨床決策支持系統(tǒng)以提升診斷、預(yù)后和預(yù)測的準(zhǔn)確性[20-25]。人工智能模型的建立一般包括圖像采集、圖像分割、特征提取與選擇以及模型構(gòu)建與驗(yàn)證。不同程序算法的應(yīng)用對于構(gòu)建模型的實(shí)用效能有著很大的區(qū)別。智能模型的建立包括兩種學(xué)習(xí)模式:監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)[26],其中,監(jiān)督學(xué)習(xí)在醫(yī)學(xué)應(yīng)用中更為常見,根據(jù)其本質(zhì)又可分為卷積神經(jīng)網(wǎng)絡(luò)組(convolutional neural network,CNN)和非神經(jīng)網(wǎng)絡(luò)組(包括隨機(jī)森林、支持向量機(jī)等)[27]。
目前,基于對不同算法建立起的診斷模型的差異,不少學(xué)者通過對不同算法建立起的模型進(jìn)行比較,以得到診斷效能更高的鑒別模型,建立起完善的計(jì)算機(jī)輔助診斷系統(tǒng)。根據(jù)一些研究發(fā)現(xiàn),對于超聲圖像深度學(xué)習(xí)的人工智能方法準(zhǔn)確度較高(可以達(dá)到85%~90%)[28],PENG 等[29]通過對18 049 張甲狀腺結(jié)節(jié)圖像深度學(xué)習(xí)建立人工智能模型,并將此模型與低年資超聲科醫(yī)師(1 ~3 年)和高年資(>8 年)超聲科醫(yī)師作比較得出結(jié)論:基于CNN 算法的鑒別模型是最佳的。此外,此模型輔助超聲醫(yī)生準(zhǔn)確診斷惡性結(jié)節(jié)的效能也有所增加,大幅度減少了FNAB,減輕了穿刺給患者帶來的痛苦。此研究的優(yōu)勢在于學(xué)者應(yīng)用了大量的甲狀腺圖片建立數(shù)據(jù)集,極大程度上滿足了模型構(gòu)建的數(shù)量要求,提高了模型鑒別腫物的質(zhì)量。并且通過智能模型與高低年資醫(yī)生的診斷效能作比較,肯定了人工智能鑒別腫物的應(yīng)用價值。但是基于CNN 算法的鑒別模型是否是智能模型建立的最優(yōu)算法,目前無從得知,為了彌補(bǔ)這方面缺陷,PARK 等[30]學(xué)者通過基于CNN 算法的鑒別模型、基于隨機(jī)向量機(jī)(support vector machine,SVM) 算法的鑒別模型以及高年資(5~20年)醫(yī)師和低年資(1 ~2 年)醫(yī)師對4919 個甲狀腺結(jié)節(jié)分別建立模型,該研究發(fā)現(xiàn),CNN 模式的智能模型優(yōu)于SVM 模式的智能模型,其敏感性、特異性以及準(zhǔn)確性分別為91.0%,80.8%以及86.0%。除此之外,分別用CNN 和SVM 輔助診斷醫(yī)師鑒別腫物,發(fā)現(xiàn)CNN 輔助超聲醫(yī)師鑒別腫物的能力高于SVM 的輔助能力。但是此研究也存在一定的局限性,首先,建立模型所用數(shù)據(jù)集的數(shù)量沒有PENG 等數(shù)量多,鑒別模型的診斷價值缺乏一定的說服力。其次,該研究中惡性結(jié)節(jié)所占比例較大,且大多數(shù)為PTC,這可能是此研究的主要局限性。但目前大多數(shù)研究僅對單一算法所建立的模型進(jìn)行比較,缺乏多種算法相互結(jié)合建立模型進(jìn)行分析,此方面還有待進(jìn)一步探索。除此之外,大量針對鑒別甲狀腺結(jié)節(jié)的AI 研究僅僅局限于超聲圖像或者細(xì)胞病理學(xué)水平,僅有小部分學(xué)者通過人工智能分析甲狀腺內(nèi)蛋白質(zhì)分子標(biāo)記物區(qū)分甲狀腺結(jié)節(jié)良惡性。SUN 等[31]通過對甲狀腺內(nèi)蛋白質(zhì)中19 種生物標(biāo)記物分析并建立AI模型,此模型對甲狀腺惡性結(jié)節(jié)分類的準(zhǔn)確性超過了91%,實(shí)現(xiàn)了分子水平模型的建立。盡管如此,直接對于甲狀腺超聲圖像的深度學(xué)習(xí)模型同樣也有不足之處,通過深度學(xué)習(xí)獲得的人工智能模型需要大量的樣本測試集以提高模型診斷的準(zhǔn)確性,如果樣本量過小,會使模型產(chǎn)生過擬合現(xiàn)象,導(dǎo)致模型準(zhǔn)確性下降[32-33]。雖然近年來,我國甲狀腺癌的發(fā)病率有所上升,如此高的發(fā)病率可以滿足研究的樣本需求,但是通過人工或者半自動分割圖像同樣增加了工作量,而全自動分割圖像的可重復(fù)性較差且模型的準(zhǔn)確性會下降。因此由專家進(jìn)行的手動分割仍然是采用的主要方法[34-35]。鑒于這種情況,不少學(xué)者正在逐步研究超聲圖像的遷移學(xué)習(xí)模型。
遷移學(xué)習(xí)是深度學(xué)習(xí)模型的一種非常流行的技術(shù)。它使用預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)在感興趣的特定目標(biāo)任務(wù)上進(jìn)一步訓(xùn)練,只需要比預(yù)訓(xùn)練數(shù)據(jù)集更少的樣本量。這樣避免產(chǎn)生因缺少高質(zhì)量的訓(xùn)練樣本導(dǎo)致的模型過擬合及泛化性能差的結(jié)果。SUN 等[36]在甲狀腺二維圖像特征的基礎(chǔ)上應(yīng)用遷移學(xué)習(xí)的方法,獲得AI 模型,然后與有豐富經(jīng)驗(yàn)的主治醫(yī)師相比,結(jié)果顯示,這一方法的準(zhǔn)確度、靈敏度和特異度均高于后者。當(dāng)然,遷移學(xué)習(xí)模型不僅僅可以用于建立甲狀腺鑒別模型,甚至可以通過甲狀腺二維超聲圖像特征建立淋巴結(jié)轉(zhuǎn)移的預(yù)測模型,YU 等[37]通過對1013 例患者建立了PTC 患者淋巴結(jié)轉(zhuǎn)移的預(yù)測模型,該模型在主要測試集和兩個獨(dú)立驗(yàn)證集中的AUC 和ACC 較高,具有不錯的預(yù)測效能。
目前,超聲檢查技術(shù)正在日新月異的發(fā)展。但是,傳統(tǒng)超聲檢查的缺點(diǎn)仍是臨床要解決的首要問題,包括檢查醫(yī)師組間及組內(nèi)變異性、視野受限以及功能成像受限等問題。目前超聲檢查開展的各種技術(shù)的應(yīng)用都不是獨(dú)立存在的,它們都在各自的領(lǐng)域發(fā)揮著獨(dú)特的優(yōu)勢,彌補(bǔ)了傳統(tǒng)超聲檢查的不足,為明確超聲診斷提供更加全面、準(zhǔn)確的信息。超聲彈性成像技術(shù)可以測量組織硬度,比較不同組織間形變規(guī)律,為臨床輔助診斷,但是其不能反映組織內(nèi)的血流情況;超聲造影技術(shù)可以更好地反映組織內(nèi)的血流情況,但檢查范圍較小,無法同時檢出多個不同部位的腫塊;基于超聲圖像的人工智能方法可以解決不同觀察者之間的變異性、簡單快捷地輔助臨床做出診斷,但是其模型的建立費(fèi)耗時力,并且對超聲圖像有一定的質(zhì)量要求。以此,可以將各種檢查技術(shù)聯(lián)合應(yīng)用起來,形成多模態(tài)的超聲檢查體系,輔助臨床醫(yī)師對甲狀腺結(jié)節(jié)做出全面、快速、準(zhǔn)確的診斷,避免對患者做出一些過度的有創(chuàng)操作,減少患者的痛苦。相信,今后會有更多的超聲檢查技術(shù)的創(chuàng)新與開發(fā),使得多模態(tài)超聲診斷體系不斷完善、不斷發(fā)展。