張迪,劉杰夫,崔新伍,倪雪君*
1.南通大學(xué)附屬醫(yī)院醫(yī)學(xué)超聲科,江蘇 南通 226000;2.華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬同濟(jì)醫(yī)院超聲影像科,湖北 武漢 430030; *通信作者 倪雪君 dyfnxj213@163.com
乳腺癌是威脅全球女性健康的最常見的惡性腫瘤和癌癥相關(guān)死亡的首要原因[1]。早期精準(zhǔn)診療對(duì)提高乳腺癌患者的生存率至關(guān)重要。超聲具有無輻射、低成本、實(shí)時(shí)成像和易于進(jìn)行介入操作等特點(diǎn),是診斷乳腺病變的重要影像學(xué)方法之一[2]。然而,常規(guī)超聲對(duì)操作者經(jīng)驗(yàn)的依賴程度很高,缺乏對(duì)圖像特征的定量分析,導(dǎo)致重復(fù)性和客觀性不足[3]。近年來,超聲組學(xué)在腫瘤學(xué)領(lǐng)域迅速發(fā)展,為臨床決策提供了潛在的支持[4-5]。本文擬對(duì)超聲組學(xué)的基本工作流程及其在乳腺腫瘤診治中的應(yīng)用進(jìn)展進(jìn)行綜述。
超聲組學(xué)是將包含腫瘤病理生理學(xué)相關(guān)信息的數(shù)字化的醫(yī)學(xué)超聲圖像轉(zhuǎn)換成可挖掘的高維數(shù)據(jù),通過對(duì)圖像定量分析揭示腫瘤病理特征與超聲圖像特征之間的關(guān)系[6]。超聲組學(xué)使用獨(dú)特的成像算法對(duì)疾病進(jìn)行量化,從而進(jìn)行分子水平的疾病診斷、預(yù)測(cè)和預(yù)后評(píng)估,其主要工作流程包括數(shù)據(jù)收集、勾畫感興趣區(qū)(ROI)、特征提取及模型建立。
1.1 數(shù)據(jù)收集 當(dāng)研究任務(wù)(預(yù)測(cè)目標(biāo))確立后,首要的工作是收集大量的醫(yī)學(xué)超聲圖像和對(duì)應(yīng)的臨床病理數(shù)據(jù),根據(jù)研究設(shè)計(jì)的不同,圖像數(shù)據(jù)的收集可能是前瞻性或回顧性的;根據(jù)數(shù)據(jù)的來源,又可分為單中心或多中心研究。多中心研究的數(shù)據(jù)收集需要參與的醫(yī)院及科室達(dá)成一致的成像協(xié)議和圖像采集標(biāo)準(zhǔn),如相同的機(jī)器型號(hào)、探頭頻率、圖像的成像條件等,避免因?yàn)槌上駞?shù)的差異產(chǎn)生不同條件的原始數(shù)據(jù),降低組學(xué)研究的可重復(fù)性的概率,從而使組學(xué)特征之間的直接比較變得困難[7]。因此,獲取標(biāo)準(zhǔn)化的高質(zhì)量超聲圖像是超聲組學(xué)的首要關(guān)鍵條件。
近年,歐洲核醫(yī)學(xué)協(xié)會(huì)(European Association of Nuclear Medicine,EANM)、核醫(yī)學(xué)與分子成像學(xué)會(huì)(Society of Nuclear Medicine and Molecular Imaging,SNMMI)和北美放射學(xué)會(huì)(Radiological Society of North America,RSNA)等組織在規(guī)范化圖像采集和重建中正在進(jìn)行的努力和圖像生物標(biāo)志物標(biāo)準(zhǔn)化倡議的提出,均旨在提高圖像采集的標(biāo)準(zhǔn)化和成像分析的可重復(fù)性[8-9],圖像生物標(biāo)志物標(biāo)準(zhǔn)化倡議提供基于共識(shí)的報(bào)告指南、基準(zhǔn)數(shù)據(jù)集和基準(zhǔn)值、特征命名和定義等,并涉及圖像處理及分割、插值、灰度離散化等一系列的標(biāo)準(zhǔn)化。也有學(xué)者建立了放射組學(xué)質(zhì)量評(píng)分[10],內(nèi)容包括但不限于是否有標(biāo)準(zhǔn)的影像協(xié)議、是否有穩(wěn)健的圖像分割、模體、區(qū)分度及臨床應(yīng)用的可能性等,以進(jìn)一步規(guī)范化評(píng)估組學(xué)研究。
1.2 ROI的勾畫與圖像分割 圖像分割是將圖像分成具有不同特質(zhì)的區(qū)域,確定病灶目標(biāo)即ROI的輪廓范圍??刹捎米詣?dòng)分割、半自動(dòng)分割或手動(dòng)分割方法,這一步通常耗時(shí)較多,且具有挑戰(zhàn)性。目前關(guān)于ROI的分割尚無公認(rèn)的“金標(biāo)準(zhǔn)”。近年來,由于深度學(xué)習(xí)的開發(fā),自動(dòng)或半自動(dòng)的分割方法較單純的手動(dòng)分割具有更高的效率和精度[11]。半自動(dòng)分割是目前最廣泛認(rèn)可的分割方法,先由計(jì)算機(jī)輔助系統(tǒng)進(jìn)行邊緣的判定勾畫,操作者再進(jìn)行細(xì)微修改,從而節(jié)省時(shí)間和精力。然而對(duì)于彌漫性或多發(fā)性病灶,當(dāng)病變形態(tài)、回聲及邊界難以明確時(shí),自動(dòng)分割可重復(fù)性較差,仍需專家進(jìn)行手動(dòng)分割。
Lee等[12]提出無分割的組學(xué)方法,與依賴于預(yù)定義特征集的分割方法不同,無分割方法可以利用表示學(xué)習(xí)技術(shù),直接從可用數(shù)據(jù)中學(xué)習(xí)解釋性特征,不僅可以避免耗時(shí)耗力的詳細(xì)分割操作,也可以防止圖像分割后腫瘤周圍信息的丟失,在臨床實(shí)踐中有極大的應(yīng)用潛力。
1.3 圖像特征的提取和選擇 利用計(jì)算機(jī)算法從選定的ROI自動(dòng)提取組學(xué)特征。通常提取的組學(xué)特征可以分為4個(gè)部分:形態(tài)特征、一階特征、二階特征和高階特征[5]。形態(tài)特征包括病灶形態(tài)、大小和邊界等,通常捕獲病灶的直觀特點(diǎn)。一階特征指從圖像中提取的灰度信號(hào)強(qiáng)度值,包括平均像素信號(hào)值和峰度等,描述了病變的直方圖特點(diǎn),但通常不包括空間信息。二階特征即紋理特征,包括相鄰像素的灰度強(qiáng)度,可以反映腫瘤的內(nèi)部異質(zhì)性和復(fù)雜性。高階特征是通過在多維空間中應(yīng)用和調(diào)整濾波器描述信號(hào)強(qiáng)度值的局部空間組織。對(duì)于不同的研究目的,挖掘的特征內(nèi)容也不同。這些特征可用于區(qū)分腫瘤間的異質(zhì)性,為研究者提供較為全面的腫瘤表型。
特征提取后通常需要識(shí)別冗余信息,篩選出高相關(guān)性的穩(wěn)定特征,并進(jìn)行特征的歸一化,可以避免模型的過度擬合和均衡特征的權(quán)重,防止某些特征占據(jù)過大或過小的權(quán)重。特征選擇方法通常分為3種:①過濾方法。即利用一定的機(jī)器學(xué)習(xí)模型,獲得各特征的權(quán) 重系數(shù),并根據(jù)權(quán)重系數(shù)的排序選擇特征,如信息增益、相關(guān)系數(shù)等。②包裹方法。從原始特征集中連續(xù)選擇特征子集進(jìn)行模型訓(xùn)練,根據(jù)模型的性能對(duì)選擇的特征子集進(jìn)行評(píng)價(jià),直至挑選出最佳特征子集,如遞歸特征消除。③嵌入方法。將特征選擇融入學(xué)習(xí)器訓(xùn)練過程,兩者在相同的優(yōu)化過程中完成,如嶺回歸。
1.4 模型建立和評(píng)估 特征選取后,超聲組學(xué)常用的建模模型包括Logistic回歸模型、監(jiān)督分類器、隨機(jī)森林、支持向量機(jī)(support vector machine,SVM)、人工神經(jīng)網(wǎng)絡(luò)、聚類分析等[13],其中Logistic回歸模型簡(jiǎn)單易行,是目前最常用的監(jiān)督分類器。模型建立后,需根據(jù)研究目的進(jìn)行驗(yàn)證評(píng)估和參數(shù)調(diào)整[14]。若模型在訓(xùn)練集、驗(yàn)證集中的準(zhǔn)確度均很低,稱為模型欠擬合,需采取模型優(yōu)化、添加新特征、減少權(quán)重正則化等措施加以糾正。當(dāng)模型在訓(xùn)練集的準(zhǔn)確度很高,但應(yīng)用到驗(yàn)證集準(zhǔn)確度很低時(shí),稱為模型過擬合,需采取措施,如獲取更多的訓(xùn)練數(shù)據(jù)、進(jìn)行數(shù)據(jù)清洗、篩選特征數(shù)目和增加權(quán)重正則化,其中獲取更多的訓(xùn)練數(shù)據(jù)最關(guān)鍵、有效。只有當(dāng)內(nèi)部和外部驗(yàn)證結(jié)果均令人滿意時(shí),該研究才能判為成功。
2.1 超聲組學(xué)對(duì)乳腺良、惡性病變的鑒別診斷 目前,乳腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(breast imaging reporting and data system,BI-RADS)的制訂和應(yīng)用將乳腺病灶的超聲特征描述和最終的評(píng)估分類標(biāo)準(zhǔn)化,以提高影像診斷效能[15]。然而,由于一些超聲特征可同時(shí)存在于惡性或良性病變中,這些特征的多樣性和操作者的主觀性可能導(dǎo)致最終診斷存在差異[16]。目前已有一些研究[17-18]嘗試探索超聲組學(xué)方法在鑒別乳腺良、惡性病變中的潛在價(jià)值。Fleury等[17]基于BI-RADS標(biāo)準(zhǔn)提取10個(gè)主要的超聲組學(xué)特征,并分別運(yùn)用包括SVM、決策樹(decision tree,DT)、多層感知器(multilayer perceptron,MLP)、線性判別分析(linear discriminant analysis,LDA)和隨機(jī)森林5種機(jī)器學(xué)習(xí)分類器,將206個(gè)病變分為良性或惡性,結(jié)果顯示病灶邊緣和病灶方向(縱橫比)是所有機(jī)器學(xué)習(xí)算法的最佳特征。在受試者工作特征曲線下面積(AUC)中,AUC最大的分類器為SVM(AUC=0.840)。顯示基于超聲組學(xué)的機(jī)器學(xué)習(xí)使用并量化的BI-RADS特征有助于對(duì)乳腺病變的良惡性進(jìn)行鑒別診斷。
肖榕等[19]回顧性分析362例乳腺腫瘤的灰階超聲圖像,并從中提取396個(gè)超聲組學(xué)特征,采用最大相關(guān)-最小冗余特征選擇及最小絕對(duì)收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)篩選出15個(gè)關(guān)鍵特征構(gòu)建超聲組學(xué)模型,該模型在訓(xùn)練組和驗(yàn)證組中診斷乳腺良、惡性病變的AUC值均為0.84,模型預(yù)測(cè)性能相當(dāng)于具有10~12年相關(guān)工作經(jīng)驗(yàn)的醫(yī)師水平,顯著高于具有4~5年相關(guān)工作經(jīng)驗(yàn)的醫(yī)師水平,但低于具有25~30年相關(guān)工作經(jīng)驗(yàn)的醫(yī)師水平,具有較高的預(yù)測(cè)性能。Lee等[20]對(duì)496例乳腺癌的超聲圖像進(jìn)行半自動(dòng)分割,并通過LASSO回歸方法對(duì)超聲組學(xué)特征進(jìn)行篩選,使用篩選后的23個(gè)組學(xué)特征構(gòu)建超聲組學(xué)模型,將該模型與使用多變量Logistic回歸建立的術(shù)前臨床病理模型相結(jié)合,合并后的模型在訓(xùn)練組和驗(yàn)證組中的AUC值分別為0.858和0.810,具有良好的預(yù)測(cè)性能。以上研究表明,超聲組學(xué)能夠明確腫塊的惡性潛能與圖像特征之間的相關(guān)性,具有良好的腫瘤診斷前景。
2.2 超聲組學(xué)預(yù)測(cè)乳腺癌腋窩淋巴結(jié)轉(zhuǎn)移 腋窩淋巴結(jié)狀態(tài)評(píng)估是臨床選擇乳腺癌手術(shù)治療方案和預(yù)后評(píng)估的重要指導(dǎo)依據(jù)[21]。傳統(tǒng)的淋巴結(jié)活檢具有侵襲性,易引起并發(fā)癥,因此如何準(zhǔn)確、無創(chuàng)地評(píng)估腋窩淋巴結(jié)受到關(guān)注。
Qiu等[22]將超聲組學(xué)特征與乳腺癌超聲圖像顯示腋窩淋巴結(jié)特征相結(jié)合,發(fā)現(xiàn)采用LASSO和嶺回歸方法的放射組學(xué)模型能利用原發(fā)病灶的超聲特征預(yù)測(cè)腋窩淋巴結(jié)轉(zhuǎn)移。Gao等[23]通過對(duì)T1/T2浸潤(rùn)性乳腺癌患者乳腺原發(fā)病灶進(jìn)行超聲組學(xué)分析,建立了評(píng)價(jià)腋窩淋巴結(jié)狀態(tài)的預(yù)測(cè)諾模圖,該諾模圖基于多變量Logistic回歸結(jié)果,結(jié)合超聲組學(xué)評(píng)分與患者年齡和病灶大小,在訓(xùn)練隊(duì)列中的AUC值為0.846,在驗(yàn)證隊(duì)列的AUC值為0.733。
Zheng等[24]采用基于深度學(xué)習(xí)的超聲影像組學(xué)方法提取乳腺癌患者的常規(guī)超聲和剪切波彈性成像的高通量特征參數(shù),并聯(lián)合臨床病理特征建立模型,以預(yù)測(cè)早期乳腺癌患者腋窩淋巴結(jié)狀態(tài),結(jié)果表明該模型在預(yù)測(cè)無腋窩淋巴結(jié)轉(zhuǎn)移(N0)與存在淋巴結(jié)轉(zhuǎn)移[N+(≥1)]時(shí)AUC值為0.902,并且能進(jìn)一步預(yù)測(cè)淋巴結(jié)轉(zhuǎn)移負(fù)荷,在預(yù)測(cè)1~2個(gè)[N+(1~2)]或≥3個(gè)[N+(≥3)]腋窩淋巴結(jié)轉(zhuǎn)移中,AUC值可達(dá)0.905,提示超聲組學(xué)可能是淋巴結(jié)陰性乳腺癌患者早期篩查淋巴結(jié)轉(zhuǎn)移的有效替代方案,可以減少不必要的淋巴結(jié)活檢及相應(yīng)的術(shù)后并發(fā)癥,同時(shí)也可以作為一個(gè)重要的臨床決策支持工具。
2.3 超聲組學(xué)預(yù)測(cè)乳腺癌的分子生物學(xué)特性 乳腺癌的分子生物學(xué)特性與臨床治療方式的選擇及預(yù)后密切相關(guān)。目前,乳腺癌分子分型的檢測(cè)主要依靠病理樣本的免疫組化檢查,但由于腫瘤細(xì)胞的異質(zhì)性,同一腫瘤組織的不同區(qū)域檢測(cè)結(jié)果可能不同,導(dǎo)致最終的腫瘤分子分型存在不確定性[25]。超聲組學(xué)可以從成像數(shù)據(jù)中發(fā)現(xiàn)難以挖掘的隱藏信息,這些信息與腫瘤的基因和表型相關(guān),可以預(yù)測(cè)腫瘤的分子生物學(xué)特征。三陰性乳腺癌較其他分子分型乳腺癌的侵襲性更強(qiáng),惡性程度高,早期準(zhǔn)確診斷對(duì)于三陰性乳腺癌的預(yù)后至關(guān)重要。Lee等[26]使用灰度共生矩陣和灰度行程矩陣對(duì)超聲圖像進(jìn)行紋理特征提取,構(gòu)建715例纖維腺瘤和186例三陰性乳腺癌的超聲組學(xué)評(píng)分,結(jié)果顯示具有良好的鑒別能力。為消除機(jī)器對(duì)特征提取的影響,Lee等[26]對(duì)經(jīng)Philips iU22機(jī)型檢查的患者亞組單獨(dú)開發(fā)了更詳細(xì)的放射組學(xué)評(píng)分,發(fā)現(xiàn)腫瘤的病理分級(jí)和分子受體狀態(tài)對(duì)超聲表現(xiàn)有一定的影響,以紋理分析為基礎(chǔ)的超聲組學(xué)可以提示腫瘤的異質(zhì)性。王瑛等[27]探討了超聲組學(xué)方法在區(qū)分浸潤(rùn)性乳腺癌中三陰性乳腺癌與非三陰性乳腺癌的價(jià)值,使用最終提取的4個(gè)關(guān)鍵組學(xué)特征構(gòu)建了超聲影像組學(xué)標(biāo)簽,該標(biāo)簽在訓(xùn)練集和驗(yàn)證集中預(yù)測(cè)三陰性乳腺癌的AUC均>0.84,提示超聲組學(xué)能進(jìn)一步提高治療前三陰性乳腺癌的診斷效能。
Guo等[28]根據(jù)BI-RADS分類將提取到的乳腺癌463個(gè)超聲組學(xué)特征轉(zhuǎn)換為形態(tài)、邊緣、邊界、回聲模式、病灶后方回聲和鈣化共6個(gè)超聲圖像特征,結(jié)果表明回聲模式預(yù)測(cè)乳腺癌分子分型的效果最好,AUC值可達(dá)0.738。Jiang等[29]采用深度學(xué)習(xí)方法從1 275例原發(fā)性乳腺癌超聲圖像中提取特征,以預(yù)測(cè)4種不同的乳腺癌分子亞型,構(gòu)建的深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)模型在2個(gè)外部獨(dú)立測(cè)試集中預(yù)測(cè)每個(gè)子亞型的準(zhǔn)確度分別為80.07%~97.02%和87.94%~98.83%,并且DCNN在區(qū)分luminal分型和非luminal分型方面也具有良好的診斷性能,在2個(gè)測(cè)試集中的精確率分別為93.29%和88.21%,表明深度學(xué)習(xí)DCNN模型能有效預(yù)測(cè)乳腺癌分子亞型,并為癌癥患者的進(jìn)一步管理提供依據(jù)。
2.4 超聲組學(xué)評(píng)估乳腺癌的治療效果 目前新輔助化療(neoadjuvant chemotherapy,NAC)是晚期乳腺癌的常規(guī)治療方法,可以使腫瘤縮小,從而進(jìn)行保乳手術(shù)。DiCenzo等[30]的一項(xiàng)多中心研究對(duì)術(shù)前經(jīng)NAC治療的晚期乳腺癌患者進(jìn)行定量超聲檢測(cè)并提取組學(xué)特征,使用灰度共生矩陣對(duì)于提取的6個(gè)定量超聲特征進(jìn)行紋理分析,根據(jù)患者對(duì)NAC的臨床病理反應(yīng)分為有反應(yīng)組和無反應(yīng)組,該研究提出的機(jī)器學(xué)習(xí)算法預(yù)測(cè)患者對(duì)NAC有無反應(yīng)的準(zhǔn)確性可達(dá)87%,提示超聲組學(xué)分析可在治療開始前用于風(fēng)險(xiǎn)分層和指導(dǎo)治療方案的選擇。李蔓英等[31]探討基于乳腺癌灰度超聲的組學(xué)特征對(duì)NAC效果的預(yù)測(cè)價(jià)值,共6個(gè)超聲組學(xué)特征納入Logistic回歸模型,其模型結(jié)果預(yù)測(cè)乳腺癌NAC臨床應(yīng)答的AUC為0.88,可能為臨床個(gè)體化治療提供參考價(jià)值。
超聲組學(xué)作為一門新興的技術(shù),能提取和分析高維與定量圖像特征,更準(zhǔn)確、更具體客觀地描述和評(píng)估腫瘤病灶,在乳腺癌的篩查、診斷、治療和預(yù)后評(píng)估中已經(jīng)取得了一定的成果。臨床實(shí)踐中,超聲組學(xué)有望為醫(yī)師提供更可靠的診斷指導(dǎo),減少超聲醫(yī)師的工作量,縮小地域之間醫(yī)療資源的不平衡。
在進(jìn)行廣泛的臨床應(yīng)用前,超聲組學(xué)仍有一些關(guān)鍵問題需要解決。首先,超聲組學(xué)最核心的問題在于原始數(shù)據(jù)的質(zhì)量和數(shù)量。與CT和MRI不同,超聲圖像的噪聲較多,且可重復(fù)性較差,圖像數(shù)據(jù)采集的標(biāo)準(zhǔn)化是限制超聲組學(xué)在“現(xiàn)實(shí)世界”臨床應(yīng)用中的關(guān)鍵瓶頸。超聲機(jī)器的型號(hào)、探頭頻率、圖像采集協(xié)議與重建設(shè)置的異質(zhì)性和多變性均對(duì)通用組學(xué)模型的訓(xùn)練提出了挑戰(zhàn)。除數(shù)據(jù)的標(biāo)準(zhǔn)化外,一個(gè)成功的組學(xué)模型還需足夠多的數(shù)據(jù)集支持模型的集成、處理和分析,達(dá)到良好的魯棒性和泛化能力。目前關(guān)于超聲組學(xué)的大部分研究數(shù)據(jù)仍為回顧性小樣本研究,可能會(huì)導(dǎo)致過擬合和過于樂觀的結(jié)果,還需多中心、大樣本的前瞻性研究進(jìn)行更深層次的探索。
此外,目前的超聲組學(xué)研究大部分僅通過分析二維超聲圖像進(jìn)行腫瘤診斷與評(píng)估,尚未對(duì)病史、實(shí)驗(yàn)室檢查指標(biāo)及其他影像學(xué)檢查、隨訪信息等進(jìn)行整合;同時(shí),聯(lián)合二維超聲、三維超聲、彈性成像及超聲造影的多模態(tài)影像能提供更豐富的圖像信息,若將多模態(tài)影像和患者臨床信息進(jìn)行匯總并構(gòu)建臨床組學(xué)模型,進(jìn)而得出更全面、準(zhǔn)確的診斷結(jié)果,將是未來超聲組學(xué)發(fā)展的方向。相信隨著影像科醫(yī)師對(duì)組學(xué)概念的不斷深入了解和多中心標(biāo)準(zhǔn)化大數(shù)據(jù)的使用,超聲組學(xué)在乳腺癌的診斷、治療及預(yù)后評(píng)估中的應(yīng)用將具有更大的潛力。