陳志庚,李響,沙琳
作者單位:大連醫(yī)科大學附屬第二醫(yī)院放射科,大連116027
新輔助化療(neoadjuvant chemotherapy,NAC)是絕大多數(shù)乳腺癌,尤其是局部晚期乳腺癌的標準治療方法[1-2],其旨在降低腫瘤分期,減少手術干預程度。雖然多數(shù)患者可以從中受益,但是全世界范圍內僅12%~28%達到病理完全緩解(pathologic complete response,pCR)[3],另有10%~35%對NAC不敏感以及5%左右出現(xiàn)病灶進展[4]。乳腺癌的反應可分為六種,即pCR、單病灶縮小、單病灶伴衛(wèi)星灶殘留、多病灶殘留、病灶穩(wěn)定以及病灶進展[5-6]。在手術方案的制訂中,對pCR和單病灶縮小傾向于采取保乳手術,余者更傾向于乳房切除術。
目前NAC 療效評估的金標準是病理活檢。Miller-Payne(MP)分級是基于病理活檢的臨床評估方法,其根據(jù)鏡下腫瘤細胞的密度和形態(tài)劃分G1~G5。實體瘤的療效評估(RECIST 1.1)是基于影像學檢查的評價方法。MRI 能夠將腫瘤內部信息可視化后用于分析,在乳腺癌的良惡性鑒別、分級和NAC 反應評估等方面得到普遍應用[7-8]。有別于傳統(tǒng)影像診斷,機器學習(machine learning,ML)能夠提取醫(yī)學圖像中肉眼無法識別的信息并轉換為定量特征,篩選其中與腫瘤異質性高度相關者用于預測或分類。本文就ML基于不同MR序列預測NAC后乳腺癌的反應進行綜述。
ML 是統(tǒng)計學和計算機科學的交叉學科,專注于對數(shù)據(jù)進行學習歸納并不斷自我完善,常用于處理預測和分類的問題。按學習方式分為監(jiān)督學習、無監(jiān)督學習、半監(jiān)督學習和強化學習。監(jiān)督學習是一類基于已標記的訓練樣本進行學習進而推測未知樣本的算法,而無監(jiān)督學習所采用的訓練樣本無需標記[9]。半監(jiān)督學習介于二者之間,是一種兼具低成本和準確性的方法[10]。強化學習與無監(jiān)督學習相似,但是引入了獎懲函數(shù),以獎勵信號函數(shù)值達到最大為目標[11]。影像組學(radiomics)主要流程為:(1)獲取醫(yī)學圖像;(2)勾畫感興趣區(qū)(region of interest,ROI);(3)提取影像特征;(4)特征降維;(5)建立模型。ML 已涉及其中(2)~(5)。相關研究常以監(jiān)督學習方法建立預測模型,常用算法有支持向量機(support vector machine,SVM)、隨機森林(random forest,RF)、邏輯回歸(Logistic regression)等。
動態(tài)對比增強磁共振成像(dynamic contrast-enhanced magnetic resonance imaging,DCE-MRI)是乳腺MRI 最靈敏的成像序列,該技術的原理是通過連續(xù)、快速地掃描獲取對比劑注射前后多個時間點的圖像。在以往研究中,NAC評估常用的MRI特征有腫瘤直徑、體積和病灶增強等,但從現(xiàn)有證據(jù)來看,該特征并不足以作為pCR的早期預測因素[12]。直方圖和紋理分析是基于統(tǒng)計建模對腫瘤異質性的定量分析,Bitencourt等[13]對DCE-MRI進行分析發(fā)現(xiàn)直方圖特征的熵、第90百分位數(shù)、方差,紋理特征的區(qū)域長度方差與pCR 密切相關,其預測效能優(yōu)于包括腫瘤直徑、增強類型在內的臨床和MRI 特征。DCE-MRI的血流動力學參數(shù)同樣可以用于定量分析,容積轉移參數(shù)(Ktrans)、速率參數(shù)(Kep)以及血管外細胞外容積分數(shù)(Ve)是早期預測腫瘤反應的良好特征[14]。但是Braman等[15]研究認為與影像特征相比,血流動力學參數(shù)并非高度相關特征。這表示影像特征可能更具備成為生物標志物的潛力。浸潤性乳腺癌對周圍組織具有侵犯性,其浸潤范圍與手術范圍密切相關,因此腫瘤周圍區(qū)域同樣需要深入分析。Braman等[15]提取腫瘤周圍區(qū)域特征用于分析,其結果證明腫瘤周圍區(qū)域的直方圖特征和紋理特征可用于預測模型,但是不同乳腺癌亞型的最佳預測特征存在差異。NAC 方案通常需要6 到8 個周期,期間腫瘤異質性的變化是值得深入探討的。治療前的圖像通常稱之為基線圖像,F(xiàn)an等[16]選取基線與兩個治療周期后圖像通過配準形成雅可比圖以反映圖像體素變化,該模型基于此三類圖像進行特征提取,其分析結果顯示反映腫瘤異質性的直方圖特征(例如平均值)和紋理特征(例如太依賴高灰度強調)的變化可用于早期預測,NAC應答組的降低程度高于無應答組。Sutton等[17]表明基線和NAC 后不同增強時間點的圖像紋理特征的變化同樣具有預測價值。該特征變化由生長分割混合高斯模型計算圖像間體素差異而得。研究中所用的Gabor 濾波器對圖像邊緣敏感,可以細致地獲取紋理的變化,此類特征屬于高階特征。但是Gabor 變換對突變信號和非平穩(wěn)信號處理能力不足,而小波變換可以彌補該缺點。小波變換是對空間頻率的局部化分析,可有效地提取圖像中的高頻和低頻信號,更加細致、全面地分析紋理變化[18]。從Zhou 等[19]的研究可知小波變換紋理特征對預測pCR 有良好的表現(xiàn),并且優(yōu)于體積紋理特征和周邊紋理特征。另有學者將關注點對準了高斯拉普拉斯(Laplacian of Gaussion,LoG),這是圖像二階空間導數(shù)的二維各向同性測度,用于突出圖像中強度發(fā)生快速變化的區(qū)域[20]。Choudhery 等[21]提取三陰性乳腺癌的3D 形狀特征和紋理特征用于分析,發(fā)現(xiàn)基于LoG 濾波器的信號強度平均值、信號強度中位數(shù)、最大信號強化、最小信號強度和信號強度標準差可用于預測pCR。上述特征類別不盡相同,所用濾波器和特征計算方法也存在差異,能夠更可信地解釋腫瘤間差異化緩解的關鍵特征可能尚待發(fā)掘。因此,特征的優(yōu)劣對比及對更多高階特征的嘗試值得深入探索。
彌散加權成像(diffusion-weighted imaging,DWI)是基于組織內水分子彌散運動的成像手段,表觀彌散系數(shù)(apparent diffusion coefficient,ADC)是其量化指標。DWI 和ADC 可以反映水分子的彌散率、腫瘤細胞密度和細胞膜完整性,用于預測NAC 反應[22]。Chen 等[23]對比了DCE-MRI和ADC 圖,結果表明基于ADC 圖的模型能夠預測pCR,并且基于DCE-MRI 和ADC 圖的聯(lián)合模型表現(xiàn)更好,其所用四個影像特征中兩個取自ADC 圖。由此可知,多模態(tài)序列中納入DWI和ADC 是一個值得考慮的選擇。另外,研究認為基于邏輯回歸的諾謨圖具備定量預測pCR 的潛能。Bian 等[24]和Chen 等[25]基于DWI、DCE-MRI、和T2WI 高效地預測了pCR 并肯定了諾謨圖的作用,并且后者通過決策曲線分析(decision curve analysis,DCA)證實了諾謨圖的有效性。上述研究大多致力于對pCR 的預測,然而非pCR 腫瘤的退縮模式是影響手術方式的重要因素,如能準確識別將有助于治療方案制定和調整。Zhuang 等[5]將pCR 和單病灶縮小作為一組,其余非pCR退縮模式為另一組,基于多模態(tài)基線圖進行預測,AUC 可達0.826。目前早期預測研究一種聚焦于基線圖像,另一種聚焦于治療期間圖像的變化。Eun 等[26]選取基線和治療中期(第3 或4 治療周期)的多模態(tài)圖像(DWI、ADC 圖、DCE-MRI 和T2)進行紋理分析,經(jīng)對比表明治療中期的預測效能優(yōu)于基線及治療中期-基線。目前,多序列的結合較之單一序列效能更佳,但是最佳的序列組合尚無定論,后續(xù)可以對此做進一步的比對研究。
目前,ML 正在向深度學習(deep learning,DL)方向發(fā)展。DL基本結構是輸入層、隱含層和輸出層,其中隱含層包括卷積層、池化層以及全連接層。卷積層負責提取圖像特征,池化層則對特征進行篩選和信息過濾,得到的特征最后進入全連接層進行非線性組合得以輸出。這是一種端到端的結構類型,即前端輸入原始圖像后末端直接輸出結果,無需對特征進行預設定,可自行創(chuàng)建特征并進行學習,建立起從輸入端到輸出端的函數(shù)關系[27]。卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)是DL的代表算法之一,該網(wǎng)絡結構是對生物神經(jīng)網(wǎng)絡的模擬,在圖像識別方面擁有其他算法不可比擬的作用[28]。
VGGNet (visual geometry group network)是CNN 中常用的網(wǎng)絡結構,常使用L2 正則化(regularization)、增強(augmentation)、舍棄(dropout)防止數(shù)據(jù)過擬合。在一些研究中已經(jīng)展現(xiàn)出比傳統(tǒng)ML 更高的效能。在Ha 等[29]研究中將NAC 后腫瘤的反應分為pCR、部分緩解和無緩解或進展三組,使用基線DCE-MRI 實現(xiàn)了良好的預測效能。El Adoui 等[30]進一步討論了NAC前后DCE-MRI在CNN預測pCR中的差異。他們發(fā)現(xiàn)雖然使用基線與NAC后圖像的組合模型的AUC最高,但是基線圖像的AUC 也達到0.7969,并且高于NAC 后圖像。此外,該研究顯示選用未經(jīng)分割的圖像較人工分割腫瘤邊界的圖像效能更佳。這說明CNN足以應付復雜信息,人為裁剪圖像可能反而減少與腫瘤異質性相關的數(shù)據(jù),限制了CNN的能力。隨著DL 深度的增加可能會出現(xiàn)梯度消失和梯度爆炸,導致淺層參數(shù)未能得到充分訓練。多通道CNN可以有效減少此類問題,使DL的淺層學習到更具區(qū)分性的特征。前文El Adoui等[30]以包含兩個并行子通道的多通道CNN 同時分析治療前后的圖像,Qu等[31]則擴展至12個并行子通道將治療前后DCE-MRI的六個增強階段圖像納入分析。后者表示NAC 后圖像的預測效能優(yōu)于基線圖像,不過采用治療前后圖像數(shù)據(jù)的組合模型表現(xiàn)仍是最優(yōu)的,并且該研究通過DCA 證實多通道CNN 具有臨床價值。目前乳腺癌CNN 研究仍以DCE-MRI 為主,而在結直腸癌中,除主要序列T2WI外,還對多種序列及其組合(DCE-MRI、ADC等)進行了探索并取得良好成效[32]。有鑒于此,多模態(tài)序列及新興序列的CNN應用可作為后續(xù)研究的思路之一。
綜上所述,直方圖特征、紋理特征和高階特征對NAC 反應的預測作用已經(jīng)得到證實,但是受限于開發(fā)人員的專業(yè)知識,傳統(tǒng)ML 設定的特征可能無法獲取正常與異常間的復雜變化。DL 則很好地彌補了這點,但是具有很高的敏感度的同時也存在較高的假陽性率。傳統(tǒng)ML 研究大部分采取人工勾畫ROI,雖然這是金標準,但是需要大量的時間和人力成本,也存在主觀因素的干擾。值得期待的是自動分割和半自動分割有望取代人工分割[33-35],不過仍需要更多的研究來進行論證。無論是傳統(tǒng)ML還是DL,都需要大數(shù)據(jù)作為支撐才能發(fā)揮出應有的效果。雖然近年的研究中納入的樣本量正在逐漸增多,但是仍然需要進一步地擴大。機器型號或參數(shù)等都可能對預測模型產(chǎn)生影響,因此圖像的預處理是極為重要的環(huán)節(jié)[36]。對預處理的具體步驟目前尚無統(tǒng)一的標準,在許多研究中往往也欠缺細致的說明。最后,現(xiàn)階段的預測模型還停留在研究階段,絕大多數(shù)是單一中心的回顧性研究,而且關于DL 應用于預測乳腺癌NAC反應的研究的數(shù)量較之傳統(tǒng)ML尚顯不足??偠灾琈L 強大的分析能力為乳腺癌診療技術的進步帶來了希望,相信隨著人工智能技術的進步,未來將開發(fā)出更精準、適用范圍更廣且更具臨床價值的ML模型。
作者利益沖突聲明:全體作者均聲明無利益沖突。