朱鈺,歐陽治強,單海燕,楊露,褚吉祥,廖承德,柯騰飛,楊軍*
結(jié)直腸癌是消化系統(tǒng)常見的惡性腫瘤,直腸癌(rectal cancer, RC)約占35%[1]。由于MRI 具有軟組織分辨率高,無電離輻射等優(yōu)勢,其在RC 治療前分期和治療后評估中起著舉足輕重的作用,能對腫瘤形態(tài)及位置、腫瘤分期、淋巴結(jié)、壁外血管侵犯(extramural vascular invasion, EMVI)、直腸系膜筋膜受累等細節(jié)進行準(zhǔn)確評估[2-4]。準(zhǔn)確的MRI 評估對RC 患者至關(guān)重要,然而,MRI 圖像結(jié)果的判讀常受到醫(yī)生診斷經(jīng)驗、業(yè)務(wù)水平和工作強度的影響,目前,常規(guī)MRI 形態(tài)學(xué)特征評價RC 病情的準(zhǔn)確性仍然不足以準(zhǔn)確指導(dǎo)制訂治療方案,有待進一步提升。因此,開發(fā)一種新型有效的圖像挖掘方法從而實現(xiàn)準(zhǔn)確診療仍然是RC領(lǐng)域所面臨的一個挑戰(zhàn)。
人工智能(artificial intelligence, AI)已在醫(yī)學(xué)圖像分析領(lǐng)域得到了頻繁成功的應(yīng)用[5-6],其能夠定量評估影像學(xué)特征并自動識別成像數(shù)據(jù)中的復(fù)雜模式[7]。機器學(xué)習(xí)(machine learning, ML)是AI的一個重要分支,在算法應(yīng)用方面,主要使用人工神經(jīng)網(wǎng)絡(luò)、支持向量機和核方法等[8]。隨著科學(xué)技術(shù)的飛速發(fā)展,以ML為核心的AI在RC中的應(yīng)用也逐漸增多。為了幫助讀者更全面地了解當(dāng)前基于MRI 的AI在RC 中的臨床應(yīng)用并為將來的研究提供一定參考,本文從多個重要方面進行了綜述。
基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)的深度學(xué)習(xí)(deep learning, DL)方法可以從訓(xùn)練數(shù)據(jù)中自動進行特征學(xué)習(xí)[9],并已應(yīng)用于醫(yī)學(xué)圖像分割。近年來,DL 算法在分割病灶方面受到了廣泛關(guān)注并得到了令人印象深刻的結(jié)果。手動分割病灶是一個既耗時又主觀的過程,限制了其在臨床實踐中的實用性。然而,基于DL 的腫瘤分割算法比手動分割更客觀高效,并減輕了工作負擔(dān)。TREBESCHI 等[9]在訓(xùn)練集中基于T2WI 和擴散加權(quán)成像(diffusion-weighted imaging, DWI)的 多 參 數(shù)MRI 訓(xùn)練CNN 用于分割RC,在獨立驗證集上,CNN 對讀者1和讀者2的骰子相似度系數(shù)分別為0.68和0.70,顯示出很高的分割精度,證明了DL 在RC 中進行準(zhǔn)確分割的潛力。U-Net 作為一種較受歡迎和成功的生物醫(yī)學(xué)圖像分割DL 模型,已被證明在生物醫(yī)學(xué)圖像分割中是有效的[10]。WANG 等[11]使用2D U-Net 算法在T2WI 上對直腸腫瘤進行分割,并計算了骰子相似度系數(shù)、杰卡德相似系數(shù)、豪斯多夫距離、平均表面距離四個指數(shù)來評估自動和手動分割的相似性;AI 模型的四個指標(biāo)分別為(0.74±0.14)、(0.60±0.16)、(20.44±13.35)和(3.25±1.69)mm;放射科醫(yī)生的這 些 指 數(shù) 分 別 為(0.71±0.13)、(0.57±0.15)、(14.91±7.62)和(2.67±1.46)mm,表明自動分割和手動分割之間沒有觀察到顯著差異。KNUTH 等[12]收集了來自不同醫(yī)院的兩組RC 患者(C1 和C2),同樣利用2D U-Net 架構(gòu)在T2WI 和DWI 上進行RC 分割;對于C1 隊列,在測試集中T2WI 模型的中位骰子相似度系數(shù)為0.77,研究發(fā)現(xiàn)加入DWI并沒有進一步提高模型性能(骰子相似度系數(shù)=0.76);基于T2WI 的模型在C1 上訓(xùn)練并應(yīng)用于C2 的骰子相似度系數(shù)為0.59。由于傳統(tǒng)U-Net 網(wǎng)絡(luò)會導(dǎo)致輪廓分割的模糊性,LI等[13]提出了一種基于輪廓預(yù)測的改進U-Net 模型用于RC 分割,并在測試集上實現(xiàn)了0.894(語義分割的評價指標(biāo)MIoU)的平均交集。由于二維分割精度有限,為進一步提高分割精度,ZABIHOLLAHY 等[14]提出了一種3D U-Net 和3D 密集U-Net 架構(gòu)在T2WI 上來分割RC,結(jié)果表明所開發(fā)的方法準(zhǔn)確、快速且可重現(xiàn),并且明顯優(yōu)于其他先進的分割方法。SUI 等[15]提出了一種新的遷移學(xué)習(xí)協(xié)議——基于變換器模型的RC 檢測和分割任務(wù)的聯(lián)合框架,這種協(xié)議可有效地實現(xiàn)腫瘤區(qū)域聯(lián)合檢測及分割。
以上研究初步提示基于MRI的AI在分割RC病灶方面取得了良好的結(jié)果,具有較好的臨床應(yīng)用前景。盡管MRI能更清楚地反映直腸結(jié)構(gòu)和腫瘤位置,但由于直腸是蠕動的管狀結(jié)構(gòu),在準(zhǔn)確分割方面也存在一些挑戰(zhàn)。在應(yīng)用前,仍需進一步驗證,如果驗證結(jié)果可靠,分割效率低、受主觀因素影響大的現(xiàn)狀勢必得到改善。未來開發(fā)一個通用模型用于在多個序列上而不僅在單個序列上分割目標(biāo)區(qū)域從而簡化分割過程并節(jié)省時間也許是非常有意義的。
術(shù)前準(zhǔn)確評估RC T分期是臨床診療決策中的關(guān)鍵步驟,其中早期RC(T1-2 和N-)的最佳治療方法是全直腸系膜切除術(shù)(total mesorectal excision,TME),而局部晚期RC(T3-4和/或N+)的治療策略是新輔助放化療(neoadjuvant chemoradiotherapy, nCRT)后行TME[16-17]。MRI被認為是評估T分期的首選方法[2]。然而,目前T分期的診斷很大程度上依賴于影像醫(yī)生的經(jīng)驗,這可能會導(dǎo)致分期準(zhǔn)確率降低。近年來,基于MRI的AI已作為新的方法被用于評估T分期,且目前大多數(shù)研究都集中在區(qū)分T1/T2 和T3/T4 的二分類問題上。
LU 等[18]基于T2WI 勾畫最?。[瘤)和最大(腫瘤和腫瘤周圍的模糊區(qū)域)ROI 建立了2 個影像組學(xué)模型,以區(qū)分T1/T2和T3/T4。在驗證集中,最小和最大描繪模型的AUC 分別為0.808 和0.903,均表現(xiàn)出了良好的預(yù)測性能,且最大描繪方法在臨床上更有益。而YOU 等[19]基于154 名患者的高分辨率T2WI 和ADC圖,使用支持向量機模型區(qū)分T1/T2和T3/T4,在驗證隊列中,高分辨率T2WI、ADC 圖和組合模型的AUC 分別為0.845、0.881 和0.910,且兩個序列聯(lián)合應(yīng)用有助于提高RC 術(shù)前診斷的準(zhǔn)確性。此外,DL 也被用于T 分期評估。WU 等[20]使用Faster R-CNN 來構(gòu)建RC T分期自動診斷平臺,結(jié)果表明該模型可能是預(yù)測RC T 分期有效且客觀的方法。最新一項研究表明,與基于高分辨T2 的AI 模型和放射科專家的視覺評估相比,基于DL 的3D 超分辨率MRI 影像組學(xué)模型在預(yù)測術(shù)前T分期方面具有更優(yōu)越的性能[21]。
從上述幾項研究不難看出,基于不同ROI和不同MRI 序列的AI 在評估RC 患者T 分期方面表現(xiàn)出了較好的性能,有望成為RC 術(shù)前T 分期的重要手段之一。然而,這幾項研究ROI 都是手動勾畫的,這更大程度上取決于影像醫(yī)生的個人經(jīng)驗和感知,難以避免主觀錯誤;其次,大部分研究都基于T2WI 序列,而其他常規(guī)序列,如DWI 和增強對于評估T 分期的準(zhǔn)確性尚不清楚,有待進一步研究。
淋巴結(jié)轉(zhuǎn)移是RC 患者最常見的轉(zhuǎn)移途徑,增加了患者局部復(fù)發(fā)的風(fēng)險。根據(jù)NCCN 指南,RC 患者治療方法的制訂取決于對盆腔淋巴結(jié)轉(zhuǎn)移情況的預(yù)判,即先行nCRT 再行手術(shù),還是手術(shù)后行輔助治療[17]。臨床上,利用MRI 對轉(zhuǎn)移性淋巴結(jié)的診斷主要基于形態(tài)學(xué)指標(biāo),如淋巴結(jié)形狀、大小和信號強度[22],然而,形態(tài)學(xué)指標(biāo)在提高淋巴結(jié)分期的準(zhǔn)確性方面仍然有限[23],且不同經(jīng)驗的放射科醫(yī)生在診斷轉(zhuǎn)移性淋巴結(jié)方面存在較大差異,從而導(dǎo)致總體診斷準(zhǔn)確度不高。因此,對淋巴結(jié)受累情況進行全面、準(zhǔn)確的評估對RC 的臨床分期、選擇治療策略和改善預(yù)后至關(guān)重要。
深度遷移學(xué)習(xí)是一種AI方法,用于對網(wǎng)絡(luò)的大型公共成像數(shù)據(jù)庫進行預(yù)訓(xùn)練,并提取邊緣、紋理和灰度等特征[24],適用于醫(yī)學(xué)圖像分析,尤其是小樣本分析。ZHAO等[25]通過遷移學(xué)習(xí)為DL框架Mask R-CNN提供輸入,開發(fā)和驗證了基于多參數(shù)MRI的全自動淋巴結(jié)檢測和分割模型。結(jié)果顯示模型檢測和分割所需的時間為1.3 s/例,明顯短于放射科醫(yī)生的200 s/例;對于淋巴結(jié)分割,模型骰子相似度系數(shù)在0.81~0.82范圍內(nèi)。LI 等[26]使用預(yù)訓(xùn)練的DL 模型(Inception-v3)識別和檢測淋巴結(jié)狀態(tài),陽性預(yù)測值、陰性預(yù)測值、敏感度和特異度分別為0.952、0.953、95.3%和95.2%,AUC和準(zhǔn)確率分別為0.994 和0.957,表現(xiàn)均優(yōu)于放射科醫(yī)生。LIU 等[27]基于臨床因素和單、多因素影像組學(xué)特征建立了五個支持向量機分類模型,以預(yù)測RC 中的淋巴結(jié)轉(zhuǎn)移;結(jié)合臨床和多因素影像組學(xué)特征的模型具有更好的分類性能和診斷準(zhǔn)確性(AUC=0.832)。此外,術(shù)前準(zhǔn)確診斷下段RC 側(cè)方淋巴結(jié)轉(zhuǎn)移對于需要行側(cè)方LN 清掃的患者非常重要。KASAI等[28]利用ML 創(chuàng)建了一個側(cè)方淋巴結(jié)轉(zhuǎn)移預(yù)測模型,該模型驗證隊列AUC 為0.903,預(yù)測能力明顯高于傳統(tǒng)方法(AUC=0.754),有助于指導(dǎo)臨床是否需要進行側(cè)方淋巴結(jié)清掃。
基于MRI的AI可以幫助快速檢測和分割淋巴結(jié),提高臨床效率,并較大限度地減少不同年資放射科醫(yī)生之間的差異,為淋巴結(jié)預(yù)測提供更多有價值的信息。
在全球每年被診斷為RC 的患者中約70%為局部進展期RC(locally advanced RC, LARC)[29]。目前對于LARC 的標(biāo)準(zhǔn)治療方法是nCRT 后行全直腸系膜切除術(shù)[17]。然而,在臨床實踐中,從無腫瘤消退到病理完全緩解(pathologic complete response, pCR),個體對nCRT的反應(yīng)是高度異質(zhì)性的。先前的研究表明約10%~25%的RC 患者在nCRT 后出現(xiàn)pCR[30]。對于pCR 患者,可實施“等待和觀察”策略,并行嚴密的定期監(jiān)測[31],從而避免手術(shù)并發(fā)癥、永久性造口等問題。然而,目前只能通過術(shù)后組織病理評估來確認pCR,因此,迫切需要在術(shù)前無創(chuàng)地準(zhǔn)確預(yù)測pCR,以確定器官保存策略的患者。盡管常規(guī)MRI 是nCRT 反應(yīng)評估的首選方式,但因MRI 評估nCRT 反應(yīng)的共識相對缺乏[32],pCR 的視覺評估仍然具有挑戰(zhàn)性。近年來,基于MRI 的影像組學(xué)和DL 的發(fā)展為評估pCR 創(chuàng)造了新的工具。
與單指數(shù)DWI相比,擴散峰度成像可產(chǎn)生更多關(guān)于組織結(jié)構(gòu)的信息。由此,ZHANG 等[33]首次提出基于T2WI 和擴散峰度圖像的DL 模型來預(yù)測pCR,研究結(jié)果表明,訓(xùn)練集的AUC 為0.99。國內(nèi)學(xué)者[34]僅基于T2WI 圖像,建立了DL 模型來預(yù)測pCR,模型的AUC、敏感度、特異度、陽性預(yù)測值、陰性預(yù)測值和準(zhǔn)確度分別為0.76、30%、96%、0.67、0.87和85%。近期,來自日本的學(xué)者也得出了相類似的結(jié)論[35]。CHEN等[36]基于極端梯度提升算法(eXtreme Gradient Boosting, XGBoost)的ML 算法預(yù)測pCR,并將AI 模型與傳統(tǒng)列線圖模型進行比較,發(fā)現(xiàn)AI 模型將訓(xùn)練集中AUC 從0.72 提高到0.95,敏感度從43.0%提高到82.2%,特異度從87.1%提高到91.6%,可為臨床醫(yī)生制訂個性化治療方案提供參考。有研究[37]基于T2WI 創(chuàng)新性地挖掘直腸系膜脂肪的信息,建立影像組學(xué)模型來預(yù)測LARC患者nCRT 后的pCR,并取得了良好的預(yù)測效能,表明腫瘤周圍直腸系膜脂肪也可能顯示出巨大的預(yù)測能力。
由此可見,AI 作為一種潛在的定量工具,在評估LARC患者pCR方面具有重要的價值,能為臨床決策提供合理依據(jù)。目前的研究普遍存在研究隊列規(guī)模小、缺乏外部驗證等問題,只有通過國內(nèi)甚至國際多中心研究才能實現(xiàn)模型的廣泛適用性。
局部復(fù)發(fā)和遠處轉(zhuǎn)移是RC預(yù)后不良的重要影響因素。大約15%~30%的結(jié)直腸癌患者會出現(xiàn)轉(zhuǎn)移[38]。如果能夠在早期識別并篩查出此類高危人群,就可以在術(shù)前對此類人群進行有針對性的治療,并制訂適當(dāng)?shù)闹委煵呗詮亩纳祁A(yù)后[8]。近年來的研究發(fā)現(xiàn),基于MRI的AI在預(yù)測RC預(yù)后方面表現(xiàn)突出。
JAYAPRAKASAM 等[37]在軸位T2WI 上提取直腸系膜脂肪的影像組學(xué)特征建立模型來預(yù)測LARC的局部復(fù)發(fā)和遠處轉(zhuǎn)移,研究發(fā)現(xiàn)在局部復(fù)發(fā)或遠處轉(zhuǎn)移的患者和未發(fā)生的患者之間,直腸系膜脂肪的影像組學(xué)特征有顯著差異。LIU 等[39]開發(fā)并驗證了基于MRI 的影像組學(xué)特征,用于預(yù)測多中心數(shù)據(jù)集的遠處轉(zhuǎn)移,研究證明基于MRI的影像組學(xué)特征是預(yù)測LARC患者遠處轉(zhuǎn)移的獨立因素。而CUI等[40]基于多參數(shù)MRI圖像提取影像組學(xué)特征并聯(lián)合臨床病理因素構(gòu)建列線圖用于預(yù)測LARC患者無病生存期,訓(xùn)練集和驗證集的C指數(shù)分別為0.780和0.803。此外,TIBERMACINE等[41]進行了一項多中心研究,評估和比較了不同的影像組學(xué)模型預(yù)測LARC 患者無病生存期的能力,結(jié)果表明模型預(yù)測無病生存期的AUC 值范圍為0.77 至0.89,均表現(xiàn)出了良好的性能。另一項回顧性多中心研究構(gòu)建了一個基于DL 的影像組學(xué)模型,用于預(yù)測接受nCRT后LARC 患者的遠處轉(zhuǎn)移,發(fā)現(xiàn)基于MRI 的DL 影像組學(xué)特征在遠處轉(zhuǎn)移預(yù)測中表現(xiàn)良好,在驗證隊列中,C指數(shù)為0.747,AUC為0.894[42]。LIANG等[43]使用基于ML 的MRI 影像組學(xué)來預(yù)測RC 的異時性肝轉(zhuǎn)移,并取得了良好的預(yù)測效能。
環(huán)周切緣(circumferential resection margin,CRM)陽性是RC 局部復(fù)發(fā)和生存率較差的預(yù)測指標(biāo)[44]。因此,準(zhǔn)確地預(yù)測CRM 是否陽性對于選擇合理的治療方案尤為重要。一項單中心回顧性研究基于Faster R-CNN 評估RC CRM 的受累情況[45],在訓(xùn)練集中,CRM 陽性和陰性的比例為1∶2;該模型的準(zhǔn)確度、敏感度和特異度分別為93.2%、83.8%和95.6%,AUC為0.953。研究表明,該AI模型可對原位腫瘤外侵引起的CRM陽性區(qū)域行風(fēng)險評估,具有初步篩選的應(yīng)用價值。然而,目前關(guān)于MRI 的AI 在RC CRM 識別中的研究仍較少,未來需要擴大樣本量行更深入的研究來完善AI輔助診斷CRM平臺。
EMVI 見于31%的RC 患者[46],研究表明EMVI 與LARC 患者的腫瘤復(fù)發(fā)和總體死亡風(fēng)險增加有關(guān),也是預(yù)后不良的指標(biāo)[47]。因此,早期識別EMVI 對治療策略的選擇具有重要意義。為了提高診斷EMVI的準(zhǔn)確性,SHU 等[48]基于T1WI、T2WI、DWI 和T1WI 增強圖像,并使用不同的ML算法,結(jié)合臨床特征構(gòu)建了聯(lián)合模型用于EMVI 的術(shù)前預(yù)測;結(jié)果表明基于貝葉斯算法構(gòu)建的聯(lián)合模型預(yù)測效能表現(xiàn)最佳,AUC、敏感度和特異度分別為0.835、71.4%和88.5%。LIU 等[49]開發(fā)和驗證了基于原發(fā)腫瘤特征的影像組學(xué)列線圖,以使用ML 預(yù)測術(shù)前病理性EMVI,結(jié)果表明影像組學(xué)列線圖的預(yù)測效率最高,AUC為0.863,可能有助于患者選擇最佳治療策略。ZHAO等[50]從合成MRI圖像中提取影像組學(xué)特征,同樣建立了列線圖預(yù)測EMVI,驗證隊列AUC為0.899,此外,影像組學(xué)特征診斷效果優(yōu)于兩位放射科醫(yī)生(AUC分別為0.912、0.732和0.763)。
以上研究成果表明基于MRI 的AI 能夠自動化、高通量地提取圖像信息,以無創(chuàng)的方式捕獲腫瘤影像信息,在RC患者風(fēng)險分層中發(fā)揮了重要作用,在很大程度上可幫助臨床醫(yī)生做出合理的醫(yī)療決策。未來,MRI 單序列建模也將逐漸走向多序列融合甚至多模態(tài)融合建模方向,但距離臨床應(yīng)用尚待時日。
從這些研究中我們不難看出隨著基于MRI 的AI在RC 中的發(fā)展與應(yīng)用不斷深入,其在病灶分割、T 分期評估、淋巴結(jié)轉(zhuǎn)移預(yù)測、nCRT 療效評估、預(yù)后預(yù)測方面的優(yōu)勢逐漸顯現(xiàn),取得了令人鼓舞的成就。然而,目前AI 仍處于試驗階段,面臨著諸多發(fā)展瓶頸。首先,高質(zhì)量的圖像對AI至關(guān)重要,目前受限于復(fù)雜的醫(yī)療場景和不均質(zhì)的圖像質(zhì)量,圖像數(shù)據(jù)標(biāo)準(zhǔn)化程度低,目前的AI算法仍不能滿足高標(biāo)準(zhǔn)醫(yī)療要求;其次,模型的穩(wěn)健性和通用性是影響其在臨床中應(yīng)用的重要因素,未來,也許通過增加研究數(shù)據(jù)量和標(biāo)準(zhǔn)化AI工作流程能夠改善;最后,DL需要大量的數(shù)據(jù)進行訓(xùn)練,而直腸是具有蠕動的管狀結(jié)構(gòu),高質(zhì)量的訓(xùn)練數(shù)據(jù)采集是一個大問題,且目前仍然無法定性地解釋DL 特征的含義。與此同時,由于“黑匣子”問題,AI 的臨床應(yīng)用進展緩慢。因此,AI 在RC 中的臨床應(yīng)用仍然存在挑戰(zhàn)。
AI 的最終目標(biāo)是實現(xiàn)臨床應(yīng)用,但并不意味著取代臨床醫(yī)生和臨床工作流程,而是減輕臨床醫(yī)生的負擔(dān),提供有用信息,以輔助臨床實現(xiàn)個性化治療。相信在不久的將來,能通過規(guī)范AI流程,打破數(shù)據(jù)之間的壁壘,提高模型的泛化性,最終將AI應(yīng)用于臨床,從而更大程度地推動結(jié)直腸學(xué)科的進步,為更多患者提供更高效精準(zhǔn)、個性化的醫(yī)療服務(wù)。
作者利益沖突聲明:全體作者均聲明無利益沖突。
作者貢獻聲明:楊軍構(gòu)思和設(shè)計本綜述,對稿件重要內(nèi)容進行了修改,支持性貢獻,獲得了國家自然科學(xué)基金項目資助;朱鈺起草和撰寫稿件,獲取、分析或解釋本研究的數(shù)據(jù);歐陽治強,單海燕,楊露,褚吉祥,廖承德,柯騰飛獲取、分析或解釋本研究的數(shù)據(jù),對稿件重要內(nèi)容進行了修改;廖承德獲得了云南省衛(wèi)生健康委員會醫(yī)學(xué)學(xué)科帶頭人基金項目資助;全體作者都同意發(fā)表最后的修改稿,同意對本研究的所有方面負責(zé),確保本研究的準(zhǔn)確性和誠信。