吳志杰 袁紫旭 蔡建 王輝
2019年全球結(jié)直腸癌新發(fā)病例約185萬例,位居惡性腫瘤發(fā)病譜的第3位;每年有近90萬人死亡,位居惡性腫瘤死亡譜的第2位。除了飲食習(xí)慣外,肥胖、缺乏體育鍛煉和吸煙等是結(jié)直腸癌發(fā)病的高危因素[1]。預(yù)計到2035年大腸癌的全球新發(fā)病例將增加到250萬例[2]。大腸癌的經(jīng)典發(fā)病模式是起源于息肉,發(fā)展為腺瘤,最終演變?yōu)榻Y(jié)直腸癌。這個過程主要是由基因突變和表觀遺傳改變積累所驅(qū)動,需要10到15年時間[3]。結(jié)直腸癌早期病變位于黏膜層及黏膜下層,早期無明顯癥狀,直至中晚期才會出現(xiàn)明顯臨床癥狀。據(jù)報道,Ⅰ、Ⅱ期結(jié)直腸癌患者接受治療,5年存活率(OS)可達(dá)75%~90%,Ⅲ期患者OS為40%~55%,Ⅳ期腸癌OS則不到20%[4]。由于結(jié)直腸癌早期癥狀隱匿,診斷非常困難,部分患者初診時就已經(jīng)處于結(jié)直腸癌晚期,治療效果很差。
結(jié)腸鏡檢查是診斷結(jié)直腸癌的金標(biāo)準(zhǔn)和首選篩查方式。結(jié)腸鏡具有很好的直觀性,可以評估息肉/腫瘤的位置、大小、數(shù)量等。更重要的是,對可疑病變進(jìn)行病理活檢鑒別良惡性。Nishihara等[5]在22年間對88 902名參與者隨訪發(fā)現(xiàn):進(jìn)行結(jié)腸鏡檢查后,近端結(jié)腸癌的死亡率明顯降低(OR∶0.47)。
增強CT掃描是結(jié)腸鏡檢查的潛在替代方法,但是增強CT掃描無法進(jìn)行活檢和息肉切除術(shù),如果發(fā)現(xiàn)可疑病變,患者仍需返回結(jié)腸鏡檢查。MRI掃描是直腸癌術(shù)前檢查手段之一,但因掃描成本較高一般不作為結(jié)直腸癌檢查的首選方式。
循環(huán)腫瘤DNA(ctDNA)是一種液體活檢技術(shù),具有操作簡便、侵害性小、重復(fù)性高、易于動態(tài)監(jiān)測腫瘤狀態(tài)等優(yōu)勢,研究發(fā)現(xiàn)ctDNA可以和CEA進(jìn)行聯(lián)合檢測,反映體內(nèi)的腫瘤負(fù)荷水平同時作為早期結(jié)腸癌篩查標(biāo)志物[6-7]。然而,不同的ctDNA檢測方法有著不同的標(biāo)準(zhǔn),適用的人群也不一樣。ctDNA在結(jié)直腸癌方面的應(yīng)用價值仍需進(jìn)一步驗證。
在結(jié)直腸癌早期篩查及診斷方面還有很多探索,例如腸道菌群的檢測,膠囊內(nèi)鏡等。但是,目前臨床上結(jié)腸鏡因其簡單便捷、診斷率及敏感性高,可以對發(fā)現(xiàn)的息肉直接病理活檢,使結(jié)腸鏡成為腸癌篩查的金標(biāo)準(zhǔn)。在病理活檢的過程中,由于細(xì)胞異質(zhì)性的存在,如何區(qū)分癌組織和正常組織,對病理圖像中細(xì)胞核進(jìn)行鑒定和分類,不同的病理醫(yī)師對同一標(biāo)本組織可能有不同的判斷結(jié)果[8]。如何避免主觀因素帶來的影響,使腸癌的早期診斷更加穩(wěn)定可靠,是目前臨床上面臨的難題。
隨著人工智能(artificial intelligence,AI)的發(fā)展,尤其是深度學(xué)習(xí)算法的開發(fā)和應(yīng)用,深度學(xué)習(xí)已在醫(yī)學(xué)圖像分析領(lǐng)域中開展了無數(shù)的應(yīng)用,在腫瘤學(xué)、放射學(xué)、病理學(xué)、皮膚病學(xué)和眼科等都取得了飛速發(fā)展。例如在眼底照片中檢測出糖尿病性視網(wǎng)膜病變[9],從皮膚照片中對皮膚癌進(jìn)行分類[10],以及檢測腫瘤轉(zhuǎn)移的病理圖像[11]。2018 年,Sun等[12]構(gòu)建了特異性識別腫瘤浸潤細(xì)胞CD8的影像組學(xué)-腫瘤標(biāo)記物的AI模型,該模型實現(xiàn)了對腫瘤的免疫分型、對PD-1抑制劑療效的精準(zhǔn)預(yù)測。2020年,我們團(tuán)隊袁紫旭等[13]在Ann Surg上報道了結(jié)直腸癌腹膜轉(zhuǎn)移的AI診斷模型,對腹膜轉(zhuǎn)移診斷率(AUC)高達(dá)0.92。深度學(xué)習(xí)在識別組織病理學(xué)圖像方面,比有經(jīng)驗的病理學(xué)家表現(xiàn)更好。最近研究開發(fā)了一種可檢測前哨淋巴結(jié)中是否存在前列腺癌和乳腺癌轉(zhuǎn)移的CNN方法,診斷的AUC值分別為0.99和0.88[8]。該模型可以成功識別所有乳腺癌和前列腺癌轉(zhuǎn)移灶,具有極高的靈敏度。
過去20年來,隨著內(nèi)鏡技術(shù)的不斷發(fā)展,結(jié)腸鏡檢查的圖像質(zhì)量和清晰度已得到顯著改善,但是在檢查過程中息肉/腺瘤仍可能被漏診。有研究報道,即使有經(jīng)驗的結(jié)腸鏡醫(yī)師,在充分準(zhǔn)備的腸道環(huán)境下,也可能會錯過大約15%的<10 mm的結(jié)直腸息肉,但是很少會錯過≥10 mm的息肉[14]。該研究表明,結(jié)腸鏡檢查對于結(jié)腸息肉/癌變的檢測是高度依賴操作者經(jīng)驗的。然而即使病變就在內(nèi)鏡的視野內(nèi),內(nèi)鏡醫(yī)師檢查時仍可能會漏掉部分息肉[15-16]。可能原因包括:(1)內(nèi)鏡醫(yī)師技術(shù)水平的差異;(2)“注意力不集中”,內(nèi)鏡醫(yī)師由于疲勞或情緒因素分心,無法同時處理屏幕上的圖像;(3)在眼球運動期間的“改變失明”時,即在視覺掃描時錯過了息肉檢出。另外,內(nèi)鏡醫(yī)師在面對多個息肉時,無法對全部息肉病理活檢,有經(jīng)驗的內(nèi)鏡醫(yī)師往往只將懷疑癌變的息肉取活檢,對年輕內(nèi)鏡醫(yī)師提出了挑戰(zhàn),因此對結(jié)直腸息肉/腺瘤的檢出率造成嚴(yán)重影響。隨著深度學(xué)習(xí)的快速發(fā)展,對于結(jié)直腸癌的早期診斷幫助越來越大。AI的輔助應(yīng)用可以提高腸鏡的息肉檢出率,以及對息肉特征辨認(rèn)的準(zhǔn)確性[17]。
美國胃腸內(nèi)窺鏡學(xué)會提出允許內(nèi)鏡醫(yī)師采取光學(xué)方式(包括AI)來替代息肉組織的病理學(xué)評估[18]。例如增生性息肉檢測陰性時,允許開展“診斷-離開”策略[19]。因此,研究人員開發(fā)了計算機(jī)輔助(CADx)系統(tǒng),CADx能將腺瘤與增生性息肉區(qū)分開,該AI模型通過對息肉表面的血管圖案進(jìn)行識別和分析,判斷出其良惡性,對息肉診斷的敏感性和特異性均>90%[20]。Kominami等[21]在一項前瞻性研究中構(gòu)建了AI模型,提取訓(xùn)練圖像上的相應(yīng)特征并量化每個圖像,診斷準(zhǔn)確度極高,敏感性為93.0%,特異性為93.3%,陽性預(yù)測值(PPV)為93.0%,陰性預(yù)測值(NPV)為93.3%。因此,CADx可以提高結(jié)直腸息肉的光學(xué)診斷率,減少臨床上非腫瘤性病變的切除概率,大大降低了醫(yī)療成本。
近年來,基于深度學(xué)習(xí)算法的AI模型發(fā)展迅速,Wang等[22]納入1 290例患者的腸鏡圖像,利用深度學(xué)習(xí)開發(fā)了AI模型,可以實時、高靈敏性、高特異性地檢測出息肉。在被檢出>1個息肉的1 138例患者中,采集了27 113例患者的結(jié)腸鏡圖像進(jìn)行驗證,每幅圖像的敏感性為94.38%,特異性為95.92%。在沒有息肉的情況下,54例結(jié)腸鏡錄像中每個圖像特異性為95.40%,該算法幫助內(nèi)鏡醫(yī)生明顯提高了息肉的檢出率(ARD)。Wang等[23]在納入的1 058例患者中,標(biāo)準(zhǔn)結(jié)腸鏡檢查組患者536例,計算機(jī)輔助結(jié)腸鏡檢查組患者522例,結(jié)果顯示AI輔助系統(tǒng)(圖1)顯著提高了ADR(AI輔助組29.1%vs.標(biāo)準(zhǔn)組20.3%,P<0.001),并增加了每位患者的平均腺瘤數(shù)量(AI輔助組0.53vs.標(biāo)準(zhǔn)組0.31,P<0.001)。因此,深度學(xué)習(xí)在圖像分析處理方面表現(xiàn)出色,可以極大地提高結(jié)直腸息肉的檢出率,這種檢出率是穩(wěn)定可靠的,不會受內(nèi)鏡醫(yī)師的工作經(jīng)驗高低等影響。
圖1 AI輔助系統(tǒng)診斷息肉的流程圖(基于SegNet架構(gòu)的檢測算法,將結(jié)腸鏡圖像按順序扭曲為二值圖像,1表示息肉像素,0表示無息肉的概率,然后輸出顯示出來)
1.基于CT圖像的AI模型
2012年,Lambin等[24]首次提出“影像組學(xué)(radiomics)”的概念。影像組學(xué)中的紋理技術(shù)能夠提供肉眼無法辨識的圖像信息,可定量評估腫瘤病變特征,協(xié)助臨床醫(yī)師進(jìn)行腫瘤分期、術(shù)前診斷、預(yù)后判斷以及預(yù)測腫瘤復(fù)發(fā)[25]。影像組學(xué)是影像技術(shù)與AI相融合的交叉技術(shù),在獲取了大量標(biāo)準(zhǔn)化的醫(yī)學(xué)圖像數(shù)據(jù)后,借助圖像分割軟件,對腫瘤進(jìn)行分割,提取強度、形態(tài)學(xué)和紋理特征,最后運用如logistic回歸模型、支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)等,建立影像組學(xué)預(yù)測和分類模型[26]。Liang等[27]納入296例結(jié)直腸癌患者的CT圖像作為訓(xùn)練集,通過自動提取最優(yōu)特征,利用logistic回歸建立了預(yù)測模型,ROC曲線驗證該模型的分級性能,該模型的AUC為0.792,靈敏度和精確度分別為62.9%和87.4%[27]。但是,影像組學(xué)需要影像科醫(yī)生提取圖像,進(jìn)行定義,需要消耗大量人力資源,難以在臨床推廣應(yīng)用。
傳統(tǒng)觀念認(rèn)為腹膜轉(zhuǎn)移已是惡性腫瘤的終末期,多推薦全身化療、姑息治療等保守療法。近年來隨著對腹膜轉(zhuǎn)移的研究深入,認(rèn)為腹膜轉(zhuǎn)移是一種局部區(qū)域性病變,提倡采用腫瘤細(xì)胞減滅術(shù)(CRS)聯(lián)合腹腔熱灌注化療(HIPEC)的積極治療策略。2020年,我們團(tuán)隊袁紫旭等[13,28]提取了19 814張結(jié)直腸癌患者靜脈期CT圖像作為訓(xùn)練集,勾畫腫瘤原發(fā)病灶,通過深度學(xué)習(xí)算法建立了殘差神經(jīng)網(wǎng)絡(luò)(ResNet模型)和神經(jīng)網(wǎng)絡(luò)注意力模型,構(gòu)建ResNet3D的AI訓(xùn)練模型,再利用7 837張CT圖像測試ResNet3D模型,為提高診斷率,進(jìn)一步提取腹膜轉(zhuǎn)移特征構(gòu)建了聯(lián)合ResNet3D模型的ResNet3D+矢量向量分類器(SVM),該模型診斷腹膜轉(zhuǎn)移的AUC高達(dá)0.92,敏感度、特異度分別為94%,已經(jīng)超過了影像專家對腹膜轉(zhuǎn)移的診斷率(AUC∶0.721)[13]。2019年,北京大學(xué)腫瘤醫(yī)院季加孚教授團(tuán)隊對胃癌CT圖像的原發(fā)腫瘤和臨近腹膜區(qū)域進(jìn)行勾畫并提取特征,構(gòu)建了三個影像組學(xué)諾模圖(radiomics nomogram),對腹膜轉(zhuǎn)移的診斷AUC分別高達(dá)0.958,0.941,0.928[29]。該諾模圖能夠極好地預(yù)測隱匿性腹膜轉(zhuǎn)移,對早期診斷具有重要的臨床意義。這表明基于CT圖像的影像組學(xué)技術(shù),可作為判斷腫瘤臨床分期和晚期轉(zhuǎn)移的輔助手段。如今AI技術(shù)與CT圖像的融合,在結(jié)直腸癌的運用主要集中在臨床分期、轉(zhuǎn)移和預(yù)后預(yù)測等方面,在早期篩查方面還有待進(jìn)一步研究。
2.基于MRI圖像的AI模型
MRI掃描是直腸癌術(shù)前檢查手段之一,在對腫瘤的位置、浸潤深度、淋巴結(jié)轉(zhuǎn)移、周圍血管組織是否受侵犯等方面具有明顯優(yōu)勢,但是MRI結(jié)果解讀極大程度地受到醫(yī)生臨床經(jīng)驗、專業(yè)水平和工作強度的影響[30]。Trebeschi等[31]通過深度學(xué)習(xí)算法開發(fā)了一種自動分割程序,利用140例直腸癌患者的MRI圖像建立訓(xùn)練集,對MRI成像進(jìn)行直腸癌的準(zhǔn)確定位和細(xì)分,該自動分割程序具有良好的診斷性能,其細(xì)分效果與專家手動勾畫的細(xì)分水平相當(dāng)(DSC為0.70)。同時,在分類方面該自動程序能夠正確分類腫瘤體素(AUC=0.99)。2018年,青島大學(xué)附屬醫(yī)院盧云團(tuán)隊利用AI開發(fā)了Faster R-CNN架構(gòu),納入28 080張直腸癌淋巴結(jié)轉(zhuǎn)移的MRI圖像,建立了AI學(xué)習(xí)訓(xùn)練的影像數(shù)據(jù)庫并進(jìn)行驗證,對每例患者M(jìn)RI圖像的診斷時間僅為20 s,是影像科醫(yī)師診斷時間的1/30,診斷的AUC高達(dá)0.912,具有良好的臨床可行性[32]。該Faster R系統(tǒng)是對高分辨率MRI圖像的淋巴結(jié)轉(zhuǎn)移進(jìn)行識別和診斷,一定程度上減輕了影像科醫(yī)師的工作量,并降低影像學(xué)專家的診斷水平差異帶來的判斷誤差。
病理診斷是疾病的金標(biāo)準(zhǔn)診斷,病理結(jié)果可能會受到切片厚度、均勻度、染色程度等圖像質(zhì)量影響,導(dǎo)致不同經(jīng)驗的病理醫(yī)師得出不同結(jié)論。20世紀(jì)60年代,Prewitt等[33]將普通血液涂片的顯微鏡視野掃描成簡單圖像,然后將光學(xué)數(shù)據(jù)轉(zhuǎn)換為光密度值矩陣,以進(jìn)行計算機(jī)圖像分析,這被認(rèn)為是數(shù)字病理學(xué)的開端。數(shù)字化病理的核心技術(shù)是全玻片數(shù)字掃描與病理圖像分析的算法,全玻片數(shù)字掃描技術(shù)(whole slide imaging,WSI)是一種現(xiàn)代數(shù)字系統(tǒng)與光學(xué)設(shè)備有機(jī)結(jié)合的技術(shù),它通過高分辨顯微鏡掃描采集到的數(shù)字圖像,再利用計算機(jī)對圖像自動進(jìn)行分割并拼接處理,量化病理圖像的紋理、形狀、大小、矩陣密度值和顏色等信息,最后得到數(shù)字病理切片。基于深度學(xué)習(xí)算法的CNN在近年來取得飛速進(jìn)步,為數(shù)字病理學(xué)的發(fā)展提供了基礎(chǔ)。
AI在病理圖像處理領(lǐng)域的應(yīng)用,簡單說是對拍攝和掃描的圖像進(jìn)行預(yù)處理、分割、特征提取和分類以獲取數(shù)字信息。數(shù)字化病理通過CNN可以對采取到的結(jié)直腸腺瘤進(jìn)行分析。通過計算機(jī)軟件來量化細(xì)胞形態(tài)、細(xì)胞核與細(xì)胞質(zhì)面積、核漿比、細(xì)胞核的核分裂像,血管壁厚度、血管密度及腔體面積等一系列的量化標(biāo)準(zhǔn),來判斷組織學(xué)分型和預(yù)測患者的生存和預(yù)后。Kainz等[34]使用兩個不同的CNN分類器對蘇木精-伊紅染色圖像進(jìn)行像素級分類,當(dāng)?shù)谝粋€分類器將腺體與背景分離時,第二個分類器則將腺體結(jié)構(gòu)識別出來。對病理圖像進(jìn)行分割識別并生成最終結(jié)果,辨別良惡性腸道腫瘤的準(zhǔn)確率達(dá)到了95%~98%。Awan等[35]使用一種稱為最佳比對度量(BAM)的新穎度量來測量腺體的形狀,使用支持向量機(jī)(SVM)分類器從BAM得到的形狀特征進(jìn)行訓(xùn)練,交叉驗證后可以區(qū)分正常組織和結(jié)直腸癌組織的準(zhǔn)確率達(dá)到了97%。
AI有助于克服病理學(xué)家的主觀視覺評估的局限性,提高病理醫(yī)師診斷的準(zhǔn)確性和客觀性。有研究報道,在4 600例宮頸細(xì)胞學(xué)篩查中,數(shù)字化閱片數(shù)每小時約為單純?nèi)斯ら喥?倍,異常細(xì)胞檢出率比單純?nèi)斯ら喥臋z出率增加了33.40%[36]?;贏NN的CellaVision DM96自動化數(shù)字圖像分析系統(tǒng)通過定位紅細(xì)胞、分割細(xì)胞圖像、提取細(xì)胞特征進(jìn)行外周血涂片分析,DM96對細(xì)胞分類結(jié)果的準(zhǔn)確性>80%[37]。因此,AI可以輔助病理醫(yī)生的診斷,初步處理海量的簡單病理圖像和提供初步病理診斷,將大大減少病理醫(yī)生的工作量。
目前,AI在許多方面都不同于人類的智慧,例如AI僅僅針對一項具體任務(wù)進(jìn)行訓(xùn)練并建立神經(jīng)網(wǎng)絡(luò),只有極少數(shù)的人類智能[38],不能狹義地認(rèn)為有AI領(lǐng)域就有最先進(jìn)的技術(shù)。AI這種進(jìn)步是用自下而上的方式來解釋它所感知到的信息和簡單任務(wù),但它們?nèi)狈Ω邔哟蔚摹⒆陨隙碌南到y(tǒng)知識,并且無法像人腦那樣建立關(guān)聯(lián)和自我分析判斷,因此AI仍處于起步階段。
首先,數(shù)據(jù)仍然是深度學(xué)習(xí)的最核心部分。研究指出,深度學(xué)習(xí)是基于輸入的數(shù)據(jù)或圖像(“喂數(shù)據(jù)”),然后自我學(xué)習(xí)并建立神經(jīng)網(wǎng)絡(luò)的算法模型。數(shù)據(jù)對于以深度學(xué)習(xí)為代表的學(xué)習(xí)模型至關(guān)重要[38]。其次,目前構(gòu)建的AI模型只適用于特定臨床范圍,一旦超出該范圍就會毫無作用。例如,根據(jù)主要來自黃種人的數(shù)據(jù)訓(xùn)練出的AI模型,對于白種族或少數(shù)族裔可能效果不佳,在美國訓(xùn)練的AI模型在亞洲可能效果不佳[39]。這種局限性很難讓某一種AI模型普遍適用于全球范圍內(nèi)。深度學(xué)習(xí)模型通??雌饋砀袷恰昂谙蛔印?,是端到端的學(xué)習(xí)設(shè)計,吸收數(shù)據(jù)并生成及輸出結(jié)論,并不能明確解釋其輸出結(jié)論的原理及過程。臨床醫(yī)生判斷息肉是否癌變時,常常根據(jù)結(jié)腸鏡檢查、病理檢查等一系列主要和次要標(biāo)準(zhǔn)。但是,AI僅僅給出一個結(jié)果,這不禁讓我們質(zhì)疑結(jié)論是否準(zhǔn)確[40]。
AI作為一門新興技術(shù),在結(jié)直腸癌診斷方面取得了令人驚喜的結(jié)果。雖然各國在數(shù)據(jù)方面都保持著比較謹(jǐn)慎的態(tài)度,但是可以料想在全球化進(jìn)程的發(fā)展,未來全球數(shù)據(jù)共享時,深度學(xué)習(xí)算法將可以運用全球數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),構(gòu)建出一種適用于全球患者的AI疾病預(yù)測模型。或者未來AI能夠直接突破目前AI模型的“模型偏差”的局限性,通過對最本質(zhì)的、最根本的特征構(gòu)建模型,并且對特征進(jìn)行定量化,解釋如何通過這個AI模型得出結(jié)果,解決目前“黑匣子”的困擾[28]。在AI技術(shù)不斷進(jìn)步的同時,我們應(yīng)該時刻謹(jǐn)記:AI僅僅只是一個工具,AI永遠(yuǎn)也不可能取代人類。AI作為一個工具只會與人類的聯(lián)系越來越緊密,在臨床實踐中,臨床醫(yī)師可以更好的使用AI這個工具,進(jìn)行疾病輔助診斷、制定治療方案及療效預(yù)測等,從繁忙的工作中將臨床醫(yī)師解放出來,更好的為患者服務(wù)。