陳亮輝,李 婷
食管癌是上消化道主要的惡性腫瘤之一。2018年食管癌發(fā)病率在全球惡性腫瘤中位居第七位,是所有癌癥死亡的第六大原因[1],多數(shù)患者就診時(shí)已達(dá)到癌癥中晚期[2]。早期食管癌及癌前病變?cè)趦?nèi)鏡下治療可以達(dá)到90%以上的治愈率[3],改善患者的預(yù)后。然而,內(nèi)鏡醫(yī)師的臨床經(jīng)驗(yàn)、專(zhuān)業(yè)水平以及病變大小等因素限制了早期食管癌內(nèi)鏡下的檢出率[4-7]。人工智能(artificial intelligence,AI)與消化內(nèi)鏡成像技術(shù)結(jié)合后,可以對(duì)大量?jī)?nèi)鏡圖像進(jìn)行學(xué)習(xí)、訓(xùn)練,分析內(nèi)鏡圖像與疾病診斷之間的關(guān)聯(lián),從而達(dá)到模仿人類(lèi)認(rèn)知的水平,幫助醫(yī)師完成快速、精準(zhǔn)的診斷。Babu P等[8]的一項(xiàng)系統(tǒng)性評(píng)價(jià)表明,運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)算法(convolution neural networks,CNN)的人工智能輔助診斷食管癌的合并準(zhǔn)確率為87.2%,敏感性為87.1%,特異性為87.3%。
本文綜述近幾年人工智能在評(píng)估食管癌前病變和食管腫瘤方面的研究文獻(xiàn),重點(diǎn)探討了AI在評(píng)估不同類(lèi)型內(nèi)鏡圖像上的應(yīng)用,以及他們的優(yōu)缺點(diǎn),以期為醫(yī)生和計(jì)算機(jī)之間的協(xié)作以及這項(xiàng)技術(shù)在臨床實(shí)踐中的應(yīng)用提供參考。
1.1 輔助識(shí)別巴雷特食管異型增生和早期食管腺癌
巴雷特食管(Barrett’s esophagus,BE)是食管腺癌最重要的危險(xiǎn)因素之一,80%的食管腺癌發(fā)生在BE基礎(chǔ)上[9],所以BE的篩查和診斷非常重要。BE黏膜的癌變是一個(gè)逐步發(fā)展的過(guò)程,然而對(duì)于普通內(nèi)鏡醫(yī)師來(lái)說(shuō),評(píng)估所有發(fā)展過(guò)程的病變,即區(qū)分無(wú)異型增生BE、低級(jí)別/高級(jí)別異型增生BE和早期腺癌,可能非常困難[10]。內(nèi)鏡醫(yī)師對(duì)BE早期異常識(shí)別的水平存在差異,病檢取材部位陽(yáng)性率低,導(dǎo)致漏診時(shí)有發(fā)生[11]。
此外,通過(guò)早期檢測(cè)適合內(nèi)鏡下治療的BE及早期食管腺癌,患者的預(yù)后可能會(huì)從根本上得到改善。目前已經(jīng)發(fā)展出很多種先進(jìn)的內(nèi)鏡技術(shù),如放大內(nèi)鏡、電子染色內(nèi)鏡、色素內(nèi)鏡、共聚焦激光顯微內(nèi)鏡、容積式激光內(nèi)鏡等,但大多數(shù)都是昂貴且耗時(shí)的,需要有一個(gè)很長(zhǎng)的學(xué)習(xí)過(guò)程,一些技術(shù)只有專(zhuān)家和熟練的內(nèi)鏡醫(yī)師才能使用[12]。因此,人工智能將為早期食管癌的檢查提供一個(gè)很好的輔助工具。
1.1.1 在白光內(nèi)鏡和窄帶成像中的應(yīng)用
高清晰白光內(nèi)鏡(white-light endoscopy,WLE)是初步識(shí)別BE異型增生的最佳選擇[13],人工智能可以提高普通內(nèi)鏡醫(yī)師對(duì)BE異型增生的診斷準(zhǔn)確性。de Groof等[14]開(kāi)發(fā)了能夠滿(mǎn)足臨床實(shí)時(shí)應(yīng)用的深度學(xué)習(xí)輔助診斷系統(tǒng),該AI 系統(tǒng)使用1 704例BE異型增生和非異型增生患者的高清WLE圖像進(jìn)行訓(xùn)練后,區(qū)分圖像為BE腫瘤和非異型增生的準(zhǔn)確率為89%,敏感性為90%,特異性為88%,其診斷的準(zhǔn)確率高于普通內(nèi)鏡醫(yī)師,同時(shí)可標(biāo)注腫瘤活檢的最佳位置,標(biāo)注結(jié)果與內(nèi)鏡專(zhuān)家有很好的一致性。因此,使用AI輔助內(nèi)鏡診斷可幫助較低年資內(nèi)鏡醫(yī)師識(shí)別 BE早期瘤變,并協(xié)助他們定位活檢部位。van der Sommen等[15]構(gòu)建了一個(gè)通過(guò)對(duì)病變部位顏色和紋理特征進(jìn)行學(xué)習(xí)的計(jì)算機(jī)輔助診斷系統(tǒng),其診斷早期腫瘤病變的敏感性和特異性均為83%。Ebigbo等[16]研發(fā)了一種基于深度學(xué)習(xí)的計(jì)算機(jī)輔助診斷系統(tǒng),在兩個(gè)WLE圖像數(shù)據(jù)集中測(cè)試,其診斷早期食管腺癌的敏感性/特異性分別為97%/88%和92%/100%,在窄帶成像(narrow-band imaging,NBI)數(shù)據(jù)集中的敏感性/特異性為94%/80%,該系統(tǒng)還顯示了病變定位能力,與內(nèi)鏡專(zhuān)家分析結(jié)果的面積符合率達(dá)到72%。然而,以上研究存在一個(gè)相同的問(wèn)題,即訓(xùn)練階段和驗(yàn)證階段使用的圖像數(shù)據(jù)集是相同的。
Hashimoto的研究組建立了一個(gè)AI系統(tǒng),用916張BE腫瘤(高度異型增生/T1腫瘤)WLE/NBI圖像和919張正常BE圖像進(jìn)行預(yù)先訓(xùn)練,隨后以“異型增生”或“非異型增生”的二分類(lèi)進(jìn)行微調(diào)[17]。該AI系統(tǒng)驗(yàn)證階段使用了另外458張測(cè)試圖像,其檢測(cè)出早期腫瘤的準(zhǔn)確率為95.4%,敏感性和特異性為96.4% 和94.2%,能夠以較高的精度(平均精度為0.7533)定位異型增生區(qū)域。
de Groof等[18]前瞻性收集了40例異型增生BE和20例非異型增生BE患者的白光內(nèi)鏡圖像作為訓(xùn)練數(shù)據(jù)集。由內(nèi)窺鏡專(zhuān)家對(duì)腫瘤圖像進(jìn)行勾畫(huà),將至少4個(gè)圈定區(qū)域的重疊區(qū)定義為“最佳點(diǎn)”。他們開(kāi)發(fā)的模型通過(guò)對(duì)BE圖像顏色和紋理特征的訓(xùn)練,從最佳點(diǎn)中提取正面特征,從非異型增生圖像中提取負(fù)面特征。該系統(tǒng)對(duì)腫瘤檢測(cè)的準(zhǔn)確性可達(dá)92%,敏感性、特異性為95%和85%。
1.1.2 在容積式激光顯微內(nèi)鏡中的應(yīng)用
容積式激光顯微內(nèi)窺鏡(volumetric laser endomicroscopy,VLE)是使用光學(xué)相干斷層掃描產(chǎn)生實(shí)時(shí)顯微橫截面的成像技術(shù),它能對(duì)食管壁層深達(dá)3 mm處的病變進(jìn)行識(shí)別。內(nèi)鏡醫(yī)師必須對(duì)大量復(fù)雜的圖像信息進(jìn)行分析,人工智能輔助則有助于對(duì)病變的快速識(shí)別。Swager等[19]使用60張VLE圖像對(duì)他們的輔助診斷系統(tǒng)進(jìn)行交叉驗(yàn)證,其檢測(cè)早期腫瘤性病變的敏感性為90%,特異性為93%。隨后,該小組又評(píng)估了采用多幀VLE圖像人工智能對(duì)早期腫瘤病變自動(dòng)識(shí)別的可行性,用3 060幀VLE圖像對(duì)多幀人工智能診斷系統(tǒng)進(jìn)行測(cè)試,與采用單幀圖像的相比,多幀圖像診斷系統(tǒng)有更高的曲線下面積(P<0.001),AUC中位數(shù)為0.91,圖像分析總用時(shí)為3.9 s[20]。
1.1.3 在內(nèi)鏡實(shí)時(shí)診斷中的應(yīng)用
早前的大多數(shù)研究都是通過(guò)使用高質(zhì)量、靜態(tài)的內(nèi)鏡圖像來(lái)實(shí)現(xiàn)的,這可能不能準(zhǔn)確地反映臨床實(shí)踐的真實(shí)情況。Seghal等[21]收集了非異型增生和異型增生BE患者的高清內(nèi)鏡視頻,使用了嵌入視頻處理器的實(shí)時(shí)圖像映射技術(shù)的軟件算法,以?xún)?nèi)鏡專(zhuān)家對(duì)圖像的評(píng)估構(gòu)成系統(tǒng)的決策樹(shù),結(jié)果模型的準(zhǔn)確率提高到92%,靈敏度和特異度分別為97%和88%。隨后,非專(zhuān)家人員使用該決策樹(shù),在訓(xùn)練前后解讀了相同的視頻。在經(jīng)過(guò)正式訓(xùn)練后,非專(zhuān)家組發(fā)現(xiàn)異型增生的準(zhǔn)確率明顯提高,敏感性從71%提高到83%。Ebigbo等[22]開(kāi)發(fā)了一個(gè)能實(shí)現(xiàn)圖像快速分析和概率預(yù)測(cè)人工智能診斷系統(tǒng),并依據(jù)癌癥發(fā)生的概率呈現(xiàn)彩色密度分布圖。該系統(tǒng)從實(shí)時(shí)內(nèi)鏡影像中隨機(jī)提取圖像,檢測(cè)早期食管腺癌的敏感性為83.7%,特異性為100.0%,準(zhǔn)確率為89.9%。
1.2 輔助識(shí)別早期食管鱗狀細(xì)胞癌
我國(guó)食管癌以食管鱗狀細(xì)胞癌(esophageal squamous cell carcinoma,ESCC)為主要亞型,占食管癌的90%以上,5 a總生存率<20%。因此,食管鱗癌及癌前病變的早期診斷對(duì)提高患者治療效果和預(yù)后至關(guān)重要[23]。內(nèi)鏡檢查為食管癌及癌前病變篩查的常規(guī)手段,人工智能在有效提高內(nèi)鏡篩查的靈敏度與診斷的準(zhǔn)確率上能起到積極作用。
1.2.1 在白光內(nèi)鏡和窄帶成像中的應(yīng)用
Guo L等[24]開(kāi)發(fā)了一個(gè)輔助食管癌診斷的人工智能系統(tǒng),可實(shí)時(shí)對(duì)早期食管鱗癌和癌前病變進(jìn)行自動(dòng)識(shí)別。該系統(tǒng)使用6 473張癌前病變、早期食管鱗癌和非癌性病變的NBI圖像進(jìn)行訓(xùn)練,并使用內(nèi)鏡圖像和視頻數(shù)據(jù)集進(jìn)行了驗(yàn)證。該系統(tǒng)為每個(gè)圖像生成一個(gè)概率熱圖,黃色表示癌變的可能性很高,藍(lán)色表示非癌性病變。該系統(tǒng)對(duì)1 480張癌變NBI圖像的敏感性為98.04%,對(duì)5 191張非癌性NBI圖像敏感性為95.03%,曲線下面積為0.989。在27個(gè)非放大視頻中,每幀的靈敏度為60.8%,每病變的靈敏度為100%。對(duì)于20個(gè)放大視頻,每幀的敏感度為96.1%,每病變的敏感度為100%。對(duì)于正常食管影像(包括33段影像),每幀特異性為99.9%,每例特異性為90.9%。在識(shí)別內(nèi)窺鏡圖像和視頻數(shù)據(jù)集中的癌前病變和早期食管鱗癌上有很高的靈敏性和特異性,該系統(tǒng)在內(nèi)窺鏡輔助診斷上有廣闊的應(yīng)用前景。
日本的Ohmori研究小組開(kāi)發(fā)了一個(gè)用于檢測(cè)和鑒別淺表食管鱗癌的系統(tǒng)[25]。訓(xùn)練數(shù)據(jù)集包含非放大和放大的正常食管病變及淺表食管鱗癌圖像,驗(yàn)證數(shù)據(jù)集由另外135名患者的內(nèi)鏡圖像構(gòu)成。該AI系統(tǒng)在非放大NBI圖像的敏感性、特異性和準(zhǔn)確性分別為100%、63%和77%;在放大內(nèi)鏡圖像組的敏感性、特異性、準(zhǔn)確性分別為98%、56%和77%,診斷性能優(yōu)于經(jīng)驗(yàn)豐富的內(nèi)鏡醫(yī)師。Cai等[26]開(kāi)發(fā)了一個(gè)使用深層神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)的計(jì)算機(jī)輔助診斷系統(tǒng),可在普通白光內(nèi)鏡成像下定位并識(shí)別早期食管鱗癌,訓(xùn)練和驗(yàn)證過(guò)程采用不同的圖像數(shù)據(jù)集,結(jié)果該系統(tǒng)的敏感性、特異性和準(zhǔn)確率分別為97.8%、85.4%和91.4%,正預(yù)測(cè)值和負(fù)預(yù)測(cè)值為86.4%和97.6%,優(yōu)于低年資內(nèi)鏡醫(yī)師,且具有實(shí)時(shí)病灶標(biāo)注提示功能,幫助內(nèi)鏡醫(yī)師檢測(cè)出之前忽略的病變。AI 對(duì)提高低年資內(nèi)鏡醫(yī)師識(shí)別早期食管癌的能力具有較高的價(jià)值。由Horie等[27]開(kāi)發(fā)的運(yùn)用CNN的人工智能系統(tǒng)檢測(cè)食管癌的靈敏度達(dá)到98%,并能夠檢測(cè)出所有<10 mm的食管癌病變。區(qū)分淺表或晚期食管癌的準(zhǔn)確率達(dá)到了98%,對(duì)食管鱗狀細(xì)胞癌和食管腺癌的診斷準(zhǔn)確率分別為99%和 90%。這些結(jié)果證明了人工智能能夠快速分析大量的內(nèi)窺鏡圖像,從而在將來(lái)的臨床實(shí)踐中提高對(duì)早期食管癌檢測(cè)的能力。
1.2.2 在內(nèi)窺鏡系統(tǒng)中的應(yīng)用
內(nèi)窺鏡系統(tǒng)是一種通過(guò)活體染色對(duì)食管上皮細(xì)胞進(jìn)行實(shí)時(shí)評(píng)估的放大內(nèi)鏡技術(shù)。內(nèi)鏡醫(yī)師可以清楚地觀察到食管黏膜上皮細(xì)胞,達(dá)到與病理診斷相似的效果[28]。但是,內(nèi)窺鏡醫(yī)生若想獨(dú)立地完成實(shí)時(shí)檢測(cè),需要具備堅(jiān)實(shí)的病理學(xué)基礎(chǔ),這顯然是不實(shí)用的。因此,人工智能可輔助其虛擬實(shí)現(xiàn)組織病理學(xué)的診斷。Kumagai等[29]應(yīng)用深度學(xué)習(xí)技術(shù)探索一種用內(nèi)鏡檢查取代組織活檢的人工智能,該系統(tǒng)對(duì)55例患者(27例ESCC和28例非腫瘤病變)中的1 520張經(jīng)染色的圖像進(jìn)行測(cè)試,人工智能在27例鱗狀細(xì)胞癌中正確診斷了25例,敏感性為92.6%;28個(gè)非癌性病變中有25個(gè)被診斷為非惡性,特異性為89.3%,總體準(zhǔn)確性為90.9%。
1.3 AI在預(yù)測(cè)食管癌浸潤(rùn)深度和分型中的應(yīng)用
內(nèi)鏡下治療比外科食管癌根治術(shù)的并發(fā)癥少,所以推薦M1或M2期食管癌為內(nèi)鏡下治療的絕對(duì)適應(yīng)證[23]。因此,準(zhǔn)確地識(shí)別浸潤(rùn)深度對(duì)于避免過(guò)度治療,從而提高術(shù)后生活質(zhì)量是至關(guān)重要的。近年來(lái),人們發(fā)現(xiàn)食管鱗狀上皮內(nèi)乳頭狀毛細(xì)血管袢(Intra-epithelial papillary capillary loop,IPCL)在內(nèi)窺鏡下的形態(tài)學(xué)改變與腫瘤浸潤(rùn)深度相關(guān)[29]。根據(jù)日本食管學(xué)會(huì)提出的基于放大內(nèi)鏡的IPCL分型法,不同的IPCL分型代表不同的病變和浸潤(rùn)深度,然而分類(lèi)仍然需要內(nèi)鏡醫(yī)師有足夠的經(jīng)驗(yàn)。因此,運(yùn)用AI技術(shù)輔助診斷將提供一個(gè)更有效、更客觀的解決方案。
日本Tokai等[30]評(píng)估了AI系統(tǒng)測(cè)量食管鱗癌浸潤(rùn)深度的能力。作者收集了1 751個(gè)ESCC圖像和浸潤(rùn)深度信息,以此來(lái)訓(xùn)練他們開(kāi)發(fā)的運(yùn)用CNN的人工智能診斷系統(tǒng)。隨后,該診斷系統(tǒng)和13名內(nèi)鏡專(zhuān)家審查了55例患者的291張測(cè)試圖像,其診斷ESCC的準(zhǔn)確率為95.5%,預(yù)測(cè)浸潤(rùn)深度的準(zhǔn)確率為80.9%,靈敏度為84.1%。該系統(tǒng)對(duì)ESCC浸潤(rùn)深度的診斷準(zhǔn)確性高于內(nèi)鏡專(zhuān)家,可作為ESCC評(píng)估的輔助工具。Everson研究小組開(kāi)發(fā)了一種能夠?qū)?nèi)鏡圖像中腫瘤或非腫瘤形態(tài)實(shí)時(shí)分類(lèi)的AI系統(tǒng)[31]。采用CNN技術(shù),通過(guò)使用17例患者的7 046張放大NBI圖像進(jìn)行訓(xùn)練,正常的IPCL被分為A型,異常者分為B1-3型,對(duì)IPCL形態(tài)的正常/異常分類(lèi)準(zhǔn)確率為93.7%,敏感性為89.3%,特異性為98%。該系統(tǒng)以實(shí)時(shí)方式運(yùn)行,診斷預(yù)測(cè)時(shí)間在26.17 ms 到37.48 ms 之間。然而,目前所開(kāi)發(fā)的模型還不能對(duì)所有的特定亞型進(jìn)行分類(lèi)。
人工智能技術(shù)與內(nèi)鏡檢查相結(jié)合,通過(guò)算法在大量的內(nèi)鏡圖像或視頻中進(jìn)行訓(xùn)練,可以達(dá)到專(zhuān)家級(jí)別的診斷水平,有效減少食管癌及癌前病變的漏診,實(shí)現(xiàn)快速、準(zhǔn)確的診斷[32]。人工智能技術(shù)將會(huì)為醫(yī)療資源缺乏、水平欠佳的地區(qū)獲得頂尖醫(yī)療技術(shù)提供一個(gè)很好的途徑,并惠及當(dāng)?shù)孛癖?,?shí)現(xiàn)優(yōu)質(zhì)醫(yī)療資源的共享。AI輔助診斷系統(tǒng)可作為醫(yī)師完成內(nèi)鏡下準(zhǔn)確診斷的重要輔助手段,同時(shí)也為未來(lái)培訓(xùn)低年資內(nèi)鏡醫(yī)師提供了一個(gè)有效的工具。
盡管AI在輔助腫瘤診斷領(lǐng)域取得了一定成果,但在向臨床實(shí)踐轉(zhuǎn)化的道路上仍面臨諸多挑戰(zhàn)[10,33]。首先,大多數(shù)研究通常只收集高質(zhì)量的內(nèi)鏡圖像構(gòu)成訓(xùn)練數(shù)據(jù)集,而病變部位被黏液、膽汁覆蓋的低質(zhì)量圖像被排除。這種做法可能會(huì)導(dǎo)致模型的過(guò)度擬合[34-35],從而夸大了AI系統(tǒng)診斷的準(zhǔn)確度。其次,因?yàn)榇蠖鄨D像數(shù)據(jù)集是回顧性的,病變部位有比較典型的特征,而更多的非典型病變則可以用來(lái)改善AI模型的性能。人工智能模型應(yīng)該通過(guò)使用完全獨(dú)立的訓(xùn)練數(shù)據(jù)集和測(cè)試集進(jìn)行評(píng)估,以反映系統(tǒng)的實(shí)際性能[36]。AI在收集使用患者數(shù)據(jù)時(shí),應(yīng)遵守倫理道德和相關(guān)法律,避免泄露患者隱私,研究人員應(yīng)開(kāi)發(fā)以達(dá)到患者最佳服務(wù)滿(mǎn)意度為中心的AI診療技術(shù)。
未來(lái)AI診斷系統(tǒng)能否代替內(nèi)鏡醫(yī)師做出診斷,尚需在未來(lái)繼續(xù)檢驗(yàn)。但可以肯定的是,AI可以協(xié)助內(nèi)鏡醫(yī)師完成食管癌的診療工作,減輕醫(yī)師的臨床工作量,同時(shí)緩解醫(yī)療資源分布的不均衡。目前,已有基于人工智能的三類(lèi)醫(yī)療器械獲得我國(guó)藥品監(jiān)督管理局的審批,這些產(chǎn)品可以幫助醫(yī)生完成復(fù)雜的醫(yī)學(xué)判斷,協(xié)助其作出診斷。隨著研究的不斷深入,相信人工智能技術(shù)也將在食管癌篩查、診斷和治療等臨床實(shí)踐中得到逐步應(yīng)用。