王士旭 柯巖 王貴齊
中國(guó)的胃癌發(fā)病率在男性及女性中分別居于第2、3 位,死亡率在男性和女性中分別居于第3、2 位[1],并給患者帶來(lái)了嚴(yán)重的健康威脅和沉重的經(jīng)濟(jì)負(fù)擔(dān)。上消化道癌的預(yù)后與分期密切相關(guān),早期胃癌內(nèi)鏡下切除5年生存率可超過(guò)90%,而進(jìn)展期胃癌患者5年生存率低于30%[2-3]。研究顯示,中國(guó)胃癌患者5年生存率僅為27.4%~35.1%[4],而同為胃癌高發(fā)地區(qū)的韓國(guó)和日本患者的5年生存率可高達(dá)64.6%和71.5%[5-6],其重要的原因是中國(guó)大多數(shù)初診患者已處于腫瘤進(jìn)展期,而國(guó)外得益于較高的早診早治率。中國(guó)醫(yī)科大學(xué)附屬第一醫(yī)院在遼寧省莊河市胃癌高發(fā)現(xiàn)場(chǎng)高危人群進(jìn)行連續(xù)15年大量行為干預(yù)和化學(xué)干預(yù)的綜合干預(yù)研究表明,干預(yù)組胃癌的死亡率(RR=0.570 6,P<0.05,AR=42.94%)和減壽率(RR=0.655 0,P<0.05,AR=34.44%)顯著低于對(duì)照組[7]。因此,上消化道癌的早診早治至關(guān)重要。
胃鏡檢查是上消化道腫瘤早發(fā)現(xiàn)、早治療的重要依據(jù),而高質(zhì)量的胃鏡檢查和規(guī)范化操作是其中的關(guān)鍵。有研究指出,在普通白光胃鏡檢查中,20%~40%的胃癌被漏診,質(zhì)量合格的胃鏡檢查是檢出胃癌的先決條件[8]。有報(bào)道,在早期上消化道腫瘤內(nèi)鏡診斷中,7.2%的早期胃癌被診斷為炎癥、潰瘍或可疑病變而造成漏診,其中73%來(lái)自于內(nèi)鏡醫(yī)師的疏忽或錯(cuò)誤診斷[9]。2016年歐洲胃腸內(nèi)鏡學(xué)會(huì)系統(tǒng)調(diào)查現(xiàn)有的證據(jù)并生成了基于此的“胃鏡檢查質(zhì)量改進(jìn)規(guī)范”[10],將胃部檢查分為10 個(gè)部位,提出在胃鏡檢查期間觀察到整個(gè)胃是保證胃鏡檢查完整性的前提。日本學(xué)者[11]在胃鏡檢查中提出了“SSS(systematic screening protocol for the stomach)”方案,建議胃部檢查應(yīng)包括正位和翻轉(zhuǎn)位在內(nèi)的至少22 個(gè)部位。但由于缺乏有效的質(zhì)量檢測(cè)和實(shí)時(shí)評(píng)價(jià)體系,胃鏡質(zhì)控指標(biāo)的執(zhí)行并不理想,實(shí)際操作中存在主觀和客觀兩方面的問(wèn)題。1)在主觀上,內(nèi)鏡醫(yī)師存在對(duì)病變及背景黏膜認(rèn)識(shí)不足或活檢位置不準(zhǔn)確,以及長(zhǎng)時(shí)間工作產(chǎn)生的視覺(jué)疲勞等[12];在技術(shù)層面,內(nèi)鏡醫(yī)師診斷水平差異較大,存在對(duì)上消化道解剖部位觀察不全的問(wèn)題[13]。2)在客觀上,上消化道早期癌與進(jìn)展期癌相比范圍較小,深度較淺,內(nèi)鏡下觀察隆起或凹陷等形態(tài)學(xué)表現(xiàn)不明顯,病變不易檢出,導(dǎo)致早期癌或癌前病變?cè)\斷困難、容易漏診[8]。以上問(wèn)題是影響上消化道診療質(zhì)量的重要因素。因此,建立一個(gè)切實(shí)可行、易于操作的方法來(lái)評(píng)估、監(jiān)測(cè)胃鏡檢查質(zhì)量是非常有必要的。
人工智能(artificial intelligence,AI)是計(jì)算機(jī)科學(xué)中的一個(gè)分支,是通過(guò)計(jì)算機(jī)的軟硬件來(lái)模擬和擴(kuò)展人類的智能行為。其學(xué)習(xí)方法可粗略的分為傳統(tǒng)學(xué)習(xí)方法和深度學(xué)習(xí)方法(圖1),傳統(tǒng)學(xué)習(xí)方法需要人工設(shè)計(jì)特征,深度學(xué)習(xí)方法可自主提取和學(xué)習(xí)特征[14]。AI 常用的算法包括最近鄰分類算法、隨機(jī)森林、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等[15]。人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)的設(shè)計(jì)靈感來(lái)自于人類大腦的生物學(xué)特性,尤其是神經(jīng)元之間的連接,利用幾個(gè)節(jié)點(diǎn)(對(duì)應(yīng)于人腦神經(jīng)元)連接在一起,根據(jù)這些節(jié)點(diǎn)的連接方式可以創(chuàng)建各種類型的網(wǎng)絡(luò)。深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)是一個(gè)在輸入層和輸出層之間隱藏了若干層的神經(jīng)網(wǎng)絡(luò),可應(yīng)用類似于人工神經(jīng)網(wǎng)絡(luò)更少的節(jié)點(diǎn)用復(fù)雜的數(shù)據(jù)來(lái)建模,適合大數(shù)據(jù)環(huán)境中的數(shù)據(jù)分析。循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)中隱藏層之間的結(jié)點(diǎn)相互連接,隱藏層的輸入包括輸入層的輸出和上一結(jié)點(diǎn)隱藏層的輸出,比較適合序列化的數(shù)據(jù)分析。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)是目前研究最多的一種深度神經(jīng)網(wǎng)絡(luò),包含多層感知器(人工神經(jīng)元),通過(guò)多個(gè)網(wǎng)絡(luò)層提取關(guān)鍵特征,在圖像處理上有突出表現(xiàn)[16-17]。目前基于CNN 的深度學(xué)習(xí)技術(shù)在皮膚癌、糖尿病視網(wǎng)膜病變等臨床圖像識(shí)別方面已有出色的表現(xiàn)[18]。
圖1 人工智能學(xué)習(xí)方法
近年來(lái),AI 在消化內(nèi)鏡領(lǐng)域也快速發(fā)展,在息肉檢出、HP 感染狀態(tài)評(píng)估、病變性質(zhì)鑒別及病變范圍評(píng)估等輔助診斷方面取得了豐碩成果,引起業(yè)內(nèi)廣泛關(guān)注[19]。AI 能夠?qū)?nèi)鏡圖像實(shí)時(shí)鑒別并準(zhǔn)確分類[20],這使其可作為“第三只眼”實(shí)時(shí)監(jiān)測(cè)內(nèi)鏡檢查質(zhì)量[21],成為質(zhì)量控制及規(guī)范化操作的客觀評(píng)價(jià)指標(biāo)。結(jié)合胃鏡檢查規(guī)范指南及上消化道內(nèi)鏡質(zhì)控指標(biāo),應(yīng)用AI 技術(shù)輔助監(jiān)測(cè)并提高上消化道內(nèi)鏡檢查質(zhì)量方面的研究無(wú)論是在AI 技術(shù)涉及的訓(xùn)練集設(shè)置、異常圖像識(shí)別、正常解剖部位判斷方面,還是在規(guī)范內(nèi)鏡醫(yī)師胃鏡操作的作用方面,較應(yīng)用AI 輔助單一病變識(shí)別的研究難度更大,與內(nèi)鏡醫(yī)生的關(guān)系更密切。相較于AI 針對(duì)單一病種單一指標(biāo)診斷準(zhǔn)確性的研究,AI 在上消化道規(guī)范化檢查及質(zhì)控中作用的研究雖然數(shù)量上不及前者,但其在規(guī)范化檢查及質(zhì)控中的作用不容小覷,為提高規(guī)范化操作水平、減少盲區(qū)、提高病變檢出率提供了可能解決途徑,也為內(nèi)鏡質(zhì)量控制的監(jiān)管提供可能的管理機(jī)制。本文就AI 在上消化道規(guī)范化檢查及質(zhì)控方面的應(yīng)用及發(fā)展進(jìn)行闡述總結(jié)。
黏膜可視化是內(nèi)鏡檢查識(shí)別病變的基礎(chǔ),用AI軟件來(lái)評(píng)估和改善上消化道黏膜暴露的質(zhì)量是AI 發(fā)展的方向之一,也是提高胃鏡檢查質(zhì)量的重要步驟[22]。國(guó)內(nèi)研發(fā)的“內(nèi)鏡AI 助手”可以準(zhǔn)確判斷是否進(jìn)行了碘染色或電子染色等,自動(dòng)為胃黏膜清潔度打分,可充分的評(píng)估胃黏膜顯示的質(zhì)量,并實(shí)時(shí)提醒內(nèi)鏡醫(yī)師對(duì)所觀察到的黏液和泡沫進(jìn)行沖洗,提高胃鏡檢查質(zhì)量從而提高上消化道早期癌的篩查率[23]。目前AI 在上消化道黏膜暴露情況監(jiān)測(cè)的研究較少,大多是集中在腸道準(zhǔn)備質(zhì)控上,Zhou 等[24]的研究顯示,AI 評(píng)估腸道準(zhǔn)備的準(zhǔn)確率為99.33%,優(yōu)于臨床內(nèi)鏡醫(yī)師,顯示AI 消化道準(zhǔn)備評(píng)估系統(tǒng)可穩(wěn)定可靠的應(yīng)用于臨床。
Kawamura 等[25]研究顯示,胃鏡檢查時(shí)間與病變檢出率之間具有顯著性相關(guān),該研究納入55 786 人次胃鏡檢查,其中15 763 人次為初次檢查胃鏡,以胃鏡檢查時(shí)間5、7 min 為截點(diǎn)將20 位內(nèi)鏡醫(yī)師分為3 組。檢查時(shí)間小于<5 min、5~7 min 腫瘤檢出率分別為0.57%、0.97%(P<0.05),當(dāng)檢查時(shí)間>7 min 時(shí)腫瘤檢出率相對(duì)于5~7 min 并無(wú)明顯提高(0.94%),由此可見(jiàn)充足的檢查時(shí)間是上消化道腫瘤檢出率的重要質(zhì)控指標(biāo)。歐洲胃腸內(nèi)鏡學(xué)會(huì)胃鏡檢查規(guī)范推薦對(duì)于首次行胃鏡檢查和隨訪時(shí)胃鏡檢查的時(shí)間均≥7 min,而對(duì)于Barrett 食管的檢查時(shí)間≥1 min/cm[10]。胃鏡檢查時(shí)間顯著影響胃鏡檢查質(zhì)量,部分醫(yī)師內(nèi)鏡觀察時(shí)間不夠,造成不能完整的觀察胃的各個(gè)解剖部位,或因速度過(guò)快而影響病變的觀察,從而導(dǎo)致病變檢出率減低。在實(shí)際操作中,也可能存在內(nèi)鏡醫(yī)師剛開(kāi)始操作速度快,為了操作時(shí)間達(dá)標(biāo)后續(xù)操作速度減慢的情況,從而導(dǎo)致前部分檢查不充分、后部分造成不必要的時(shí)間浪費(fèi)。Gong 等[26]研究顯示,AI 可以通過(guò)對(duì)動(dòng)態(tài)的分幀數(shù)識(shí)別記錄進(jìn)鏡或退鏡的某個(gè)微小區(qū)段的觀察時(shí)間進(jìn)而計(jì)算出實(shí)時(shí)觀察速度。這種實(shí)時(shí)觀察速度相較于傳統(tǒng)的整體觀察時(shí)間能更精準(zhǔn)的反應(yīng)內(nèi)鏡的觀察質(zhì)量,更具臨床意義。
在胃鏡檢查期間觀察到下咽、食管、胃到十二指腸上消化道所有解剖部位是檢查完整性的先決條件,部位識(shí)別是AI 評(píng)估胃鏡檢查完整性的前提。Takiyama 等[20]進(jìn)行的單中心研究將上消化道內(nèi)鏡靜態(tài)白光圖片分為喉、食管、胃和十二指腸,其中胃又分為上部、中部和下部,不包含出血、氣泡、模糊、散光等低質(zhì)量圖片,排除因腫物遮擋或過(guò)于局部而無(wú)法進(jìn)行部位識(shí)別的圖片,共納入27 335 張圖片。然后對(duì)其進(jìn)行0~359°的隨機(jī)旋轉(zhuǎn),以此構(gòu)成上消化道7 個(gè)部位的訓(xùn)練集,通過(guò)深度學(xué)習(xí)構(gòu)建基于CNN 的部位識(shí)別系統(tǒng),然后用17 081 張靜態(tài)白光圖片驗(yàn)證其部位識(shí)別能力。結(jié)果顯示CNN 系統(tǒng)自動(dòng)識(shí)別上消化道各個(gè)解剖部位的整體準(zhǔn)確性為97%,識(shí)別喉、食管、胃和十二指腸的敏感性和特異性分別為93.9%和100%、95.8%和99.7%、98.9% 和93.0%、87.0% 和99.2%,識(shí)別胃的上、中、下部的敏感性和特異性分別為96.9%和98.5%、95.9% 和98.0%、96.0% 和98.8%。該研究同時(shí)用包含低質(zhì)量圖片的訓(xùn)練集進(jìn)行訓(xùn)練,發(fā)現(xiàn)與不包含低質(zhì)量圖片時(shí)CNN 系統(tǒng)在部位識(shí)別準(zhǔn)確性上相似。然而該研究的局限性在于納入的是靜態(tài)圖片,對(duì)靜態(tài)圖片的部位評(píng)估并不能反應(yīng)AI 在實(shí)時(shí)狀態(tài)下的檢測(cè)性能。
國(guó)內(nèi)學(xué)者研發(fā)的“ENDOANGEL”系統(tǒng)采用24 54 9 張上消化道靜態(tài)白光和NBI 圖片基于CNN 進(jìn)行2次訓(xùn)練,第一次按10 部位分法將其分為食管、食管胃結(jié)合部、胃竇、十二指腸球部、十二指腸降部、胃體下部、胃體中部、胃底、胃體中部翻轉(zhuǎn)位和胃角,第二次在“SSS”方案的基礎(chǔ)上增加了食管、食管胃結(jié)合部、十二指腸球部和十二指腸降部4 個(gè)部位構(gòu)成上消化道26 部位。然后用該部位識(shí)別系統(tǒng)對(duì)170 張靜態(tài)圖片進(jìn)行驗(yàn)證,其識(shí)別上消化道10 部位及26 個(gè)部位的準(zhǔn)確性分別為90% 和65.88%,與高年資內(nèi)鏡醫(yī)師(90.22% 和63.76%)的水平近似[27],可以看出隨著部位的細(xì)分,AI 診斷系統(tǒng)的識(shí)別準(zhǔn)確性明顯下降,但仍然可以達(dá)到高年資內(nèi)鏡醫(yī)師水平。該研究的局限性是納入驗(yàn)證的數(shù)據(jù)集太少,可能存在一定的偏倚,優(yōu)點(diǎn)是該AI 輔助診斷系統(tǒng)可記錄和監(jiān)測(cè)胃鏡觀察到的部位,給內(nèi)鏡醫(yī)師反饋出可能存在的檢查盲區(qū),從而避免部位遺漏,降低漏診率,提高胃鏡檢查質(zhì)量。該研究在前期工作的基礎(chǔ)上,應(yīng)用動(dòng)態(tài)實(shí)時(shí)監(jiān)測(cè)驗(yàn)證“ENDOANGEL”系統(tǒng)在降低胃鏡檢查盲區(qū)的性能,將437 例患者隨機(jī)分為3 組,分別為常規(guī)胃鏡檢查組、超細(xì)胃鏡檢查組及無(wú)痛胃鏡檢查組,然后每組再分為AI 輔助和無(wú)AI 輔助2 個(gè)亞組。該研究結(jié)果顯示,有AI 輔助的無(wú)痛胃鏡組盲區(qū)率明顯低于AI 輔助的超細(xì)胃鏡檢查組和AI 輔助的常規(guī)胃鏡檢查組(3.42%vs.21.77%vs.31.23%,P<0.05);在所有的有AI 輔助亞組中的盲區(qū)率均低于無(wú)AI 輔助的亞組(無(wú)痛組:3.42%vs.22.46,P<0.001;超細(xì)組:21.77%vs.29.92%,P<0.001;常規(guī)組:31.23%vs.42.46%,P<0.001)[28]??傊?,AI 系統(tǒng)在部位識(shí)別、降低胃鏡檢查盲區(qū)、提高胃鏡檢查質(zhì)量上的廣闊的應(yīng)用前景,但因其訓(xùn)練和驗(yàn)證的圖片均來(lái)自單中心,其臨床適用性還需擴(kuò)大規(guī)模進(jìn)行驗(yàn)證。
胃鏡檢查過(guò)程中需要內(nèi)鏡醫(yī)師實(shí)時(shí)采圖,存在著采集部位不全面甚至可疑病變部位圖像漏采等問(wèn)題。有報(bào)道表明,在一個(gè)常規(guī)屏幕中,多達(dá)5%的視場(chǎng)會(huì)受到偽影等不同程度的影響,圖片采集質(zhì)量也會(huì)因此下降,通過(guò)AI 可實(shí)現(xiàn)自動(dòng)化的圖像分析,然后對(duì)圖像進(jìn)行高質(zhì)量的篩選[29]。Wu 等[30]的一項(xiàng)單中心RCT 研究開(kāi)發(fā)了用AI 系統(tǒng)自動(dòng)提取胃鏡檢查過(guò)程中圖像的功能,該研究納入324 例患者隨機(jī)分成兩組進(jìn)行實(shí)時(shí)胃鏡檢查,根據(jù)胃鏡26 個(gè)部位對(duì)比AI 系統(tǒng)自動(dòng)采圖和內(nèi)鏡醫(yī)師采圖的完整度,結(jié)果顯示前者自動(dòng)提取圖像的完整性顯著高于內(nèi)鏡醫(yī)師組(90.64%vs.79.14%,P<0.001),內(nèi)鏡醫(yī)師在AI 輔助下采集圖像完整度也能得到顯著提高(92.91%vs.79.14%,P<0.001)。該研究同時(shí)也評(píng)價(jià)了AI 系統(tǒng)的盲點(diǎn)監(jiān)測(cè)率,其盲點(diǎn)監(jiān)測(cè)準(zhǔn)確性為90.02%,在臨床操作中可以起到實(shí)時(shí)質(zhì)量監(jiān)控和自動(dòng)生成圖像的作用。在中國(guó),在胃癌中約有68%的大?。? cm 的病灶位于胃小彎側(cè),主要是胃底與胃竇處[31],在該研究中內(nèi)鏡醫(yī)師組在這兩個(gè)部位的遺漏率分別為40.67% 和19.33%,而在AI 輔助下這兩個(gè)部位的遺漏率下降到了20% 和4%。這也表明AI 在胃鏡檢查過(guò)程中可以實(shí)時(shí)分析胃鏡圖像并自動(dòng)準(zhǔn)確地提取和儲(chǔ)存各個(gè)部位圖像,輔助內(nèi)鏡醫(yī)師提高胃鏡檢查的完整性、減少盲區(qū)。另外,出于質(zhì)量控制的目的由質(zhì)控專家檢查所有圖片質(zhì)量有一定主觀性而且工作效率低下,AI 可以輔助對(duì)內(nèi)鏡圖像及進(jìn)行質(zhì)量評(píng)估并給出修改意見(jiàn)。國(guó)內(nèi)研發(fā)的“智能消化內(nèi)鏡質(zhì)量控制系統(tǒng)”可以自動(dòng)采集高清圖片并提供結(jié)構(gòu)化的報(bào)告模板,實(shí)時(shí)生成內(nèi)鏡質(zhì)控報(bào)表,對(duì)內(nèi)鏡圖像和報(bào)告有針對(duì)的進(jìn)行督導(dǎo)改進(jìn),進(jìn)而提高圖文報(bào)告合格率[23]。
目前AI 技術(shù)在上消化道內(nèi)鏡質(zhì)控方面推廣應(yīng)用還存在很多不足:1)構(gòu)建高質(zhì)量的AI 輔助系統(tǒng)是上消化道內(nèi)鏡質(zhì)控的關(guān)鍵基礎(chǔ)和首要前提,雖然中國(guó)已在建立AI 體系質(zhì)量控制方面形成初步共識(shí)[32],但AI輔助胃鏡質(zhì)控方面的研究較少且納入均為單中心研究,數(shù)據(jù)數(shù)量及種類偏少、數(shù)據(jù)質(zhì)量及標(biāo)注質(zhì)量參差不齊,與共識(shí)仍存在較大差距。2)AI 在上消化道檢查時(shí)間控制、降低檢查盲區(qū)、提高胃鏡檢查完整性方面剛剛起步,涉及的質(zhì)控指標(biāo)還不完善,如檢查前的患者準(zhǔn)備、檢查中不良反應(yīng)的監(jiān)測(cè)及圖文報(bào)告符合率等,有待在今后的實(shí)踐中逐漸完善。3)AI 輔助系統(tǒng)有望在實(shí)時(shí)操作中降低檢查盲區(qū)比例,促進(jìn)規(guī)范化操作,但能否因此提高病變檢出率甚至降低疾病死亡率尚缺乏研究數(shù)據(jù)支持。4)AI 輔助診斷及質(zhì)控過(guò)程中的醫(yī)療責(zé)任尚不明確,可能出現(xiàn)遺漏甚至錯(cuò)誤,在AI 投入應(yīng)用進(jìn)入臨床前,須進(jìn)一步明確責(zé)任機(jī)制。
上消化道內(nèi)鏡的質(zhì)量控制中質(zhì)控指標(biāo)繁多,尚缺乏有效的監(jiān)管和制約。雖然AI 在上消化道早期癌內(nèi)鏡的質(zhì)控中剛剛起步,但其在部位識(shí)別、監(jiān)測(cè)檢查時(shí)間、減少胃鏡檢查盲區(qū)方面已有了初步的成果,也為胃鏡檢查質(zhì)量的監(jiān)管提供可能。隨著AI 算法的不斷完善及進(jìn)步,AI 輔助質(zhì)控系統(tǒng)的逐步應(yīng)用及推廣,內(nèi)鏡檢查質(zhì)量也將不斷提高,最終會(huì)成為內(nèi)鏡同質(zhì)化診療的重要輔助手段。