馬菲妍,張彩霞,冬雪川
(1.河北醫(yī)科大學(xué)第二醫(yī)院, 河北 石家莊 050005;2.深圳市新產(chǎn)業(yè)眼科新技術(shù)有限公司,廣東 深圳 518055)
糖尿病視網(wǎng)膜病變(DR)是糖尿病患者常見的眼部并發(fā)癥,在中國(guó)總?cè)丝谥蠨R的患病率為1.14%,在糖尿病患者人群中患病率為18.45%[1],DR能造成視力不可逆的損傷,是工作年齡人群?jiǎn)适б暳Φ闹饕?。而DR的早期預(yù)防、定期檢查、早期診斷并及時(shí)給予有效治療對(duì)延緩病變進(jìn)展、減少視力喪失至關(guān)重要。多光譜成像技術(shù)是一種新型的眼底成像技術(shù)[2],它可以利用各種波長(zhǎng)不同的單色LED光源,分別投射入眼底不同深度[3],采集基于不同組織及病理產(chǎn)物吸收光譜的差異形成的圖像,可以更清晰地觀察包括糖尿病視網(wǎng)膜病變?cè)趦?nèi)的各類疾病體征。人工智能(AI)尤其是深度學(xué)習(xí)算法近年在醫(yī)療健康、自動(dòng)駕駛、游戲競(jìng)技、網(wǎng)絡(luò)安全等領(lǐng)域展現(xiàn)了巨大的潛力,并開始應(yīng)用在實(shí)際場(chǎng)景[4-11],尤其是在糖尿病視網(wǎng)膜病的自動(dòng)檢測(cè)中體現(xiàn)了一定的價(jià)值[12-15]。但深度學(xué)習(xí)通常需要大量人工標(biāo)注的樣本數(shù)據(jù),給軟件的開發(fā)帶來相當(dāng)?shù)睦щy。多光譜眼底圖像通過多種光譜,多種通道和維度展現(xiàn)疾病的特征,有望降低樣本量要求,節(jié)約開發(fā)資源,并進(jìn)一步提升智能診斷的敏感性和特異性。本研究中筆者通過對(duì)比基于多光譜眼底成像開發(fā)的AI系統(tǒng)和傳統(tǒng)醫(yī)師對(duì)糖尿病視網(wǎng)膜病變的診斷一致性,以評(píng)估AI的實(shí)際診斷能力。
1.1一般資料:收集自2018年4月~2018年10月期間于河北醫(yī)科大學(xué)第二醫(yī)院眼科門診就診的200例糖尿病患者的右眼多光譜系列圖像(RHA2020多光譜眼底成像系統(tǒng),ANNIDIS corporation,加拿大),波長(zhǎng)范圍包括550 nm、580 nm、590 nm、620 nm、660 nm、690 nm、740 nm、760 nm、780 nm、810 nm、850 nm,全部圖像均在免散瞳條件下拍攝,以黃斑中心凹為中心,成像范圍43°,見圖1。本研究符合赫爾辛基宣言,并由河北醫(yī)科大學(xué)第二醫(yī)院倫理委員會(huì)審核通過。
圖1 多光譜眼底成像所獲得的各波長(zhǎng)圖片以及擬合而成的功能圖
納入標(biāo)準(zhǔn):年齡≥18歲;已經(jīng)過詳細(xì)的內(nèi)分泌檢查確診為2型糖尿?。粺o角膜瘢痕、晶狀體混濁等影響眼底拍攝的屈光介質(zhì)異常;圖像對(duì)焦清晰,無異常偽影;亮度均勻,可明顯分辨血管和視盤等主要眼部結(jié)構(gòu)。排除標(biāo)準(zhǔn):圖像明顯分辨率不足或其他圖像拍攝異常;病歷資料不完整。
1.2方法
1.2.1閱片者分組:依據(jù)閱片方式的不同將閱片者分為四組:①采用AI系統(tǒng)閱片定義為AI組;②由3名具有5年以上眼底照片和眼底檢查經(jīng)驗(yàn)的眼科醫(yī)師組成的高年資眼科醫(yī)師組;③由3名具有5年以下眼底照片和眼底檢查經(jīng)驗(yàn)的眼科醫(yī)師組成的低年資眼科醫(yī)師組;④由3名無既往眼科檢查經(jīng)驗(yàn),在本研究開始前經(jīng)過系統(tǒng)閱片培訓(xùn)的內(nèi)分泌醫(yī)生組成的內(nèi)分泌醫(yī)師組。
1.2.2多光譜眼底圖像的標(biāo)注:均采用分級(jí)標(biāo)注,共四級(jí):①無微血管瘤或出血點(diǎn);②1個(gè)象限存在微血管瘤或出血點(diǎn);③1~3個(gè)象限存在微血管瘤或出血點(diǎn);④4個(gè)象限均可見微血管瘤。底圖像均由2位資深眼底專家獨(dú)立診斷并意見一致時(shí)為確定診斷,意見不一致時(shí)交由第3名眼底專家閱片,定標(biāo)一致的結(jié)果作為閱片標(biāo)注的參考標(biāo)準(zhǔn)。
1.2.3閱片的方法:AI組和全部醫(yī)師組均對(duì)所有眼底圖像進(jìn)行閱片。AI組由研究人員將圖像輸入軟件系統(tǒng)進(jìn)行閱片,并保留自動(dòng)診斷的結(jié)果;醫(yī)師組均通過RHA自帶的電腦系統(tǒng)和閱片軟件對(duì)多光譜眼底圖像進(jìn)行閱片,保留閱片結(jié)果。同時(shí)記錄AI和醫(yī)師組單張閱片時(shí)間和總耗時(shí)。
1.3統(tǒng)計(jì)學(xué)方法:采用SPSSAU20.0進(jìn)行統(tǒng)計(jì)學(xué)軟件處理數(shù)據(jù)。不同閱片者的閱片結(jié)果和參考標(biāo)準(zhǔn)的比較采用加權(quán)Kappa系數(shù)進(jìn)行評(píng)價(jià),AI組和醫(yī)師組的比較以Kendall系數(shù)進(jìn)行評(píng)價(jià)。AI系統(tǒng)和各醫(yī)師組的單張平均閱片時(shí)間比較采用重復(fù)測(cè)量方差Bonferroni法分析,根據(jù)球形度檢驗(yàn)結(jié)果選擇Greenhouse-Geisser校正結(jié)果,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1閱片結(jié)果的一致性比較:高年資眼科醫(yī)師組、低年資眼科醫(yī)師組、內(nèi)分泌醫(yī)師組共9位醫(yī)師的閱片結(jié)果與參考標(biāo)準(zhǔn)相比較的加權(quán)Kappa系數(shù)見表1。各組間相比,AI組和高年資眼科醫(yī)師組的Kendall協(xié)調(diào)系數(shù)為0.957,差異有統(tǒng)計(jì)學(xué)意義(P<0.01),診斷水平接近;AI組與低年資眼科醫(yī)師組和內(nèi)分泌醫(yī)師組相比,差異有統(tǒng)計(jì)學(xué)意義(P<0.01),內(nèi)分泌醫(yī)師組和低年資眼科醫(yī)師組協(xié)調(diào)系數(shù)依次低于AI組和高年資眼科醫(yī)師組,但差異無顯著統(tǒng)計(jì)學(xué)意義(P>0.05)。見表2。
表1 不同閱片者對(duì)多光譜DR眼底圖像標(biāo)注一致性的比較
2.2閱片速度的比較:AI組、高年資眼科醫(yī)師組、低年資眼科醫(yī)師組、內(nèi)分泌醫(yī)師組的平均閱片時(shí)間分別為(1.48±0.27)s,(14.92±3.26)s,(15.56±3.24)s,(40.13±6.59)s。見圖2。各組平均閱片時(shí)間的差異具有統(tǒng)計(jì)學(xué)意義(F=3220.879,P<0.01)。各組間比較,AI組的閱片時(shí)間明顯少于各醫(yī)師組,高年資眼科醫(yī)師組和低年資眼科醫(yī)師組少于內(nèi)分泌醫(yī)師組,而高年資眼科醫(yī)師組和低年資眼科醫(yī)師組之間差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。見表3。
表2 不同閱片組對(duì)多光譜DR眼底圖像標(biāo)注一致性的比較(n=200)
圖2 人工智能系統(tǒng)及不同級(jí)別醫(yī)師單張平均閱片時(shí)間的比較
表3 不同閱片組對(duì)多光譜DR眼底圖像標(biāo)注時(shí)間的比較
DR根據(jù)組織病理學(xué)和嚴(yán)重程度主要分為非增生性糖尿病視網(wǎng)膜病變(NPDR)和增生性糖尿病視網(wǎng)膜病變(PDR),NPDR最早期可識(shí)別的眼底表現(xiàn)則是視網(wǎng)膜微血管瘤[16]。微血管瘤的出現(xiàn)通常不會(huì)引發(fā)明顯的臨床癥狀,但微血管瘤的存在代表已存在組織結(jié)構(gòu)損傷。在流行病學(xué)研究和臨床試驗(yàn)中發(fā)現(xiàn),微血管瘤數(shù)會(huì)隨著DR的發(fā)展而增加,可預(yù)測(cè)從NPDR轉(zhuǎn)變?yōu)镻DR和黃斑水腫的進(jìn)展[17-20]。微血管瘤的存在和嚴(yán)重性已經(jīng)被可靠的用于評(píng)估DR的嚴(yán)重性和進(jìn)展風(fēng)險(xiǎn)。
傳統(tǒng)眼底照相和眼底鏡采用可見光波進(jìn)行眼底觀察,由于可見光拍攝過程中不同光譜信息存在干擾,微血管瘤的信噪比明顯降低,容易造成微小病灶的遺漏,不利于對(duì)疾病的觀察,容易忽視早期糖尿病視網(wǎng)膜病變。
熒光素眼底血管造影比眼底照片可更早和更多地發(fā)現(xiàn)微動(dòng)脈瘤,明確區(qū)分動(dòng)脈瘤與出血點(diǎn)[21-23]。但因其為有創(chuàng)檢查,且檢查時(shí)需要應(yīng)用造影劑,可能會(huì)對(duì)有嚴(yán)重腎功能損傷的患者造成負(fù)擔(dān),并存在引起嚴(yán)重過敏性休克反應(yīng)的風(fēng)險(xiǎn),所以一般在糖尿病視網(wǎng)膜病變的篩查階段并不被采用。
多光譜成像技術(shù)是一種新型的眼底成像技術(shù),利用波長(zhǎng)不同的單色LED光源,分別投射入眼底不同深度,采集基于不同組織及病理產(chǎn)物吸收光譜的差異形成的圖像,可以清晰地將視網(wǎng)膜、脈絡(luò)膜分層顯示在不同的照片上,以冠狀面圖像方式呈現(xiàn)。對(duì)疾病代謝物質(zhì)可用敏感波長(zhǎng)進(jìn)行重點(diǎn)觀察,因此能靈敏地發(fā)現(xiàn)疾病異常。該檢查快速便捷且無創(chuàng),無需散瞳,可適用于早期篩查多種眼底疾病[24-28]。
Li等[29]以FFA作為參照標(biāo)準(zhǔn),將常規(guī)眼底照相和多光譜成像對(duì)比,認(rèn)為在DR的早期篩查中多光譜成像對(duì)于微動(dòng)脈瘤的檢測(cè)要比常規(guī)眼底照相更為敏感、可信,且形態(tài)上與FFA保持高度的吻合,尤其在580 nm波長(zhǎng)的圖像。而Kerry等[30]則發(fā)現(xiàn)多光譜相對(duì)眼底彩照,甚至能夠探及糖尿病前期的微血管瘤。此外也有其他眾多的研究證明了多光譜成像在DR疾病診斷領(lǐng)域的價(jià)值[31-32],因此對(duì)于DR的早期篩查,MSI相比傳統(tǒng)彩照有更明顯的優(yōu)勢(shì)。但多光譜也有其局限性,包括圖像張數(shù)多,閱片時(shí)間長(zhǎng),學(xué)習(xí)曲線長(zhǎng)等。
AI 是計(jì)算機(jī)科學(xué)、控制論、信息論、神經(jīng)生理學(xué)、心理學(xué)、語(yǔ)言學(xué)等多種學(xué)科互相滲透而發(fā)展起來的一門綜合性學(xué)科,其通過制造智能機(jī)器或智能系統(tǒng),模擬或延伸人類智能活動(dòng)能力。深度學(xué)習(xí)算法具有自動(dòng)特征提取功能,可基于有標(biāo)注的樣本自行學(xué)習(xí)并抓取圖片中的特征,最后輸出自行分類的結(jié)果。保證深度學(xué)習(xí)準(zhǔn)確度高的前提之一,是樣本在人工標(biāo)注階段被盡可能正確地標(biāo)注分類。高質(zhì)量的大樣本標(biāo)注可使深度學(xué)習(xí)算法自動(dòng)特征提取的優(yōu)勢(shì)得到充分發(fā)揮,對(duì)病變識(shí)別與分類的準(zhǔn)確度更高,與人工標(biāo)注一致性更好。但在臨床和實(shí)際人工智能的開發(fā)中,大樣本的獲取往往有現(xiàn)實(shí)上的困難。多光譜人工智能采用多光譜、多通道進(jìn)行開發(fā),針對(duì)敏感體征的波長(zhǎng)所呈現(xiàn)的對(duì)比度更容易被AI所提取,因此在準(zhǔn)確性和樣本量的節(jié)約方面有著明顯的優(yōu)勢(shì)。
本研究對(duì)比了多光譜人工智能閱片系統(tǒng)和醫(yī)師閱片的準(zhǔn)確性及一致性。人工智能展現(xiàn)了和高年資眼科醫(yī)師基本等同的閱片能力,甚至略高于低年資眼科醫(yī)師和內(nèi)分泌醫(yī)師。由于本研究主要比對(duì)不同閱片組對(duì)微血管瘤/出血點(diǎn)的識(shí)別力,而本體征識(shí)別難度低,相對(duì)常見,易于醫(yī)師學(xué)習(xí)和掌握,因此低年資眼科醫(yī)師組和內(nèi)分泌醫(yī)師組的準(zhǔn)確性雖略低于AI和高年資眼科醫(yī)師組,但差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。但AI 閱片克服了不同醫(yī)師的知識(shí)構(gòu)成不同、標(biāo)注時(shí)的心理狀態(tài)與精力存在差異以及隨著時(shí)間推移帶來的記憶力和理解力的改變等主觀差異的影響,顯然更適合疾病篩查場(chǎng)景[33]。
本研究同時(shí)比較了AI和各閱片醫(yī)師組的閱片時(shí)長(zhǎng),AI總體領(lǐng)先于醫(yī)師組,這是由計(jì)算機(jī)的運(yùn)算特征所決定的,與AI 系統(tǒng)的運(yùn)行速度,計(jì)算機(jī)硬件配置、處理系統(tǒng)、 AI 算法的復(fù)雜程度及圖形處理器的部署等因素有關(guān)。研究中,高年資眼科醫(yī)師和低年資眼科醫(yī)師的閱片時(shí)間接近,是因?yàn)楸倔w征的識(shí)別是眼科醫(yī)生的基本診斷工作,在難度上基本沒有明顯的差異。但內(nèi)分泌組醫(yī)師的閱片時(shí)間明顯延長(zhǎng),這是因?yàn)槠鋵?duì)眼專科疾病的相關(guān)知識(shí)了解較淺,缺乏對(duì)眼底病變?cè)\斷的經(jīng)驗(yàn),且對(duì)病變的病理基礎(chǔ)認(rèn)識(shí)不足而不能適應(yīng)閱片工作,結(jié)合其在診斷準(zhǔn)確性上的不足,本類AI的開發(fā)可能更適合全科醫(yī)生的使用。
本研究的局限性在于未考慮多種多光譜成像系統(tǒng)采集圖像識(shí)別的通用和兼容性能,同時(shí)也僅對(duì)微血管瘤/出血點(diǎn)單一體征進(jìn)行識(shí)別,而AI軟件尚需要進(jìn)一步完善。未來,需要在此方向進(jìn)行多中心和多層級(jí)的臨床研究驗(yàn)證。
綜上所述,糖尿病視網(wǎng)膜病的疾病診斷對(duì)于全科醫(yī)師和年輕醫(yī)師閱片標(biāo)注的難度大,學(xué)習(xí)曲線長(zhǎng)。通過人工智能和多光譜眼底成像技術(shù)的結(jié)合能夠提升閱片質(zhì)量和閱片速度,降低開發(fā)難度,有利于不同資質(zhì)的醫(yī)師,尤其是全科醫(yī)師和年輕醫(yī)師快速掌握本病的診斷和篩查。