李靜雯 王令瓏 趙陽光 崔偉男
(1.中國信息通信研究院云計算與大數(shù)據(jù)研究所,北京 100191;2.香港理工大學,中國香港 100872)
由于人口老齡化現(xiàn)象加劇,加上現(xiàn)代社會人們用眼過度問題突出,有數(shù)據(jù)顯示,我國每年有近4 億患者飽受各類眼科疾病的困擾,白內(nèi)障患病人數(shù)高達2.5億甚至2.8 億,青光眼患者預計達到2 100 萬人,尤其老年人居多[1]。如此龐大的患病人群,如若不能得到及時治療,嚴重會導致殘疾,嚴重影響患者的生活質(zhì)量,同時給社會帶來沉重的醫(yī)療負擔。
與龐大的患者數(shù)量形成鮮明對比的是,基層眼科醫(yī)師數(shù)量較少,無法滿足全國各地患者需求。現(xiàn)階段,我國正從頂層設計層面改善醫(yī)療資源分配不均的問題。2022 年1 月,國家衛(wèi)生健康委員會發(fā)布了《“十四五”全國眼健康規(guī)劃(2021—2025 年)》,明確提出我國逐步建立并完善“國家—區(qū)域—省—市—縣”五級眼科醫(yī)療服務體系,強化二級以上綜合醫(yī)院眼科設置與建設,補齊眼科及其支撐學科短板。若能利用人工智能技術輔助眼科醫(yī)師進行疾病診斷,有助于基層醫(yī)療機構提高眼科疾病的篩查能力,有效緩解眼科醫(yī)療資源匱乏的現(xiàn)狀,實現(xiàn)醫(yī)療資源在基層醫(yī)療機構的全面覆蓋以及眼科疾病的早期干預,使患者及時得到有效治療。
人工智能(Artificial Intelligence,AI)是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)的一門新技術科學,其目標是像人一樣決策和行動。人工智能這一概念被提出后,歷經(jīng)數(shù)年的發(fā)展,已取得了卓越的研究成果。特別是深度學習被提出后,人工智能再次取得突破性進展,同時移動互聯(lián)網(wǎng)的發(fā)展也為人工智能帶來更多應用場景。如今人工智能已在多個領域嶄露頭角,能夠輔助或代替人類完成一些復雜的高精度工作。
機器學習是實現(xiàn)人工智能的重要途徑,也是最早發(fā)展起來的人工智能算法。與傳統(tǒng)的基于規(guī)則的算法不同,機器學習能夠通過計算模型和算法從大量數(shù)據(jù)中學習到規(guī)律和特征,自動學習如何獲得算法模型參數(shù)。根據(jù)數(shù)據(jù)形式(即數(shù)據(jù)是否有人工標注)不同,機器學習算法可以分為監(jiān)督學習、無監(jiān)督學習與強化學習三種。
監(jiān)督學習采用人工標注的數(shù)據(jù)進行訓練,是相對成熟的機器學習算法,常見算法有決策樹、支持向量機(Support Vector Machine,SVM)、神經(jīng)網(wǎng)絡等;無監(jiān)督學習能夠從未標注數(shù)據(jù)集中挖掘數(shù)據(jù)的分布或數(shù)據(jù)間的關系,常見的算法有 K 均值聚類(K-Means Clustering,K-Means)算法、主成分分析等;強化學習隨著深度學習和神經(jīng)網(wǎng)絡的發(fā)展而產(chǎn)生,介于監(jiān)督學習和無監(jiān)督學習兩者之間,是智能系統(tǒng)在與環(huán)境的連續(xù)互動中學習最優(yōu)行為策略的機器學習算法。
此外,深度學習是機器學習的技術分支之一,并且是一種深層的機器學習模型。深度學習通過搭建深層的人工神經(jīng)網(wǎng)絡來進行模型訓練,實現(xiàn)知識學習,常用于各種監(jiān)督模式識別問題,如圖像識別、自然語言識別等[2]。最常用的深度學習模型為多層神經(jīng)網(wǎng)絡,其“深度”體現(xiàn)在對特征的多次變換上。
機器學習在醫(yī)療領域的研究與應用越來越廣泛,機器學習模型通?;谀骋惶囟ㄈ蝿斩鴦?chuàng)建,如疾病預測、智能輔助診斷、疾病預后評估、新藥研發(fā)、健康管理等方面。機器學習能夠?qū)A酷t(yī)療數(shù)據(jù)進行分析進而得到醫(yī)療決策。例如,在疾病預測方面,通過分析大量患者的常規(guī)臨床數(shù)據(jù)并將其應用到機器學習算法上,可以預測諸如阿爾茨海默病、心血管病等疾病的患病風險;在智能輔助診斷方面,利用大量醫(yī)學影像數(shù)據(jù)訓練機器學習模型,實現(xiàn)病灶識別與標注、靶區(qū)自動勾畫、影像三維重建、生理信息定量計算等功能;在健康管理方面,智能可穿戴設備和移動健康應用有助于實現(xiàn)疾病早期診斷、個體化治療、疾病進展監(jiān)測與預測;在藥物研發(fā)方面,機器學習能夠輔助預測分子特征、生物活性、不良反應等,有效節(jié)約試驗成本,縮短藥物研發(fā)周期。
眼科疾病的診斷主要依靠眼底圖像。人工智能基于眼底圖像的診斷介入,對于糖尿病性視網(wǎng)膜病變、青光眼、黃斑變性等眼科疾病的診斷具有很高的敏感度和特異度,可以為醫(yī)生的圖像診斷結(jié)果提供參考依據(jù),有效提升疾病診斷(特別是早期診斷)的準確性,對患者的預后有著重要意義。尤其是對于基層醫(yī)療機構而言,人工智能可以有效緩解因醫(yī)療資源分配不均帶來的就醫(yī)難題。
例如,糖尿病視網(wǎng)膜病變(Diabetic Retinopathy,DR)是發(fā)病率極高的糖尿病并發(fā)癥?;颊叩奶悄虿〔〕淘介L,視網(wǎng)膜病變的病情越重;年齡越大,視網(wǎng)膜病變的患病幾率越高。但是,由于糖尿病視網(wǎng)膜病變的初期癥狀并不明顯,加之醫(yī)療條件受限以及患者對疾病的認知不足,很多患者常常忽略定期眼底檢查,當出現(xiàn)視力下降癥狀后才就診,進而導致患者的治療難度加大、花費增多、預后變差。而基于深度學習的糖尿病視網(wǎng)膜病變篩查方法則為這一疾病的早期發(fā)現(xiàn)提供了有效手段。2016 年,谷歌公司在《美國醫(yī)學協(xié)會雜志》發(fā)表了關于深度學習在DR 篩查中應用的論文。其中提出的深度學習算法,能夠通過視網(wǎng)膜照片判斷糖尿病視網(wǎng)膜病變的可能性,有助于醫(yī)生在資源有限的情況下篩選出更多的病人。本文將重點分析基于機器學習的眼科疾病輔助診斷應用情況。
數(shù)據(jù)和算法是機器學習的兩大重要組成部分,本章節(jié)將從數(shù)據(jù)和算法兩方面分析機器學習在眼科疾病輔助診斷中的應用情況。
現(xiàn)代眼科疾病的檢查結(jié)果多以圖像或數(shù)字形式呈現(xiàn),能夠準確客觀地記錄病情,為臨床診斷提供依據(jù),是人工智能輔助診斷系統(tǒng)研發(fā)的重要數(shù)據(jù)資源。目前,常用的眼科診斷方式有射線診斷(X 射線、電子計算機斷層掃描、磁共振成像等)、聲像診斷(B 超、彩色多普勒成像等)、眼底血管造影(熒光素眼底血管造影等)以及光像診斷(裂隙燈顯微鏡照相系統(tǒng)、角膜共焦顯微鏡等)。此外,以手機等遠程設備終端獲取高質(zhì)量眼部圖片,豐富了眼科圖像資源的獲取來源,使遠程醫(yī)療成為可能。
眼科疾病數(shù)據(jù)庫需要具備如下特點:數(shù)據(jù)量大且種類豐富;數(shù)據(jù)結(jié)構化、規(guī)范化。用于機器學習訓練的數(shù)據(jù)質(zhì)量越高,模型的準確性和泛化性越強,得到的智能輔助診斷系統(tǒng)越具備臨床使用價值。但現(xiàn)有的眼科數(shù)據(jù),往往存在標注數(shù)據(jù)量不足、數(shù)據(jù)種類和形式單一、數(shù)據(jù)質(zhì)量較低、缺乏統(tǒng)一標注標準等問題。
目前公開的眼科數(shù)據(jù)庫通常是為了項目或競賽而創(chuàng)建的,數(shù)據(jù)量較少、病種較單一,難以滿足臨床應用的需求。例如ANR-TECSAN-TELEOPHT 項目建立的E-Ophtha[3],由E-Ophtha-MA(包含381 張標注MA 的彩色眼底圖像)和E-Ophtha-EX(包含82 張標注EX 的彩色眼底圖像)兩個子集構成。美國電氣與電子工程師協(xié)會國際生物醫(yī)學影像研討會(ISBI-2018)舉辦“糖尿病視網(wǎng)膜病變:分割和分級挑戰(zhàn)”競賽時采用的數(shù)據(jù)集IDRID(Indian Diabetic Retinopathy Image Dataset),由597 張像素值為4 288×2 848 的彩色眼底圖像(JPEG 格式)組成[4]。
因此,建立一個高質(zhì)量的基于人工智能研究的眼科數(shù)據(jù)庫至關重要。數(shù)據(jù)庫的建立需注重數(shù)據(jù)采集和數(shù)據(jù)標注兩個環(huán)節(jié),數(shù)據(jù)庫可包含多種數(shù)據(jù)形式(圖像、文本等)和多病種(白內(nèi)障、青光眼等),區(qū)域性廣,并且標注人員經(jīng)過培訓,標注規(guī)范,可采用多專家標注并引入專家信任度等指標。同時,在數(shù)據(jù)庫的建設中,數(shù)據(jù)溯源、數(shù)據(jù)脫敏、數(shù)據(jù)審核等流程也應進一步規(guī)范,確保該數(shù)據(jù)庫的規(guī)范性和科學性。2020 年,在世界人工智能大會上,北京協(xié)和醫(yī)院眼科主任陳有信教授課題組發(fā)布了“糖尿病視網(wǎng)膜病變常規(guī)眼底彩色照相AI 標準數(shù)據(jù)庫”的建設成果,該數(shù)據(jù)庫包含來自全國14 個地區(qū)連續(xù)采集的真實世界數(shù)據(jù),涵蓋目前市場上主要眼底照相機型。經(jīng)倫理審查和清洗脫敏,篩選出1.5 萬張?zhí)悄虿』颊吆髽O部眼底彩照,由北京協(xié)和醫(yī)院眼科閱片團隊進行標注,通過內(nèi)部專家評審和國內(nèi)同行權威專家外部評審,建立包含15 000 張高質(zhì)量標注彩照的檢測數(shù)據(jù)庫[5]。數(shù)據(jù)庫按《深度學習輔助決策醫(yī)療器械軟件審評要點》構建,充分體現(xiàn)了“權威性、多樣性、科學性、封閉性、動態(tài)性、規(guī)范性”等特點。
目前用于眼科疾病輔助診斷系統(tǒng)的機器學習算法主要為監(jiān)督學習,通過帶有專家標注的眼科疾病數(shù)據(jù)進行模型訓練,獲得區(qū)分度大的特征用于疾病分類。被引入眼科疾病檢測的傳統(tǒng)機器學習算法中,常見算法有決策樹、支持向量機、K-Means 等。Odstrcilik[6]等采用馬爾可夫隨機場提取眼底圖像特征,支持向量回歸模型預測視網(wǎng)膜神經(jīng)纖維層厚度,實現(xiàn)青光眼的評估。Acharyar[7]等考慮到白內(nèi)障的病情嚴重程度與眼前段圖像模糊度成正比的現(xiàn)象,采用模糊K 均值算法和反向傳播算法對預處理后的140 張眼前段圖像進行特征提取并分類,其準確率、敏感度和特異度分別達到93.33%、98.00%和100.00%。Lin[8]等用隨機森林生成模型預測兒童近視進展,實現(xiàn)早期干預。
近年來,深度學習算法也被廣泛應用,卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)評估糖尿病患者的大型多種族群體的視網(wǎng)膜圖像時,具有高達93.8%的靈敏度和94.5%的特異度[9]。中山大學中山眼科中心建立的“CC-Cruiser 先天性白內(nèi)障人工智能平臺”(簡稱“CC-Cruiser”)通過裂隙燈圖像檢測先天性白內(nèi)障。該平臺自動裁剪相關區(qū)域并采用3 個獨立的CNN 網(wǎng)絡檢測是否存在白內(nèi)障,并進行分級和給出治療建議,CC-Cruiser 經(jīng)驗證已達到資深眼科專家的水平[10]。
現(xiàn)有眼科疾病輔助診斷系統(tǒng)多為單一病種的分類診斷,包括青光眼、白內(nèi)障、糖尿病視網(wǎng)膜病變、黃斑病變以及早產(chǎn)兒視網(wǎng)膜病變、弱視、先天性眼病(如先天性白內(nèi)障等)等小兒常見疾病。但眼科疾病種類繁多,臨床表現(xiàn)多樣,因此多病種的眼科輔助診斷系統(tǒng)是未來研發(fā)趨勢,其應用必將有效輔助臨床醫(yī)生提高診斷能力。2021 年底,北京協(xié)和醫(yī)院發(fā)布了眼科多病種輔助診斷AI 的臨床試驗結(jié)果。該系統(tǒng)能夠?qū)?3 種主要眼底疾病和數(shù)十種眼部病變進行識別提示和輔助診斷。臨床試驗結(jié)果顯示,視網(wǎng)膜色素變性的診斷靈敏度為100.00%,特異度為98.50%;視網(wǎng)膜脫離的診斷靈敏度為100.00%,特異度為98.72%;病理性近視的診斷靈敏度為100.00%,特異度為97.82%[11]。
此外,眼科疾病輔助診斷系統(tǒng)多以單一類型影像(如眼底彩照、裂隙燈照片等)作為模型的輸入。但在實際的臨床診斷中,醫(yī)生往往會同時參考不同類型、不同模態(tài)的影像樣本和其他疾病表征,進行綜合診斷。李錫榮[12]將多模態(tài)深度學習方式分為數(shù)據(jù)層融合、特征層融合和任務層融合。數(shù)據(jù)層將不同模態(tài)的樣本融合在一起,輸入神經(jīng)網(wǎng)絡等學習模型,這種范式要求不同模態(tài)的樣本之間具備較高的空間關聯(lián)性。特征層則是在各個模態(tài)的特征提取過程中實現(xiàn)融合,常見的融合算法有特征向量拼接、雙線性池化、張量融合等[13]。任務層直接將各個模態(tài)的預測結(jié)果進行融合。Wang[14]等分別從眼底照片和光學相干層析圖像中提取相關特征,之后在特征層將不同模態(tài)特征拼接起來,實現(xiàn)正常眼底/干性老年性黃斑變性(Age-related Macular Degeneration,AMD)/濕 性AMD 的三 分類。Xu[15]等也采用類似架構,解決了四分類問題(正常眼底/干性AMD/濕性AMD/息肉狀脈絡膜血管病變)。
眼科疾病輔助診斷系統(tǒng)作為醫(yī)療器械,需要接受嚴格的監(jiān)管,同時作為新興的人工智能醫(yī)療器械,其審批涉及產(chǎn)品劃分、算法評估、臨床評價、數(shù)據(jù)處理等多方面內(nèi)容,審批難度較大。監(jiān)管機構和醫(yī)院對數(shù)據(jù)的安全性和準確性問題還是較為謹慎。而且人工智能算法迭代速度快、算法多樣、算法可釋性差,特別是深度學習作為“黑盒算法”,僅反映輸出與輸入的相關性,很難關聯(lián)現(xiàn)有的醫(yī)學知識,算法更新難以保證人工智能醫(yī)療器械的安全性和有效性,快速迭代的特性也給監(jiān)管帶來很大困難。此外,其倫理規(guī)范、評價標準等建設工作尚處于起步階段。
因此,眼科疾病輔助診療類醫(yī)療器械監(jiān)管還需相關監(jiān)管機構依據(jù)產(chǎn)品的特點和功能采取分級分類監(jiān)管模式和寬嚴有別的監(jiān)督方式,將算法設計、開發(fā)、應用置于監(jiān)管機構、倫理委員會和社會公眾的共同監(jiān)督之下,創(chuàng)建完善的人工智能醫(yī)療器械產(chǎn)品主體責任體系。同時加強倫理制度建設,提升公眾的倫理意識。此外,考慮到當前眼科疾病數(shù)據(jù)缺乏現(xiàn)狀和數(shù)據(jù)安全問題,可搭建眼科疾病數(shù)據(jù)集和檢測公共服務平臺,研究制定包含質(zhì)控標準、測試規(guī)范、評價指標等內(nèi)容的測評數(shù)據(jù),實現(xiàn)對產(chǎn)品安全性、有效性的可靠評估。
基于機器學習的眼科疾病輔助診斷系統(tǒng)能夠輔助醫(yī)生進行眼科疾病診斷,通過技術手段有效緩解醫(yī)療資源分配不均、眼科醫(yī)師缺乏的現(xiàn)狀。作為與人工智能緊密結(jié)合的新技術,眼科疾病輔助診斷系統(tǒng)具備廣闊的應用前景。同時由于該診斷系統(tǒng)是一種新型醫(yī)療器械,應在技術推進的同時,加強相關標準、數(shù)據(jù)庫的創(chuàng)建,完善相關監(jiān)管政策,共同推動輔助診斷系統(tǒng)技術和產(chǎn)業(yè)的發(fā)展。