石念峰,王榮勤,吳和燕綜述,夏正坤審校
IgA腎病(immunoglobulin A nephropathy,IgAN)是全球最常見的原發(fā)性腎小球疾病[1],也是導(dǎo)致終末期腎病(end-stage renal disease, ESRD)的常見原因[2-3]。由于缺乏特征的血清學(xué)表現(xiàn),腎活檢仍然是IgAN診斷的權(quán)威檢查手段,但由于其有創(chuàng)性,導(dǎo)致大部分患者在確診時(shí)已經(jīng)進(jìn)入ESRD。如何早期識(shí)別有進(jìn)展風(fēng)險(xiǎn)的患者將具有積極的現(xiàn)實(shí)意義。傳統(tǒng)模式下,臨床研究的數(shù)據(jù)統(tǒng)計(jì)、分析等環(huán)節(jié)需要耗費(fèi)大量人力、效率低。近年來,隨著機(jī)器學(xué)習(xí)技術(shù)的廣泛應(yīng)用,醫(yī)學(xué)研究者開始嘗試借助機(jī)器學(xué)習(xí)模型進(jìn)行IgAN的病理分析、早期檢測(cè)與診斷、預(yù)后預(yù)測(cè)、生存分析等[4]。本文就機(jī)器學(xué)習(xí)在IgAN中的應(yīng)用作一綜述,旨在為IgAN輔助診療提供最新的機(jī)器學(xué)習(xí)應(yīng)用參考。
機(jī)器學(xué)習(xí)是人工智能的一種研究方向,主要任務(wù)是從數(shù)據(jù)中自動(dòng)分析建立規(guī)律,并利用規(guī)律對(duì)未來數(shù)據(jù)或無(wú)法觀測(cè)的數(shù)據(jù)進(jìn)行預(yù)測(cè)[5-6]。機(jī)器學(xué)習(xí)和統(tǒng)計(jì)建模具有顯著差異。首先,兩者目的任務(wù)不同。機(jī)器學(xué)習(xí)主要任務(wù)是通過數(shù)據(jù)集學(xué)習(xí)建立可重復(fù)預(yù)測(cè)的模型,多用于解決預(yù)測(cè)問題[6];統(tǒng)計(jì)建模則是發(fā)現(xiàn)數(shù)據(jù)集中變量之間的關(guān)系以及這些關(guān)系的重要性,多用于推斷變量間的相關(guān)性或變量的未來值。由于是一種“端”到“端”的技術(shù),大多數(shù)機(jī)器學(xué)習(xí)算法預(yù)測(cè)結(jié)果缺乏可解釋性[5]。其次,機(jī)器學(xué)習(xí)和統(tǒng)計(jì)模型的有效性評(píng)估不同。前者需要借助測(cè)試集驗(yàn)證其準(zhǔn)確性,后者則使用置信區(qū)間、顯著性檢驗(yàn)等進(jìn)行評(píng)價(jià)。
醫(yī)學(xué)領(lǐng)域多采用統(tǒng)計(jì)建模方法進(jìn)行早期診療、預(yù)后評(píng)測(cè)和生存分析等研究[1,7-8]。吳和燕等[2]等利用Cox比例風(fēng)險(xiǎn)模型研究發(fā)現(xiàn),伴C1q沉積的兒童IgAN發(fā)生ESRD的風(fēng)險(xiǎn)是C1q陰性患兒的5.772倍,得出C1q沉積是兒童IgA腎預(yù)后不良的獨(dú)立危險(xiǎn)因素的結(jié)論。Barbour等[8]利用Cox比例風(fēng)險(xiǎn)模型對(duì)來自日本、中國(guó)、歐洲等3927名成年IgAN患者的病理分析,構(gòu)建一個(gè)適合多種族的、由估算腎小球?yàn)V過率(estimated glomerular filtration rate, eGFR)、活檢時(shí)平均動(dòng)脈壓(mean arterial blood pressure,MAP)和尿蛋白、MEST-C評(píng)分等構(gòu)成的IgAN終末事件風(fēng)險(xiǎn)預(yù)測(cè)模型,能夠準(zhǔn)確地預(yù)測(cè)成年IgAN患者進(jìn)入ESRD的概率。然而,考慮到IgAN終末事件和患者的年齡相關(guān),該風(fēng)險(xiǎn)預(yù)測(cè)模型是否適用于兒童IgAN患者還有待進(jìn)一步研究[7]。
隨著機(jī)器學(xué)習(xí)技術(shù),尤其是深度學(xué)習(xí)技術(shù),在計(jì)算機(jī)視覺、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域的出色表現(xiàn),機(jī)器學(xué)習(xí)模型已經(jīng)逐步被應(yīng)用到病理檢測(cè)[9]、預(yù)后評(píng)估[3,10]等醫(yī)學(xué)領(lǐng)域中。利用機(jī)器學(xué)習(xí)技術(shù),從臨床數(shù)據(jù)中提取新知識(shí)、定義預(yù)測(cè)模型,以支持檢測(cè)、診斷、預(yù)后和治療等,已成為醫(yī)學(xué)研究和臨床醫(yī)師的重要手段[4,11]。
IgA腎病發(fā)病隱匿,臨床表現(xiàn)不一,病理?yè)p傷類型多樣,早期診斷生物標(biāo)志物匱乏。因此,基于機(jī)器學(xué)習(xí)的IgA腎病診斷近年來逐漸成為一個(gè)研究熱點(diǎn)[1,12]。
2.1機(jī)器學(xué)習(xí)構(gòu)建模型優(yōu)化病理診斷腎病理與預(yù)后密切相關(guān),通過腎活檢中腎小球形狀識(shí)別,觀察腎形態(tài)演變,可預(yù)測(cè)IgA腎病患者發(fā)生ESRD的概率[13]。準(zhǔn)確的腎小球顯微醫(yī)學(xué)圖像分割和形態(tài)分析對(duì)于獲得可靠的疾病診斷非常重要。隨著機(jī)器學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network, CNN)在多視覺分類問題方面的成功應(yīng)用,醫(yī)學(xué)研究者開始嘗試?yán)脵C(jī)器學(xué)習(xí)的圖像分割和物體分類技術(shù),提高IgA腎病活檢病理診斷的準(zhǔn)確性和效率。
Han等[14]構(gòu)建了一個(gè)像素級(jí)標(biāo)記的腎小球顯微醫(yī)學(xué)圖像分割數(shù)據(jù)集,通過按比例縮小區(qū)域提議網(wǎng)絡(luò)中的錨點(diǎn)數(shù)量和增加Mask分支中的反卷積層數(shù),提高腎小球分割精度,實(shí)現(xiàn)了腎小球顯微醫(yī)學(xué)圖像的自動(dòng)分割。Lituiev等[15]訓(xùn)練了基于U-Net的深度卷積神經(jīng)網(wǎng)絡(luò),進(jìn)行腎數(shù)字化組織切片中的淋巴樣聚集物(LA)識(shí)別,95%置信區(qū)間的AUC達(dá)到97.78%±0.93%,IoU得分為69.72%±6.24%,顯著提高了腎活檢評(píng)估的準(zhǔn)確性和速度。Simon等[16]設(shè)計(jì)了一種支持向量機(jī)(support vector machine, SVM)和CNN融合的腎局部薄切片中腎小球定位和組織結(jié)構(gòu)識(shí)別方法,借助腎局部薄切片的局部二值模式圖像特征向量訓(xùn)練SVM模型,通SVM加速腎小球識(shí)別深度訓(xùn)練和特征集構(gòu)建,實(shí)施IgA腎活檢的腎組織病理診斷,將糖尿病性腎病小鼠模型的病理變化誤報(bào)率降低至3%以下。Ledbetter等[17]將每位IgAN患者的eGFR值被附加到CNN網(wǎng)絡(luò)的倒數(shù)第二層,通過eGFR進(jìn)行腎形態(tài)分類輔助CNN訓(xùn)練,預(yù)測(cè)IgAN患者的腎功能。實(shí)驗(yàn)表明,單獨(dú)添加初始eGFR將CNN訓(xùn)練時(shí)間減少2倍,網(wǎng)絡(luò)的驗(yàn)證誤差減少20%,提高了IgAN腎活檢的高分辨率數(shù)字病理的掃描效率。Chagas等[9]將CNN和SVM結(jié)合,訓(xùn)練了毛細(xì)血管內(nèi)膜和腎小球高細(xì)胞性兩種病變深度分類型,借助多任務(wù)分類實(shí)現(xiàn)腎組織切片病變掃描和篩選,進(jìn)而完成人類腎圖像中腎小球高細(xì)胞性的自動(dòng)檢測(cè),腎小球病變識(shí)別失敗率僅有4%。由此可見,通過機(jī)器學(xué)習(xí)構(gòu)建模型對(duì)于優(yōu)化病理圖像診斷具有極大的意義。
2.2無(wú)創(chuàng)性IgA腎病早診生物標(biāo)志物發(fā)現(xiàn)腎活檢是IgAN診斷的金標(biāo)準(zhǔn)[12]。然而,由于其具有創(chuàng)性,患者接受度較低,導(dǎo)致大部分患者在確診時(shí)已進(jìn)入ESRD。因此,醫(yī)學(xué)研究者在基于機(jī)器學(xué)習(xí)的無(wú)創(chuàng)性或微創(chuàng)性IgA腎病早診生物標(biāo)志物方面進(jìn)行了大量的研究[18]。
Agar等[19]收集了1979年1月至1989年7月期間在墨爾本Prince Henry's醫(yī)院進(jìn)行腎穿刺活檢的284名患者臨床及病理數(shù)據(jù),建立了小型腎病活檢數(shù)據(jù)庫(kù),采用DLG算法進(jìn)行腎病自動(dòng)診療,IgAN診斷準(zhǔn)確率可達(dá)81.26%。Agar據(jù)此認(rèn)為,如果建立大型腎病活檢數(shù)據(jù)庫(kù),采用機(jī)器學(xué)習(xí)技術(shù)可能會(huì)顯著提升腎小球疾病診斷的準(zhǔn)確率,甚至可能實(shí)現(xiàn)非侵入式診斷。Ruchika等[20]開發(fā)了一個(gè)基于規(guī)則的診斷決策支持系統(tǒng)DSS,利用決策樹算法實(shí)現(xiàn)腎小球疾病臨床自動(dòng)診斷。首先,將包括IgAN在內(nèi)的15種常見的腎小球疾病的標(biāo)準(zhǔn)臨床特征和病理學(xué)特征抽象成知識(shí)庫(kù);接著,依據(jù)29項(xiàng)臨床檢驗(yàn)指標(biāo),將每種腎小球疾病抽象為1個(gè)或多個(gè)特征矢量,利用決策樹算法通過特征矢量間的歐拉距離自動(dòng)預(yù)測(cè)疾病類型。對(duì)612名患者的實(shí)驗(yàn)表明,DSS能正確預(yù)測(cè)509例,占83.2%。Afshin等[21]收集了13名IgAN尿樣,利用LASSO、MCP和隨機(jī)森林作多變量分析等方法,對(duì)尿樣中的493種尿蛋白進(jìn)行研究,評(píng)估高維和低樣本量時(shí)生物標(biāo)志物對(duì)IgAN診斷的有效性。實(shí)驗(yàn)表明,LASSO、MCP和隨機(jī)森林分別僅顯示出7、3和5個(gè)生物標(biāo)志物作為IgAN腎病的有效因子,其中最有效的生物標(biāo)志物是LASSO中的細(xì)胞外硫酸酯酶Sulf-2(OR=0.28)和血清白蛋白(OR=2.66),MCP中的α1-抗胰蛋白酶(OR=73.7)。
在診斷時(shí)預(yù)測(cè)患者的IgAN長(zhǎng)期預(yù)后評(píng)估是IgAN診治主要困難之一。Junhyug等[22]收集了韓國(guó)首爾國(guó)立大學(xué)醫(yī)院腎內(nèi)科于1979年至2014年的1622位患者的17個(gè)臨床與病理指標(biāo)構(gòu)建數(shù)據(jù)集,將IgAN患者初步診斷后的十年內(nèi)是否進(jìn)展至ESRD變?yōu)榉诸悊栴},采用邏輯回歸、神經(jīng)網(wǎng)絡(luò)、決策樹、Boostings等6種機(jī)器學(xué)習(xí)算法分別建立了IgAN進(jìn)展預(yù)測(cè)模型,發(fā)現(xiàn)eGFR、腎小球硬化百分比和腎小球硬化癥強(qiáng)度等對(duì)IgAN預(yù)后影響較大。
Pesce等[23]開發(fā)一種臨床決策支持系統(tǒng)(CDSS),通過對(duì)1040例經(jīng)活檢證實(shí)的IgAN患者(意大利546人、挪威441人、日本53人)長(zhǎng)期隨訪,使用腎活檢時(shí)的可用臨床數(shù)據(jù)借助人工神經(jīng)網(wǎng)絡(luò)(ANN)對(duì)ESRD及其時(shí)間進(jìn)行定量風(fēng)險(xiǎn)評(píng)估。將性別、年齡、MEST分級(jí)、血清肌酐、24h蛋白尿量和高血壓等指標(biāo)作為ANN輸入?yún)?shù),首先預(yù)測(cè)ESRD的狀態(tài),然后預(yù)測(cè)達(dá)到ESRD的時(shí)間(≤3年、3~8年、>8年)。實(shí)驗(yàn)表明,ANN在ESRD預(yù)測(cè)(意大利、挪威和日本IgA腎病人群的AUC分別為89.95%、93.3%和100%)和時(shí)間選擇方面均表現(xiàn)出了很高的性能(來自意大利、挪威和日本IgAN患者的f測(cè)度分別為90.7%、90.7%和70.8%),可用于識(shí)別“高風(fēng)險(xiǎn)” IgAN患者。Han等[24]將人口統(tǒng)計(jì)學(xué)、臨床和病理等19個(gè)參數(shù)作為輸入?yún)?shù),分別使用邏輯回歸、隨機(jī)森林、SVM、決策樹等6種機(jī)器學(xué)習(xí)算法建立模型評(píng)估IgAN患者的ESRD風(fēng)險(xiǎn)。實(shí)驗(yàn)結(jié)果表明,隨機(jī)森林預(yù)測(cè)到ESRD的進(jìn)展性能最好(準(zhǔn)確度為93.97%,敏感性80.60%,和特異性95.27%)。Chen等[10]收集了自單個(gè)中心的1022名中國(guó)IgAN患者和來自18個(gè)腎臟中心的1025名IgAN患者的人口統(tǒng)計(jì)學(xué)、臨床和病理等36個(gè)參數(shù),采用XGBoost和Cox回歸模型,構(gòu)建了簡(jiǎn)化的評(píng)分標(biāo)準(zhǔn)模型(SSM),實(shí)現(xiàn)診斷性腎活檢后5年內(nèi)進(jìn)展為ESRD或eGFR降低50%的IgA腎病風(fēng)險(xiǎn)分層。Kaplan-Meier分析評(píng)估SSM獲得風(fēng)險(xiǎn)分層表明,C統(tǒng)計(jì)量為0.84(95%CI:0.80-0.88),風(fēng)險(xiǎn)分層顯著(P<0.001),據(jù)此發(fā)布了IgA腎病ESRD風(fēng)險(xiǎn)南京預(yù)測(cè)模型。Liu等[3]對(duì)2009年1月至2013年11月在湘雅市第二醫(yī)院接受活檢證實(shí)患有IgAN的262名患者的人口統(tǒng)計(jì)學(xué)和臨床病理數(shù)據(jù)進(jìn)行了回顧性分析,結(jié)合隨訪數(shù)據(jù)(中位隨訪時(shí)間為4.66年),利用隨機(jī)森林(RF)構(gòu)建模型預(yù)測(cè)IgA腎病患者的ESRD狀態(tài)。首先,使用性別、年齡、高血壓、血清肌酐、24h蛋白尿和MEST分級(jí)等6個(gè)預(yù)測(cè)指標(biāo)來訓(xùn)練初始RF模型(F測(cè)度為0.8,AUC為92.57%);接著,在6個(gè)預(yù)測(cè)指標(biāo)中添加Oxford-MEST分?jǐn)?shù)訓(xùn)練并改進(jìn)RF模型,發(fā)現(xiàn)改進(jìn)后的RF模型優(yōu)于初始RF模型(AUC為96.1%、F測(cè)度為0.823);最后,當(dāng)分別加入C3和eGFR后RF模型AUC分別提高到97.29%和95.45%。同時(shí),還觀察到通過額外尿酸、血紅蛋白和白蛋白均可改善RF模型的性能。
與腎病臨床醫(yī)學(xué)的預(yù)后評(píng)估、治療決策方法相比較,機(jī)器學(xué)習(xí)具有高敏感檢出、高維信息挖掘、高通量計(jì)算的能力,可提供更加豐富的診斷指標(biāo),輔助鑒別診斷、基因分析及預(yù)后判斷等[11],提高IgAN的預(yù)后評(píng)估、診斷治療質(zhì)量。然而,機(jī)器學(xué)習(xí)在IgAN中的應(yīng)用,還有很多工作需要醫(yī)學(xué)研究者去探索和認(rèn)識(shí)。一方面,基于機(jī)器學(xué)習(xí)的IgAN早期檢測(cè)、診斷、治療和預(yù)后研究還處于未成熟階段。另一方面,由于機(jī)器學(xué)習(xí)“端”到“端”的特性,導(dǎo)致IgA腎病診療和預(yù)測(cè)模型缺乏可解釋性,無(wú)法被廣泛臨床應(yīng)用。基于此,本文對(duì)機(jī)器學(xué)習(xí)在IgA腎病中應(yīng)用,提出幾點(diǎn)思考。
4.1多源數(shù)據(jù)融合的IgAN早診生物標(biāo)志物智能篩選IgA腎病早診生物標(biāo)志物發(fā)現(xiàn)研究基于小樣本數(shù)據(jù)集的較多,機(jī)器學(xué)習(xí)算法的輸入條件單一,主要以人口學(xué)指標(biāo)和特定的病理或臨床特征為主,如性別、年齡、MEST分級(jí)、血清肌酐、24h蛋白尿量、MEST分級(jí)等。未來,在IgA腎病早期發(fā)現(xiàn)、早診早治研究方面,應(yīng)結(jié)合醫(yī)院電子病歷及病理等系統(tǒng),實(shí)時(shí)采集臨床與檢驗(yàn)等數(shù)據(jù),從無(wú)癥狀患者檢查指標(biāo)中篩選出IgA腎病高危人群,跟蹤其疾病進(jìn)展,結(jié)合基因組學(xué)和蛋白質(zhì)組學(xué)等生物數(shù)據(jù),借助機(jī)器學(xué)習(xí)技術(shù)篩選并獲得可靠的IgA腎病早期預(yù)警標(biāo)志物。
4.2多算法融合優(yōu)化機(jī)器學(xué)習(xí)算法性能每種機(jī)器學(xué)習(xí)算法都有其局限性,單一分類器不能完全滿足IgA腎病診療,需要將多種算法有機(jī)結(jié)合起來、揚(yáng)長(zhǎng)避短,提高IgAN應(yīng)用中機(jī)器學(xué)習(xí)的魯棒性和臨床實(shí)用價(jià)值。
4.3結(jié)合醫(yī)學(xué)機(jī)理的IgAN機(jī)器學(xué)習(xí)模型構(gòu)建機(jī)器學(xué)習(xí)得到的算法模型多為缺乏臨床醫(yī)學(xué)解釋的深度模型。一方面由于模型無(wú)法與傳統(tǒng)的循證醫(yī)學(xué)證據(jù)進(jìn)行有效關(guān)聯(lián),缺少可信性[25];另一方面模型的行為缺乏透明性,研究者很難界定模型的遷移邊界和工作機(jī)制,無(wú)法遷移至其他疾病診療。因此,采用可視化、消融實(shí)驗(yàn)、注意力機(jī)制等基于結(jié)果的可解釋技術(shù),結(jié)合臨床醫(yī)學(xué)理論和實(shí)踐,設(shè)計(jì)可解釋的合理模型架構(gòu),可為IgAN臨床應(yīng)用提供更多可信賴的、可轉(zhuǎn)移的循證醫(yī)學(xué)證據(jù)。
4.4研究基于深度學(xué)習(xí)的IgAN臨床應(yīng)用基于深度學(xué)習(xí)的IgAN診療一直以來都是充滿挑戰(zhàn)的醫(yī)學(xué)研究領(lǐng)域,不僅在于IgAN隱匿、發(fā)病周期長(zhǎng),還在于IgAN發(fā)病機(jī)制不明、影響因素多。廣大醫(yī)學(xué)研究者們已經(jīng)做了大量的研究探索并模型設(shè)計(jì),但現(xiàn)有模型泛化能力有限,無(wú)法規(guī)?;糜谂R床實(shí)踐。構(gòu)建涵蓋多種族、大樣本數(shù)據(jù)集,開展基于深度學(xué)習(xí)的IgAN臨床應(yīng)用,是一個(gè)值得期待的研究領(lǐng)域。
基于機(jī)器學(xué)習(xí)的IgAN研究具有重要醫(yī)學(xué)和社會(huì)價(jià)值。本文從機(jī)器學(xué)習(xí)和統(tǒng)計(jì)建模的本質(zhì)區(qū)別入手,對(duì)機(jī)器學(xué)習(xí)在優(yōu)化病理診斷、無(wú)創(chuàng)性IgAN早診生物標(biāo)志物發(fā)現(xiàn)和IgAN進(jìn)展預(yù)測(cè)及預(yù)后評(píng)估等三個(gè)方面的最新應(yīng)用進(jìn)行了綜述,認(rèn)為基于機(jī)器學(xué)習(xí)的IgAN早期檢測(cè)、診斷、治療和預(yù)后研究還處于未成熟階段,并且機(jī)器學(xué)習(xí)在IgAN早診早治和ESRD進(jìn)展預(yù)測(cè)的應(yīng)用將是IgAN領(lǐng)域的研究熱點(diǎn)。將機(jī)器學(xué)習(xí)與醫(yī)院電子病歷及病理等系統(tǒng)集成,建立多算法融合、魯棒和可解釋的IgAN診療模型和臨床應(yīng)用,降低患者的ESRD發(fā)生概率,具有廣闊的應(yīng)用前景。