潘云菲 胡夢(mèng)杰 趙費(fèi)敏 任菁菁
據(jù)世界衛(wèi)生組織保守估計(jì),2010年全球范圍內(nèi)肌少癥患者超過5 000萬,預(yù)計(jì)2050年患病人數(shù)將高達(dá)5億[1]。數(shù)據(jù)顯示,≥65歲人群中有近1/3患肌少癥,患病率為14%~33%;≥80歲人群患病率則高達(dá)50%~60%[2]。肌少癥導(dǎo)致身體活動(dòng)能力低下,生活質(zhì)量降低[3]。循證醫(yī)學(xué)證據(jù)顯示,肌少癥是老年人群跌倒、抑郁等疾病的重要危險(xiǎn)因素[4-6],且被證實(shí)對(duì)各種疾病的預(yù)后都有影響,增加再入院率,延長(zhǎng)住院時(shí)間,極大加重了個(gè)人及社會(huì)負(fù)擔(dān)[3]。肌少癥的診斷需包括肌肉質(zhì)量、肌肉力量及軀體功能等多方面評(píng)估,傳統(tǒng)診斷方法繁瑣、耗時(shí),分割效果受操作者差異限制,因此衛(wèi)生服務(wù)效能和效率均較低[7]。近年來,人工智能(artifical intelligence,AI)在數(shù)據(jù)、算法、算力驅(qū)動(dòng)下迅速發(fā)展,在醫(yī)學(xué)影像學(xué)領(lǐng)域基本實(shí)現(xiàn)人體成分自動(dòng)分割,診斷效能較好,故被用于構(gòu)建肌少癥AI診斷模型,以期簡(jiǎn)單、準(zhǔn)確地診斷及管理肌少癥。本文就近年來AI在肌少癥診斷中的應(yīng)用現(xiàn)狀與前景作一綜述。
1.1 肌少癥的定義及疾病影響 1989年Rosenberg等[8]首先提出了肌少癥的概念,用以表示在正常增齡過程中肌肉(不含脂肪的骨骼肌肌肉組織)的丟失。此后隨著概念逐漸擴(kuò)展,肌少癥又包含了肌肉力量和肌肉功能等方面的內(nèi)容。2010年,歐洲老年人肌少癥工作組(European Working Group on Sarcopenia in Older People,EWGSOP)將肌少癥定義為與增齡相關(guān)的進(jìn)行性骨骼肌量減少、伴有肌肉力量和(或)肌肉功能減退的綜合征,并可能導(dǎo)致跌倒、殘疾、生活質(zhì)量下降等不良后果。研究表明肌少癥影響多種疾病預(yù)后,其在慢性心力衰竭[9]、腫瘤性疾?。ㄈ缥赴10]、直腸癌[11-13]、肺癌[14])預(yù)后中的預(yù)測(cè)價(jià)值也已被證實(shí)。
1.2 肌少癥的發(fā)病機(jī)制 肌少癥發(fā)病機(jī)制十分復(fù)雜,目前仍處于研究和探索階段,一般認(rèn)為與年齡、炎癥、運(yùn)動(dòng)、蛋白攝入、激素、遺傳等因素有關(guān),免疫失調(diào)、神經(jīng)病變、線粒體異常、脂質(zhì)累積、胰島素抵抗、運(yùn)動(dòng)神經(jīng)元退化、骨骼肌蛋白合成與分解代謝失衡、細(xì)胞因子的動(dòng)態(tài)調(diào)節(jié)失衡等都可能引發(fā)或加劇肌少癥[15]。
1.3 肌少癥的診斷 肌少癥的診斷標(biāo)準(zhǔn)較多,EWGSOP、國際肌少癥工作組(International Working Group on Sarcopenia,IWGS)、亞洲肌少癥工作組(Asian Working Group for Sarcopenia,AWGS)先后提出了觀點(diǎn)相仿的診斷標(biāo)準(zhǔn),主要從肌量減少、肌力下降及軀體功能減退等3個(gè)方面展開評(píng)估。(1)肌肉質(zhì)量/數(shù)量的評(píng)估:MRI和CT被認(rèn)為是非侵入性評(píng)估的金標(biāo)準(zhǔn),能夠精準(zhǔn)區(qū)分肌肉組織和脂肪組織,但存在設(shè)備成本高、缺乏便攜性等問題,暫不作為臨床常用評(píng)估手段。雙能X射線吸收測(cè)定法(dual energy X-ray absorptiometry,DXA)較前兩種方法在臨床上使用更廣泛,電離輻射小,測(cè)量較為簡(jiǎn)便,是目前最常用的方法之一。生物電阻抗測(cè)量分析(bioimpedance analysis,BIA)設(shè)備價(jià)格低,攜帶使用方便,是肌少癥篩查的重要手段;但診斷易受機(jī)體含水量及其他因素的影響,評(píng)估結(jié)果有一定誤差。(2)肌肉力量的評(píng)估:握力檢測(cè)容易操作且與日常生活能力、住院時(shí)間的長(zhǎng)短等有關(guān)[16],因此被推薦作為評(píng)估肌肉力量的最佳臨床指標(biāo)。(3)軀體功能評(píng)估:目前測(cè)量軀體功能方法較多,如步速測(cè)定、簡(jiǎn)易體能狀況量表評(píng)估和起坐試驗(yàn)等,其中步速法更為實(shí)用。此外,EWGSOP及AWGS最新提出的共識(shí)推薦使用簡(jiǎn)易五項(xiàng)評(píng)分問卷或小腿圍測(cè)量等方法對(duì)肌少癥進(jìn)行初步篩查,如篩查陽性再進(jìn)行肌肉力量、軀體功能和肌肉質(zhì)量/數(shù)量等。
1.4 肌少癥的治療 運(yùn)動(dòng)干預(yù)和營養(yǎng)干預(yù)是目前肌少癥治療的基石,兩者結(jié)合能夠獲得較好效果,但仍需進(jìn)一步研探最佳方案?,F(xiàn)有藥物治療肌少癥的證據(jù)仍不夠充分,血流限制、神經(jīng)肌肉電刺激、振動(dòng)等其他治療手段確切的臨床益處仍不確定??傮w來講,目前肌少癥治療多采用運(yùn)動(dòng)聯(lián)合營養(yǎng)干預(yù)。在常規(guī)臨床實(shí)踐中,早期篩查、早期診斷和早期干預(yù)肌少癥及其危險(xiǎn)因素對(duì)提高老年人生活質(zhì)量、減少并發(fā)癥、避免嚴(yán)重后果具有重要意義。
2.1 AI應(yīng)用領(lǐng)域 AI是基于計(jì)算機(jī)程序的智能實(shí)體,能夠模擬人類進(jìn)行學(xué)習(xí)、推理和自我校正,并根據(jù)環(huán)境認(rèn)知最大限度地模擬人類智能[17],完成傳統(tǒng)意義上的依賴人的智力才能完成的復(fù)雜工作,涵蓋計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、社會(huì)科學(xué)等學(xué)科,擁有較強(qiáng)的大數(shù)據(jù)存儲(chǔ)和分析能力,涉及機(jī)器人、語言識(shí)別、圖像識(shí)別、自然語言處理、機(jī)器學(xué)習(xí)和專家系統(tǒng)等多個(gè)領(lǐng)域[18]。近年來,AI在數(shù)據(jù)、算法、算力的驅(qū)動(dòng)下迅速發(fā)展,醫(yī)學(xué)領(lǐng)域應(yīng)用AI有助于提高圖像識(shí)別、遺傳學(xué)和基因組學(xué)分析、智能診療、預(yù)測(cè)預(yù)后等方面的準(zhǔn)確性;在輔助診療、減輕醫(yī)生的數(shù)據(jù)分析壓力方面,準(zhǔn)確性可接近人類專家水平[19]。
2.2 機(jī)器學(xué)習(xí)(machine learning,ML)及其在醫(yī)學(xué)領(lǐng)域的主要應(yīng)用 ML是AI的主要亞類,其原理是通過算法進(jìn)行數(shù)據(jù)集中學(xué)習(xí)并作出準(zhǔn)確預(yù)測(cè),通常不需明確的程序設(shè)定。ML的常用算法包括支持向量機(jī)、決策樹、隨機(jī)森林和神經(jīng)網(wǎng)絡(luò)等[20]。其中支持向量機(jī)、決策樹等已被廣泛應(yīng)用于心肌梗死預(yù)測(cè)、病理識(shí)別及術(shù)式改進(jìn)等方向[21]。深度學(xué)習(xí)(deep learning,DL)是基于神經(jīng)網(wǎng)絡(luò)的一種ML算法,采用多個(gè)非線性處理層對(duì)數(shù)據(jù)信息進(jìn)行逐層提取,通過分析高維數(shù)據(jù)檢測(cè)超出人類識(shí)別能力的細(xì)微變化并挖掘更深層次的特征,從而實(shí)現(xiàn)圖像分割和分類預(yù)測(cè)。因DL可直接應(yīng)用原始數(shù)據(jù)而避免信息丟失,且在數(shù)據(jù)規(guī)模較大、預(yù)測(cè)任務(wù)復(fù)雜時(shí)表現(xiàn)出更高的效率,因而成為當(dāng)前研究熱點(diǎn)[21-22]。近年來,作為DL代表算法之一的卷積神經(jīng)網(wǎng)絡(luò)在人體成分自動(dòng)分割方面展現(xiàn)了良好的效能,如Roth等[23]利用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建模型實(shí)現(xiàn)CT圖像上胰腺的自動(dòng)定位與分割;Yan等[24]利用DL識(shí)別局部解剖結(jié)構(gòu)并對(duì)人體部位進(jìn)行定位等。
人體成分的分析對(duì)診斷肌少癥非常重要。對(duì)肌肉和脂肪組織進(jìn)行分割,傳統(tǒng)方法是由醫(yī)師手工分割完成,效果較好但耗時(shí)較長(zhǎng),同時(shí)由于醫(yī)師技能存在個(gè)體差異,結(jié)果往往較難復(fù)制[25]。半自動(dòng)化的分割方法需要人工修正錯(cuò)誤或進(jìn)行復(fù)雜的手工制作[26],受限于人力資源和時(shí)間需求,通常不能應(yīng)用于大型數(shù)據(jù)集。這也是CT、MRI檢查在臨床上廣泛應(yīng)用,但在臨床實(shí)踐中難以推廣的原因,因缺乏自動(dòng)化分割測(cè)量工具,實(shí)際分割工作依舊繁瑣、耗時(shí)及昂貴,且易受操作者差異限制,衛(wèi)生服務(wù)效能和效率并不高[7]。因此,基于AI的自動(dòng)化分割成為目前大部分肌少癥AI診斷模型構(gòu)建的研究熱點(diǎn)。
3.1 基于影像學(xué) 目前大部分研究將肌少癥作為影像學(xué)標(biāo)志物,使用DL,特別是卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行人體成分的自動(dòng)分割,效果較為理想。大部分研究構(gòu)建的肌少癥診斷模型利用CT/MRI圖像,在第3腰椎(L3)水平(因L3水平骨骼肌和脂肪組織對(duì)應(yīng)于全身的組織,故被認(rèn)為是人體成分分析的標(biāo)準(zhǔn)標(biāo)志[27])進(jìn)行人體成分自動(dòng)分割,少部分研究則在第12胸椎(T12)、L4、L5-第1骶椎(S1)水平等進(jìn)行人體成分自動(dòng)分割,得到特定層面的骨骼肌橫截面積(cm2),使用預(yù)定的回歸方程,與身高的平方(m2)進(jìn)行標(biāo)準(zhǔn)化處理,得到骨骼肌指數(shù)(cm2/m2),并用以估計(jì)全身組織質(zhì)量,實(shí)現(xiàn)肌少癥的診斷。研究發(fā)現(xiàn),部分AI人體成分自動(dòng)分割模型的Dice系數(shù)(Dice系數(shù)是DL圖像分割標(biāo)準(zhǔn)之一,取值范圍為0~1,越接近1說明構(gòu)建的模型越好)高于0.95,診斷效能較高,應(yīng)用前景可觀,見表1。多項(xiàng)回顧性研究證實(shí),使用這些模型可實(shí)現(xiàn)人體成分自動(dòng)分割,從而實(shí)現(xiàn)肌少癥的診斷,在評(píng)估肌少癥/非肌少癥對(duì)腫瘤患者(包括婦科惡性腫瘤[28-29],泌尿系統(tǒng)惡性腫瘤[30],消化系統(tǒng)惡性腫瘤[31]等)預(yù)后的影響也有不錯(cuò)表現(xiàn)。
表1 利用ML實(shí)現(xiàn)人體成分自動(dòng)分割的文獻(xiàn)報(bào)道
基于影像學(xué)人體成分自動(dòng)分割的肌少癥診斷模型還存在以下缺點(diǎn):(1)因放射學(xué)量化特征相似,與骨骼肌臨近或重疊的臟器可能被誤認(rèn)為骨骼肌組織,和脂肪組織放射學(xué)量化特征相似的體素可能會(huì)被誤認(rèn)為內(nèi)臟脂肪組織,可見AI診斷模型的準(zhǔn)確性還有待提高[7,43]。(2)單個(gè)層面的CT圖像分析可能無法精確反映全身肌肉、脂肪組織量。(3)部分研究沒有明確表明如何選擇研究層面。(4)部分研究設(shè)定的相關(guān)參數(shù)可能并不適合所有人群,需要進(jìn)一步結(jié)合種族、性別、疾病等特征進(jìn)行參數(shù)設(shè)定。(5)AI算法極為復(fù)雜,無法清晰展現(xiàn)推理過程(“黑匣子”原理),系統(tǒng)輸出結(jié)果的可解釋性差。就目前的研究現(xiàn)狀而言,基于影像學(xué)人體成分自動(dòng)分割的肌少癥診斷模型展現(xiàn)了較好的效能,今后可選擇多模態(tài)多層面影像實(shí)現(xiàn)人體成分自動(dòng)分割,并結(jié)合種族、性別等特征進(jìn)行肌少癥診斷模型構(gòu)建,以提高模型的泛化能力和準(zhǔn)確性。
3.2 基于非影像學(xué)等結(jié)構(gòu)化信息 部分研究利用ML評(píng)估不同結(jié)構(gòu)化信息的重要性,確定重要因素并建立模型,從而診斷及預(yù)測(cè)肌少癥[44-48]。納入的結(jié)構(gòu)化信息包括年齡、體質(zhì)量、身高、BMI、腰圍、臀圍、收縮壓、舒張壓以及平均紅細(xì)胞血紅蛋白量、HDL、平均紅細(xì)胞體積、紅細(xì)胞、TG、簡(jiǎn)易營養(yǎng)評(píng)估量表(mini nutritional assessment,MNA)、血鈉、尿素氮、鐵蛋白、維生素D、FPG等。亦有研究通過AI建立重要變量之間的相關(guān)性網(wǎng)絡(luò)[45],為深入研究肌少癥發(fā)生和發(fā)展的主要生物學(xué)機(jī)制提供了可能。
3.3 其他相關(guān)進(jìn)展 近年來一些便攜、可穿戴設(shè)備的逐步應(yīng)用為肌少癥的AI診斷提供了新思路。利用慣性傳感器獲得患者不同時(shí)相的步態(tài)參數(shù)信息,包括時(shí)空參數(shù)(左/右腿站立時(shí)相時(shí)間、左/右腿擺動(dòng)時(shí)相時(shí)間、單/雙腿站立時(shí)相時(shí)間、左/右腿站立時(shí)相百分比、左/右腿跨步時(shí)間等)以及相應(yīng)的統(tǒng)計(jì)參數(shù)(最大/小值、最小值、標(biāo)準(zhǔn)差、均方根、峰度、偏度等),通過不同算法構(gòu)建基于步態(tài)參數(shù)信息的AI診斷模型,準(zhǔn)確度較高[49-50]。穿戴式表面肌電圖探針可收集運(yùn)動(dòng)時(shí)來自腓腸肌外側(cè)肌群及脛骨前肌的原始肌電圖信號(hào),使用ML提取并選擇特征,使用不同算法構(gòu)建肌少癥AI診斷模型也可獲得較高的準(zhǔn)確度,其中樸素貝葉斯算法準(zhǔn)確度相對(duì)較低,但也達(dá)到了0.828[51],支持向量機(jī)算法準(zhǔn)確度較高,為0.967。
小部分學(xué)者將研究的焦點(diǎn)轉(zhuǎn)向?qū)ふ以缙谠\斷的生物標(biāo)志物。Chung等[52]研究了來自多種族的肌少癥患者(118例患者,17 339個(gè)基因)和健康人群轉(zhuǎn)錄組譜,選定27個(gè)基因作為模型輸入特征變量,建立四層深層神經(jīng)網(wǎng)絡(luò)DSnet-v1,并將其應(yīng)用于獨(dú)立的測(cè)試數(shù)據(jù)。結(jié)果發(fā)現(xiàn)模型靈敏度為100%,特異度為94.12%,準(zhǔn)確度為95.83%,平衡準(zhǔn)確度為97.06%,接收機(jī)AUC為0.99,可用于實(shí)現(xiàn)肌少癥的智能診斷。為了擴(kuò)展患者數(shù)據(jù),研究組同時(shí)開發(fā)了網(wǎng)絡(luò)應(yīng)用程序(http://sarcopeniaai.ml/),用戶可有限制地訪問DSnet-v1,獲取轉(zhuǎn)錄組數(shù)據(jù)從而用以診斷肌少癥。Kwak等[53]對(duì)46名正常受試組和50例肌少癥患者的21個(gè)潛在生物標(biāo)志物的血清學(xué)進(jìn)行分析,結(jié)果發(fā)現(xiàn)正常組和肌少癥組IL-6、骨連接素/基底膜蛋白40、巨噬細(xì)胞遷移抑制因子、胰島素樣生長(zhǎng)因子1水平差異有統(tǒng)計(jì)學(xué)意義。雖然這4個(gè)生物標(biāo)志物均不適合作為診斷肌少癥的單一生物標(biāo)志物,但將這些生物標(biāo)志物聯(lián)合使用合并成單一風(fēng)險(xiǎn)評(píng)分時(shí),肌少癥診斷準(zhǔn)確率顯著提高(AUC=0.763)。事實(shí)上,用以肌少癥診斷的有效多重生物標(biāo)志物仍在不斷發(fā)現(xiàn)與豐富中,未來可進(jìn)一步研究與肌少癥相關(guān)的生物學(xué)途徑,探索診斷肌少癥的生物學(xué)標(biāo)志物最佳組合。
目前大部分AI肌少癥診斷模型構(gòu)建的研究均為回顧性研究,納入的數(shù)據(jù)存在發(fā)表偏倚,單中心研究居多,樣本量較小,模型泛化能力較差,絕大部分研究納入的人群背景與中國不同,缺乏大樣本、前瞻性的適合中國人群背景的AI肌少癥診斷模型。未來可通過前瞻性隊(duì)列研究,深入探討單個(gè)放射學(xué)特征是否可用于肌少癥診斷或是否導(dǎo)致不同的臨床結(jié)局等方面的研究。針對(duì)中國肌少癥人群建立多模態(tài)數(shù)據(jù)庫,以探討適用于中國人群的肌少癥AI診斷模型。
單個(gè)層面的CT圖像自動(dòng)分割分析可能無法精確反映全身肌肉、脂肪組織量,不一定適用于所有患者。今后可考慮將單個(gè)研究層面擴(kuò)展為研究區(qū)域,實(shí)現(xiàn)研究區(qū)域內(nèi)的人體成分自動(dòng)分割,降低模型的不穩(wěn)定性,從而更準(zhǔn)確地反映整體的骨骼肌質(zhì)量。若能進(jìn)一步實(shí)現(xiàn)不同區(qū)域內(nèi)/多層面的對(duì)等轉(zhuǎn)換,利用臨床獲取度更高的CT圖像(比如胸部CT平掃圖像),則更有利于肌少癥的早期篩查及早期診斷,在缺乏有效治療手段的情況下,患者受益可能更高。
當(dāng)前大部分研究均基于肌肉質(zhì)量的影像學(xué)信息,忽略了肌肉力量和肌肉功能等結(jié)構(gòu)化信息,但肌肉力量和肌肉功能是診斷肌少癥及評(píng)估嚴(yán)重程度中不可缺少的依據(jù)。研究表明,“肌少癥可能”(AWGS2019年共識(shí)標(biāo)準(zhǔn))的簡(jiǎn)化評(píng)估對(duì)于肌少癥的診斷準(zhǔn)確性非常好,而“肌少癥可能”的簡(jiǎn)化評(píng)估主要依據(jù)肌肉力量和肌肉功能等結(jié)構(gòu)化數(shù)據(jù),同時(shí)還包括小腿圍、SARC-F量表評(píng)分等[54]。EWGSOP2也提出應(yīng)同時(shí)運(yùn)用影像學(xué)信息和非影像學(xué)信息發(fā)現(xiàn)和診斷肌少癥[3],因此今后可考慮將基于肌肉質(zhì)量等非結(jié)構(gòu)化信息和篩查指標(biāo)、基于肌肉力量和肌肉功能評(píng)估等結(jié)構(gòu)化信息與生物學(xué)標(biāo)志物相結(jié)合,并利用便攜智能設(shè)備等先進(jìn)儀器,構(gòu)建肌少癥AI診斷模型,在提高效能的同時(shí)擴(kuò)大應(yīng)用場(chǎng)景,從而實(shí)現(xiàn)不同場(chǎng)景下的快速診斷及篩查。
DL等算法自動(dòng)提取數(shù)據(jù)特征,細(xì)節(jié)較難捕捉,系統(tǒng)輸出結(jié)果多數(shù)不具可解釋性,目前對(duì)于AI可解釋性探索仍處于起步階段,比如生成熱力圖以顯示DL模型關(guān)注的區(qū)域[55],今后關(guān)于肌少癥診斷模型的可解釋性亦是研究的方向之一。
隨著人口老齡化程度加劇,肌少癥發(fā)病率逐漸升高。肌少癥與多種不良臨床結(jié)局相關(guān),治療手段有限。相比傳統(tǒng)診斷方法,DL,特別是卷積神經(jīng)網(wǎng)絡(luò)在實(shí)現(xiàn)人體成分自動(dòng)分割方面有較好的效能,有利于實(shí)現(xiàn)基于影像學(xué)的肌少癥AI診斷模型的構(gòu)建,但未來關(guān)于肌少癥的AI診斷仍面臨優(yōu)化挑戰(zhàn),需要進(jìn)一步深入研究。