武文杰,郭 睿,張春柯,顏建軍,王憶勤,燕海霞,馬孝天
(1.上海中醫(yī)藥大學基礎醫(yī)學院,上海 201203;2.華東理工大學機械與動力工程學院,上海 201203)
隨著近年來生活水平的提高和飲食結構的改善,以非酒精性脂肪肝(non-alcoholic fatty liver disease,NAFLD)和肝脂肪浸潤(fatty infiltration of liver,F(xiàn)IL)為主的肝細胞脂肪病變檢出率逐年攀升。NAFLD是指除長期大量飲酒和其他明確的致病因素外,以三酰甘油為主的脂質(zhì)在肝細胞中堆積的慢性代謝性疾病[1]。FIL則是導致肝臟多型損害的一種病理狀態(tài),被認為是誘發(fā)脂肪肝的危險病理改變[2]。肝脂肪病變可導致肝臟微循環(huán)血流量減少,從而使肝細胞處于持續(xù)的缺血低氧狀態(tài),還會加劇糖代謝障礙,使肝細胞內(nèi)環(huán)境穩(wěn)態(tài)失調(diào),對肝細胞再生具有諸多不利影響[3-4]。
腹部超聲作為肝、膽、脾、腎等腹腔器官的重要臨床輔助診斷技術,可對病變部位、病因和病理類型進行初步診斷。研究[5]表明,當肝臟發(fā)生50%以上脂肪沉積量時,超聲診斷的靈敏度可達90%。因此,通過腹部超聲可進一步掌握肝臟脂肪病變程度。但肝脂肪病變多無明顯癥狀,其發(fā)病具有隱匿性,且多數(shù)患者只有通過定期健康體檢腹部超聲才能對自身病理狀態(tài)有所察覺,故探索一種便捷、實時、無創(chuàng)獲取的肝脂肪病變評估方法具有重要的臨床意義。
脈診是頗具特色的中醫(yī)診斷方法之一。醫(yī)者感觸“寸口”橈動脈搏動來區(qū)分不同脈象,其實質(zhì)是借助心血管系統(tǒng)這一信息平臺,綜合來自全身各系統(tǒng)的信息以獲取臟腑的生理病理變化。隨著信息學、工程學和計算機學等現(xiàn)代多學科技術與中醫(yī)脈診的交叉滲透,脈診客觀化研究已經(jīng)取得一定的成果,并已在多種心血管疾病的研究中得以應用[6],但其在肝臟疾病研究中的應用卻鮮見報道。左側(cè)寸口關部為肝之所候,因此本實驗通過檢測左側(cè)寸口關部的脈象信號,分析與肝臟相關的生理病理信息。
脈象信號等人體生理信號具有非線性特性,其非線性效應主要來源于心臟的非線性激勵、血管系統(tǒng)幾何形狀及力學性質(zhì)的非線性、血管壁運動的非線性、血液流動的非線性流體的特殊性等[7]。非線性分析方法已被廣泛應用于心電信號等諸多生物信號的研究中[8]。遞歸圖(recurrence plot,RP)是刻畫系統(tǒng)非線性動力學特征的重要工具,其反映出的規(guī)則、局部結構可以定性地描述一維信號的非線性動力學特征,而遞歸定量分析(recurrence quantity analysis,RQA)則是對RP的定量分析[9-10],可定量地分析一維信號的非線性動力學特征。因此,本研究通過RQA方法提取體檢人群肝脂肪病變者脈象信號的RQA特征,基于RQA特征建立肝脂肪病變的識別模型,以期為肝脂肪病變提供一種實時、便捷的評估方法。
1.1 病例來源 本研究納入的249例研究對象(男111例,女138例)來源于2021年3月至2021年8月上海中醫(yī)藥大學附屬岳陽醫(yī)院體檢中心體檢人群,平均年齡(56.7±11.0)歲。根據(jù)腹部超聲檢測報告,將研究對象分為兩組:非肝脂肪病變組(共99例)、肝脂肪病變組(NAFLD、FIL共150例)。受試者自愿參加本次醫(yī)學試驗,且對本次試驗獲取的全部資料知情且同意。本試驗采集整理的所有個人信息及資料被嚴格保密且僅用于本次醫(yī)學試驗。
1.2 一般資料 通過問卷及體檢報告收集整理受試者一般資料,包括性別、年齡、身高、體質(zhì)量,依據(jù)身高和體質(zhì)量計算體質(zhì)量指數(shù)(body mass index,BMI)。
1.3 脈象信號采集 采用華東理工大學和上海中醫(yī)藥大學共同研發(fā)的ZY-Ⅰ型脈診儀采集受試者左側(cè)腕掌橫紋橈動脈處脈象信號。囑被檢者取端坐位或仰臥位,平靜呼吸且身心放松,前臂外展,掌心朝上,局部氣血調(diào)和,采集時間為60 s。取最佳脈象信號圖用于RQA特征提取與分析。
1.4 分析方法
1.4.1 RP RP是利用二維圖形方式來定性描述系統(tǒng)非線性動力學特征的工具。對于非線性動力學系統(tǒng)而言,相空間重構是研究其系統(tǒng)復雜度的基礎。RP則是基于相空間重構思想構造而成。根據(jù)Takens嵌入原理[11],選擇適當?shù)那度刖S數(shù)和延遲時間,對實際或觀測手段獲得的時間序列可以重構一個與原動力系統(tǒng)拓撲結構相同的相空間。例如,對于脈診儀采集的一維脈象信號時間序列(見圖1A),首先根據(jù)Takens原理構造脈象信號的相空間結構(嵌入維數(shù)為3,延遲時間為5),再根據(jù)脈象信號在相空間的重構軌跡構造二維RP,見圖1B。RP上每個點由相空間軌跡對應的行、列向量點之間的距離進行描述[12],根據(jù)公式(1)進行繪制。
Rij=θ[ε-‖X(i)-X(j)‖],i,j=1,2,…,N
(1)
其中,ε為距離閾值,‖.‖為歐式距離,θ[x] 為海維賽德函數(shù)。根據(jù)i和j之間的距離是否大于或小于ε,Ri,j取值為1或0,在RP中表現(xiàn)為黑點和白點。RP則是通過線段及黑點反映系統(tǒng)的非線性動力學特征。如圖1B所示,脈象信號的RP可視化地展示了其非線性動力學特征,在45°對角線出現(xiàn)了較長的線段結構,這些線段互相平行,間距近似相等,表明了脈象信號動力學系統(tǒng)演化的周期性及規(guī)律性。但RP只能定性地展現(xiàn)系統(tǒng)動力學特征,因此還需要對其進行定量分析。
圖1 一維脈象信號圖(A)和脈象信號RP(B)
1.4.2 遞歸定量分析 RP中的線段結構和分布可以從不同角度定性地反映系統(tǒng)的特性,RQA則是對RP中遞歸點的密度、線段結構等細節(jié)進行定量分析的一種方法。RQA特征主要包括遞歸率(recurrence rate,RR)、確定性(determinism,DET)、對角線長度的均值(averaged diagonal length,L)、遞歸熵(entropy of diagonal length,ENTR)、最長對角線(length of longest diagonal line,Lmax)、層狀度(laminarity,LAM)、豎直/水平線段長度均值(trapping time, TT)和最長豎直/水平線段長度(length of longest vertical line,Vmax),各量化分析特征的計算方法見如下公式[13]:
(1)RR:RP中出現(xiàn)的遞歸點數(shù)與整幅圖點數(shù)的比值,其高值反映了一個較強的周期性嵌入過程。
(2)
(2)DET:構成平行于對角線線段的遞歸點數(shù)與總的遞歸點數(shù)的比值,可用于區(qū)分個別發(fā)散的遞歸點和有規(guī)律的特定圖案。
(3)
(3)L:RP中對角線長度的均值。
(4)
(4)ENTR:RP中對角線結構長度分布的香農(nóng)熵,P(l)是對角線結構長度分布的概率密度。
(5)
(5)Lmax:最長對角線長度,Ni是45°對角線結構的個數(shù)。
Lmax=max({li;i=1,…,Ni})
(6)
(6)LAM:指構成豎直或水平線段結構的遞歸點的百分比,P(v)是長度為v的豎直或水平線段的頻率分布,vmin是最小分析長度,一般取2。
(7)
(7)TT:RP中構成垂線段的平均長度,是測量系統(tǒng)內(nèi)一個特定狀態(tài)平均時間的指標。
(8)
(8)Vmax:RP中構成垂線段的最長長度。
Vmax=max({vi,i=1,…,Nv})
(9)
1.6 機器學習方法 隨機森林(random forest,RF)是一種有較高預測率、對異常值和噪聲具有較好容忍度且不容易出現(xiàn)過度擬合的機器學習方法。其能通過Bootstrap重抽樣技術從原始整體中提取多個樣本,對每個樣本進行決策樹建模,然后組合多棵決策樹的預測,通過投票得出最終預測結果[14]。RF因其在方法及理論上的優(yōu)勢,廣泛應用于疾病診斷與預測研究。
1.7 模型評價 根據(jù)模型識別結果,繪制模型的混淆矩陣,如表1所示。根據(jù)公式(10)—(13)計算模型的評價指標:準確率、精準率、召回率、F1值,并繪制模型的受試者工作特征曲線(receiver operating characteristic curve,ROC)并計算ROC曲線下面積(area under the curve,AUC)來評價模型識別性能。
表1 模型識別結果
(10)
(11)
(12)
(13)
2.1 一般資料 兩組體檢人群性別、年齡、BMI比較,差異具有統(tǒng)計學意義(P<0.05)。其中,男性肝脂肪病變頻數(shù)高于女性(P<0.05);肝脂肪病變組的年齡、BMI大于非肝脂肪病變組(P<0.05)。見表2。
表2 兩組體檢人群一般資料分析
2.2 脈象信號RQA特征分析 肝脂肪病變組脈象信號RQA特征RR、DET、L、ENTR、LAM、TT、Vmax均顯著高于非肝脂肪病變組(P<0.05),Lmax差異無統(tǒng)計學意義(P>0.05)。見表3。
表3 兩組體檢人群脈象信號RQA特征比較[M(QR1,QR3)]
2.3 模型的建立與評價 本研究基于150例體檢人群肝脂肪病變者和99例體檢人群非肝脂肪病變者的脈象信號RQA特征和一般資料,運用RF算法建立肝脂肪病變組識別模型。采用5倍交叉檢驗策略進行模型訓練與預測,即將整體樣本集分為5份,輪流將其中4份作為模型訓練集,1份作為模型測試集,最終確定識別模型的輸出類別。
識別模型以腹部超聲報告作為實際類別,結果顯示,實際類別與模型輸出類別均判斷為肝脂肪病變組(即TP)的病例數(shù)為129例;實際類別為肝脂肪病變組,但模型輸出類別判斷為非肝脂肪病變組(即FN)的病例數(shù)為21例;實際類別與模型輸出類別均判斷為非肝脂肪病變組(即TN)的病例數(shù)為71例;實際類別為非肝脂肪病變組,但模型輸出類別判斷為肝脂肪病變組(即FP)的病例數(shù)為28例。經(jīng)過模型的識別結果計算,模型的準確率為80.34%、精確率為82.17%、召回率為86.00%、F1值為84.04%、AUC為86.77%。見圖2。
圖2 肝脂肪病變識別模型ROC曲線
脈象信號蘊藏了豐富的人體生理病理信息。研究[15]發(fā)現(xiàn),脈象時域特征h1、h3、h4、h5、h5/h1可用于脂肪肝及正常人脈象特征的鑒別,為肝脂肪病變的脈象客觀化研究及早期診斷提供了參考。脈象時域分析是一種直觀的線性方法,其關注于脈象信號圖曲線上某些點或局部特征,未能將曲線所包含的信息全部利用起來,并且難以反映信號內(nèi)部的非線性特性。人體多種生理信號如脈象信號具有非線性特性,非線性動力學方法已在生理信號分析中得到較好的應用[16]。因此,本研究通過非線性動力學方法,提取體檢人群肝脂肪病變者與非肝脂肪病變者的脈象信號的非線性動力學特征并進行分析,探討兩組受試者的脈象差異。
本研究提取了體檢人群脈象信號的RQA特征,不同的RQA特征具有不同的非線性動力學意義。其中,RR計算了RP中遞歸點的密集度,反映系統(tǒng)內(nèi)部某些特定狀態(tài)在未來重現(xiàn)的概率,較高值意味著系統(tǒng)內(nèi)部更強的周期性;DET表示RP中構成對角線的遞歸點的百分比,其值與系統(tǒng)內(nèi)部確定性或平均可預測程度呈正比;L為相鄰兩條軌道相互接近的平均時間步長,也是系統(tǒng)確定性的反應特征;ENTR是評價RP對角線長度分布復雜度的參數(shù),其值越高則RP包含越多對角線結構。故較高的DET、L、ENTR反映了肝脂肪病變組的脈象信號具有更高的確定性。LAM反映系統(tǒng)狀態(tài)響應快慢的程度,其值越大反映系統(tǒng)越穩(wěn)定;TT是預測一個動態(tài)系統(tǒng)未來可能性有多大的指標,對動態(tài)系統(tǒng)的時間進行量化,其值越高,反映系統(tǒng)越穩(wěn)定且復雜度降低;Vmax反映系統(tǒng)穩(wěn)定性,其值和系統(tǒng)穩(wěn)定性呈正比。本研究發(fā)現(xiàn),肝脂肪病變組的脈象信號RQA特征RR、DET、L、ENTR、LAM、TT、Vmax均顯著高于非肝脂肪病變組(P<0.05),提示該組脈象信號具有更高的規(guī)律性、確定性和穩(wěn)定性。
本研究對體檢人群肝脂肪病變組與非肝脂肪病變組的一般資料進行比較,結果顯示肝脂肪病變組男性構成比、年齡及BMI均高于非肝脂肪病變組(P<0.05)。男性肝脂肪病變者較多,可能與工作壓力大、社交應酬中攝入過多高脂食物等不良生活習慣相關。肝脂肪病變組年齡偏高,有研究[17]報道,年齡是肝脂肪病變的獨立危險因素,這可能與因年齡增長而出現(xiàn)的肝臟代謝綜合征有關。高BMI是肝脂肪病變的風險因素,肥胖患者因肝臟攝入脂肪量超過其氧化及脂化功能,誘發(fā)脂肪大量無序堆積,導致病變程度不斷加深[18]。
RF算法是一種用于數(shù)據(jù)挖掘的機器學習算法,具有訓練過程快速且高效、能有效應對數(shù)據(jù)樣本不平衡以及避免數(shù)據(jù)過擬合等優(yōu)點,因此,本研究基于一般資料和脈象信號RQA特征,運用RF算法建立了體檢人群脂肪肝病變識別模型,并取得了較好的準確率、精確率、召回率、F1值、AUC。本研究顯示,脈象檢測技術在肝脂肪病變的早期篩查中具有一定的臨床應用價值,可用于疾病亞臨床狀態(tài)的檢測,發(fā)揮中醫(yī)“治未病”的診療思想。
本研究同時存在一定的局限性:肝脂肪病變常被納入“痞滿”“積證”等中醫(yī)疾病范疇,中醫(yī)認為其基本病機多為脾失運化,肝失疏泄,木郁乘土,濕聚成痰,導致痰、濕、郁、瘀阻滯肝絡而發(fā)病。其雖病在肝,但與脾、胃、腎等臟腑的水液代謝障礙密不可分。受限于研究采用的單探頭脈診采集設備,本實驗僅采集、分析了左側(cè)關部(肝之所候)的脈象信號,而忽視了水液代謝等相關臟腑在寸口三部脈象上的征象。隨著三部脈診儀的研發(fā)與應用,今后研究可通過分析寸、關、尺不同部位的脈象信號,深入探索中醫(yī)脈診的臨床診斷價值。