胡曉娟 ,崔驥 ,屠立平 ,姚興華 ,許家佗
1.上海中醫(yī)藥大學上海中醫(yī)健康服務(wù)協(xié)同創(chuàng)新中心,上海 201203; 2.上海中醫(yī)藥大學基礎(chǔ)醫(yī)學院,上海 201203
中醫(yī)脈診通過脈象“位、數(shù)、形、勢”四要素的重要屬性信息反映人體健康與疾病狀態(tài)[1]。脈搏搏動圖(以下簡稱“脈圖”)是脈象的客觀化表現(xiàn)和客觀診斷依據(jù),也是脈診現(xiàn)代化研究的代表性成果。中醫(yī)脈診現(xiàn)代化研究根據(jù)研究路線主要分為中醫(yī)脈診理論梳理、中醫(yī)脈診信號感知、中醫(yī)脈象智能分析、中醫(yī)智能脈診臨床應(yīng)用及各個環(huán)節(jié)所涉及的中醫(yī)脈診標準化研究。中醫(yī)脈診現(xiàn)代化研究已經(jīng)開展近半個世紀,取得一定進展?;诿}圖的中醫(yī)脈象智能分析是指針對脈象傳感器獲取的信號進行智能分析的過程,具體包括脈象信號預(yù)處理、特征識別、模式分類。目前中醫(yī)脈診信號感知涉及的脈象傳感器和采集設(shè)備主要集中于單點、單部采集,正在向陣列式的多點、多部脈圖方向發(fā)展?;谥嗅t(yī)脈診信號感知現(xiàn)狀,本文針對中醫(yī)脈象智能分析的研究進展與發(fā)展趨勢,從單點、單部及多點、多部兩類脈圖進行綜述。
一個典型的脈圖及其常用參數(shù)見圖1[1],主要由主波、重搏前波、重搏波組成。單點、單部脈圖智能分析主要包括數(shù)據(jù)預(yù)處理、特征識別和模式分類。
圖1 脈搏周期圖及常用參數(shù)特征
通過脈象傳感器和采集設(shè)備獲得的脈圖原始信號中存在的噪聲、漂移和異常值會影響特征提取效果。因此,幾種經(jīng)典濾波器如高通、平均平滑、小波濾波器及幾種濾波器級聯(lián)的濾波方法用于噪聲消除[2-4]。小波、經(jīng)驗?zāi)B(tài)分析等方法用來處理由呼吸或抖動產(chǎn)生的基線漂移,小波變換技術(shù)因其計算量少而效果佳的特點可更有效消除漂移。針對噪聲消除和漂移消除技術(shù)無法檢測和處理失真信號引起的異常值問題,研究者引入了基于動態(tài)時間扭曲的方法,通過計算單個脈圖段與所有其他脈圖段的扭曲路徑距離來識別異常脈圖波形[4]。Garg等[5]通過曼哈頓距離和堪培拉距離獲得更好的異常值檢測,并提出實時脈圖信號質(zhì)量評估框架以估計波形異常。Jiang等[6]研究基于多傳感器融合的脈圖質(zhì)量評估框架。異常波處理是數(shù)據(jù)預(yù)處理的重要內(nèi)容,目前就如何區(qū)分身體功能異常和失真信號導(dǎo)致的波形異常的方法尚無有效解決方案,還需進一步深入研究。
單點、單部脈圖分析方法從時域、頻域到時頻分析,從線性分析到非線性分析,諸如小波變換、傅里葉變換、樣本熵等各種譜分析變換后的譜能量、諧波等[7-8]。時域分析通?;趩我恢芷诿}圖或幾個分段周期進行平均,以獲得“平均脈圖周期”。研究者對脈圖提取的參數(shù)有差異,主要脈圖參數(shù)見表1[1,9-10]。
表1 主要脈圖參數(shù)
幾種主流時域特征提取方法及其優(yōu)缺點見表2。目前主波提取準確性較高,但因波形復(fù)雜,重搏前波、重搏波在實際應(yīng)用中的檢測效果較差,提取上有一定難度,因此重搏前波、重搏波提取方法還需深入研究,以進一步闡釋脈象的機制。
表2 脈圖時域特征提取方法分析
雖然當前很多脈象智能分析避開了時域特征提取這一環(huán)節(jié),但筆者認為時域特征依舊是脈圖智能分析的基礎(chǔ),尤其是主波的提取,不僅是脈型和疾病診斷的重要特征,也是脈搏波周期分段的依據(jù),同時重搏前波和重搏波也代表重要的生理意義。
20世紀80年代研究者開始研究脈圖頻域、時頻和非線性特征識別方法。頻域特征反映脈圖整體特征,典型分析方法包括功率譜分析和倒譜分析。時頻分析是把一維信號或系統(tǒng)表示成一個時間和頻率的二維函數(shù),時頻平面能描述出各個時刻的譜成分,時頻分析可從時間、頻域角度反映脈圖的特征。常用的方法有短時傅里葉變換和小波分析。非線性特征多用于臨床特定病證的脈圖分析[11]。典型的頻域、時頻分析及非線性分析研究見表3。
表3 不同脈圖特征分析方法比較
已有研究顯示,時域、視頻、非線性脈圖特征在臨床中有其各自的表征意義[12-13],因此具體特征提取方法研究應(yīng)與臨床應(yīng)用結(jié)合,挖掘不同維度特征提取方法是后續(xù)研究的基礎(chǔ)。
脈圖模式分類從早期的人工讀圖識別開始,發(fā)展至20世紀80年代后開始計算機識別脈圖。目前對于常見脈象的(平、弦、滑、遲、數(shù)、虛、實、浮、沉脈等)及高血壓等常見疾病的單點、單部脈圖分析已取得一定成果。
從句法分析指導(dǎo)的模糊識別和相似度度量方法[14-15],到以支持向量機(SVM)為代表的傳統(tǒng)機器學習方法[16-19],再到目前人工智能領(lǐng)域應(yīng)用較多的深度學習為方法。基于統(tǒng)計的模式分類方法雖然依賴于輸入的特征,但其白盒子的特點便于理解和應(yīng)用,如張嘉琪[20]利用馬爾可夫決策與蒙特卡羅搜索算法設(shè)計脈象分類方案,可縮減訓練時間和資源,并可保留完整的經(jīng)驗軌跡,在提高脈象識別準確率的同時,還可解決處理過程中的“黑箱”問題。深度學習在其處理和挖掘潛在特征方面有其優(yōu)勢,但制約深度學習方法實際應(yīng)用的一個因素在于小脈圖數(shù)據(jù)集。脈圖數(shù)據(jù)集通常不夠大,使其難以訓練用于脈圖分析的魯棒模型。
人工智能技術(shù)的發(fā)展為中醫(yī)脈象智能分析提供機遇,醫(yī)生指下屬于無數(shù)傳感器的多源多部位信號,單點、單部信號單一、信息有限。因此,研究者們也在思考解決途徑,獲取多點、多部脈圖對其進行智能分析或可部分解決此問題。多個脈診研究團隊研發(fā)可采集寸、關(guān)、尺三部脈圖的裝置[21-23]。廣州、遼寧、北京等多地研究機構(gòu)從“三部九候”理論到現(xiàn)代化應(yīng)用等多個層面對多點、多部脈圖進行了研究。
研究者首先驗證多點、多部脈圖的研究必要性;在此基礎(chǔ)上,多點、多部脈圖數(shù)據(jù)預(yù)處理多沿用單點、單部脈圖處理方法。
單點、單部脈圖分析從原始信號濾波、去基線、特征提取分析及模式分類均進行了系統(tǒng)的研究,但目前與臨床應(yīng)用尚有一定距離。研究者就單部脈圖與多部脈圖的信息學差別進行研究,結(jié)果顯示多部脈圖獲取的信息量較大;Li等[10]采用時頻、頻域、時頻分析等方法,研究了寸、關(guān)、尺位腕部脈象特征的相關(guān)性和差異性,利用每個位置的66個特征指標,詳細計算了寸、關(guān)、尺位置及雙手之間的Spearman相關(guān)系數(shù),從定量和定性兩方面研究了脈象采集位置之間的關(guān)系,結(jié)果表明,不同部位之間的特征有差異,為脈象的客觀診斷和脈象信息的全面揭示奠定了基礎(chǔ)。
多點、多部脈圖特征識別以單點、單部脈圖為基礎(chǔ),主要有2種分析思路。一種是先將多點、多部脈圖看作多通道單點脈圖,首先處理單點、單部脈圖特征,然后對多通道的特征進行綜合分析。如Wang等[19]使用主成分分析和最小二乘法等方法結(jié)合時域特征分析寸、關(guān)、尺三部脈圖,并在脂肪肝和肝硬化數(shù)據(jù)上獲得了較好的效果。另一種思路則將多點多部看作整體,分析其整體特征。Chu 等[24]根據(jù)寸、關(guān)、尺三部時空特征,并比較浮、中、沉的不同,區(qū)分了健康弦脈和高血壓弦脈,Chung等[25]基于3×4的12 點陣脈象傳感器,利用離散模型和曲面擬合模型定義陣列式脈圖特征,比較三部一起按和關(guān)部單按脈圖的關(guān)系?;谇鏀M合定義5個陣列式脈圖參數(shù)(見圖2):曲面峰值最大值(Vppmax)、脈長(Length)、脈寬(Width)、收縮期(AS)和舒張期(DS)面積。其中Vppmax定義為曲面擬合的最大值;Length、Width、AS、DS根據(jù)擬合后圖形曲面的坐標軸定義。
圖2 離散模型與曲面擬合模型示意圖
上海中醫(yī)藥大學許家佗團隊提出不同時刻的脈圖容積(APV)系列特征[26-28],并通過健康與高血壓脈圖陣列脈搏波分析表明,APV能可靠地反映中醫(yī)脈搏特征。APV是指單位時間(1個周期)內(nèi)脈搏波波動的平均體積。按照傳感器的位置組織成3*4列二維數(shù)組,數(shù)據(jù)F為12個點幅值高度,利用線性插值對3*4=12個點的F進行插值到N*N,實驗中取N=1 000,即3*4列二維數(shù)組變?yōu)榈? 000*1 000矩陣M,M可看成多個點幅值,目的是組成一個面(見圖3),不同時刻的體積,即X軸(脈寬)、Y軸(脈長)、Z軸(幅度)圍成的圖形體積[25]。
多點、多部的脈圖模式分類主要以融合分析為主。從特征融合角度,Lu等[29]提出一種多尺度特征提取模型,該模型包含三部分:卷積神經(jīng)網(wǎng)絡(luò)用于提取單周期脈圖的空間特征和多周期脈圖的節(jié)奏特征;遞歸神經(jīng)網(wǎng)絡(luò)用于保留脈圖的長期依賴性特征;最后,使用推理層通過提取的特征進行分類。該模型在連續(xù)無創(chuàng)血壓數(shù)據(jù)集上進行心血管疾病分類精度達到96%。Lin等[30]將脈圖數(shù)據(jù)轉(zhuǎn)換為二維圖像,將獲得的特定特征值轉(zhuǎn)換為多維數(shù)組,并在SVM分類器中進行訓練,分析正常人和慢性病患者脈圖二維圖像的差異,分類精度高于基本時間特征,實驗結(jié)果表明,使用特定特征挖掘算法進行疾病檢測是可行的。Zhang等[18]基于三部脈圖提出基于圖的多通道特征融合方法,通過應(yīng)用堆疊稀疏自動編碼器和小波散射生成2種不同的特征,將一個腕部脈圖樣本的每個特征視為與其相應(yīng)特征向量相關(guān)聯(lián)的節(jié)點,并用于構(gòu)建一個候選圖,通過開發(fā)圖卷積網(wǎng)絡(luò),取得較好效果。Jiang等[31]提出決策級脈圖融合框架,使用Karhunen-Loeve多重廣義判別典型相關(guān)分析將脈圖多種特征融合到一個特征向量中,對每種類型的融合特征訓練支持向量機分類器,框架采用決策級融合方法將這些分類器結(jié)合進行脈搏信號分類,以解決異構(gòu)特征融合問題。
多點、多部脈圖的預(yù)處理多沿用單點、單部分析方法;整體性特征分析較少,多點、多部脈圖智能化分析方法集中在融合方法本身,缺少理論指導(dǎo)下的融合分析方法。中醫(yī)生診脈時根據(jù)“三部九候”“位、數(shù)、形、勢”信息,獲得與疾病或狀態(tài)相關(guān)的主要信息,找到問題的主要矛盾,從寸關(guān)尺部位、浮中沉空間等多個方面綜合分析,得出最終的脈象分析結(jié)論。由于脈象分類具有“多維”“綜合”的特點,此過程的多維有效信息融合問題,尚未得到有效解決。符合臨床意義的脈象包含“位、數(shù)、形、勢”多維信息,目前基于脈圖的脈象分類研究主要集中在單點、單部脈圖,并且已取得進展;但是,基于“三部九候”理論的脈象分類研究尚不成熟。目前“三部九候”脈圖分析方法大多因為信息局限而簡單堆砌,未能很好地處理各部脈圖間關(guān)系,無法滿足臨床脈診的全面需要[32]。
脈象全域特征(時間、節(jié)律、頻率及寸關(guān)尺部位、浮中沉空間、定性和定量的波形特征等)分析需要對各部脈圖進行有效的融合處理以給出綜合決策,綜合決策不僅是信息的簡單堆積,其本質(zhì)是基于多維信息融合的屬性判別問題。融合分析方法可為解決脈象全域特征分析提供借鑒。在信息研究領(lǐng)域,融合是一種形式框架,其過程是用數(shù)學方法和技術(shù)工具綜合不同信息,目的是得到有用信息或進行綜合的決策融合技術(shù),可分為數(shù)據(jù)層、特征層和決策層融合。就多部脈圖而言,數(shù)據(jù)層融合是指將原始的時間序列數(shù)據(jù)直接作為融合方法輸入;特征層融合為提取各部脈圖特征作為輸入;決策層融合是將各部脈圖的分類結(jié)果作為融合方法的輸入,最后給出綜合結(jié)果。貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、SVM等機器學習方法[33],根據(jù)其各自的優(yōu)勢都被應(yīng)用到數(shù)據(jù)層和特征層的融合分析中,用來挖掘多源信息的內(nèi)在聯(lián)系。而決策層的典型方法是適用于處理多源不確定性信息的D-S證據(jù)融合模型,其優(yōu)點是可將證據(jù)(輸入數(shù)據(jù))之間細微的差別累加起來,當這些差別累積到一定程度就能進行區(qū)分,達到提高綜合決策準確率的效果,但它需要知道每個輸入的先驗概率,而大多數(shù)情況是不容易獲得的。
隨著人工智能和深度學習技術(shù)的發(fā)展[34-37],深度神經(jīng)網(wǎng)絡(luò)也被應(yīng)用于信息融合領(lǐng)域。如Ren等[38]通過多通道深層神經(jīng)網(wǎng)絡(luò)進行多源圖像數(shù)據(jù)的融合,取得了一定的效果,其結(jié)果也在標準數(shù)據(jù)集中進行驗證,同時表明深層神經(jīng)網(wǎng)絡(luò)在多信息融合分析方面的優(yōu)勢。金林鵬等[39]在卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上,通過構(gòu)建的導(dǎo)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)多導(dǎo)聯(lián)心電圖融合分析,通過大數(shù)據(jù)驗證該模型有明顯優(yōu)勢。從信號角度,脈圖與心電圖都具有周期性的特征,且多部之間都具有相似的結(jié)構(gòu)。
基于此,本文提出以中醫(yī)脈診理論、信息融合理論為指導(dǎo),關(guān)注顯性整體特征,利用深度學習挖掘隱性特征,構(gòu)建脈圖融合分析模型分析“位、數(shù)、形、勢”全域特征;構(gòu)建脈圖全域特征表達模型,從而找出表征脈象或身體狀態(tài)的主特征結(jié)合,并通過臨床驗證的中醫(yī)脈象智能分析研究新思路(見圖4),以期提供多點、多部脈圖智能分析研究的可行途徑。
圖4 中醫(yī)脈象智能分析研究新思路
中醫(yī)脈象智能化分析方法主要集中在單點、單部脈圖分析中,基于多點、多部脈圖的研究主要集中在多點、多部脈圖必要性分析、整體特征分析及融合分析方面,正在發(fā)展階段。現(xiàn)階段脈診的現(xiàn)代化研究成果在實驗室范圍均取得較好效果,但是在實際臨床中應(yīng)用較少。面向臨床應(yīng)用是脈象智能分析研究的重要內(nèi)容。本文以中醫(yī)“三部九候”脈診理論為指導(dǎo),基于多點、多部脈圖數(shù)據(jù),從“位、數(shù)、形、勢”角度利用深度學習與信息融合方法相結(jié)合進行脈圖全域特征融合分析的新思路,為中醫(yī)脈圖智能化分析提供可行途徑,有望解決脈診現(xiàn)代化研究中關(guān)鍵技術(shù)問題,為實現(xiàn)“三部九候”中醫(yī)脈診的數(shù)據(jù)化、規(guī)范化、標準化提供方法學突破。