甘永進,趙 地,陳 輝,李 瓊,鄭金存,*
(1. 玉林師范學院 物理與電信工程學院,廣西 玉林 537000;2. 玉林師范學院 體育健康學院,廣西 玉林 537000)
作為體內(nèi)負責運載氧的蛋白質(zhì),血紅蛋白是血液的重要組成部分,是衡量貧血、失血以及真性血紅蛋白增多癥等疾病診斷和分類的重要指標[1-2]。當體內(nèi)血紅蛋白水平低于正常水平時表現(xiàn)為貧血,貧血可導(dǎo)致孕婦免疫力下降,引發(fā)早產(chǎn)、死胎等現(xiàn)象,對新生兒的器官、骨骼以及智力的發(fā)育也有不良影響[3];而當體內(nèi)血紅蛋白水平高于正常水平時,常伴隨著腫瘤、心肺疾病等疾病的病發(fā)[4]。因此,檢測血紅蛋白對相關(guān)疾病的及時診斷和預(yù)防至關(guān)重要。
目前對血紅蛋白的檢測主要通過有創(chuàng)的手段進行,不但對患者帶來創(chuàng)傷,并且檢測周期長、價格貴、需要專業(yè)的醫(yī)護人士進行操作,不利于開展家庭或社區(qū)的檢測工作,而無創(chuàng)血紅蛋白檢測方法可以避免上述問題,故對無創(chuàng)血紅蛋白檢測展開研究具有一定的現(xiàn)實意義。
本文采用雙波長發(fā)光管對指尖光電容積脈搏波信號(Photoplethysmography,PPG)進行采集,結(jié)合集合經(jīng)驗?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)及形態(tài)學濾波方法對PPG信號進行降噪處理后提取PPG信號形態(tài)、時域和頻域的特征參數(shù),再由皮爾森相關(guān)系數(shù)和主成分分析(Principal Component Analysis,PCA)對特征參數(shù)進行篩選,形成最優(yōu)特征子集,最后由支持向量回歸方法(Support Vector Regression,SVR)建立血紅蛋白預(yù)測模型。
功能性血紅蛋白(氧化血紅蛋白、還原血紅蛋白)及非功能性血紅蛋白(高鐵血紅蛋白、碳氧血紅蛋白)構(gòu)成了人體血紅蛋白,前者約占人體總血紅蛋白含量的95%~99%,故血紅蛋白濃度檢測常指檢測功能性血紅蛋白濃度。
本文基于修正后的朗伯-比爾定律進行無創(chuàng)血紅蛋白檢測研究,由兩個波長的光源對指尖進行照射,得出物質(zhì)濃度方程組并解出各物質(zhì)的濃度。朗伯-比爾定律如式(1)所示:
(1)
其中,ρ為路徑長度因子,εα是吸光系數(shù),d是最短路徑,θ是未知集合因子,I0、I為入射前后的光強。
對式(1)兩端進行求導(dǎo)得
(2)
其中,〈L〉是平均路徑長度。由修正后的朗伯-比爾定律,得吸光度變化ΔA為
ΔA=[ε1(λ)c1+ε2(λ)c2+…+ε1(λ)c1]ΔL。
(3)
因本文主要檢測氧化血紅蛋白和還原血紅蛋白兩種蛋白的濃度,故選取兩種波長進行這兩種蛋白的檢測,此時由式(3)可得
(4)
其中,ε1(λ1)和ε1(λ2)表示氧化血紅蛋白在波長λ1、λ2處的消光系數(shù),而ε2(λ1)和ε2(λ2)表示還原血紅蛋白在波長λ1、λ2處的消光系數(shù)。由式(4)得
(5)
其中,c1、c2為分別為氧化血紅蛋白和還原血紅蛋白的濃度,IACλ1、IACλ2為兩路PPG信號的交流分量,IDCλ1、IDCλ2為兩路PPG信號的直流分量。因血氧飽和度Spo2為c1和c2的比值,結(jié)合式(5)可得
(6)
當λ2選擇氧化血紅蛋白和還原血紅蛋白具有等吸收點的波長時,ε2(λ2)=ε1(λ2),式(6)可簡化為
(7)
綜上所述,因氧化血紅蛋白和還原血紅蛋白在某一給定波長處總的吸光量等于兩者在該波長處各自吸光量之和,故選定兩個波長的光源進行檢測,可以組成一個二元一次方程組,由此解得氧化血紅蛋白和還原血紅蛋白的濃度。而選擇等吸收點可以簡化求解方程,由圖1可見,由于在波長為905 nm處血紅蛋白的消光系數(shù)變化比較平緩,且其值與等吸收點805nm波長處相差較小,可認為近似相等,因此λ2選擇為905 nm。另外,為避免信號混疊,λ1盡可能選取兩者吸收系數(shù)差異大的波長。圖1中可見,660 nm波長處,兩種血紅蛋白吸收系數(shù)差別最大,故λ1選擇為660 nm。本文使用660 nm和905 nm的光源分時復(fù)用分別描記PPG信號。
圖1 兩種蛋白的吸收特性
Fig.1 Absorption characteristics of two proteins
為采集到可靠的指尖光電脈搏波信號,本文采用集成了波長905 nm與660 nm的雙波長反射式血氧傳感器DCM03進行指尖PPG信號的檢測。結(jié)合TI公司的完全集成模擬前端芯片AFE4400,由AFE4400控制DCM03雙波長發(fā)光管交替開啟的頻率[5-7],并完成I-V轉(zhuǎn)換、光電信號矯正、濾除電路高頻噪聲以及AD轉(zhuǎn)換等工作,完成對數(shù)字化指尖容積脈搏的采集,再將數(shù)字化脈搏波信號經(jīng)過SPI接口傳輸給MCU(MSP430F5529),在MCU里做進一步處理后傳輸給PC機。具體設(shè)計框圖如圖2所示。
圖2 PPG采集系統(tǒng)框圖
Fig.2 Block diagram of PPG acquisition system
受環(huán)境光、暗電流以及肌電等因素影響,系統(tǒng)采集到的原始PPG存在高頻干擾及基線漂移等,波形如圖3(a)所示。為提高PPG信噪比,得到更純凈、可靠的PPG信號以提升后續(xù)特征點識別的準確性,本文采用EEMD結(jié)合形態(tài)學濾波的方法對原始PPG信號進行降噪處理。
因為經(jīng)驗?zāi)B(tài)分解存在虛假分量和模態(tài)混疊的問題[8],為提升分解效率[9],采用更能提高信號信噪比[10]的EEMD對原始容積脈搏波信號進行處理。EEMD將信號分解得到的本征模函數(shù)(Intrinsic Mode Function, IMF)分量根據(jù)頻率由高到低進行排列,信號中的噪聲往往被分解到高頻IMF分量中,EEMD降噪原理就是將高頻噪聲分量、虛假分量以及余項從原始信號中剔除,并對剩下的IMF分量進行重構(gòu),以恢復(fù)真實信號[11],具體實現(xiàn)步驟如下:
① 對原始脈搏波信號x(t)添加白噪聲ωi(t),得到復(fù)合信號xi(t)=x(t)+ωi(t);
③xi(t)與m1(t)作差,得到去除低頻信號的信號h1(t)=xi(t)-m1(t);
⑤ 原始信號x(t)減去這個高頻IMF分量,得到r1(t)=x(t)-c1(t);
1.1.1 課程體系 目前該課程是電子科學與技術(shù)專業(yè)的選修課,為學生知識拓展,以及能力提升之用.集成電路設(shè)計設(shè)置在電子科學與技術(shù)專業(yè)大三第2學期,修完的專業(yè)基礎(chǔ)課只有模擬電子電路、數(shù)字電子電路、電路分析、理論物理基礎(chǔ)和半導(dǎo)體物理,對集成電路設(shè)計課程來說,還缺少必要的固體物理、晶體管物理以及量子力學.此外,也沒有集成電路設(shè)計相關(guān)的專業(yè)課,如集成電路工藝、集成電路設(shè)計CAD、集成電路封裝與測試等專業(yè)課.若沒有集成電路專業(yè)基礎(chǔ)課的學習,學生后續(xù)學習就比較吃力,教師講授也相對較困難,也就是說,不管對教師教學,還是學生學習,都沒有很好的知識體系框架的保障.
即原信號被分解為n個平穩(wěn)信號和一個余項,將高頻噪聲分量、虛假分量以及余項從原始信號中剔除,并對剩下的IMF分量進行重構(gòu)即可實現(xiàn)EEMD對脈搏波的降噪處理。
圖3 各階段PPG信號及其頻譜圖
Fig.3 The wave form and spectrogram of PPG
經(jīng)EEMD濾波后的波形見圖3(b)。對比圖3(a)和(b)可見EEMD處理重構(gòu)后的信號信噪比更高。但EEMD處理后的信號存在基線漂移,本文基于形態(tài)濾波,設(shè)計不同尺寸結(jié)構(gòu)元素的開-閉和閉-開運算的平均對PPG的基線漂移進行抑制[12]。開運算可消除微小的尖刺,濾除信號峰值噪聲,平滑信號邊界輪廓,而閉運算用于實現(xiàn)平滑或抑制信號波谷噪聲。傳統(tǒng)形態(tài)的開-閉和閉-開運算以不同順序級聯(lián)開閉運算存在統(tǒng)計偏移現(xiàn)象,為避免該現(xiàn)象,定義廣義開-閉和閉-開濾波器為
FOC(f,g1,g2)=f○g1●g2,
(8)
FCO(f,g1,g2)=f●g1○g2,
(9)
其中,F(xiàn)OC和FCO分別代表廣義開-閉運算和廣義閉-開運算,g1和g2表示不同尺寸的結(jié)構(gòu)元素,f代表欲進行基線漂移抑制的信號,○和●分別代表開運算和閉運算。
具體步驟框圖見圖4,將EEMD重構(gòu)后的信號分別和不同結(jié)構(gòu)元素進行開-閉和閉-開運算后,將兩者的結(jié)果進行平均,再與輸入信號相減得到抑制漂移的信號。經(jīng)過形態(tài)學濾波后的波形見圖3(c),結(jié)合圖5各個階段波形的頻譜可見,基線漂移得到了抑制,信號比得到了提高。
圖4 去基線漂移框圖
Fig.4 The block diagram of baseline removal
圖5 各個階段波形的頻譜圖
Fig.5 spectrogram of each stage
為進一步說明算法的有效性,本文比較不同小波算法、傳統(tǒng)陷波器以及本文算法對PPG信號處理后的信噪比,實驗結(jié)果如表1所示。由表1可見,本文算法得到的信噪比較高,在對系統(tǒng)采集到的原始PPG信號進行處理時,效果優(yōu)于小波及傳統(tǒng)陷波器。
表1 幾種不同去基線算法的信噪比
Tab.1 SNR of different algorithms
經(jīng)EEMD和形態(tài)學濾波共同處理降噪后的PPG信號可進行特征提取工作。本文主要對PPG信號進行形態(tài)特征、時域特征參數(shù)以及頻域特征參數(shù)的提取。
參數(shù)提取操作以一個周期PPG為對象,采用數(shù)據(jù)分割與區(qū)間搜索提取算法,定義并選擇其原波形及一階微分、二階微分波形的特征信息,提取波形關(guān)于時間信息、幅值信息、比值信息、面積信息、頻域信息等具代表性的特征參數(shù)。首先,在一個完整周期內(nèi)的PPG波形及其一階微分、二階微分波形上搜索PPG波峰、PPG波谷、波潮、重搏波峰、重搏波谷、主波一次微分波形峰值點、重搏波一次微分波形峰值點、潮波一次微分波形波谷點、主波二次微分波形波峰點、二次微分波形波谷以及潮波二次微分波形波峰等特征點,在此基礎(chǔ)上計算相應(yīng)特征點的幅值,并計算時間信息參數(shù)諸如血流射出加速度最大時間段、一次心跳周期時間段、脈搏傳播時間[13]、血流射出容量最大時間段等,計算比值信息參數(shù)諸如潮波與主波的幅值比、重搏波峰與主波的幅值比、重搏波谷與主波的幅值比等,計算面積信息參數(shù)諸如一個完整周期內(nèi)PPG波形的面積、信號起始點至潮波處的面積、潮波至重搏波谷處的面積以及重搏波谷下一個信號起始點的面積等,計算頻域信息參數(shù)如頻譜峰值最大、次大頻率點等,加上年齡、身高、體重等個人信息參數(shù),形成一個包括32個特征參數(shù)的集合。
實驗中,將采取的一分鐘內(nèi)多個周期的信號進行上述特征參數(shù)的提取得到多組特征參數(shù),再計算每個特征參數(shù)[14]的平均值以形成特征參數(shù)向量,最后將各特征參數(shù)從1至32進行編號組成含32個特征向量的原始特征向量集。
皮爾森相關(guān)系數(shù)反映兩個變量間的相關(guān)性,兩個變量間的皮爾森相關(guān)系數(shù)絕對值小于0.2時說明這兩個變量間不具備相關(guān)性,反之則具有相關(guān)性。PCA算法將一個矩陣中的樣本數(shù)據(jù)投影到一個新的空間中去,包含了原始特征的絕大部分信息[15]的同時去除冗余的屬性特征,實現(xiàn)特征空間降維。
為去除冗余及不相關(guān)的特征及達到降低維度的目的,在不影響精度的前提下提高算法效率,本文通過由皮爾森相關(guān)系數(shù)先排除掉不相關(guān)的特征參數(shù),再由PCA進行降維,去除冗余的特征,保留核心特征并完成高維空間映射到低維空間,最終形成核心特征子集。
實驗時,對200個測試者進行實驗,采集到200個測試者的PPG信號并進行降噪處理后,提取特征參數(shù)得到200×32大小的特征矩陣,結(jié)合每個測試者的血紅蛋白值進行相關(guān)性分析得到皮爾森相關(guān)系數(shù)如圖6所示。
圖6 皮爾森相關(guān)系數(shù)圖
Fig.6 Pearson correlation coefficient
由圖6知,有21個特征參數(shù)皮爾森系數(shù)在0.2以上,故可構(gòu)造出用于計算血紅蛋白的矩陣大小為200×21,對該矩陣進行主成分分析,得到該矩陣主成分的特征值,如圖7所示。選擇特征值大于1的主成分,因此可得到11維用于計算血紅蛋白的矩陣。
圖7 各主成分的特征值
Fig.7 Characteristic value of principal component
其中,被選擇用于后續(xù)建模的11個特征分量別是血流射出加速度最大時間段、射血結(jié)束時間段、脈搏傳播時間、PPG起始點到潮波處的面積、PPG射血加速度最大處的幅值與PPG波峰幅值的比、潮波二次微分波形波峰對應(yīng)PPG波形處的幅值與PPG波峰幅值的比、潮波一次微分波形波谷對應(yīng)PPG波形處的幅值與PPG波峰幅值的比、收縮期與舒張期射血速度最大時間段、一次心跳周期時間段、對應(yīng)二次微分峰值的PPG波形處的幅值以及PPG起始點到重波峰值的時間段。
作為一種以核思想為基礎(chǔ)的模型訓練方法,SVR不僅減小算法結(jié)構(gòu)風險,而且克服傳統(tǒng)預(yù)測算法中模式識別的缺陷,其使用內(nèi)積核函數(shù)定義的非線性變換把輸入空間轉(zhuǎn)換到另一個高維空間,在這個高維空間里求解最優(yōu)超平面[16]。SVR可簡述如下:
對于訓練樣本集T,T={(x1,y1),(x2,y2),…,(x1,y1)}∈(x×y)l,其中xi∈Rm,yi∈{-1,1},i=1,…,l,則上述提到的11維矩陣可組成本文的訓練樣本集,形如y=ω1x1+ω2x2+…+ωNxN,簡化為f(x)=ωTx+b,求解最優(yōu)化問題,其優(yōu)化目標函數(shù)為
s.t.yi((ω·xi)+b)≥1。
(10)
根據(jù)最優(yōu)解(ω·x)+b*=0確定的分類面,決策函數(shù)為f(x)=sgn((ω·x)+b*)。
推廣至回歸問題即SVR,引入損失函數(shù),構(gòu)造最小化目標如下:
(11)
綜合考慮非線性因素及降低模型復(fù)雜度,本文在選擇RBF作為核函數(shù)的前提下,為建立穩(wěn)健的SVR模型,本文基于交叉驗證理論的網(wǎng)格搜索方法優(yōu)選懲罰參數(shù)c與核函數(shù)參數(shù)g。
實驗進行時,對30個男性與20個女性進行數(shù)據(jù)的采集,測試者的年齡在18~55周歲之間。測試者經(jīng)過適當休息后,保持身體平穩(wěn)避免抖動,同時使用本系統(tǒng)與Mission Hb微創(chuàng)血紅蛋白分析儀進行實驗。本系統(tǒng)采集到的數(shù)據(jù)作為預(yù)測值,而Mission Hb微創(chuàng)血紅蛋白分析儀測量得到的數(shù)據(jù)作為真實值,兩者相關(guān)性分析如圖8所示,圖中虛線為y=x。
經(jīng)實驗得,預(yù)測值和真實值之間的相關(guān)系數(shù)為0.76,表明基于SVR的人體血紅蛋白含量的無創(chuàng)檢測有一定的可靠性,與臨床檢測方法的檢測具有較高的相關(guān)性。
圖8 數(shù)據(jù)相關(guān)性分析
Fig.8 Correlation analysis
為進一步說明所建模型的有效性,對實驗數(shù)據(jù)進行一致性校驗,得到測值與真值之間的P值為0.802 4,H值為1。由兩組數(shù)據(jù)繪制的盒子圖如圖9所示,從圖9可見,盒子的本體有重疊部分,說明兩組數(shù)據(jù)沒有顯著性差異。
為說明本文方法處理效果的優(yōu)越性,對上文50個測試者采集到的11維數(shù)據(jù)集,將SVR模型與其他常用模型分別進行處理并預(yù)測血紅蛋白值,結(jié)合實際的有創(chuàng)測量結(jié)果并計算預(yù)測相關(guān)系數(shù)(Relevant coefficient of prediction,Rp)、預(yù)測標準偏差(Root mean squared error of prediction,RMSEP),結(jié)果如表2所示。Rp反映真值和測值之間相關(guān)的程度,而RMSEP衡量數(shù)據(jù)值偏離算術(shù)平均值的程度,由表2可見,相比多項式回歸、偏最小二乘回歸以及kNN算法,本文算法在具有最高的相關(guān)系數(shù),而預(yù)測標準偏差最小,說明本算法相比于這幾種常用的算法而言,預(yù)測效果最佳。
圖9 兩組數(shù)據(jù)的盒子圖
Fig.9 Boxplot of two sets of data
表2 SVR與常用算法處理效果的比較
Tab.2 Comparison of SVR and common algorithms
結(jié)合DCM03與AFE4400設(shè)計光電容積脈搏波采集系統(tǒng)以開展人體血紅蛋白的無創(chuàng)檢測研究。設(shè)計EEMD結(jié)合形態(tài)學濾波的方法對PPG信號進行降噪,通過對比不同濾波方法的信噪比,發(fā)現(xiàn)本文方法濾波效果較好,優(yōu)于小波算法及傳統(tǒng)陷波器。為驗證血紅蛋白預(yù)測模型的有效性,對50位實驗者進行測量,實驗結(jié)果表明,相關(guān)系數(shù)達到0.76,測值與真值之間有較高的相關(guān)性。為進一步說明模型的可靠性,對測值與真值進行一致性校驗,得到兩者間P值為0.802 4,H值為1,兩者盒子圖本體有較大重疊,表明測值與真值之間沒有顯著性差異。為說明本文方法的優(yōu)越性,將SVR與多項式回歸、偏最小二乘回歸以及kNN這幾種常用算法進行對比,由相關(guān)系數(shù)及標準偏差可知,SVR預(yù)測效果最佳。實驗結(jié)果表明,論文建立的無創(chuàng)血紅蛋白檢測模型具有一定的可靠性和準確性,可望用于貧血癥早期診斷。