李思楠, 趙 海
(1.河北民族師范學(xué)院 物理與電子工程系,河北 承德 067000;2.東北大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,遼寧 沈陽(yáng) 110000)
本文研究的人體生理狀態(tài)判別機(jī)制,首先通過(guò)脈搏、呼吸和體溫三種傳感器來(lái)實(shí)時(shí)采集人體的三大生命體征信號(hào),對(duì)信號(hào)進(jìn)行預(yù)處理和特征提取后,按照各自信號(hào)的判別機(jī)制將人體的生理狀態(tài)分類為“普通狀態(tài)”和“事件狀態(tài)”兩大類,最后將3組判決結(jié)果進(jìn)行數(shù)據(jù)融合,劃分出人體在連續(xù)時(shí)間段內(nèi)生理狀態(tài)所處于的不同狀態(tài)等級(jí),使用戶可以根據(jù)自身生理狀態(tài)所處的等級(jí)高低對(duì)自身情況進(jìn)行選擇性關(guān)注和感知。
利用反射式脈搏波傳感器[7]采集人體手腕處的脈搏波信號(hào),脈搏波信號(hào)是一種低頻信號(hào),頻率集中在10 Hz以下,采集過(guò)程中不可避免地會(huì)受到周?chē)h(huán)境中溫濕度、電磁場(chǎng)以及采集者自身呼吸和運(yùn)動(dòng)的影響。本文選擇Sym8小波作為基函數(shù),使用基于小波分解和重構(gòu)的方法,消除采集過(guò)程中摻雜的高頻噪聲及基線漂移。
脈搏波的上升支時(shí)間(t1)和高度(H1)與血管壁彈性和射血速度等指標(biāo)有關(guān);脈搏波的下降支時(shí)間(t2)和高度(H2)與外周阻力有關(guān);脈波周期(T)等于心跳周期;此外,反射指數(shù)(AI,AI=H2/H1)是反映動(dòng)脈硬化程度的重要指標(biāo)之一,可作為心血管健康的評(píng)價(jià)指標(biāo)。在本文中,使用差分閾值方法[8]來(lái)提取脈搏波的每個(gè)周期中的特征參數(shù),并篩選出6個(gè)時(shí)域特征向量S=[t1,t2,H1,H2,T,AI]。采用主成分分析的方法[9]來(lái)減少數(shù)據(jù)的維數(shù)。從該6維向量中提取前兩個(gè)主成分元素pca1和pca2作為SVM的輸入向量。
訓(xùn)練和測(cè)試的數(shù)據(jù)集由N對(duì)提取特征量后的樣本數(shù)據(jù)構(gòu)成,形式為:(xi,yi),i=1,2,…,N,xi∈R,yi∈{0,1}。這里xi為一個(gè)二維的特征向量,分別包含了從脈搏波數(shù)據(jù)集進(jìn)行特征向量提取和主成分分析后的第一和第二主成分pca1和pca2,即xi∈(pca1,pca2)。yi表示xi數(shù)據(jù)的標(biāo)簽,如果yi=1,xi屬于事件狀態(tài),如果yi=0,xi屬于普通狀態(tài)。
SVM訓(xùn)練應(yīng)用于本文是一個(gè)帶約束的尋找最優(yōu)“超平面”的最小值求解問(wèn)題[10]
(1)
式中w為最優(yōu)“超平面”的法向量,使‖w‖變得最小,就相當(dāng)于使分類間隔達(dá)到最大,約束條件為
圍繞保障人民群眾飲食用藥安全這一中心任務(wù),昆明市局全面落實(shí)“黨政同責(zé)”和“四有兩責(zé)”要求,把食品藥品安全納入各級(jí)政府公共安全體系、目標(biāo)管理績(jī)效考核體系,權(quán)重提高到3%,實(shí)行“一票否決制”。2013年以來(lái)開(kāi)展了50多項(xiàng)全市食品藥品安全整治行動(dòng)。將食品藥品安全列入全市“十三五”重點(diǎn)專項(xiàng)規(guī)劃,每年專項(xiàng)經(jīng)費(fèi)超過(guò)2000萬(wàn)元。
yi(wTxi+b)≥1,i=1,2,…,N
(2)
式中b為超平面距離原點(diǎn)偏移量,而分類函數(shù)判別式為
f(x)=sgn{(wTx)+b}
(3)
由于在實(shí)際情況中,樣本數(shù)據(jù)中的“事件狀態(tài)”和“普通狀態(tài)”的特征向量分界可能并不明顯,不是線性可分的情況,有可能出現(xiàn)兩類數(shù)據(jù)的混疊。為此,引入松弛變量ξi≥0和誤差懲罰因子C
(4)
yi(wTxi+b)≥1-ξi,i=1,2,…,N
(5)
本文采用粒子群算法[11~13]來(lái)確定最優(yōu)的懲罰因子C和核函數(shù)的參數(shù)σ,使選擇C和σ的過(guò)程轉(zhuǎn)化為一個(gè)優(yōu)化搜索過(guò)程。
訓(xùn)練和分類的過(guò)程歷經(jīng)3個(gè)階段,通過(guò)數(shù)據(jù)準(zhǔn)備階段的脈搏波特征提取和主成分分析,確定了pca1和pca2作為SVM的2維輸入向量,在算法標(biāo)定階段,利用粒子群算法來(lái)確定最優(yōu)懲罰因子C和核函數(shù)的參數(shù)σ,在分類判別階段由構(gòu)建好的分類器對(duì)測(cè)試數(shù)據(jù)進(jìn)行分類。分類的可能結(jié)果如表1所示,為了客觀分析該方法的分類效果,本文采用了SVM常用的幾項(xiàng)評(píng)價(jià)指標(biāo)[14,15]:精確率:Precision=TP/(TP+FP);召回率:Recall=TP/(TP+FN);分類準(zhǔn)確率:Accuracy=(TP+FN)/(TP+FN+TN+FN)。
表1 分類的可能結(jié)果匯總
以上的指標(biāo)是反映分類器的靜態(tài)性能指標(biāo),為了評(píng)估分類判別的動(dòng)態(tài)過(guò)程,需要通過(guò)觀察ROC(receiver opera-ting characteristic)曲線的變化趨勢(shì)。其中,真陽(yáng)性率(true positive rate,TPR=TP/(TP+FN))和假陽(yáng)性率(false positive rate,FPR=FP/(FP+TN))分別作為ROC曲線的橫坐標(biāo)和縱坐標(biāo)。AUC是用ROC曲線下的面積來(lái)評(píng)價(jià)分類器性能,計(jì)算公式為
(6)
本文中實(shí)驗(yàn)者經(jīng)歷三種事件狀態(tài),包含為運(yùn)動(dòng)、酒精刺激和睡眠,普通狀態(tài)為人體處于靜止坐立狀態(tài)之下。選用紅外反射式脈搏傳感器采集人體手腕處的脈搏波信號(hào),采樣率200 Hz。16名實(shí)驗(yàn)者(年齡23~27歲),在實(shí)驗(yàn)場(chǎng)景中依次經(jīng)歷4種實(shí)驗(yàn)過(guò)程分別為:靜止坐立(10 min)、運(yùn)動(dòng)(10 min)、睡眠(80 min)和喝酒刺激(30 min),分類標(biāo)簽如表2所示。采集得到的數(shù)據(jù)通過(guò)交叉驗(yàn)證的方式,選取其中50 %為訓(xùn)練集數(shù)據(jù),另50 %為測(cè)試集數(shù)據(jù)。
表2 人體生理狀態(tài)分類標(biāo)簽
圖1(a)所示為SVM構(gòu)建的訓(xùn)練效果?!撂?hào)代表訓(xùn)練集中的普通狀態(tài)下對(duì)應(yīng)數(shù)據(jù),實(shí)心圓點(diǎn)代表事件狀態(tài)下(運(yùn)動(dòng)、睡眠、喝酒)對(duì)應(yīng)的數(shù)據(jù),兩類數(shù)據(jù)的邊界界限并不明顯,但SVM可以通過(guò)最優(yōu)分類曲線將數(shù)據(jù)進(jìn)行區(qū)分。
圖1(b)為SVM的分類效果,方格符號(hào)記表示被分類為“普通狀態(tài)”的測(cè)試數(shù)據(jù),米字符號(hào)記表示被分類為“事件狀態(tài)”的測(cè)試數(shù)據(jù)。從中可以看到雖然邊界模糊,但兩種生理狀態(tài)可以被成功分類。
圖1 SVM訓(xùn)練和分類效果
統(tǒng)計(jì)16名實(shí)驗(yàn)者的4項(xiàng)分類指標(biāo)如表3所示,精確率和召回率平均值分別達(dá)到了96.12 %和94.18 %,平均的分類準(zhǔn)確率也達(dá)到了96.85 %。從實(shí)驗(yàn)者1的ROC曲線中可以看出,分類器的TPR始終保持在90 %以上,并不斷提升,AUC值達(dá)到0.9476。
由于每個(gè)脈搏周期都會(huì)產(chǎn)生一組分類結(jié)果,本文利用脈搏波得到了一組分類判決結(jié)果(0/1),如果采集的時(shí)間較長(zhǎng),則判決結(jié)果同樣為大量數(shù)據(jù)。因此,本文會(huì)對(duì)判決的結(jié)果進(jìn)行單位轉(zhuǎn)換,由每個(gè)脈搏周期生成一個(gè)判決結(jié)果轉(zhuǎn)化為1 min生成一個(gè)判決結(jié)果。采取的方法是:如果一分鐘內(nèi)判決結(jié)果中0(普通狀態(tài))的數(shù)量大于1(事件狀態(tài))的數(shù)量,則用二進(jìn)制數(shù)0表示該1 min的判決結(jié)果,否則用1表示該1 min的判決結(jié)果。
利用呼吸波傳感器獲取呼吸信號(hào),從得到的呼吸信號(hào)時(shí)域周期中可以計(jì)算出實(shí)時(shí)的呼吸頻率,然后跟設(shè)定好的閾值比較,來(lái)判定當(dāng)前人的生理狀態(tài)。成年人在平靜狀態(tài)下的呼吸頻率為每分鐘16~20次,女性平均比男性快1~2次,低于12次/分屬于呼吸過(guò)緩。因此,文本中設(shè)置呼吸頻率的閾值為下限12次/分,上限20次/分。在閾值范圍內(nèi),人體的狀態(tài)被判定為“普通”(標(biāo)記為0),超出閾值范圍則狀態(tài)被判定為“事件”(標(biāo)記為1)。每個(gè)呼吸周期會(huì)產(chǎn)生一次判決結(jié)果,因此,同樣需要對(duì)呼吸的分類結(jié)果進(jìn)行單位轉(zhuǎn)化,轉(zhuǎn)化方式同脈搏波的轉(zhuǎn)化方法相同,最終由呼吸波信號(hào)的分類結(jié)果得到一組每分鐘對(duì)應(yīng)一個(gè)的判決結(jié)果(0/1)。
人體的體溫不會(huì)在短時(shí)間發(fā)生突變,本文中基于體溫信號(hào)的人體狀態(tài)分類先利用數(shù)字體溫傳感器采集人體的體溫信號(hào),每分鐘采樣一次,再跟設(shè)定好的閾值進(jìn)行比較,判斷人體生理狀態(tài)分類為0(普通狀態(tài))還是1(事件狀態(tài))。設(shè)定的閾值可以根據(jù)使用者的具體情況而調(diào)節(jié)。本文實(shí)驗(yàn)者的閾值范圍設(shè)定在36~37 ℃。在這個(gè)閾值范圍內(nèi)分類結(jié)果為0(普通狀態(tài)),超過(guò)閾值范圍分類為1(事件狀態(tài))。最終生成一個(gè)只含有0或1的二進(jìn)制數(shù)組。
本文提出一種基于二進(jìn)制編碼的數(shù)據(jù)融合方法,將三種信號(hào)的判決結(jié)果進(jìn)行決策級(jí)融合,得到人體生理狀態(tài)的綜合評(píng)價(jià)結(jié)果(1組3 Bit二進(jìn)制編碼)。為了能夠直觀展示這種數(shù)據(jù)融合方法,本文選擇了一名實(shí)驗(yàn)者,連續(xù)4 h內(nèi)通過(guò)三種傳感器采集脈搏波、呼吸和體溫信號(hào),采集過(guò)程如圖2(a)所示,這4 h內(nèi)該實(shí)驗(yàn)者經(jīng)歷了10 min的運(yùn)動(dòng)、80 min睡眠和40 min的喝酒刺激,各個(gè)時(shí)間節(jié)點(diǎn)已被標(biāo)注。利用三種信號(hào)各自的判別機(jī)制對(duì)人體生理狀態(tài)生成了連續(xù)240 min的0/1判決數(shù)組如圖2(b)所示,三種信號(hào)都對(duì)人體經(jīng)歷的事件狀態(tài)的分類能力各不相同。
圖2 三種信號(hào)采集過(guò)程、時(shí)域波形及分類判決結(jié)果
在進(jìn)行二進(jìn)制編碼融合的過(guò)程中,需要先確定三組信號(hào)脈搏、呼吸、體溫各自分類判決結(jié)果的編碼順序,即確定融合后的3 bit二進(jìn)制數(shù)中,最高位、中間位、最低位的優(yōu)先級(jí)排序。
三組狀態(tài)的分類結(jié)果由3組二進(jìn)制序列(240個(gè)0或1)組成。其中1代表人體處于“事件”狀態(tài),0代表人體處于“普通狀態(tài)”。由一次的狀態(tài)分類結(jié)果到下一次的分類結(jié)果共存在4種情況:p1表示由前一狀態(tài)0變換為下一狀態(tài)1的次數(shù)占全部分類的比例;p2表示由前一狀態(tài)1變換為下一狀態(tài)0的次數(shù)占全部分類次數(shù)的比例;同理,p3表示由前一狀態(tài)0變換為下一狀態(tài)0的次數(shù)占全部分類次數(shù)的比例;p4表示由前一狀態(tài)1變換為下一狀態(tài)1的次數(shù)占全部分類次數(shù)的比例。
這里用p1和p2的和代表了生理狀態(tài)發(fā)生改變的頻率,它的值越小,說(shuō)明此種信號(hào)越穩(wěn)定,越不容易發(fā)生突變。這里引入熵S的概念來(lái)衡量信號(hào)的狀態(tài)變換的頻度
S=-(p1+p2)log2(p1+p2)
(7)
三種信號(hào)的熵值統(tǒng)計(jì)如表3所示,熵值S的值越大,代表狀態(tài)發(fā)生改變的期望越高,即兩種狀態(tài)之間轉(zhuǎn)換的頻度越高,該信號(hào)自身的穩(wěn)定性越差;反之,信號(hào)的穩(wěn)定性越好。由表3統(tǒng)計(jì)可以看出,體溫信號(hào)的穩(wěn)定性最高,脈搏次之,呼吸信號(hào)的穩(wěn)定性最差。因此,本文選體溫信號(hào)的判決結(jié)果作為3 bit二進(jìn)制編碼的最高位,脈搏信號(hào)的判決結(jié)果為中間位,呼吸信號(hào)的判決結(jié)果作為最低位。
表3 三種信號(hào)的熵值統(tǒng)計(jì)
經(jīng)過(guò)了二進(jìn)制編碼融合方法之后形成的人體生理狀態(tài)綜合評(píng)價(jià)結(jié)果是由一組3 bit二進(jìn)制數(shù),因?yàn)? bit二進(jìn)制數(shù)的取值范圍是0~7,本文也將人體的生理狀態(tài)分為8個(gè)等級(jí),如表4所示。
利用二進(jìn)制編碼融合的方法,將人體的生理狀態(tài)評(píng)價(jià)結(jié)果表示為8個(gè)等級(jí)的時(shí)間序列的形式。數(shù)據(jù)融合后的等級(jí)越高,表明人的生理狀態(tài)越值得關(guān)注,等級(jí)越低,表明人體的生理狀態(tài)越穩(wěn)定,越不必關(guān)注。處于等級(jí)0時(shí)則代表人此刻處于“普通狀態(tài)”。
表4 生理狀態(tài)的等級(jí)劃分
實(shí)驗(yàn)者在4 h(240 min)的生理狀態(tài)等級(jí)分布情如圖3所示,時(shí)間分辨率為1 min,每條直線代表了人體生理狀態(tài)在該分鐘內(nèi)所處的等級(jí),而線段的高度代表了所處等級(jí)的大小,一共分8個(gè)等級(jí),線段越高,等級(jí)越高。從圖中可以看到,實(shí)驗(yàn)者所經(jīng)歷的運(yùn)動(dòng)、睡眠、飲酒三種狀態(tài)在圖中都有不同等級(jí)的體現(xiàn)。高強(qiáng)度的運(yùn)動(dòng)對(duì)人體生理狀態(tài)的影響最大,該段時(shí)間內(nèi)人體被判定為最高等級(jí),值得用戶重點(diǎn)關(guān)注,40 min喝酒過(guò)程,人體生理狀態(tài)先由等級(jí)2上升到等級(jí)6,隨后又下降回等級(jí)2,直接對(duì)映了人體生理狀態(tài)變化的過(guò)程,開(kāi)始階段酒精對(duì)人體的影響逐漸加大,對(duì)心血管系統(tǒng)的刺激導(dǎo)致人體內(nèi)部的各種生理反應(yīng)開(kāi)始顯現(xiàn),體溫上升,而最后當(dāng)酒精隨著人體汗液的排出及肝臟的處理,生理狀態(tài)又逐漸恢復(fù)為普通狀態(tài)。而睡眠過(guò)程在圖中的等級(jí)為2,說(shuō)明了睡眠對(duì)人體的生理狀態(tài)的影響程度沒(méi)有運(yùn)動(dòng)和喝酒影響大,只在脈搏信號(hào)上得以區(qū)分,在呼吸和體溫信號(hào)上沒(méi)有顯現(xiàn)出區(qū)別。
圖3 1min分辨率的可視化效果
本文提出一種多傳感器融合的人體生理狀態(tài)分類方法,通過(guò)脈搏、呼吸、體溫三種傳感器采集的數(shù)據(jù)分別將人體生理狀態(tài)分類為“普通狀態(tài)”和“事件狀態(tài)”,隨后采用二進(jìn)制編碼的方式將3組分類結(jié)果進(jìn)行數(shù)據(jù)融合,得出了一組能夠反映人體所處生理狀態(tài)等級(jí)的可視化結(jié)果,不僅增強(qiáng)了使用者對(duì)自身生理狀態(tài)的感知,還能根據(jù)最終結(jié)果還原出每一組信號(hào)的分類情況。為體域網(wǎng)產(chǎn)品中如何處理和存儲(chǔ)海量人體生理數(shù)據(jù)提供了一個(gè)全新的方法。