馮玉蓉 陳 瑋 蔡光躍
指紋、人臉、掌紋、虹膜、視網(wǎng)膜等人體生理特征目前已經(jīng)被廣泛應(yīng)用于商用生物識(shí)別領(lǐng)域,然而,這類特征同屬“靜態(tài)”特征,容易被復(fù)制、偽造。近年來,心電、心音等“動(dòng)態(tài)”的人體生理特征已被證明可用于生物識(shí)別。其中基于心電生物識(shí)別的研究較為廣泛,這得益于:心電在病理檢測(cè)等領(lǐng)域的研究起步較早,研究也較深入,且心電信號(hào)比較容易采集、系統(tǒng)成本較低,最關(guān)鍵的是心電信號(hào)是“動(dòng)態(tài)”特征,理論上很難模仿,不像指紋、人臉、掌紋等生理特征多為靜態(tài)二維圖像,而像心電、心音、腦電信號(hào)通常是動(dòng)態(tài)的時(shí)間函數(shù)。
心電信號(hào)用于生物識(shí)別早在1999年由Biel等提出,此方法首先應(yīng)用時(shí)域分析方法,再提取心電信號(hào)各階段的持續(xù)時(shí)間、幅度、傾角等特征進(jìn)行簇類獨(dú)立軟模型(Soft Independent Modeling of Class Analogy,SIMCA)分類,對(duì)20位受試者的心電特征信號(hào)進(jìn)行了聚類分析,驗(yàn)證了心電信號(hào)可以應(yīng)用于生物識(shí)別領(lǐng)域[1~2];Irvine 等于 2001年提出通過檢測(cè)心率變異性作為特征信號(hào)進(jìn)行人體識(shí)別[3];隨后在2002年,Shen,Tompkins和Hu等聯(lián)合使用模板法與DBNN(Decision-Based Neural Network)算法進(jìn)行人體識(shí)別,并達(dá)到100%的識(shí)別率。Israel等于2005年在前人的基礎(chǔ)上從心電信號(hào)標(biāo)準(zhǔn)波形中提取了15種時(shí)長(zhǎng)作為特征向量,并分析了電極位置、心情狀況等因素對(duì)識(shí)別性能的影響;2008年,Chanetal分別應(yīng)用信號(hào)之間的殘差百分比(Percent Residual Difference,PRD)、相關(guān)系數(shù)(Correlation Coefficient,CCORR)以及小波距離(Wavelet Distance Measure,WDIST)三種特征進(jìn)行分類,實(shí)驗(yàn)結(jié)果表明,WDIST方法的分類準(zhǔn)確率要優(yōu)于前兩種方法近10%,準(zhǔn)確率達(dá)89%;2008年,Khalil and Sufi提出了多項(xiàng)式擬合參數(shù)距離(polynomial distance measurement,PDM)算法,該算法先檢出心電信號(hào)的標(biāo)準(zhǔn)波形,并將其分為P波、QRS波、T波三段,對(duì)各段信號(hào)微分后進(jìn)行多項(xiàng)式擬合,將三段曲線的多項(xiàng)式擬合參數(shù)合并后作為特征值,通過測(cè)量特征值之間的距離進(jìn)行人體識(shí)別,結(jié)果表明,該算法所需的心電波形周期短,識(shí)別速度快,識(shí)別準(zhǔn)確率高。與多數(shù)基于標(biāo)準(zhǔn)心電信號(hào)波形檢測(cè)的生物識(shí)別系統(tǒng)不同,Plataniotis,Hatzinakos和Lee于2006提出了一種以ECG波形序列的離散余弦變換之間的自相差系數(shù)作為特征值的生物識(shí)別算法,該算法具有較低的錯(cuò)誤拒絕率、錯(cuò)誤通過率且識(shí)別準(zhǔn)確率可達(dá)100%。另外,基于心電的人體識(shí)別技術(shù)也正在逐步走向應(yīng)用研究[3~5],如 Sufi和 Khalil在 2008 將這一技術(shù)用于遠(yuǎn)程醫(yī)療系統(tǒng)中的病人識(shí)別;Bui,Agrafioti和Hatzinakos在2010將心電生物識(shí)別應(yīng)用于網(wǎng)絡(luò)安全認(rèn)證。上述各類算法與應(yīng)用中,分析心電頻譜來提取生物特征的方法較為少見,多采用波形特征進(jìn)行分析。
1)導(dǎo)聯(lián)的選擇:標(biāo)準(zhǔn)的心電圖有12個(gè)導(dǎo)聯(lián),但是從已有的文獻(xiàn)來看,大多采用一個(gè)導(dǎo)聯(lián)的數(shù)據(jù),也有使用全部12導(dǎo)聯(lián)[1]。一方面,因?yàn)楦鱾€(gè)導(dǎo)聯(lián)之間信號(hào)的相關(guān)性較大,選擇的通道較多會(huì)產(chǎn)生冗余。從實(shí)用性來講,過多的導(dǎo)聯(lián)會(huì)使系統(tǒng)更加龐大復(fù)雜。
2)波形特征分析:心電的波形信息相對(duì)更多,幾乎所有的心電識(shí)別方法都是從波形上來區(qū)分。經(jīng)過對(duì)其他文獻(xiàn)所使用的特征進(jìn)行歸納[6~7],再結(jié)合臨床上診斷所用的方法,預(yù)計(jì)可以嘗試的心電特征有如下幾種:
時(shí)間點(diǎn):P波位置、Q波位置、S波位置、T波位置(以R波峰值為參考點(diǎn),分別計(jì)算相對(duì)時(shí)間位置)。
時(shí)間間隔:P波間期、QRS波間期、T波間期、PR間期、QT間期、RR間期
其他:QRS波形面積、ST段斜率。
因?yàn)槿说男穆什皇呛愣ǖ?,所以在?jì)算時(shí)間點(diǎn)的時(shí)候可以在每個(gè)心搏周期內(nèi)歸一化,計(jì)算后得到的是相對(duì)的時(shí)間或者百分比。
分析心電頻譜來提取生物特征的方法較為少見。
圖1 ECG信號(hào)的15個(gè)時(shí)域特征和6個(gè)幅值特征
通常,心音心電信號(hào)采集過程中電極或者聽診器的放置位置都有了固定的模式,如心電的胸導(dǎo)聯(lián)和肢體導(dǎo)聯(lián),心音也有4個(gè)典型的位置(Aortic,Pulmonary,LLSB and Mitral)。因?yàn)樾囊魝鞑サ母蓴_比心電多,心音只能在心臟周圍前胸和后背的區(qū)域采集。心電的采集區(qū)域要大一些,手腕、腳腕、肩部都能采到。所以我想,在采集心電的時(shí)候,除了標(biāo)準(zhǔn)的電極位置之外,還要考慮電極位置是否容易接觸到,像手腕、腰部,甚至手指。聽診器的位置在每次實(shí)驗(yàn)時(shí)相對(duì)固定,如第X肋間,鎖骨中線外(內(nèi))側(cè)X厘米等等。
至于實(shí)驗(yàn)對(duì)象的姿勢(shì)變化和身體狀態(tài)是否會(huì)顯著影響實(shí)驗(yàn)結(jié)果,現(xiàn)在還沒從文獻(xiàn)中找到答案?;蛟S可以嘗試在不同的條件下做實(shí)驗(yàn),靜坐、直立、平躺等姿勢(shì),和適度運(yùn)動(dòng)后半小時(shí)、一小時(shí)等等。
在做到盡可能多地從心音心電信號(hào)中提取得到信息之后,要選擇可靠的學(xué)習(xí)和識(shí)別的算法來處理特征向量。
第二點(diǎn),在進(jìn)行動(dòng)物養(yǎng)殖時(shí),缺乏必要的免疫程序。全國(guó)范圍內(nèi)動(dòng)物養(yǎng)殖的品種較為復(fù)雜,為了適應(yīng)市場(chǎng),很多區(qū)域擁有具有區(qū)域性的動(dòng)物養(yǎng)殖方案,這則造成了動(dòng)物養(yǎng)殖免疫程序的混亂。另外,很多鄉(xiāng)鎮(zhèn)農(nóng)戶文化程度較低,對(duì)于動(dòng)物免疫程序毫無概念,往往錯(cuò)過了最佳的動(dòng)物防疫時(shí)機(jī),造成動(dòng)物免疫效果不理想。
身份確認(rèn)可用閾值判斷的方法來實(shí)現(xiàn)。預(yù)先把處理得到的所有成員的特征信息求均值,每個(gè)成員用一個(gè)N維的向量表示,向量存儲(chǔ)在數(shù)據(jù)庫(kù)中。輸入一個(gè)新的N維向量Xin,并且選擇需要匹配的成員Mi,計(jì)算向量Xin與Mi的歐式距離,如果距離小于閾值,則認(rèn)為結(jié)果匹配;反之則識(shí)別不成功。
身份識(shí)別是指輸入一個(gè)識(shí)別特征,在數(shù)據(jù)庫(kù)中尋找出特征與它最接近的成員。識(shí)別過程是學(xué)習(xí)和分類的過程。已有的樣本數(shù)據(jù)組成一個(gè)訓(xùn)練集,把他們作為分類模型的輸入信號(hào),通過修改模型參數(shù),使得輸出的分類結(jié)果與訓(xùn)練數(shù)據(jù)所屬類別最為接近。
BP神經(jīng)網(wǎng)絡(luò)的分類是把訓(xùn)練集的每個(gè)N維特征編碼作為輸入層,經(jīng)過中間幾個(gè)隱含層,按照不同權(quán)值計(jì)算,在輸出層預(yù)測(cè)特征編碼所對(duì)應(yīng)的待識(shí)別個(gè)體。在不斷的迭代計(jì)算過程中調(diào)整隱含層各個(gè)節(jié)點(diǎn)的權(quán)值,使預(yù)測(cè)的結(jié)果最優(yōu)化。
SVM支持向量機(jī)是建立一個(gè)分類超平面作為決策曲面,使正例和反例之間的隔離邊緣被最大化。首先通過非線性變換將訓(xùn)練集的N維特征編碼變換成一個(gè)M維(M>N)的向量,然后在M維的空間中求取最優(yōu)線性分類面,非線性變換的核函數(shù)包括內(nèi)積函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)等。最后,將需分類的樣本數(shù)據(jù)也同樣映射到這個(gè)平面,根據(jù)映射的結(jié)果預(yù)測(cè)樣本的分類。
LVQ學(xué)習(xí)向量量化是用于訓(xùn)練競(jìng)爭(zhēng)層的有監(jiān)督學(xué)習(xí)方法的輸入前向神經(jīng)網(wǎng)絡(luò)。輸入一個(gè)訓(xùn)練特征編碼,計(jì)算與它最近的競(jìng)爭(zhēng)層神經(jīng)元,從而找到與之相連接的線性輸出層神經(jīng)元,若輸入的特征編碼類別與線性輸出層神經(jīng)元所對(duì)應(yīng)的類別一致,則對(duì)應(yīng)的競(jìng)爭(zhēng)層神經(jīng)元權(quán)值沿著輸入的方向移動(dòng);反之,若兩者類別不一致,則對(duì)應(yīng)的競(jìng)爭(zhēng)層神經(jīng)元沿著輸入的反方向移動(dòng)。
心電信號(hào)的消噪方法和心音信號(hào)的處理方法類似。心電信號(hào)的主要頻率成分集中在0.1Hz~250Hz,其頻率分布比心音信號(hào)更加廣泛。原始信號(hào)的采樣頻率為1000Hz,信號(hào)以120s為一個(gè)單位。測(cè)試的數(shù)據(jù)來自隨機(jī)選取的十三個(gè)測(cè)試者,在靜息狀態(tài)下記錄他們5~9段心電圖II導(dǎo)聯(lián)信號(hào)。
信號(hào)的消噪仍舊使用小波分解和重構(gòu)的方法。小波函數(shù)選用db5,調(diào)用Matlab函數(shù)’wavedec’對(duì)信號(hào)做9級(jí)小波分解。去除第1、2級(jí)高頻噪音和第9級(jí)低頻直流成分,調(diào)用Matlab函數(shù)’waverec’將剩余各級(jí)小波系數(shù)重構(gòu),得到消噪之后的心音信號(hào)。
上文已經(jīng)提到,心電信號(hào)在時(shí)域上的信息量較多,如QRS波群的寬度,QT間隔,R波、T波的幅度大小等等[8,9]。所以,心電信號(hào)的特征主要從時(shí)域和波形上選擇。
綜合比較文獻(xiàn)[1][10][11]所選用的特征,本文在此基礎(chǔ)上又增加了關(guān)于T波的細(xì)節(jié)特征,最終選取23個(gè)心電信號(hào)特征,如下表所示。
表1 23個(gè)心電特征的列表
圖2 心電特征在信號(hào)波形圖上的對(duì)應(yīng)關(guān)系
首先,對(duì)去噪的信號(hào)做微分運(yùn)算,對(duì)微分的結(jié)果平方,再用移動(dòng)窗口局部求和,找出信號(hào)變化最劇烈的位置。將區(qū)間內(nèi)絕對(duì)值最大的點(diǎn)定位R波的頂點(diǎn)。再在兩個(gè)R波之間檢測(cè)T波的頂點(diǎn)。
標(biāo)記完R波和T波,在R波前后各加一個(gè)窗口,區(qū)間內(nèi)絕對(duì)值最大的點(diǎn)分別標(biāo)記為Q波和S波的頂點(diǎn)。Q波起點(diǎn)、S波終點(diǎn)、T波的起點(diǎn)和終點(diǎn)用閾值法求的。Q波起點(diǎn)處附近信號(hào)的斜率逐漸增大,把斜率剛剛超過設(shè)定閾值的點(diǎn)標(biāo)記為Q波起點(diǎn)。在S波終點(diǎn)附近,信號(hào)的斜率逐漸減小,把斜率剛剛小于設(shè)定閾值的點(diǎn)標(biāo)記為S波終點(diǎn)。用同樣的辦法找出T波的起點(diǎn)和終點(diǎn)。閾值的設(shè)定需要根據(jù)信號(hào)的幅度做調(diào)整,初次分析測(cè)試者的信號(hào)時(shí)需要人工確認(rèn)。
按照上述方法,計(jì)算每一個(gè)心電圖波形的上述特征參數(shù)。再對(duì)同一個(gè)測(cè)試者同一段120s測(cè)試信號(hào)內(nèi)的所有心電圖特征參數(shù)分別求和,除以心跳次數(shù),得到每個(gè)參數(shù)的平均值。把23個(gè)平均值合成為一個(gè)23維向量,表示一個(gè)樣本片段。因此,每一段120s的心電圖信號(hào)都生成一個(gè)23維向量,表示這一個(gè)樣本片段。根據(jù)采樣的數(shù)據(jù),每個(gè)測(cè)試者分別對(duì)應(yīng)5~9個(gè)向量。
接下去就是利用模式識(shí)別的方法對(duì)特征進(jìn)行學(xué)習(xí)和分類。
圖3 98個(gè)樣本中,兩個(gè)特征(RR間期和QRS寬度)的分布情況
我們采用支持向量機(jī)的方法來對(duì)特征進(jìn)行學(xué)習(xí)和分類。
支持向量機(jī)(簡(jiǎn)稱SVM)是一種監(jiān)督式學(xué)習(xí)的方法,即已知訓(xùn)練點(diǎn)的類別,求訓(xùn)練點(diǎn)和類別之間的對(duì)應(yīng)關(guān)系,以便將訓(xùn)練集按照類別分開,或者是預(yù)測(cè)新的訓(xùn)練點(diǎn)所對(duì)應(yīng)的類別。
對(duì)于線性可分的情況,N維特征所在的空間中線性判別函數(shù)的一般式為g(x)=wTx+b,分類面方程是wTx+b=0。將判別函數(shù)歸一化,使兩類所有樣本滿足 | g(x ) |≥1,此時(shí)離分類面最近的樣本的 | g(x)|=1,而要求分類面對(duì)所有樣本都能正確分類,就是要求它滿足 yi(wTxi+b)-1≥0,i=1,2,…,n。兩類樣本的分類空隙(Margin)的間隔大小:Margin=2‖w‖。
因此,最優(yōu)分類面問題可以表示成如下的約束優(yōu)化問題,求函數(shù)φ
SVM的主要思想可以概括為兩點(diǎn):一是針對(duì)線性可分情況進(jìn)行分析,對(duì)于線性不可分的情況,通過使用非線性映射算法將低維輸入空間線性不可分的樣本轉(zhuǎn)化為高維特征空間使其線性可分,從而使得高維特征空間采用線性算法對(duì)樣本的非線性特征進(jìn)行線性分析成為可能;二是它基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論之上在特征空間中建構(gòu)最優(yōu)分割超平面,使得學(xué)習(xí)器得到全局最優(yōu)化,并且在整個(gè)樣本空間的期望風(fēng)險(xiǎn)以某個(gè)概率滿足一定的上界。的最小值。為此,可以定義如下的Lagrange函數(shù):
其中,ai≥0為L(zhǎng)agrange系數(shù),我們的問題是對(duì)w和b求Lagrange函數(shù)的最小值。把上式分別對(duì)w、b、αi求偏微分并令它們等于0,得:
以上三式加上原約束條件可以把原問題轉(zhuǎn)化為如下凸二次規(guī)劃的對(duì)偶問題:
這是一個(gè)不等式約束下二次函數(shù)機(jī)制問題,存在唯一最優(yōu)解。若 ai為最優(yōu)解,則不為零的樣本即為支持向量,因此,最優(yōu)分類面的權(quán)系數(shù)向量是支持向量的線性組合。b*可由約束條件αi[yi(wTxi+b)-1]=0求解,由此求得的最優(yōu)分類函數(shù)是:
若一個(gè)超平面不能把兩類點(diǎn)完全分開時(shí)(只有少數(shù)點(diǎn)被錯(cuò)分),可以引入松弛變量 ξi(ξi≥0,i=),使超平面wTx+b=0滿足:
當(dāng)0<ξi<1時(shí),樣本點(diǎn) xi仍舊被正確分類,而當(dāng)ξi≥1時(shí)樣本點(diǎn)xi被錯(cuò)分。為此,引入以下目標(biāo)函數(shù):
其中C是一個(gè)正常數(shù),稱為懲罰因子,此時(shí)SVM可以通過二次規(guī)劃(對(duì)偶規(guī)劃)來實(shí)現(xiàn):
將每位測(cè)試者的數(shù)據(jù)分為兩類,一類是學(xué)習(xí)數(shù)據(jù),另一類是測(cè)試數(shù)據(jù)。在每位測(cè)試者的心電圖片段中,隨機(jī)選擇兩個(gè)23維向量作為測(cè)試數(shù)據(jù),其余片段作為學(xué)習(xí)數(shù)據(jù)。這里使用libsvm工具箱的Matlab代碼來進(jìn)行測(cè)試。
經(jīng)過訓(xùn)練識(shí)別和測(cè)試,12名測(cè)試者的24個(gè)樣本中有21個(gè)識(shí)別成功,準(zhǔn)確率為87.5%。下圖是測(cè)試結(jié)果顯示,橫軸是樣本編號(hào),縱軸是樣本類別。如圖所示,24個(gè)樣本中有3個(gè)樣本的預(yù)測(cè)結(jié)果和實(shí)際結(jié)果不相符合。
圖4 訓(xùn)練和測(cè)試結(jié)果
本文提出了一種利用心電心音特征作為生物識(shí)別的方法。對(duì)于得到的心電心音信號(hào)首先進(jìn)行多重小波濾波去噪,得到較好的分類基礎(chǔ)數(shù)據(jù),再采用支持向量機(jī)做特征分類與識(shí)別,并選取了兩組數(shù)據(jù)互為對(duì)比。通過實(shí)際的心電心音識(shí)別實(shí)驗(yàn),表明了本文中所采用的方法有較好的識(shí)別效果,可作為生物身份識(shí)別的一種實(shí)際方法。
[1]Lena Biel.ECG Analysis:A New Approach in Human Identification[C]//IMTCi99.Proc.of the 16th IEEEInstrumentation and Measurement Technology ConJ,1999(1):557-561.
[2]Biel,Lena;Pettersson,Ola;Philipson,Lennart;Wide Peter.ECG Analysis:A New Approach in Human Identification[J].2001 IEEE Transactions on Instrumentation and Measurement,2001,50(3):808-812.
[3]Beritelli,F(xiàn).A Multiband Approach To Human Identity Verification Based On Phonocardiogram signal analysis[M].Biometrics Symposium(Bsym),2008:71-76.
[4]Beritelli,F(xiàn).,and Serrano,Biometric identification based on frequency analysis of cardiac sounds[C]//IEEE Transactions on Information Forensics and Security 2,2007:596-604.
[5]Biel L,Pettersson O,Philipson L,and Wide P,ECGanalysis:A new approach in human identification[C]//Proceedings of the 16th IEEE Instrumentation and Measurement Technology Conference,Vols.1-3,557-561.
[6]侯宏花,桂志國(guó).人體心電心音信號(hào)定征分析系統(tǒng)設(shè)計(jì)[J].醫(yī)療衛(wèi)生裝備,2010,31(4):24-26.
HOU Honghua,GUI Zhiguo.The design of ECG and heart sound signal analysis system[J].Medical and health equipment,2010,31(4):24-26.
[7]熊獅.基于Android系統(tǒng)健康信息移動(dòng)監(jiān)測(cè)技術(shù)的研究[D].廣州:華南理工大學(xué),2013,19-29.
XIONG Shi.Research on health monitoring system based on Android system[D].Guangzhou:South China University of Technology,2013,19-29.
[8]Israel,Steven A.;Irvine,John M.1;Cheng,Andrew1;Wiederhold,Mark D.2;Wiederhold,Brenda,Brenda k..ECG to Identify individuals[J].Pattern Recognition:The Journal of the Pattern Recognition Society,2005,38(1):133-142.
[9]Shen,T.W.;Tompkins,W.J.;Hu,Y.H..One-lead ECG for identity verification[C]//In Proceedings of the 2nd Conference of the IEEE Engineering in Medicine and Biology Society,2002,1:62-63.
[10]Beritelli,F(xiàn).A Multiband approach to human identity verification based on PhonoCardioGram signal analysis[C]//6th Biometrics Symposium(BSYM2008),2008:71-76.
[11]Beritelli,F(xiàn)rancesco;Serrano,Salvatore.Biometric identification based on frequency analysis of cardiac sounds[C]//IEEETransactions on Information Forensics and Security 2,2007:596-604.