国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于CNN和LSTM的睡眠呼吸暫停檢測算法

2021-01-08 02:25劉子龍
電子科技 2021年2期
關(guān)鍵詞:時序特征提取卷積

葛 靖,劉子龍

(上海理工大學(xué) 光電信息與計算機工程學(xué)院,上海200093)

近年來,睡眠呼吸暫停癥(Sleep Apnea Syndrome,SAS)越來越受到人們關(guān)注。SAS是發(fā)生在睡眠過程中的一種常見的睡眠障礙,一般由上氣道塌陷或其他氣道阻塞引起的呼吸氣流減少或消失且反復(fù)發(fā)作引起。據(jù)研究表明,SAS可能導(dǎo)致多種疾病,如糖尿病、慢性腎病、抑郁癥等,嚴(yán)重的甚至?xí)?dǎo)致猝死。通常來講,最好的睡眠呼吸暫停篩查和診斷方法為多導(dǎo)睡眠圖(Poly Somno Graphy,PSG),但獲取PSG需要病患夜間在醫(yī)院進(jìn)行睡眠監(jiān)測并記錄各種生理信號,不僅操作不便,且成本較高[1]。

研究人員已經(jīng)提出多種使用較少生理信號的檢測方法來簡化呼吸事件自動檢測,這在一定程度上克服了PSG的缺點。這些方法多基于生理記錄,例如心電信號(Electro Cardio Graph,ECG)、血氧飽和度、鼾聲,呼吸信號等[2]。目前大多數(shù)替代研究都集中在從生理信號中提取時間特征、光譜特征和非線性特征,以及各種特征選擇方法。傳統(tǒng)機器學(xué)習(xí)分類方法的人工特征識別能力較好,特別是許多監(jiān)督學(xué)習(xí)方法如支持向量機和神經(jīng)網(wǎng)絡(luò)等,已被廣泛應(yīng)用于SAS檢測。

深度學(xué)習(xí)方法在近幾年逐漸受到人們的青睞,它們在各領(lǐng)域應(yīng)用中表現(xiàn)出優(yōu)異的性能。傳統(tǒng)的分類學(xué)習(xí)方法在睡眠呼吸紊亂事件的自動檢測方面取得了較高的性能,但手動特征提取仍需要相關(guān)專業(yè)知識且勞動強度大。深度學(xué)習(xí)無需使用任何領(lǐng)域知識即可自動從輸入信號中學(xué)習(xí)并查找特征,有著強大的學(xué)習(xí)能力[3]。

本文選用單導(dǎo)聯(lián)心電信號來進(jìn)行睡眠呼吸暫停綜合癥的檢測。心電信號易受到SAS事件的影響,其檢測也相對普及,可由各種可穿戴設(shè)備精準(zhǔn)測量。本研究選擇使用卷積網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和長短時記憶模型(Long-Short Term Memory,LSTM)來進(jìn)行呼吸暫停事件的檢測。

1 材料和方法

1.1 數(shù)據(jù)集獲取

本研究中用于分析的心電信號均來自于的Physionet Apnea-ECG數(shù)據(jù)庫。醫(yī)學(xué)專家對該數(shù)據(jù)集做了專門的標(biāo)注信息,具有較強的權(quán)威性。每個記錄都帶有一組參考呼吸暫停注釋,注釋記錄每分鐘內(nèi)呼吸的狀態(tài)。這是專家根據(jù)同時記錄的相關(guān)信號得出的,并提供總呼吸暫停低通氣指數(shù)。

該數(shù)據(jù)庫分為訓(xùn)練集和測試集,采樣頻率為100 Hz,每組包含35條患者數(shù)據(jù)記錄,每條記錄具有大約8個小時的ECG數(shù)據(jù)。本實驗共有32位受試者,包括男性25位、女性7位。受試者年齡在27~63歲之間,體重在53~135 kg之間。“N”和“A”是專家標(biāo)記的注釋(A代表呼吸暫停,N代表非呼吸暫停)[4]。

1.2 數(shù)據(jù)預(yù)處理及標(biāo)注

如圖1所示,信號預(yù)處理分為兩個階段。第一階段主要任務(wù)為去除ECG記錄中的噪聲。從數(shù)據(jù)集得到的信號存在多種干擾等,如基線漂移、工頻干擾等。為了保證噪聲心電分類的準(zhǔn)確率,需要對噪聲進(jìn)行處理。首先,ECG信號通過60 Hz的陷波濾波器濾波;然后使用截止頻率分別為5 Hz和35 Hz的帶通二階ButterWorth濾波器濾波。每個樣本為1 min的ECG信號,劃分好相應(yīng)的訓(xùn)練集和測試集,處理后的ECG信號作為卷積模型的輸入。

第二階段從每段ECG信號中提取了RR間隔和ECG派生呼吸(ECG Derived Respiration,EDR)信號。由數(shù)據(jù)集注釋信息得到每段ECG信號的R波發(fā)生時間,由此得到RR間期信息和EDR信號。EDR信號的獲得經(jīng)過以下步驟:先濾波后的心電信號進(jìn)行樣板插值,根據(jù)R波峰的幅度變化得到R波的幅度調(diào)制信號;然后經(jīng)過平滑處理和下采樣得到EDR信號[5];最終根據(jù)數(shù)據(jù)集注釋信息和處理好的ECG信號,得到數(shù)據(jù)集每60 s的ECG信號的間接特征。RR間期和EDR信號。此外,還需從數(shù)據(jù)集注釋中選取部分與SAS事件有關(guān)的其他特征,例如年齡、性別、身體質(zhì)量指數(shù)等。

圖1 數(shù)據(jù)處理流程圖Figure 1. Flow chart of data process

完成所有數(shù)據(jù)預(yù)處理程序后,第一、二階段的信號分別作為兩個模型的輸入。

1.3 網(wǎng)絡(luò)模型設(shè)計

CNN與LSTM的選擇參考雙方的優(yōu)點:CNN模型優(yōu)點是自動進(jìn)行特征提取,處理高維數(shù)據(jù)無壓力,在處理初始ECG信號有很好的優(yōu)勢,且在多份SAS研究文獻(xiàn)中顯示達(dá)到較好的檢測效果;LSTM模型具有時序記憶優(yōu)點,但時間跨度很大時,序列過長會使得準(zhǔn)確率下降,無法有效解決梯度問題。所以原ECG信號(6 000×1)作輸入時無法發(fā)揮它的優(yōu)點。當(dāng)把ECG派生特征R-R間期當(dāng)作輸入,則大幅降低了數(shù)據(jù)量。在時序上,ECG信號是有一定的聯(lián)系的,例如心率變異性(Heart Rate Variability,HRV)是由兩個相鄰的R-R間期時間長短決定的,HRV在SA事件上存在變化[6]。LSTM在時序上的特征提取在本文目標(biāo)上相對優(yōu)于CNN空間特征提取。

1.3.1 CNN模型

使用一維CNN對時間序列心電信號進(jìn)行分類,可無需進(jìn)行任何手動特征提取和后處理,即通過適當(dāng)?shù)挠?xùn)練,卷積層即可學(xué)習(xí)提取特定于患者的特征。CNN層由1個卷積層、池化層和隱藏層組成。通過卷積運算輸出特征圖,卷積層為這些層學(xué)習(xí)激活輸入信號中特定模式的濾波器(內(nèi)核)。內(nèi)核在輸入信號上滑動時與輸入信號卷積。通過卷積運算輸出特征圖,一維卷積層的第i個神經(jīng)元輸出如下

(1)

式中,b為偏置;f為卷積層的激活函數(shù);m為卷積核的個數(shù);xi為輸入的序列;wj為卷積核的權(quán)重矩陣[7]。

圖2 卷積網(wǎng)絡(luò)模型結(jié)構(gòu)Figure 2. Architectures of CNN model

表3表1 CNN模型的網(wǎng)絡(luò)配置Table 1. Network configuration of CNN model

用于本研究的一維CNN的模型結(jié)構(gòu)如圖2所示。CNN模型將預(yù)處理后的心電段作為輸入,每個樣本6 000點(60 s×100 Hz),輸入層的維度是 6 000 × 1。Relu被用作激活函數(shù),每個卷積后都有一個激活函數(shù),并且通過卷積層之間的池化層對特征進(jìn)行壓縮,簡化網(wǎng)絡(luò)復(fù)雜度。在卷積前進(jìn)行一個BN層來標(biāo)準(zhǔn)化參數(shù),每個池化層之后都進(jìn)行一個Dropout來防止過擬合[8]。最終通過一層全連接層結(jié)合sigmoid激活函數(shù)輸出預(yù)測結(jié)果。

從表1看到的模型參數(shù)將3種內(nèi)核大小應(yīng)用于卷積層50×1、30×1、10×1。卷積層的內(nèi)核大小從第一個逐漸減小到最后一個。當(dāng)所有內(nèi)核尺寸都太小或統(tǒng)一大時,則會提取不必要的特征或丟失主要特征以降低識別率。

1.3.2 LSTM模型

LSTM屬于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)的一種改良,方便學(xué)習(xí)時間相關(guān)性的數(shù)據(jù)隨著時間的推移。LSTM基于一個內(nèi)存單元,通過輸入門處理其內(nèi)部狀態(tài)的讀、寫和重置功能(it),此外還有輸出門(ot)和遺忘門(ft)。每個門的工作是記住何時以及在多大程度上應(yīng)該更新內(nèi)存中的權(quán)重。遺忘門處理單元的內(nèi)部狀態(tài),其自適應(yīng)地忘記或重置單元的內(nèi)存。這些門的功能如以下表達(dá)式所示。

it=σ(Wxixt+Whiht-1+bi)

(2)

ft=σ(Wxfxt+Whfht-1+bf)

(3)

ot=σ(Wxoxt+Whoht-1+bo)

(4)

gt=σ(Wxcxt+Whcht-1+bc)

(5)

ct=ft·ct-1+it·gt

(6)

ht=ot·φ(ct)

(7)

其中,c是細(xì)胞激活載體;σ是非線性雙曲正切函數(shù);xt是在時間t到存儲單元層的輸入;W是權(quán)重矩陣;bi、bf、bc、bo是偏置量。

表2 LSTM模型的網(wǎng)絡(luò)配置Table 2. Network configuration of LSTM model

圖3 LSTM模型結(jié)構(gòu)Figure 3. Architecture of LSTM model

首先把經(jīng)過第二階段處理的ECG間接信號作為Input1,通過LSTM 層提取時序特征;接著把每段信號的其他醫(yī)療信息年齡性別等作為Input2,設(shè)計一個LSTM和FC的組合模型,兩個結(jié)構(gòu)并行;最后通過融合(Merge)層連接輸出??紤]到輸入數(shù)據(jù)的尺寸不同,先加入批歸一化(Batch Normalization,BN)層對數(shù)據(jù)標(biāo)準(zhǔn)化,即減去平均值并除以每個值周期的標(biāo)準(zhǔn)差來對信號進(jìn)行歸一化。如果不進(jìn)行標(biāo)準(zhǔn)化,則數(shù)據(jù)分析的結(jié)果將受到要素的不同尺寸單位的影響。在以上兩個深度學(xué)習(xí)模型中,歸一化用于在0和1之間轉(zhuǎn)換數(shù)據(jù);最后對所有模型進(jìn)行訓(xùn)練,直到過度擬合開始發(fā)生。根據(jù)模型的訓(xùn)練情況一步步對超參數(shù)進(jìn)行調(diào)整,不斷優(yōu)化模型。如果驗證損失在長時期內(nèi)沒有得到改善,則停止訓(xùn)練,并將權(quán)重恢復(fù)為在驗證集中達(dá)到最佳性能的值。

2 實驗結(jié)果與分析

2.1 實驗設(shè)備

本文使用Tensorflow為后端的Keras和Python3.6來實現(xiàn)深度學(xué)習(xí)方法。Keras是一個深度學(xué)習(xí)庫,用于構(gòu)建和評估設(shè)計的深度學(xué)習(xí)方法。每種方法的培訓(xùn)和測試都是在Win10環(huán)境中使用GTX1050Ti的硬件規(guī)范進(jìn)行的。深度學(xué)習(xí)方法的訓(xùn)練完全由反向傳播算法監(jiān)督。基于ADAM更新規(guī)則,通過最小化交叉熵?fù)p失函數(shù)對模型參數(shù)進(jìn)行優(yōu)化,將數(shù)據(jù)分割為256個數(shù)據(jù)段的小批,以優(yōu)化培訓(xùn)和測試過程。在對每個小批進(jìn)行訓(xùn)練之后,使用此配置計算一個累積梯度。

2.2 實驗結(jié)果與分析

本文有3類評價指標(biāo):準(zhǔn)確率(Accuracy)為被正確分類的樣本所占的比例;精準(zhǔn)率(Precision)是預(yù)測出來為正樣本的結(jié)果中,有多少是正確分類;召回率(Recall)為所有正例中被正確分類的比例,衡量了模型對正例樣本的識別能力

Recall=TP/TP+FN

(8)

Precision=TP/TP+FP

(9)

Accuracy=TP+TN/TP+TN+FP+FN

(10)

其中,TP、TN、、FP和FN分別代表“真陽性”、“ 真陰性”、“ 假陽性”和“假陰性”。

表3 CNN模型和LSTM模型的評價性能

由表3可以看出,LSTM優(yōu)于CNN模型。CNN模型使用原始ECG信號作為輸入,指標(biāo)分別為 75.3%、78.1%、80.7%;而LSTM模型的指標(biāo)分別達(dá)到 87.4%,84.2%,85.5%,在ECG長時序分段上從衍生信號自動提取特征更具有優(yōu)勢。

從表4可知,本文方法的性能具有一定的優(yōu)越性。文獻(xiàn)[19]使用了隱馬爾可夫和DNN模型,指標(biāo)分別為84.7%、88.9%、82.1%,精準(zhǔn)率和本文相近,準(zhǔn)確率上本文較優(yōu)。文獻(xiàn)[4]使用傳統(tǒng)的SVM達(dá)到了91.29%的準(zhǔn)確度和89.84%的靈敏度,但其在信號處理上過于復(fù)雜繁瑣。特征的提取多達(dá)十幾種,涉及到了信號的時域、頻域和非線性特征的特征集。而基于LSTM的方法準(zhǔn)確度盡管低于SVM傳統(tǒng)分類方法,但仍具有較好的性能,并結(jié)合了人工特征提取和LSTM的模型優(yōu)點,相比傳統(tǒng)機器學(xué)習(xí)分類方法更為簡便,有作為呼吸暫停綜合征患者初篩手段的潛力。

表4 與傳統(tǒng)方法的性能比較

本文也分析了深度學(xué)習(xí)CNN 模型的不足。在對比了其他多個使用CNN方法的文獻(xiàn)[8,10,12,14]后,研究者認(rèn)為在輸入為原始ECG信號時,CNN相比其他模型更為適用,且相對ECG時間較短的分段效果更好,其在特征提取時會提高針對性。盡管CNN模型在本文所得精度較低,但當(dāng)選用第二個模型LSTM以原始ECG信號段作為輸入時,分類效果反而不如CNN模型,存在著諸多問題如精度更低且模型訓(xùn)練時間長等。使用CNN方法的研究多以原始ECG信號段作為輸入,實驗效果較好。本文的CNN模型也對其做了參照,但并未能達(dá)到其所示效果,原因可能為數(shù)據(jù)庫與處理方式不同。具體地,文獻(xiàn)[10]等選用的是每10 s一個樣本,本文所選的數(shù)據(jù)庫是基于60 s一次的分段標(biāo)注,帶來的問題是信號數(shù)據(jù)太多,不能使卷積網(wǎng)絡(luò)更有針對性的提取特征,導(dǎo)致最終的訓(xùn)練結(jié)果不太理想。

LSTM模型輸入則在原始數(shù)據(jù)集的基礎(chǔ)上做了二次處理,從ECG中提取了EDR信號和RR間期。它們和SAS事件的發(fā)生時序上都有著聯(lián)系,且使模型的特征提取和學(xué)習(xí)更為精準(zhǔn)??紤]到LSTM的記憶性會得到更好的效果,故文中設(shè)計了此模型,且該模型在訓(xùn)練指標(biāo)上優(yōu)于CNN模型。

3 結(jié)束語

本文基于輸入ECG信號的處理差異,以深度學(xué)習(xí)方法設(shè)計了相應(yīng)的最優(yōu)模型CNN和LSTM用于檢測呼吸暫停事件的發(fā)生。通過對比后發(fā)現(xiàn),LSTM模型通過ECG衍生信號作為輸入,結(jié)合了人工特征信號提取和LSTM的優(yōu)點,在長時序分段信號上從衍生信號自動提取特征更具有優(yōu)勢,具有更好的效果。本文方法提高了SAS檢測的實用性、準(zhǔn)確性,更加適用于長時序分段的心電信號。本研究的不足之處在于數(shù)據(jù)來源不夠廣泛,且模型輸入相對依賴R峰的精準(zhǔn)檢測。在未來的工作中,可以驗證樣本ECG時間段的長短劃分是否具有對應(yīng)的最優(yōu)模型,并進(jìn)一步擴展數(shù)據(jù)來源,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù),提高泛化能力。

猜你喜歡
時序特征提取卷積
清明
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
基于不同建設(shè)時序的地鐵互聯(lián)互通方案分析
基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
從濾波器理解卷積
基于Daubechies(dbN)的飛行器音頻特征提取
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
基于FPGA 的時序信號光纖傳輸系統(tǒng)
Bagging RCSP腦電特征提取算法
基于模體演化的時序鏈路預(yù)測方法