劉洪濤 王偉 胡少嫻 劉斌
(1 深圳市聯(lián)影高端醫(yī)療裝備創(chuàng)新研究院,深圳,518045; 2 深圳聯(lián)影智融醫(yī)療科技有限公司,深圳,518052; 3 深圳高性能醫(yī)療器械國家研究院有限公司,深圳,518126)
睡眠呼吸暫停綜合征(Sleep Apnea Syndrome,SAS)是由于某些原因造成睡眠時上氣道通氣不暢或堵塞等而引起呼吸暫停和低通氣,目前已經(jīng)成為威脅生命健康的多發(fā)疾病之一[1]。最近幾年醫(yī)學(xué)界對該病有了更為深入的認(rèn)識,并已證實該病是誘發(fā)缺血性心臟病的重要危險因素之一,同時還會引起肺心病和高血壓,甚至引起夜間猝死,故通常被稱為“睡眠殺手”[2]。成人睡眠呼吸暫停綜合征主要可以分為三類,分別是阻塞性睡眠呼吸暫停綜合征、中樞性睡眠呼吸暫停綜合征、混合性睡眠呼吸暫停綜合征[3-5]。臨床上以阻塞性睡眠呼吸暫停綜合征最為常見,本研究也以此為討論重點。
目前睡眠呼吸暫停綜合征檢測的金標(biāo)準(zhǔn)是在睡眠實驗室中使用多導(dǎo)睡眠儀(In-laboratory Polysomnography,In-lab PSG)記錄睡眠事件,記錄參數(shù)包括血氧飽和度、口鼻氣流、呼吸運動、腦電圖、睡姿、肌電圖、眼電圖和心電圖等,并進(jìn)行判讀診斷[6]。但是該方式操作復(fù)雜,費用昂貴,且對用戶的睡眠造成負(fù)擔(dān),不能完全真實的反映用戶的睡眠情況。本方案設(shè)計了一種基于單導(dǎo)聯(lián)心電圖(Electrocardiograph,ECG)的睡眠呼吸暫停識別方法,大大降低了睡眠呼吸暫停綜合征檢測的復(fù)雜程度,同時又兼顧了識別效果,該方案可以應(yīng)用在多種ECG采集設(shè)備,比如便攜設(shè)備、家用設(shè)備等,對呼吸暫停綜合征的篩查起到積極意義。
阻塞性睡眠呼吸暫停低通氣綜合征(Obstructive Sleep Apnea-hypopnea Syndrome,OSAHS),也被稱為阻塞性睡眠呼吸暫停(Obstructive Sleep Apnea,OSA),以睡眠期間上氣道反復(fù)出現(xiàn)完全阻塞(呼吸暫停)或部分阻塞(低通氣)為特征[7]。OSAHS發(fā)生時經(jīng)常導(dǎo)致血氧飽和度下降,兩次呼吸暫停期間有打鼾,通??梢杂^察到喘息、氣哽和身體活動導(dǎo)致睡眠中斷。OSAHS是最常見的睡眠呼吸紊亂疾病,在美國大約影響到2%~4%的人口,在中國也影響到4%左右的人口,如果沒有被早期診斷并給予有效的治療,OSAHS患者可能會出現(xiàn)白天過度嗜睡、認(rèn)知障礙、高血壓、心肌梗死、心律失常、肺動脈高壓、中風(fēng)、代謝綜合征等疾病[8]。
阻塞性呼吸暫停主要是由于氣道受阻而發(fā)生的。當(dāng)正常呼吸時,氣體交換的關(guān)鍵是喉以上的上呼吸道,使氣體暢通地進(jìn)入氣管和支氣管,如果由于某種原因,這段氣流受限就將出現(xiàn)打鼾或阻塞性睡眠呼吸暫停。高達(dá)60%的中重度OSAHS是由于肥胖所致,頸咽部組織擁擠,導(dǎo)致呼吸阻塞。局部結(jié)構(gòu)異常也可能導(dǎo)致呼吸道阻塞,如上下頜畸形,或腺樣體扁桃體肥大。另外內(nèi)分泌疾病,如肢端肥大癥和甲狀腺功能減退,也是OSAHS的危險因素;睡前飲酒、使用鎮(zhèn)靜藥物,或由于結(jié)構(gòu)異常、鼻炎或二者兼具造成夜間鼻塞或充血都可能加重OSAHS;除此以外,老年生理變化也是原因之一,老年人局部組織松弛,肌張力減弱,致使咽壁松弛、塌陷而內(nèi)移,引起打鼾或OSAHS。
圖1 阻塞性呼吸暫停氣道圖
目前阻塞性呼吸暫停檢測的金標(biāo)準(zhǔn)是在睡眠實驗室中使用多導(dǎo)睡眠儀(In-laboratory Polysomnography,In-lab PSG)記錄睡眠事件,記錄參數(shù)包括血氧飽和度、口鼻氣流、呼吸運動、腦電圖、睡姿、肌電圖、眼電圖和心電圖等,并進(jìn)行判讀診斷。
圖2 多導(dǎo)睡眠儀(In-lab PSG)
該方法可提供足夠的細(xì)節(jié)和準(zhǔn)確的結(jié)果,但仍有不足,比如需要患者在睡眠實驗室里佩戴檢測儀器進(jìn)行整晚睡眠,同時需要一位睡眠醫(yī)師參與到研究過程中,得到數(shù)據(jù)后需要人工分析得出結(jié)果,因此導(dǎo)致整個過程耗時、價格昂貴,且舒適度低,不適宜應(yīng)用于龐大的OSAHS患者群體中,也不便于早期的篩查和診斷。
PSG雖然是檢測睡眠呼吸暫停的金標(biāo)準(zhǔn),但是由于PSG使用的復(fù)雜性,現(xiàn)在越來越多的人使用單導(dǎo)聯(lián)信號進(jìn)行睡眠呼吸暫停監(jiān)測,有一些研究采用血氧信號[9]和氣流信號[10],但是更多的研究為了適應(yīng)硬件條件和便攜式穿戴設(shè)備的需求,采用的是單導(dǎo)聯(lián)的ECG信號。很多研究都把注意力放置在了設(shè)計不同的特征上,比如C.Varon[13]從ECG信號中提取呼吸信號,然后從呼吸信號中提取7個特征;M.O.Mendez[14]通過KNN算法可以達(dá)到85%以上的識別率;Surrel等開發(fā)了一個睡眠呼吸暫停系統(tǒng),通過可穿戴傳感器采集到的ECG信號,提取了88個有效特征,然后用SVM進(jìn)行分類;Bsoul等通過RR序列數(shù)據(jù)提取了111個特征開發(fā)了一套實時的睡眠呼吸檢測系統(tǒng)[15]。
近些年隨著深度學(xué)習(xí)的發(fā)展,有些研究人員開始用深度學(xué)習(xí)的方法來研究睡眠呼吸暫停問題,比如D.Dey等直接將ECG原始數(shù)據(jù)應(yīng)用在深度神經(jīng)網(wǎng)絡(luò)上,來檢測睡眠呼吸暫停[16-18],但是ECG信號采樣率在100 Hz,而且受到神經(jīng)網(wǎng)絡(luò)的深度限制;通過深度CNN網(wǎng)絡(luò)模型,分別驗證了ECG與EDR的性能,取得了突出進(jìn)展。綜合國內(nèi)外睡眠呼吸暫停的研究過程,ECG已經(jīng)成為研究的主流,同時基于RR間隔與深度學(xué)習(xí)的識別方法也逐漸取代了基于HRV的傳統(tǒng)機(jī)器學(xué)習(xí)方法,在性能上有質(zhì)的提升。
3.1 數(shù)據(jù)來源 本方案使用的是Physionet[12]的CinC Challenge 2000數(shù)據(jù)庫(也稱為ECG呼吸暫停數(shù)據(jù)庫),用于訓(xùn)練和評估。此數(shù)據(jù)集中有70條記錄,僅使用了35條帶注釋的記錄。在標(biāo)記的數(shù)據(jù)集中,包括30名男性和5名女性,年齡從27~63歲?;颊咂骄挲g46歲,BMI為28±6.5 kg/m2。每位患者的ECG信號記錄長度范圍為430~578 min,其中總呼吸暫停時間為303±20 min。ECG信號的采樣率為100 Hz。所有35次錄音均逐分鐘貼上標(biāo)簽,以區(qū)分呼吸暫停分鐘與非呼吸暫停分鐘。每分鐘的每一段都由專家檢查和標(biāo)注??偣灿?6 988段分鐘。呼吸暫停類包括6 496 min,非呼吸暫停類包括10 492 min。
3.2 算法方案
本算法方案包括數(shù)據(jù)預(yù)處理、模型設(shè)計與訓(xùn)練、算法性能比較驗證3個部分。
3.2.1 數(shù)據(jù)預(yù)處理 本方案采用的是單導(dǎo)聯(lián)的ECG數(shù)據(jù),所以從ECG的數(shù)據(jù)處理開始。具體包括:1)R波檢測:本方案采用PT算法來進(jìn)行R波檢測。2)片段分割:按照常規(guī)的方法,以1 min為單位進(jìn)行片段分割,因為label也是以1 min為單位標(biāo)注的,但是這里的數(shù)據(jù)片段我們選取5 min的R波序列(以1 min為中心,前后各取2 min)作為label對應(yīng)的數(shù)據(jù)樣本,Apnea數(shù)據(jù)之間是相互關(guān)聯(lián),并且不管是Apnea還是Norm事件都有一定的持續(xù)性。3)計算RR間期(RR Intervals,RRI):RRI可以體現(xiàn)心率的變化,反映神經(jīng)系統(tǒng)的活躍程度,計算相鄰R波之間的間隔距離,形成RRI序列。4)去除異常RRI:R波檢測不能確保每個檢測到的R波都是正確的,那么計算的RRI也會有問題,這里以RRI的均值為中心,刪除偏差20%幅度以外的值。5)去除異常片段:對于瞬時心率在30~200次/min以外的RRI視為異常心率。6)2 Hz插值:采用3次樣條插值算法,形成每分鐘固定120個點的RRI序列。7)去基線:對數(shù)據(jù)做去基線處理。8)劃分?jǐn)?shù)據(jù)集:將數(shù)據(jù)按照8∶1∶1的比例分為訓(xùn)練集、驗證集、測試集,進(jìn)行交叉驗證。9)數(shù)據(jù)歸一化:采用z-score標(biāo)準(zhǔn)化的方式將數(shù)據(jù)歸一化。
3.2.2 模型設(shè)計 本方案模型采用深度殘差網(wǎng)絡(luò)結(jié)構(gòu),模型共33層卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)結(jié)構(gòu),每層CNN之間采用BatchNorm+ReLu的結(jié)構(gòu),模型有16個Resnet模塊,每個Resnet模塊由兩層CNN組成,同時在resnet模塊的兩層CNN之間設(shè)計有dropout減少過擬合,為了便于設(shè)計,模型的通道個數(shù)每4層CNN增加一倍,CNN的卷積核大小每4層減小一倍,resnet位置增加的通道部分補(bǔ)零。
圖3 ECG數(shù)據(jù)預(yù)處理流程圖
算法采用adam優(yōu)化方法,earlystop訓(xùn)練方式,L2正則,class_weight按照樣本比例設(shè)計,lr為0.001,并隨著valid數(shù)據(jù)loss變化而衰減,batch_size為128,dropout為0.2。如下圖所示。
圖4 深度殘差網(wǎng)絡(luò)模型結(jié)構(gòu)圖
3.2.3 算法驗證 訓(xùn)練集、驗證集、測試集按照8∶1∶1的比例分配,共進(jìn)行10折交叉驗證,交叉驗證的驗證集與測試集測試結(jié)果顯示算法在驗證集與測試集上的結(jié)果基本無差別,性能相對穩(wěn)定。見圖5、圖6。
圖5 驗證集交叉驗證結(jié)果
圖6 測試集交叉驗證結(jié)果
同時對于測試集的測試結(jié)果,我們與眾多文獻(xiàn)做了比較,各指標(biāo)論文比較結(jié)果顯示本文算法在正確率、特異性上都超過之前的算法,靈敏度比Lei,et al.del的結(jié)果低0.18%,但是同時本算法的特異性和精度要高出2%,算法的誤判大幅度減少。見表1。
表1 算法結(jié)果與文獻(xiàn)結(jié)果比較(%)
本方案設(shè)計了一種基于深度殘差網(wǎng)絡(luò)(ResNet)模型的算法,實現(xiàn)了睡眠呼吸暫停綜合征的準(zhǔn)確判斷。在方案設(shè)計中,首先通過對數(shù)據(jù)的時間相關(guān)性處理,增加數(shù)據(jù)的表達(dá)能力,然后設(shè)計基于ResNet的深層網(wǎng)絡(luò),進(jìn)行模型訓(xùn)練,實現(xiàn)了睡眠呼吸暫停識別。本方案使用Apnea-ECG數(shù)據(jù)庫進(jìn)行模型開發(fā)和驗證。單分鐘SAS的10折交叉驗證平均正確率為95.33%。另外,本文方法在整體正確率、特異性、精確度上都比之前的論文有提升,靈敏度也與Lei,et al.del等相差無幾。但是算法也有可以優(yōu)化的方向:1)模型結(jié)構(gòu)可以通過多通道的方式豐富特征;2)增加數(shù)據(jù)量,現(xiàn)有的數(shù)據(jù)量相對較少,還需要更廣泛地驗證和優(yōu)化。這些研究方向還需要繼續(xù)探索。