高勝寒,熊 馨,相 艷,劉瑞湘,葉哲江
1(昆明理工大學 信息工程與自動化學院,昆明 650500)
2(云南省第二人民醫(yī)院 臨床心理科,昆明 650000)
E-mail:478219759@qq.com
睡眠呼吸暫停綜合征(Sleep Apnea Syndrome)是一類最常見的睡眠呼吸系統(tǒng)疾病,包括阻塞型、中樞型、混合型.其主要由上呼吸道部分或完全阻塞引起,臨床表現(xiàn)為不同程度的打鼾、口鼻氣流基本停止以及心律失常等.在一次8小時左右的睡眠中,呼吸暫停事件會發(fā)生數(shù)十甚至數(shù)百次,嚴重時會導致一些神經(jīng)與心腦血管疾病.通常人們使用呼吸暫停低通氣指數(shù)(AHI)以評估SAS的嚴重程度,若AHI>5并伴有其他癥狀的受試者將被診斷為SAS[1-3].
多導睡眠圖(Polysomnography,PSG)分析是現(xiàn)今診斷SAS最常用的方法之一,利用患者睡眠期間的生理信號分析其睡眠狀態(tài),常用的生理信號包括口鼻氣流信號、腦電信號(Electroencephalography,EEG)、心電信號(Electrocardiogram,ECG)等.采集信號的過程要求患者在睡眠時佩戴多個電極帽,之后由睡眠醫(yī)學專家進行睡眠狀態(tài)分析.近年來,隨著SAS患者的不斷增多,睡眠醫(yī)學專家的嚴重短缺導致許多患者得不到及時診斷和治療.因此,有不少研究者進行關于SAS自動檢測的研究.Laiali Almazaydeh等人[4]提出了一種基于聲音動態(tài)檢測(Voice Activity Detection,VAD)算法的模型進行特征提取,之后使用分類器進行睡眠呼吸暫停檢測.Song等人[5]利用EDR信號和ECG信號中的時域與頻域特征,提出一種隱馬爾可夫模型用于SAS檢測.Sharma等人[6]提出一種基于Hermit基函數(shù)從心電信號RR區(qū)間提取特征方法,同時使用支持向量機(Support Vector Machine,SVM)進行二分類.M.Emin Tagluk等人[7]提出一種基于雙譜分析提取EEG特征的方法進行睡眠呼吸暫停檢測.
上述關于SAS自動檢測的研究,雖然取得不錯的進展,但工作重心還是停留在平均分割信號(傳統(tǒng)方法通常將信號分割成30s的數(shù)據(jù)段)后進行分類,缺少發(fā)病的具體時間,無法詳細識別發(fā)病的中心時間與持續(xù)時間,而睡眠呼吸暫停綜合癥的實際發(fā)病情況是一個連續(xù)、不確定的過程.傳統(tǒng)的分割信號檢測機制存在特征信息與檢測精度的矛盾,如果每段信號被分得較短,攜帶的特征信息偏少,影響檢測性能,同時需要計算機更高的處理頻率;而分割信號較長則導致時間精度下降,檢測結(jié)果更新緩慢.此外,信號分割還有可能破壞發(fā)病時期的連續(xù)性,在一定程度上割裂了發(fā)病開始、發(fā)病時、發(fā)病結(jié)束存在關聯(lián)的特征信息.除傳統(tǒng)的特征提取與機器學習分類器結(jié)合的方法外,近年來,深度學習也為本研究領域注入一些新的思路.卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)是一種源自模擬生物視覺信號處理機制的一種深層次神經(jīng)網(wǎng)絡,其結(jié)構(gòu)特征、反向傳播以及權(quán)值自動更新等機制決定了CNN強大的分析能力.Tao等人[8]提出了一種基于ECG心電信號與LeNet5網(wǎng)絡的睡眠呼吸暫停檢測模型,通過平均分割心電信號后進行二分類.
由于心肺耦合程度高,心電信號已被廣泛應用于睡眠呼吸暫停的檢測.受人體內(nèi)外部病理條件的調(diào)節(jié),腦電信號與大腦對神經(jīng)信息的處理有關.與其它信號相比,腦電信號的產(chǎn)生機制更為復雜,具備更多的神經(jīng)系統(tǒng)特征信息.例如,當使用功率譜分析腦電信號時,Zhou等人[9]分析了SAS發(fā)生之前、期間和之后睡眠腦電信號變化.當SAS發(fā)生時,EEG的絕對功率和相對功率在0~15Hz頻段存在升高,在15~30Hz頻段較SAS發(fā)病前降低.而在SAS發(fā)病后,各頻段的絕對功率均顯著高于SAS前,但在0~8Hz頻段的絕對功率有所恢復.SAS發(fā)病時睡眠腦電信號的變化為利用睡眠腦電信號檢測SAS提供了支持,這些更全面的特征在其他PSG信號中是不存在的.腦電信號的研究頻段主要集中在0-30Hz,依據(jù)睡眠狀態(tài)與腦電信號的醫(yī)學原理與特征,可將腦電信號分為以下幾種節(jié)律波:1)δ波:0.5~3Hz;2)θ波:4~8Hz之間;3)α波:8~13Hz;4)β波:14~30Hz.
睡眠呼吸暫停綜合征檢測的難點在于特征提取與發(fā)病時間的確定.大腦功能連接性的衡量方法包括腦電信號通道間的相干性、相關性、鎖相值分析、相位滯后指數(shù)等,利用來自兩個通道或不同大腦區(qū)域的EEG信號之間的線性相關作用,如果兩個信號之間存在較高的一致性意味著存在同步的神經(jīng)元活動、神經(jīng)元功能整合,反之低一致性則意味著存在獨立活動的神經(jīng)元,此時神經(jīng)元功能存在分離[10-12].Li[13]等人在進行神經(jīng)系統(tǒng)異常組與健康組對照實驗中觀察到大腦功能連接性的差異.利用腦電功能連接性來研究神經(jīng)系統(tǒng)類疾病已取得一定成功,通過對 EEG 信號構(gòu)建腦網(wǎng)絡并進行量化分析,能在臨床上輔助睡眠呼吸暫停綜合癥的診斷[14].
針對目前SAS自動檢測機制的不足,本文基于睡眠腦電信號,利用腦電功能連接性與改進目標檢測算法[15,16]提出一種新的SAS自動檢測模型SD-FCE(SAS Detection based on Functional Connectivity of Electroencephalography),其主要包含以下幾個方面:
1)在EEG的預處理中,引入經(jīng)驗模態(tài)分解(Empirical Mode Decomposition,EMD)[17,18]進行分解-去噪-重構(gòu),以降低EEG中噪聲的影響.同時為了避免特征信息的割裂,確保每一次發(fā)病的EEG信號完整性,本文通過較長的固定滑動窗口與相對較短的滑動步進從EEG中提取數(shù)據(jù)片段進行分析,保證每次檢測模型獲得足夠的特征信息;
2)利用神經(jīng)系統(tǒng)異常時所產(chǎn)生的腦電功能連接異常作為主要特征構(gòu)建腦電功能連接矩陣,之后將功能連接矩陣輸入卷積神經(jīng)網(wǎng)絡以完成特征提??;
3)模型包含兩個用于識別SAS是否發(fā)病和發(fā)病時中心時間、持續(xù)時間的模塊.為同時進行合理的優(yōu)化,本文模型的損失函數(shù)綜合了分類與回歸,標簽中負樣本的位置數(shù)據(jù)不參與損失的計算,一定程度緩解樣本不均衡所帶來的影響.
相比于傳統(tǒng)的二分類算法,本文從SAS發(fā)病的神經(jīng)功能特征入手,基于SSD目標檢測算法的改進,從根本上改變了SAS的檢測機制.直接檢測發(fā)病的中心時間點與持續(xù)時間將更加接近于真實情況,同時性能優(yōu)于其他基于EEG的目標檢測[19,20]模型.
本文通過固定滑動窗口從EEG中提取數(shù)據(jù)片段進行處理.在單次檢測過程中,一段時間長為120s的睡眠腦電信號被視為檢測載體的最小單位xn∈X(n∈N*),xn通過長度為120s的滑動窗口從某位受試者8小時左右的睡眠腦電信號X中提取.選擇長度120s、步進10s的滑動窗口為了盡可能的使檢測載體的最小單位xn能夠完整的包含發(fā)病時間相對較長的目標,同時選擇步進較小的滑動機制是為了應對發(fā)病位置的不確定性,如圖1(a)所示.
圖1 EEG片段提取(a)、預選框與真實發(fā)病框的表征(b)、重疊度(c)Fig.1 Extract EEG segments(a),representation of default frame and true frame(b),intersection over union(c)
基于滑動窗口提取到的數(shù)據(jù)段,以每z秒為一個中心時間點生成一系列用于密集采樣的預選框(Default frames),這些預選框的長度從10s~120s均勻增加,步進為10s.若z=1時,則每段數(shù)據(jù)上將生成Nd=12×120s=1440個預選框,若z不確定,則每段數(shù)據(jù)上將生成Nd=1440/z個預選框.單個預選框定義為Di={ci,di}(i∈[1,Nd]),其中ci與di分別為預選框的中心時間點與持續(xù)時間,如圖1(b)所示.同理,將呼吸暫停實際發(fā)病的時間位置信息用真實發(fā)病框(True frames)表征為Tj={cj,dj}.
在訓練開始之前,需要將預選框與真實發(fā)病框進行匹配,匹配后得到真實發(fā)病框相對于預選框的偏移值.設偏移Oi={Ci,Di},則由公式(1)即可得到匹配后的偏移值.
(1)
此舉在于將每段數(shù)據(jù)對應的發(fā)病情況進行網(wǎng)格化整理與位置數(shù)據(jù)歸一化.例如,一些數(shù)據(jù)段存在著不同數(shù)量、時間長短不一的發(fā)病片段,而其余數(shù)據(jù)不存在發(fā)病,這種隨機性將導致難以直接使用未處理的真實發(fā)病框.在訓練與測試過程中,網(wǎng)絡對于目標位置信息的輸出O′i={C′i,D′i}就是被預測的真實目標相對于已知預選框的偏移值.匹配的原則包括以下幾個方面:
1)單個真實發(fā)病框能匹配多個預選框,反之則不能;
2)決定兩者之間是否匹配的參數(shù)是重疊度(IoU)[21].IoU定義為兩者交集與并集的比值,如圖1(c)所示.只有IoU值大于匹配的閾值才可進行匹配,即IoU{Di,Tj}>μ,其中IoU,μ∈[0,1].若出現(xiàn)某一個預選框與多個真實發(fā)病框均大于匹配閾值,那么將選擇IoU值最高的真實發(fā)病框與其完成匹配.事實上,匹配閾值設定合理的前提下,上述情況非常少見;
3)對于匹配閾值的設置,為了盡可能降低正負樣本不平衡所帶來的影響,同時考慮任務的類型,我們需要使網(wǎng)絡對預選框的正向預測傾向于保守.這是因為對于模型的預測結(jié)果還需進行非極大值抑制(Non-Maximum Suppression,NMS)[15]處理,以消除一些正向預選框同時識別同一個目標,僅留下正向預測概率最大的一個預選框,所以不需要訓練數(shù)據(jù)處于絕對平衡的二分類情況之下.通過相關研究[19-23],設置匹配閾值將正負樣本的比例控制在1:3左右能取得相對更好的效果.
4)將匹配成功的預選框標記為正樣本,對應位置信息為得到的偏移值;其余則標記為負樣本,位置信息均為0.
在完成匹配之后,得到經(jīng)過處理的標簽li={Ci,Di,Gi,Si},其中Gi與Si分別為背景信號與SAS發(fā)病的分類標簽,且有Si,Gi∈{0,1}.
2.2.1 相干性分析
相干性用于分析信號之間的頻譜互相關,其數(shù)學表達式如公式(2)所示:
(2)
其中n為每段信號的數(shù)據(jù)點數(shù),A和φ分別為信號的振幅和相位,分子表示在頻率f下信號x和y之間的交叉譜密度,分母表示頻率f下信號x和y功率估計乘積的平方根.在頻率f0處,Cohxy(f0)的值介于0~1之間,其中0表示無耦合,1表示兩個信號之間的最大線性相關.
2.2.2 相關性分析
相關性用于估計信號間時域內(nèi)的線性相關的水平.
(3)
如公式(3)所示,Cov(x,y)是信號x和y之間的協(xié)方差,σx和σy分別是信號x和y的標準差.并且存在Corrxy∈[-1,1],當Corrxy=±1時,信號間呈現(xiàn)正或負線性相關性;當Corrxy=0時,信號間無相關性.
2.2.3 鎖相值分析
鎖相值分析(Phase Locked Value,PLV)是利用相位同步來分析信號之間可能存在的功能性相互作用.當公式(2)中的Ax(f,k)=Ay(f,k)=1時,可得到PLV的表達式如公式(4)所示:
(4)
在頻率f0處存在PLVxy(f0)∈[0,1],當PLVxy(f0)=0時,信號間缺乏相位同步;當PLVxy(f0)=1時,信號間完全相位同步.
2.2.4 相位滯后指數(shù)分析
相位滯后指數(shù)(Phase Lag Index,PLI)表示信號之間相位差分布的不對稱性,其定義如公式(5)所示:
(5)
式(5)中,n為信號通道的長度,φx(f,k)-φy(f,k)表示頻率f下信號x與y之間的相位同步.在頻率f0處存在PLIxy(f0)∈[0,1],當PLIxy(f0)=0時,信號間沒有耦合;當PLIxy(f0)=1時,信號間完全耦合.
SD-FCE模型主要由特征提取模塊φT、分類模塊φC、位置回歸模塊φL共3個部分構(gòu)成.φT模塊主要包含腦電功能連接性特征提取與卷積神經(jīng)網(wǎng)絡的部分層組,經(jīng)過數(shù)據(jù)提取與預處理的EEG信號兩兩通道間進行腦電功能連接性分析,得到腦電功能連接矩陣.隨后將腦電功能矩陣輸入卷積神經(jīng)網(wǎng)絡的層組,其主要包含k個大致相同并且依次相連的結(jié)構(gòu),每個層組均包含卷積層、最大池化、批標準化、RELU激活函數(shù).經(jīng)過特征提取后得到的特征向量將進入分類模塊φC與位置回歸模塊φL.SD-FCE模型的結(jié)構(gòu)如圖2所示.
圖2 SD-FCE模型的結(jié)構(gòu)Fig.2 Architecture of SD-FCE
若輸入的EEG通道數(shù)為c、每個通道的數(shù)據(jù)點數(shù)為t,卷積神經(jīng)網(wǎng)絡寬度為w,φT模塊中第k組卷積神經(jīng)網(wǎng)絡特征提取層的輸入數(shù)據(jù)點數(shù)為tk,每段數(shù)據(jù)上生成Nd個預選框,模型參數(shù)如表1所示.
表1 模型參數(shù)Table 1 Model parameters
φC與φL模塊均包含一個相同的卷積層,其使用與特征向量等長的卷積核(kernel)進行處理,但網(wǎng)絡寬度(width)不再與φT相同,為了模型能按預選框的數(shù)量輸出對應的分類與位置回歸結(jié)果,將網(wǎng)絡寬度設置為兩倍于每段數(shù)據(jù)上生成的預選框數(shù)量.φC與φL模塊不同的是分類模塊φC多出一個Soft-max層,為了將分類的輸出劃歸為類別預測概率.
損失函數(shù)(Loss function)是一類用于衡量預估事件與真實事件差別的函數(shù),通常作為模型的優(yōu)化準則,通過尋求損失函數(shù)最小化進行優(yōu)化.在SD-FCE模型中,損失函數(shù)L(p(xi),li)建立在模型預測值p(xi)={C′i,D′i,G′i,S′i}與真實標簽li之間,G′i與S′i分別為模型對背景信號、SAS發(fā)病的概率,且有G′i,S′i∈[0,1].令∑L(p(xi),li)=φ++φ-,其中φ+與φ-的值分別如公式(6)、公式(7)所示:
(6)
(7)
(8)
公式(6)、公式(7)中m+與m-分別為某一批次訓練標簽中正、負樣本的個數(shù).將損失以正、負樣本分開計算后除以其樣本個數(shù),并且在負樣本中不計算位置信息的損失,此舉有利于緩解數(shù)據(jù)的不平衡性,同時盡可能降低背景信號位置標簽所帶來的影響.L1smooth(Δx)損失函數(shù)源自Fast R-CNN[21]中計算目標回歸框的損失,本文中我們將其用于計算正樣本位置信息的損失,詳見公式(8).
為了使不規(guī)律的真實發(fā)病框網(wǎng)格參數(shù)化,需要利用規(guī)則的預選框?qū)ζ溥M行匹配,模型依托于規(guī)則的預選框輸出相應的偏移量.在預測時,輸出的偏移量需要與其對應的預選框位置數(shù)據(jù)進行解匹配,即逆向計算公式(1)才能得到實際預測的SAS發(fā)病位置.實際情況中,由于匹配時存在多個預選框均匹配了同一個真實發(fā)病框,所以在預測時也存在多個預選框同時預測一個SAS事件.對此,在解匹配之前,還需要通過非極大值抑制[15]對預選框進行篩選,僅留下一個預測分數(shù)最高的預選框用于解匹配得到真實預測的SAS事件.在非極大值抑制中,首先將這些預選框按預測分數(shù)由高到低排序,然后將分數(shù)最高的預選框依次與第2名、第3名等進行IoU計算,如果IoU值高于一定閾值,則視為它和分數(shù)最高的預選框預測的是同一個SAS事件,將其刪除,直至剩下最后一個分數(shù)最高的預選框.依次計算IoU的過程是為了排除那些與分數(shù)最高的預選框重疊度不高的其它預選框,因為同一組數(shù)據(jù)有可能存在預測其它SAS的預選框.
本文實驗數(shù)據(jù)來自由葡萄牙克英布拉大學(Universidad de Coimbra)睡眠醫(yī)學中心采集并公開的多導睡眠圖(Polysomnography,PSG)數(shù)據(jù)集“ISRUC-Sleep”[24].數(shù)據(jù)集共包含3個數(shù)據(jù)子組(Subgroup I、II、III),分別為睡眠障礙受試者100例、服用睡眠藥物的受試者8例以及健康受試者10例.每位受試者的PSG均由完整的8小時左右睡眠行為構(gòu)成,大部分PSG提供了18個通道,其中有6個通道為睡眠EEG(F3-A2、C3-A2、O1-A2、F4-A1、C4-A1、O2-A1),采樣頻率200Hz,兩個通道為呼吸氣流,采樣頻率12.5Hz.數(shù)據(jù)集提供了每位受試者包括年齡、性別、其他病癥、藥物服用情況在內(nèi)的基本體征信息,以及由兩名訓練有素的睡眠醫(yī)學專家進行睡眠分期、睡眠事件、SAS發(fā)病情況的標記.
數(shù)據(jù)集提供了睡眠障礙受試者單位時間段內(nèi)是否發(fā)生SAS的標簽,結(jié)合PSG內(nèi)提供的呼吸氣流通道可得到受試者發(fā)病的具體時間信息[7],如圖3所示.
圖3 SAS發(fā)病的時間段[7]Fig.3 Case of SAS time [7]
本文使用了Subgroup I中僅患SAS的睡眠障礙受試者PSG數(shù)據(jù)共計12名,表2統(tǒng)計了每位受試者在一次完整的PSG采集中SAS的發(fā)病次數(shù)、最短與最長的持續(xù)時間以及平均持續(xù)時間.選取的12名受試者的睡眠EEG經(jīng)過預處理后得到18485組包含6通道、每通道長度為24000的數(shù)據(jù)與其對應的分類、位置標簽.表3統(tǒng)計了包含一定目標數(shù)量的數(shù)據(jù)組數(shù).
表2 受試者的SAS發(fā)病信息Table 2 SAS information of subjects
表3 包含一定目標數(shù)量的數(shù)據(jù)組數(shù)Table 3 Quantity of EEG segments with number of SAS
EEG以其信號微弱、極易混入噪聲等特性為研究人員帶來許多挑戰(zhàn).傳統(tǒng)的EEG預處理包括使用一個頻帶寬度為0-35Hz左右的低通濾波器進行濾波,以此來濾除EEG中的高頻噪聲.但由于EEG是典型的非線性、非平穩(wěn)信號,傅里葉變換以其固定的基函數(shù)為非平穩(wěn)信號的分析帶來一定的局限性.Norden E.Huang等人[17]提出一種新的處理非平穩(wěn)信號的方法——經(jīng)驗模態(tài)分解(Empirical Mode Decomposition,EMD),EMD可以依據(jù)數(shù)據(jù)自身的時間尺度特征來進行信號分解,無須預先設定基函數(shù).這與建立在需要基函數(shù)的傅里葉變換、小波變換方法有著本質(zhì)區(qū)別,因而EMD在處理非平穩(wěn)及非線性數(shù)據(jù)上具有非常明顯的優(yōu)勢,利用其自適應性進分解-降噪-重構(gòu)能獲得更為純凈的EEG信號.
數(shù)據(jù)集提供的睡眠EEG為未經(jīng)過任何處理的原始EEG,一些片段不可避免的混入了噪聲,如果不能合理地削弱這些噪聲,低質(zhì)量數(shù)據(jù)將會使模型學習受到極大的干擾.在本文處理過程中,結(jié)合數(shù)據(jù)集的實際情況,采用兩種方法對數(shù)據(jù)進行清洗:
1)將受噪聲污染嚴重的片段刪除;
2)使用EMD對其進行分解、降噪、重構(gòu)操作,以去除高頻噪聲.將每段數(shù)據(jù)進行EMD分解得到9-14不等個IMFs分量,由于EEG中含有的噪聲基本處于高頻部分,所以將最高頻率的IMF分量去除,剩下的IMFs分量進行重構(gòu)獲得降噪后的信號.原始EEG信號與降噪后的信號如圖4所示.
圖4 原始EEG與降噪后的EEG時域?qū)Ρ菷ig.4 Raw EEG and de-noised EEG in time domain
本文實驗操作的環(huán)境為Ubuntu 18.04.3LTS操作系統(tǒng)、Inter Core i5 8250U、16GB RAM、Python3.7.3、Pytorch1.2.0.實驗超參數(shù)設置如表4所示.
表4 超參數(shù)設置Table 4 Hyper-parameters settings
本文采用召回率(Recall)、精確率(Precision)、F1-score、最小二乘估計(Least Square Estimate,LSE)作為評價指標,設TP,F(xiàn)N,F(xiàn)P,TN分別為真陽性(True Positive)、假陰性(False Negative)、假陽性(False Positive)、真陰性(True Negative),那么召回率、精確率、F1-score、LSE分別如公式(9)-公式(12)所示.
(9)
(10)
(11)
LSE=∑(yi-y′i)2
(12)
在超參數(shù)設置中,k的取值直接決定了網(wǎng)絡的規(guī)模大小,本文通過對近年來相關論文的研究[19,20,25-27],在一定范圍內(nèi)沒有發(fā)現(xiàn)網(wǎng)絡規(guī)模與性能存在直接且固定的聯(lián)系,所以本文設置了一組對照試驗,將k分別取值為3、4、5、6,以驗證不同網(wǎng)絡規(guī)模對于網(wǎng)絡性能的影響.對于本文的方法,z的取值也至關重要,這將直接影響網(wǎng)絡對于位置預測的精度與網(wǎng)絡的規(guī)模.依據(jù)得到Nd值的大小,本文將z分別取值為1、2、3,與此對應的Nd值分別為1440、720、480.對照實驗的結(jié)果如表5所示.
表5 網(wǎng)絡深度與預選框數(shù)量的實驗結(jié)果對比Table 5 Experimental results of network depth and number of default frames
通過對比實驗,隨著網(wǎng)絡層數(shù)的加深,召回率(Recall)有一定程度的上升,但由此帶來的影響就是精確率(Precision)下降.同時隨著預選框生成的數(shù)量減少,也出現(xiàn)了召回率上升、精確率下降的結(jié)果,因此考慮模型回歸的精度與模型復雜度,最終選擇k=5、z=1.
為驗證本文模型的性能,本文進行了多次實驗,對比S.Chambon等人[20]提出的DOSED(Dreem One Shot Event Detector)檢測模型與其對比實驗結(jié)果,其對比模型包括Parekh等人[28]與Lachner-Piza等人[29]提出的模型.上述對比模型在SSC(Stanford Sleep Cohort)[30]數(shù)據(jù)集進行了實驗,對比本文模型的實驗結(jié)果如表6所示.模型的ROC曲線如圖5所示,模型訓練時的損失曲線如圖6所示.
圖5 ROC曲線Fig.5 ROC curve
圖6 損失曲線Fig.6 Loss curve
表6 實驗結(jié)果Table 6 Experimental results
通過實驗結(jié)果可以發(fā)現(xiàn),本文模型的性能在平均召回率(Recall)、平均精確率(Precision)方面優(yōu)于以往提出的基于EEG的檢測任務.睡眠K-復合波(K-compose)、紡錘波(Spindle)與頻帶能量是EEG的主要特征,而SAS發(fā)病時間段與正常睡眠時間段的結(jié)合部分與K-復合波存在一定的關系,正常偏深睡眠時期下丘腦會產(chǎn)生一些紡錘波,睡眠的深淺與SAS發(fā)病時存在一定的關聯(lián),但K-復合波的產(chǎn)生并不一定是由于SAS發(fā)病產(chǎn)生的,所以網(wǎng)絡對特征較為明顯的K-復合波存在一定的誤判概率,除了對多個正向的預選框正確預測之外,還可能存在一些零散的負樣本被錯誤地預測為正向,所以模型的結(jié)果相對于類似的任務對一些數(shù)據(jù)存在“選擇性”.
與傳統(tǒng)的均勻分割后進行二分類的SAS檢測任務不同,傳統(tǒng)的檢測任務經(jīng)過特征提取與分類之后僅需要預測兩個數(shù)值,而在網(wǎng)絡規(guī)模相差不大的情況下本文提出的方法需要輸出1440×4個數(shù)值,這使得結(jié)果包含很多不確定性.但預測時并不是這1440個預選框的數(shù)據(jù)都有用,我們只需要那些相對來說評分較高、多個正向且重疊度較高的預選框,一些單獨存在于其他地方的正向預選框可以忽視,這是因為檢測方法中使用了大量的預選框進行密集采樣,某一個被檢測的目標將會被多個預選框集中識別.最后通過非極大值抑制,留下一定范圍內(nèi)評分最高的預選框與其對應的偏移量,解匹配得到真實的預測位置數(shù)據(jù).
實驗結(jié)果表明,本文提出的全新SAS檢測模型具備可行性,同時模型性能優(yōu)于其他EEG目標檢測任務.
本文提出了一種全新的檢測SAS方法,通過腦電功能連接性分析與卷積神經(jīng)網(wǎng)絡為主要的模型結(jié)構(gòu)完成特征提取、分類與位置預測.相比于傳統(tǒng)SAS檢測方法與EEG類似的研究,該方法不再局限于平均分割信號后進行分類,而是在一定時間段內(nèi)預測每次發(fā)病的時段,因為SAS發(fā)病的時長與時間點對于醫(yī)生的診斷也蘊含著非常重要的信息.為了使模型在學習預測中受干擾更小、更容易學習到特征,本文提出EMD等方法進行信號去噪聲、去偽跡;使用特定的滑動窗口數(shù)據(jù)提取機制,既提高了檢測頻率,同時也保證模型單次預測可用的數(shù)據(jù)量足夠多,以獲得更好的結(jié)果.如何處理不規(guī)則的發(fā)病時間標簽是本文的關鍵一步.參考目標檢測算法的過程,使用類似的用于密集采樣的預選框?qū)⒄鎸嵉陌l(fā)病時間標簽網(wǎng)格參數(shù)化.特定的損失函數(shù)保證了分類與回歸的同時優(yōu)化.針對兩個分別用于分類與位置預測的模塊,損失函數(shù)進行了功能區(qū)分,并且一部分預測結(jié)果不參與損失函數(shù)的計算.正樣本同時參與分類、回歸的損失計算,負樣本則僅參與分類的損失計算,以減輕數(shù)據(jù)不平衡所帶來的影響.
分析睡眠EEG是診斷SAS的重要途徑之一.睡眠EEG不僅提供了整體睡眠結(jié)構(gòu)與睡眠狀態(tài)的宏觀信息,還提供了時域中的微觀結(jié)構(gòu).Alattar M.A等人[31]的研究表明,SAS患者睡眠期間的覺醒與呼吸暫停事件對皮層腦電影響顯著,這決定了SAS患者的睡眠腦電在微觀結(jié)構(gòu)中存在異于健康人的部分,特別是CAP活動.CAP(Cyclic Alternating Pattern)[32]是一種涉及大腦皮層的一種腦電活動,常出現(xiàn)于睡眠的NREM期.CAP活動由A相與B相組成,A相由一段主要成分包括慢波(Slow waves)、Detal波、K-復合波等高振幅波構(gòu)成,而B相為普通的背景節(jié)律波,以A相+B相組合為一次CAP循環(huán).SAS嚴重干擾睡眠結(jié)構(gòu)與穩(wěn)態(tài),而CAP作為睡眠穩(wěn)態(tài)的標志,將直接導致睡眠EEG的微觀結(jié)構(gòu)發(fā)生一些特定的變化[32-34].
本文利用SAS發(fā)病時神經(jīng)系統(tǒng)異常特征與深度學習方法,以SSD目標檢測算法為基礎提出一種新的SD-FCE模型,為SAS自動檢測提供了新的思路與可靠的自動檢測結(jié)果,該方法的提出為醫(yī)生在SAS臨床診斷中提供了更多的重要信息,這是傳統(tǒng)分類方法所不具備的絕對優(yōu)勢.在下一步的研究中,本文將繼續(xù)尋求模型改進方法,包括嘗試不同的網(wǎng)絡結(jié)構(gòu)、關注最新的相關算法,挖掘腦電內(nèi)更多維度的特征,以獲得更佳的性能.