国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

鼾聲檢測(cè)研究綜述

2020-07-20 13:42孫井鵬胡晰遠(yuǎn)彭思龍
世界睡眠醫(yī)學(xué)雜志 2020年3期
關(guān)鍵詞:鼾聲文獻(xiàn)能量

孫井鵬 胡晰遠(yuǎn) 彭思龍

摘要 鼾聲檢測(cè)任務(wù)近年來(lái)取得了較大的發(fā)展,出現(xiàn)了許多相應(yīng)的檢測(cè)方法,這些方法也有著較為明確的框架與發(fā)展趨勢(shì)。因此,本文就鼾聲檢測(cè)的研究現(xiàn)狀進(jìn)行總結(jié),并給出該方向發(fā)展前景的討論,以期讓大家在了解其歷史發(fā)展的基礎(chǔ)上,跟進(jìn)最新進(jìn)展,對(duì)未來(lái)的發(fā)展方向有更加深入的認(rèn)識(shí)。

關(guān)鍵詞 鼾聲檢測(cè);阻塞型睡眠呼吸暫停綜合征;研究綜述

Abstract The snore detection task has made great progress in recent years,and many approaches have been proposed.These methods have a relatively clear framework and development trend.Therefore,this article summarizes the current research situation of snore detection and discusses the development of this field with the hope that everyone could follow the latest situation on the basis of understanding its historical development and have a deeper understanding of the future development of snore detection.

Keywords Snore detection;OSAHS;Review

中圖分類號(hào):R714.253;R765文獻(xiàn)標(biāo)識(shí)碼:Adoi:10.3969/j.issn.2095-7130.2020.03.075

1 鼾聲檢測(cè)研究背景與意義

阻塞性睡眠呼吸暫停低通氣綜合征(OSAHS)作為最常見(jiàn)的睡眠呼吸疾病之一,嚴(yán)重影響著人類的睡眠質(zhì)量[1-2]及健康狀況,世界上約有5%的人患有OSAHS,如果得不到及時(shí)治療,OSAHS將會(huì)誘發(fā)高血壓、冠心病、糖尿病、心力衰竭,甚至猝死等癥狀。目前臨床上診斷OSAHS的“金標(biāo)準(zhǔn)”是睡眠多導(dǎo)監(jiān)測(cè)(PSG),其是通過(guò)記錄患者一夜睡眠期間的若干生理信號(hào)(如腦電信號(hào)、心電信號(hào)、肌電信號(hào)、眼電信號(hào)、血氧飽和度和鼾聲等),然后通過(guò)睡眠技師人工分析得到關(guān)于OSAHS的報(bào)告。這一過(guò)程需要耗費(fèi)大量的醫(yī)護(hù)人力和醫(yī)療設(shè)備資源,導(dǎo)致很多OSAHS患者不能得到及時(shí)治療。鼾聲作為OSAHS早期特征,也是最典型的癥狀之一,近年來(lái)引起了研究人員的廣泛關(guān)注。一方面,鼾聲與OSAHA有著緊密的聯(lián)系:OSAHS表現(xiàn)為睡眠中塌陷的上氣道反復(fù)出現(xiàn)閉合引起呼吸暫停或通氣不足,并伴有打鼾、血氧飽和度下降以及呼吸結(jié)構(gòu)紊亂等癥狀。在此過(guò)程中,隨著塌陷程度的增加,上氣道內(nèi)的壓力也隨之增加,導(dǎo)致氣流速度加快并引起上氣道內(nèi)某些組織的振動(dòng)從而產(chǎn)生了鼾聲。鑒于此,如果上氣道的狀態(tài)(如振動(dòng)位置、塌陷程度)不同,那么根據(jù)鼾聲產(chǎn)生的過(guò)程,不同狀態(tài)下產(chǎn)生的鼾聲也應(yīng)該不同,即鼾聲能夠反映上氣道的狀態(tài)。另一方面,鼾聲數(shù)據(jù)的采集較之PSG也更加方便。有研究表明,鼾聲中包含著OSAHS的信息,因此,近年來(lái)有大量的基于鼾聲的OSAHS研究。但是,這些研究大部分都集中在鼾聲信號(hào)的分析上,而在鼾聲信號(hào)的檢測(cè)方面則比較少。大多數(shù)鼾聲分析的研究,其鼾聲數(shù)據(jù)都是基于人工截取標(biāo)注的,手動(dòng)標(biāo)注數(shù)據(jù)需要耗費(fèi)大量的時(shí)間與人力,不僅精度低(鼾聲的起止位置不精確)而且效率低,從鼾聲領(lǐng)域的研究來(lái)看,也不便于該領(lǐng)域的快速發(fā)展,因此鼾聲檢測(cè)任務(wù)是鼾聲分析領(lǐng)域至關(guān)重要并亟待解決的問(wèn)題。

2 鼾聲檢測(cè)研究現(xiàn)狀

在鼾聲檢測(cè)的研究中,相關(guān)方法可以分為兩大類:1)多階段法;2)單階段法。兩者的區(qū)別在于:前者需要經(jīng)過(guò)多個(gè)階段的分析處理才能實(shí)現(xiàn)鼾聲的檢測(cè),而后者是一種一步到位的檢測(cè)方法。

2.1 多階段法

多階段的方法把鼾聲檢測(cè)任務(wù)分為多個(gè)過(guò)程,該類方法大概可歸納為以下3個(gè)階段:1)有聲段檢測(cè);2)特征提取;3)鼾聲檢測(cè)。

2.1.1 有聲段檢測(cè) 通過(guò)觀察音頻信號(hào)的時(shí)域波形我們能夠發(fā)現(xiàn),有聲音的部分與背景部分存在明顯不同,如波形分布不同、幅度變化特點(diǎn)不同?;诖宋墨I(xiàn)[3-4]提出一種基于局部窗口的聲音檢測(cè)方法,該種檢測(cè)方法通過(guò)統(tǒng)計(jì)落入該窗口中的觀測(cè)值的個(gè)數(shù)來(lái)分析是否到達(dá)聲音事件的端點(diǎn)。考慮到背景聲音的方差較之有聲段的方差更為穩(wěn)定,文獻(xiàn)[5]提出一種更為簡(jiǎn)便的基于方差變化的有聲段檢測(cè)方法,但是該方法在背景變化較大的情況下穩(wěn)定性較差。更為常用且更加穩(wěn)定的方法是基于短時(shí)能量閾值的方法[6-13],有聲段的中間部分能量通常會(huì)大于背景聲,不過(guò)其端點(diǎn)部分很可能由于能量較小而被背景聲音淹沒(méi),為了解決這個(gè)問(wèn)題,通常將單位時(shí)間內(nèi)通過(guò)零點(diǎn)的次數(shù)(過(guò)零率)與短時(shí)能量結(jié)合[6,12-13],因?yàn)檫^(guò)零率與能量無(wú)關(guān),通常背景聲的過(guò)零率小于有聲段,二者結(jié)合會(huì)取得更準(zhǔn)確的結(jié)果。除時(shí)域外,文獻(xiàn)[14]通過(guò)雙閾值的方法對(duì)音頻的功率譜進(jìn)行篩選達(dá)到有聲段檢測(cè)的目的。

2.1.2 特征提取 早期在特征提取階段研究人員使用的都是較為簡(jiǎn)單的特征如能量[4],基頻[12],自相關(guān)系數(shù)[13]以及時(shí)域或譜域的特征[5]。這些特征較為簡(jiǎn)單,并沒(méi)有考慮到鼾聲與其他聲音的區(qū)別,所以檢測(cè)效果不好[3-4,6]。根據(jù)鼾聲的子帶能量分布特征,將鼾聲的頻譜分為若干子頻帶,計(jì)算每個(gè)頻帶的能量以表征聲音事件的能量分布特征,這種做法較之簡(jiǎn)單的使用頻率特征有稍微的改善,但是,值得注意的是其使用的子帶能量分布特征并不能很好地表征人耳聽(tīng)覺(jué)特性,也沒(méi)有明顯的聲學(xué)意義。為了模仿人耳處理聲音的過(guò)程,文獻(xiàn)[11]通過(guò)對(duì)聲音事件進(jìn)行聲音圖像建模(AIM)以期模仿聲音從外耳到大腦的聽(tīng)覺(jué)通路,AIM主要包含5個(gè)步驟,分別為:類耳蝸處理(Pre-cochlear Processing)、底膜運(yùn)動(dòng)處理(Basilar MemBrane Motion)、神經(jīng)激活模式(Neural Activity Pattern)、脈沖識(shí)別(Strobe Identification)和穩(wěn)態(tài)聽(tīng)覺(jué)成像(Stabilized Auditory Image),雖然該方法有一定的仿生學(xué)意義,但是過(guò)程復(fù)雜,在鼾聲檢測(cè)領(lǐng)域并沒(méi)有得到廣泛的應(yīng)用。實(shí)際上目前在表征人耳聽(tīng)覺(jué)方面使用較多并在語(yǔ)音識(shí)別中表現(xiàn)出明顯優(yōu)勢(shì)的聲學(xué)特征是梅爾頻率倒譜系數(shù)(MFCC),近年來(lái)許多鼾聲檢測(cè)的方法也將MFCC作為主要聲學(xué)特征之一[7-10,14-15],其是通過(guò)將音頻的頻譜通過(guò)一組能夠反映人耳聽(tīng)覺(jué)特性的非線性分布的梅爾頻率濾波器組得到的。它的第一個(gè)系數(shù)反應(yīng)音頻的能量大小,為了使特征獨(dú)立于能量的變化可以將第一個(gè)系數(shù)刪除。另外,為了反應(yīng)音頻的動(dòng)態(tài)特性,通常將MFCC的一階與二階差分與其結(jié)合在一起使用。

2.1.3 鼾聲檢測(cè) 自進(jìn)入21世紀(jì)以來(lái),鼾聲檢測(cè)方向的研究較之以前出現(xiàn)了小幅增長(zhǎng),涌現(xiàn)了一批檢測(cè)算法,這些算法可分為有監(jiān)督和無(wú)監(jiān)督兩類。有監(jiān)督算法中[5-17],早期,文獻(xiàn)[15]將鼾聲分為起始、中間與結(jié)束3個(gè)狀態(tài),試圖通過(guò)對(duì)鼾聲事件使用隱馬爾科夫模型進(jìn)行建模的方式實(shí)現(xiàn)檢測(cè)的目的,但是由于鼾聲的多樣性,該類建模方法并沒(méi)能取得較好的應(yīng)用。更多的研究使用的是基于分類的方法,K-近鄰(KNN)算法[9]、支持向量機(jī)(SVM)[17]、高斯混合模型(GMM)[7]、線性回歸[6]、邏輯斯蒂回歸[11]等分類算法均有應(yīng)用,除了單獨(dú)的分類器之外,文獻(xiàn)[8]使用集合多個(gè)分類器的集成學(xué)習(xí)分類器Adaboost應(yīng)用在鼾聲檢測(cè)的任務(wù)中。無(wú)監(jiān)督算法主要是以聚類算法為主[3-4],分別通過(guò)Fuzzy c-means與k-means 2種聚類算法來(lái)實(shí)現(xiàn)鼾聲檢測(cè)。然而基于上述聚類算法和分類算法的鼾聲檢測(cè)算法,一定程度上實(shí)現(xiàn)了相關(guān)功能,但是效果不盡如人意,究其原因主要是因?yàn)轺曅盘?hào)的高度非線性與多樣性,且大多數(shù)鼾聲信噪比較低,這也給檢測(cè)任務(wù)帶來(lái)了一定的難度,而近年來(lái)隨著大數(shù)據(jù)的興起與高性能計(jì)算的普及,神經(jīng)網(wǎng)絡(luò)強(qiáng)大的數(shù)據(jù)表示能力得以展現(xiàn),在解決非線性表示問(wèn)題上,在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、語(yǔ)音識(shí)別等領(lǐng)域表現(xiàn)出了卓越的性能,并獲得廣泛關(guān)注。文獻(xiàn)[10]構(gòu)建了人工神經(jīng)網(wǎng)絡(luò)模型(ANN)用于鼾聲檢測(cè),取得了不錯(cuò)的效果,但是由于他們使用的只是層數(shù)較少的普通的神經(jīng)網(wǎng)絡(luò)模型,在表示時(shí)間序列上優(yōu)勢(shì)并不明顯,為了克服這個(gè)問(wèn)題,文獻(xiàn)[14]利用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)較好地表達(dá)了鼾聲的時(shí)間序列特征,取得了較高的準(zhǔn)確率。

2.2 單階段法 目前大部分的研究基本上都是多階段的方法,但這種做法通常會(huì)面臨以下問(wèn)題。首先,在有聲段檢測(cè)階段,無(wú)論是基于時(shí)域還是頻域特征,均是基于閾值的,而這些閾值是超參數(shù)很難選擇。一般的解決方式是采用自適應(yīng)的方法選擇閾值,如根據(jù)整個(gè)訓(xùn)練集的數(shù)據(jù)分布選擇閾值,也只是杯水車薪,其泛化能力較差。其次,在特征提取階段,我們注意到,研究人員試圖從鼾聲的產(chǎn)生端、人耳的接收端來(lái)模擬人耳對(duì)鼾聲的感知特性,共振峰、梅爾頻率倒譜系數(shù)這些都只是基于我們的先驗(yàn)知識(shí)而人工設(shè)計(jì)的特征,至于該特征是否真的能像預(yù)期的一樣反映人類的聽(tīng)覺(jué)系統(tǒng)特性,還需要進(jìn)一步探索,而且目前使用較多的特征也比較單一。最后,目前大部分的鼾聲檢測(cè)算法,其實(shí)是在選定類型下的鼾聲分類算法,這些研究只考慮了睡眠期間的除鼾聲之外的部分其他聲音(如咳嗽、說(shuō)話、呼吸等),但在實(shí)際情況下,睡眠期間還會(huì)發(fā)生許多其他類型的聲音(如敲門(mén)聲、動(dòng)物叫聲、汽車聲等),因此這些方法均不能很好地適用于實(shí)際情況。因此,我們需要一種更加魯棒,獨(dú)立于人工特征,更適用于實(shí)際情況的鼾聲檢測(cè)算法。有文獻(xiàn)[18]在這方面做了初步的嘗試,提出了一種基于深度學(xué)習(xí)的端到端的鼾聲檢測(cè)模型,該模型以一維卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),以原始錄音數(shù)據(jù)為輸入,直接輸出鼾聲檢測(cè)結(jié)果,但是由于該模型使用的是卷積網(wǎng)絡(luò),在表達(dá)時(shí)間序列信息上有所不足,其性能還有待進(jìn)一步改善。

3 發(fā)展前景

縱觀近20多年鼾聲檢測(cè)領(lǐng)域的發(fā)展可以看到,以往基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法正在慢慢被深度學(xué)習(xí)所替代,多階段算法的主導(dǎo)地位也出現(xiàn)了向單階段方法過(guò)渡的跡象,相信隨著近年來(lái)海量數(shù)據(jù)的出現(xiàn),計(jì)算力的大幅度提升,單階段檢測(cè)方法將成為未來(lái)的趨勢(shì)。如何做到快速、準(zhǔn)確地檢測(cè)到睡眠期間的鼾聲,將是未來(lái)睡眠相關(guān)研究領(lǐng)域內(nèi)一個(gè)必須要深度探討的問(wèn)題。

參考文獻(xiàn)

[1]Macarthur K E,Ryan C M,Bradley T D,et al.Differential Effect of Snoring and Obstructive Sleep Apnea on Sleep Structure and Sleepiness[M]//C77.PREDICTORS OF SLEEP DISORDERED BREATHING AND RESPONSE TO TREATMENT.American Thoracic Society,2018:A5899-A5899.

[2]胡雪君,康健,王瑋,等.持續(xù)正壓通氣對(duì)阻塞性睡眠呼吸暫?;颊咚哔|(zhì)量改善作用[J].中國(guó)醫(yī)科大學(xué)學(xué)報(bào),2001,30(3):44-46.

[3]Azarbarzin A,Moussavi Z M K.Automatic and unsupervised snore sound extraction from respiratory sound signals[J].IEEE Transactions on Biomedical Engineering,2010,58(5):1156-1162.

[4]Azarbarzin A,Moussavi Z.Unsupervised classification of respiratory sound signal into snore/no-snore classes[C]//2010 Annual International Conference of the IEEE Engineering in Medicine and Biology.IEEE,2010:3666-3669.

[5]Jané R,Solà-Soler J,F(xiàn)iz J A,et al.Automatic detection of snoring signals:validation with simple snorers and OSAS patients[C]//Proceedings of the 22nd Annual International Conference of the IEEE Engineering in Medicine and Biology Society(Cat.No.00CH37143).IEEE,2000,4:3129-3131.

[6]Cavusoglu M,Kamasak M,Erogul O,et al.An efficient method for snore/nonsnore classification of sleep sounds[J].Physiological measurement,2007,28(8):841.

[7]Dafna E,Tarasiuk A,Zigel Y.Automatic detection of snoring events using Gaussian mixture models[C]//Seventh International Workshop on Models and Analysis of Vocal Emissions for Biomedical Applications.2011.

[8]Dafna E,Tarasiuk A,Zigel Y.Automatic detection of whole night snoring events using non-contact microphone[J].PloS one,2013,8(12):e84139.

[9]Qian K,Xu Z,Xu H,et al.Automatic detection,segmentation and classification of snore related signals from overnight audio recording[J].IET Signal Processing,2015,9(1):21-29.

[10]Swarnkar V R,Abeyratne U R,Sharan R V.Automatic picking of snore events from overnight breath sound recordings[C]//2017 39th Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC).IEEE,2017:2822-2825.

[11]Nonaka R,Emoto T,Abeyratne U R,et al.Automatic snore sound extraction from sleep sound recordings via auditory image modeling[J].Biomedical Signal Processing and Control,2016,27:7-14.

[12]Abeyratne U R,Wakwella A S,Hukins C.Pitch jump probability measures for the analysis of snoring sounds in apnea[J].Physiological measurement,2005,26(5):779.

[13]Karunajeewa A S,Abeyratne U R,Hukins C.Silence-breathing-snore classification from snore-related sounds[J].Physiological Measurement,2008,29(2):227.

[14]Arsenali B,van Dijk J,Ouweltjes O,et al.Recurrent Neural Network for Classification of Snoring and Non-Snoring Sound Events[C]//2018 40th Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC).IEEE,2018:328-331.

[15]Duckitt W D,Tuomi S K,Niesler T R.Automatic detection,segmentation and assessment of snoring from ambient acoustic data[J].Physiological measurement,2006,27(10):1047.

[16]Perez-Macias J M,Tenhunen M,Vrri A,et al.Detection of snores using source separation on an Emfit signal[J].IEEE journal of biomedical and health informatics,2017,22(4):1157-1167.

[17]Christoph Janott,Christian Rohrmeier,Maximilian Schmitt,et al.Snoring-an acoustic definition[C]//2019 41st Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC).IEEE,2019:3653-3657.

[18]Sun J,Hu X,Zhao Y,et al.SnoreNet:Detecting Snore Events from Raw Sound Recordings[C]//2019 41st Annual International Conference of the IEEE Engineering in Medicine and Biology Society(EMBC).IEEE,2019:4977-4981.

猜你喜歡
鼾聲文獻(xiàn)能量
Hostile takeovers in China and Japan
正能量
爸爸的鼾聲
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
爸爸的鼾聲
父親的鼾聲
正能量描繪詞
正能量描繪詞
九江县| 莱阳市| 隆化县| 巴彦淖尔市| 定结县| 富阳市| 清镇市| 伊金霍洛旗| 陕西省| 闵行区| 开封市| 三穗县| 石楼县| 长宁区| 慈溪市| 宝应县| 水城县| 仲巴县| 云阳县| 南溪县| 株洲市| 呼玛县| 元氏县| 龙泉市| 翁牛特旗| 涞源县| 汉源县| 泗阳县| 盐池县| 广州市| 斗六市| 寻乌县| 杂多县| 文成县| 洞口县| 抚宁县| 如皋市| 江山市| 安徽省| 松阳县| 湾仔区|