国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種雙耳聽覺模型及其在軸心軌跡分析中的應用

2012-09-15 08:49:16李允公張金萍
振動與沖擊 2012年18期
關鍵詞:基底膜雙耳毛細胞

李允公,戴 麗,張金萍

(1.東北大學 機械工程與自動化學院,沈陽 110819;2.沈陽化工大學 機械工程學院,沈陽 110142)

聽覺模型[1-3]是一種以模擬人類聽覺系統(tǒng)的生理結構和工作機理為主要特征的信號分析系統(tǒng),除了語音、噪聲、音樂、聲納等信號外,它對機械振動信號也具有良好的分析性能[4-5]。通常情況下,使用最多的是單耳聽覺模型,而人類擁有的是雙耳聽覺系統(tǒng),因此,可以考慮建立并應用雙耳聽覺模型。目前的聽覺生理學研究表明,聽覺系統(tǒng)對雙耳耳蝸輸出的信息所進行的操作主要是提取時間差ITD和強度差IID,并依據(jù)ITD和IID估計聲源方位角和距離[6]。因此,建立雙耳聽覺模型的直接目的是進行聲源定位,如Roman等[6]所建的雙耳聽覺模型以ITD和IID為線索,可實現(xiàn)聲源數(shù)目的自動探測和運動軌跡跟蹤。但由于信號傳播方式的不同,對于機械振動信號,僅利用ITD和IID信息進行信號源的定位顯然存在困難。

另一方面,聽覺系統(tǒng)實現(xiàn)聲源定位的過程也是一種對信號進行特征提取的過程,且特征提取的結果同聲源信號的結構和聲源的方位密切相關。所以,可以考慮利用雙耳聽覺模型對兩個傳感器所得信號進行處理,以實現(xiàn)信號的特征提取。

軸心軌跡是一種十分典型的基于雙傳感器的設備信息,且決定軸心軌跡形狀的兩個根本因素即是兩路信號中相同頻率成分的相位和幅值關系,因此,以軸心軌跡為分析對象,本文建立了一種雙耳聽覺模型,并通過試驗驗證了所建模型對于軸心軌跡的特征提取具有良好的性能。

1 模型的基本原理

本文所建的雙耳聽覺模型如圖1所示。兩個單耳模型的結構相同,均包括基底膜模型、內毛細胞模型和側抑制模塊,雙耳模型對兩側抑制處的輸出信號計算ITD和IID。其中,基底膜模型的主要功能是對信號進行帶通濾波,內毛細胞模型負責對帶通濾波結果進行半波整流,側抑制模塊模擬的是傳入神經系統(tǒng)的部分功能,可對內毛細胞模型的輸出信息進行頻域上的精簡。

圖1 雙耳聽覺模型基本結構Fig.1 Structure of the binaural auditory model

2 模型的具體實現(xiàn)

2.1 基底膜模型

基底膜是人耳耳蝸的核心部件,不同頻率的信號會在基底膜不同位置處激發(fā)出振動波峰,因此,通常使用Gammatone帶通濾波器組[7]模擬基底膜的工作。設濾波器個數(shù)為M,第m個濾波器為h(m,t),則基底膜模型的輸出為:

式中,x(t)為輸入信號,y(m,t)為基底膜輸出,*表示時域卷積。Gammatone濾波器的時域表達式為:

式中,α為濾波器階數(shù),當α=4時可以很好的模擬基底膜特性;fm為中心頻率,各濾波器的中心頻率在頻率軸上呈對數(shù)均勻分布;相位φm通常取為零;B的計算公式為:

其中,ERB(fm)為濾波器的等價矩形帶寬。圖2為采樣頻率1 000 Hz,M=18時的各濾波器幅值譜的分布情況,其中橫縱坐標均為對數(shù)坐標。可見,Gammatone濾波器組的各中心頻率的分布隨頻率的升高而逐漸變得稀疏,且各濾波器之間存在較大的頻率重合度,可有效避免信息的遺漏。同時易知,提高M有益于增加高頻段的中心頻率分布密度,但同時也加大了低頻段的密度,從而使濾波信息過度冗余,因此,M不易過大。在語音信號分析中,M一般為20~190[8],考慮到機械振動信號的采樣頻率往往遠小于語音信號的采樣頻率,結合以往研究經驗,M取16~120較為適宜。

圖2 M=18時的Gammatone濾波器組幅值譜Fig.2 Amplitude spectrums of Gammatone filterbank with M=18

2.2 內毛細胞模型

基底膜的振動會刺激耳蝸柯蒂氏器官中的內毛細胞,由其完成振動刺激到電刺激的能量轉換。

內毛細胞的一個特性是只對基底膜正方向的運動產生反應,因此,本文中的內毛細胞模型負責對基底膜輸出信號y(m,t)進行半波整流,即:

在后面的計算中可發(fā)現(xiàn),利用半波整流后的信號進行ITD信息提取時會方便很多。同時,需要說明的是,內毛細胞還有非線性壓縮和低頻鎖相等功能,但考慮到本文模型的具體要求,未進行模擬。

2.3 側抑制

內毛細胞的輸出信息需經過三級傳入神經被傳至聽覺中樞,在一些聽覺模型中,常使用側抑制[9]計算簡單模擬傳入神經,計算方法如下:

式中:k=1,…,M-1,fk+1和fk分別為第k+1和第k個Gammatone濾波器的中心頻率。式(5)實質上是對內毛細胞的輸出進行頻域微分,目的是消除Gammatone濾波器組較大的重合度對分析結果的影響,從而既可簡化輸出信息,又能夠突出幅值較大的濾波信號。

考慮到計算時差的方便,對y2(k,t)再進行一次半波整流,結果設為y3(k,t)。

2.4 時差與強度差計算

設兩單耳模型的側抑制輸出分別為y3L(k,t)和y3R(k,t)。由于人耳對聲音信號是分段式處理的(每段約 20 ms),所以,首先將 y3L(k,t)和 y3R(k,t)等分為 N段,每一段信號設為),時域離散形式設為),L 為每段的長度。繼而便可計算時差ITD和強度差IID。

目前已有的雙耳聽覺模型中,通常使用互相關方法計算雙耳時差ITD[6],但對計算結果還需進一步判斷超前還是滯后??紤]到信號經內毛細胞模型的半波整流處理后,側抑制的輸出y3(k,t)中會存在間歇式出現(xiàn)的幅值為零的時間段,且y3(k,t)經N等分后,每一段信號的長度較短,因此,本文采用如下的簡單的數(shù)值方法得到時差ITD。

設第k個通道的第n個時間段上的時差為ITD(k,n),確定出中第一個由零變?yōu)榉橇愕狞c的位置 zL(k,n)和 zR(k,n),則有:第k個通道的第n個時間段上的雙耳強度差IID(k,n)則按下式計算:

實際軸心軌跡不可能是一條理想的封閉曲線,加之在計算時差和強度差時所進行的分段處理未考慮到信號的自身狀態(tài),因此,在本文的多次試驗中發(fā)現(xiàn)由所建模型得到的ITD(k,n)和IID(k,n)均會隨時間進行波動,其中ITD(k,n)的波動更大,但其峰值幾乎保持不變。由于通常在設備穩(wěn)速情況下檢測軸心軌跡,因此,選取第k個通道上所有時間段上ITD(k,n)的峰值ITDm(k)和IID(k,n)的均值IIDm(k)作為模型的輸出。為縮減輸出數(shù)據(jù)量,若某一通道所得的ITDm(k)為零,則將其略去,并同時略去該通道所得的IIDm(k)??芍?,只要兩路信號在某Gammatone濾波器的頻段內存在初始相位不同的分量,就會得到時差和強度差的計算結果。

3 試驗驗證

利用一轉子試驗臺(圖3)測取五種不同形狀的軸心軌跡,如圖4所示,測試時采樣頻率為1 000 Hz,各軸心軌跡的數(shù)據(jù)點為20 000個。

圖3 轉子試驗臺Fig.3 Rotor test-bed

對于雙耳聽覺模型,取基底膜的Gammatone濾波器個數(shù)為48,考慮到前9個濾波器的中心頻率在0~3 Hz間密集分布,故而略去,則實際的濾波器個數(shù)為39。計算時差和強度差時,取每段的長度為L=250。由各軸心軌跡得到的ITDm(k)和IIDm(k)如圖5所示。

由圖5可見,不同形狀的軸心軌跡會得到截然不同的ITDm(k)和IIDm(k),且所使用的數(shù)據(jù)量至多只有39個點,說明本文所建模型對于軸心軌跡的特征提取具有一定的效果。在進行軸心軌跡的智能識別時,可將濾波器中心頻率、ITDm(k)和IIDm(k)構成的向量作為特征,也可將ITDm(k)和IIDm(k)的某種統(tǒng)計結果作為特征,繼而利用諸如神經網絡、模糊聚類等方法進行識別和分類。當然,具體的識別方法還應結合軸心軌跡和本文模型的輸出形式進行設計和研究。而無論采用哪種識別方法,所需的特征至多為30余個向量,且具有一定的信息冗余性。當然,特征的數(shù)據(jù)量還取決于Gammatone濾波器的個數(shù)。

當然,由于信號在聽覺模型中經過半波整流和側抑制處理,加之Gammatone濾波器間具有較大的重合合度,所以模型輸出的ITDm(k)和IIDm(k)是兩路信號在各頻段上的一種統(tǒng)計特征,且與真實的時間差和相位差并不完全等同。

圖6 圖4(e)軸心軌跡兩路信號的幅值譜Fig.6 Amplitude spectrums of two-channel signals in fig.4(e)

在2.4節(jié)已經提到,只要兩路信號中存在初始相位不同的頻率成分,就會得到相應的 ITDm(k)和IIDm(k),而且,兩路信號間的時間差和強度差的大小與各單路信號的幅值間不存直接的聯(lián)系,因此,信號中微弱的頻率成分可能會在ITDm(k)和IIDm(k)中得到反映。如由圖5(e)所示軸心軌跡得到的ITDm(k)和IIDm(k)表明,信號在120~280 Hz的頻率區(qū)間內存在諧波分量,但這部分信號在兩路信號的幅值譜中卻十分微弱,如圖6所示。所以,雙耳聽覺模型具有一定的提取微弱信號的潛力。同時,需要說明的是,對是否存在微弱信號成分的判斷方法是某一頻段中是否計算得到ITDm(k)和IIDm(k),而不是依據(jù)ITDm(k)和 IIDm(k)的幅值大小。

4 結論

模擬人類聽覺系統(tǒng)的工作機理,建立了一種雙耳聽覺模型,該模型的主要目的是提取兩路信號在各頻段上的時間差和強度差,以實現(xiàn)對信號的特征提取?;谒P停治隽宋宸N不同形狀的軸心軌跡,所得結果具有良好的可區(qū)分性,說明雙耳聽覺模型對于軸心軌跡的特征提取問題具有一定的適用性。同時,由于所建模型提取的是兩路信號間在強度和時間方面的關系,與單路信號的幅值無直接聯(lián)系,因此,雙耳聽覺模型也具有表征和提取微弱信號的潛力。

[1] Serajul H,Roberto T,Anthony Z.A temporal auditory model with adaptation for automatic speech recognition[J].ICASSP’2007,2007,4:1141-1144.

[2] Klapuri A.Multipitch analysis of polyphonic music and speech signals using an auditory model[J].IEEE Transactions on Speech and Audio Processing,2008,16(2):255-266.

[3] Chu W,Champagne B.A simplified early auditory model with application in speech/music classification[C] //IEEE CCECE/CCGEI,Ottawa,2006:775-778.

[4] Li Y G,Zhang J P,Dal L,et al.Auditory-model-based feature extraction method for mechanical faults diagnosis[J].Chinese Journal of Mechanical Engineering,2010,21(3):391-397.

[5] 李允公,張金萍,高洪波,等.機械振動信號的聽覺譜表達及其特性研究[J].振動與沖擊,2010,29(11):204-208.

[6] Roman N,Wang D L.Binaural tracking of multiple moving sources[J]. IEEE Transactions on Audio,Speech,and Language Processing,2008,16(4):728-739.

[7] 陳世雄,宮 琴,金慧君.用Gammatone濾波器組仿真人耳基底膜的特性[J].清華大學學報(自然科學版),2008,46(6):33-38.

[8] 李朝暉,遲惠生.聽覺外周計算模型研究進展[J].聲學學報,2006,31(5):449-465.

[9] Wang K.Shamma S.Self-normalization and noise-robustness in early auditory representations[J].IEEE Transactions on Speech and Audio Processing,1994,2(3):421-435.

猜你喜歡
基底膜雙耳毛細胞
輕叩雙耳好處多
新生小鼠耳蝸基底膜的取材培養(yǎng)技術*
輕叩雙耳好處多
幕上毛細胞星形細胞瘤的MR表現(xiàn)及誤診分析
哥窯青釉雙耳彝爐
紫禁城(2020年5期)2021-01-07 02:13:34
讓永久性耳聾患者有望恢復聽力的蛋白質
鳥綱類生物雞用于耳蝸毛細胞再生領域研究進展
豚鼠耳蝸基底膜響應特性的實驗測試與分析
振動與沖擊(2018年4期)2018-03-05 00:34:24
如何認識耳蝸內、外毛細胞之間的關系
Fibulin-2在診斷乳腺基底膜連續(xù)性的準確性研究
上饶县| 屏东县| 韶山市| 乡城县| 龙川县| 陵水| 湖北省| 阿拉尔市| 三门峡市| 合水县| 定远县| 濮阳县| 六枝特区| 南宫市| 抚顺县| 湘潭市| 清镇市| 弥勒县| 阿克陶县| 宝应县| 双江| 海晏县| 昂仁县| 即墨市| 敖汉旗| 久治县| 从江县| 淮北市| 宕昌县| 盐源县| 陆河县| 玉门市| 辉南县| 雷山县| 阳泉市| 平和县| 普安县| 个旧市| 东兰县| 明溪县| 方正县|