王風(fēng)嬌,任昱昊,趙 進(jìn),段法兵
(青島大學(xué)復(fù)雜性科學(xué)研究所,山東 青島 266071)
耳蝸神經(jīng)網(wǎng)絡(luò)中語(yǔ)音信號(hào)傳輸?shù)拇碳l件信息研究
王風(fēng)嬌,任昱昊,趙 進(jìn),段法兵
(青島大學(xué)復(fù)雜性科學(xué)研究所,山東 青島 266071)
在耳蝸神經(jīng)網(wǎng)絡(luò)對(duì)語(yǔ)音信號(hào)的刺激響應(yīng)過程中,針對(duì)如何區(qū)分編碼最有效率的語(yǔ)音信號(hào)分量問題,提出了刺激條件信息分布計(jì)算方法,研究了給定刺激條件下平均不確定性度的減小。實(shí)驗(yàn)結(jié)果表明:積分發(fā)放神經(jīng)網(wǎng)絡(luò)膜電位發(fā)放的刺激條件信息不僅能夠從統(tǒng)計(jì)意義上給出平均互信息的大小,而且清晰地表明信號(hào)中各分量的編碼效率,確定輸入信號(hào)中對(duì)于互信息量起主要作用的事件分量范圍以及內(nèi)部噪聲的可利用性,證實(shí)噪聲強(qiáng)度與最大刺激條件信息量之間的非單調(diào)關(guān)系,這些研究結(jié)果為進(jìn)一步探索人工耳蝸動(dòng)作電位發(fā)放的解碼方案提供了理論依據(jù)。
耳蝸神經(jīng)網(wǎng)絡(luò);語(yǔ)音信號(hào);積分發(fā)放神經(jīng)元;刺激條件信息
在神經(jīng)元網(wǎng)絡(luò)的信息傳遞過程中,信息理論在比較神經(jīng)信息的編碼方案和感官系統(tǒng)的神經(jīng)數(shù)據(jù)分析中得到廣泛應(yīng)用。比如香農(nóng)平均互信息經(jīng)常被用來(lái)分析神經(jīng)元響應(yīng)中包含刺激信號(hào)的信息量的多少,從統(tǒng)計(jì)平均意義上表示有關(guān)刺激信息的不確定度縮減量[1-2]。但是,在信息的傳輸過程中,平均互信息量不能體現(xiàn)輸入信號(hào)中最有編碼效率的分量,它是神經(jīng)網(wǎng)絡(luò)有關(guān)刺激信號(hào)集合的統(tǒng)計(jì)意義上信息傳輸特征量。因此,DeWeese與Meister[3]提出事件信息來(lái)衡量在神經(jīng)代碼中特殊信號(hào)所產(chǎn)生的信息量。在整個(gè)響應(yīng)向量空間,對(duì)事件信息進(jìn)行統(tǒng)計(jì)平均得到平均互信息,因此事件信息是平均互信息的一種分解形式[3]。進(jìn)一步地,由于刺激信號(hào)和響應(yīng)的非對(duì)稱性,Butts[4]提出了刺激條件信息,定義為在給定一個(gè)刺激事件條件下,觀測(cè)數(shù)據(jù)中不確定性的平均減少量,對(duì)于整個(gè)刺激信號(hào)空間對(duì)刺激條件信息進(jìn)行統(tǒng)計(jì)平均同樣得到平均互信息。刺激條件信息在視覺模型數(shù)據(jù)處理[5]和聽覺表層神經(jīng)細(xì)胞[6]的研究中得到了廣泛關(guān)注,依據(jù)最大刺激條件信息可以方便地確定刺激信號(hào)中最有編碼效率的信號(hào)分量[4-6]。
上述刺激條件信息的研究[4-6]雖然注重了每個(gè)刺激信號(hào)分量對(duì)于神經(jīng)元響應(yīng)的編碼效率,但是沒有考慮神經(jīng)元內(nèi)部大量自發(fā)的電位隨機(jī)發(fā)放活動(dòng)(內(nèi)部噪聲)對(duì)于編碼效率的影響。大量的研究表明,神經(jīng)網(wǎng)絡(luò)的信息傳遞和動(dòng)作電位的協(xié)同發(fā)放都有噪聲的參與,而且噪聲起到積極的秩序建設(shè)作用[7-9]。本文對(duì)于耳蝸神經(jīng)網(wǎng)絡(luò)中刺激信號(hào)分量的編碼效率以及信息傳遞過程中的噪聲作用進(jìn)行了研究,提出了互信息和刺激條件信息的數(shù)值計(jì)算方法,實(shí)驗(yàn)分析了耳蝸神經(jīng)網(wǎng)絡(luò)膜電位積分發(fā)放神經(jīng)元模型的響應(yīng)特性。刺激信號(hào)選為一段語(yǔ)音,不同數(shù)目并聯(lián)神經(jīng)網(wǎng)絡(luò)響應(yīng)的平均互信息結(jié)果表明,隨著內(nèi)部噪聲強(qiáng)度的增加,語(yǔ)音信號(hào)的傳輸存在最優(yōu)的噪聲環(huán)境,此即超閾值隨機(jī)共振現(xiàn)象[8]。而且,在給定噪聲強(qiáng)度下,平均互信息表明信息的增益不需要大的神經(jīng)元群體,有限數(shù)目的神經(jīng)元就可使得信息傳輸效率提高約10%,當(dāng)噪聲強(qiáng)度進(jìn)一步增大時(shí),保持信息增益則需要增加神經(jīng)網(wǎng)絡(luò)中神經(jīng)元數(shù)目。進(jìn)一步地,刺激條件信息分布的實(shí)驗(yàn)結(jié)果清晰地表明了刺激信號(hào)中各分量的編碼效率,能夠確定輸入信號(hào)中對(duì)于互信息量起主要作用的事件分量范圍。而且,刺激條件信息的分布也反映了基于超閾值隨機(jī)共振機(jī)制的內(nèi)部噪聲積極作用,證實(shí)了噪聲強(qiáng)度與最大刺激條件信息量之間的非單調(diào)關(guān)系。這些研究結(jié)果為進(jìn)一步探索人工耳蝸的膜電位積分放電刺激的解碼方案提供了理論依據(jù),在生物神經(jīng)元刺激信息處理中具有廣泛的應(yīng)用前景。
1.1 積分發(fā)放神經(jīng)元模型
基于聽覺生理刺激產(chǎn)生機(jī)制,本文利用積分發(fā)放模型對(duì)耳蝸接收語(yǔ)音刺激信號(hào)的特性進(jìn)行模擬。漏電積分發(fā)放模型[9-10]雖然是對(duì)神經(jīng)模型的工作機(jī)制抽象簡(jiǎn)化后的產(chǎn)物,但是能非常確切地描述神經(jīng)元?jiǎng)幼麟娢坏幕咎匦?,因此在聽覺生理模型中得到廣泛應(yīng)用[9-10]。耳蝸神經(jīng)元在一個(gè)頻帶處理區(qū)域內(nèi),具有同樣生理性質(zhì)的神經(jīng)元呈并聯(lián)陣列排列[9-10],設(shè)每個(gè)積分發(fā)放模型描述的神經(jīng)元膜電位Vi(t)滿足
(1)
1.2 刺激條件信息計(jì)算方法
設(shè)神經(jīng)元輸入刺激信號(hào)為x(t),神經(jīng)元響應(yīng)為y(t),那么刺激信號(hào)和響應(yīng)之間的互信息[11]為
(2)
這里f(x)和f(y)分別為x(t)與y(t)的概率密度,二者的聯(lián)合概率密度為f(x,y)。平均互信息是對(duì)于刺激信號(hào)總體的概率進(jìn)行加權(quán)平均,反映了兩個(gè)隨機(jī)變量集合之間的信息傳遞,但是不能反映刺激信號(hào)集合內(nèi)個(gè)體對(duì)于信息傳遞的貢獻(xiàn)。因此,Butts[4]提出了刺激條件信息
(3)
表示了在給定刺激信號(hào)下,觀測(cè)數(shù)據(jù)中不確定性的平均減少量。這里,f(x|y)和f(y|x)為條件概率密度。在刺激信號(hào)向量空間內(nèi),對(duì)于刺激信號(hào)集合進(jìn)行概率平均得到平均互信息
(4)
因此,刺激條件信息可以看成平均互信息在刺激信號(hào)空間中進(jìn)行投影的分量。
f(xi,yj)≈kij/(KΔxΔy)
(5)
X與Y的概率密度分別為
(6)
條件概率密度分別計(jì)算為
(7)
于是得出刺激條件信息數(shù)值計(jì)算公式
(8)
積分發(fā)放神經(jīng)元外部刺激語(yǔ)音信號(hào)如圖1所示,表示一段語(yǔ)音信號(hào)“The girl lost in the forest”,持續(xù)時(shí)間2.5 ms,縱坐標(biāo)代表了幅值的大小。圖2給出了當(dāng)門限值Vth=0.95 V時(shí),平均互信息I(x,y)隨著神經(jīng)元數(shù)目N以及所加噪聲強(qiáng)度σ的變化。由圖2可以看出,隨著內(nèi)部噪聲強(qiáng)度的增加,語(yǔ)音信號(hào)的傳輸存在隨機(jī)共振現(xiàn)象,對(duì)于相同數(shù)目的神經(jīng)元網(wǎng)絡(luò)來(lái)講,平均互信息隨著噪聲強(qiáng)度的增加存在一個(gè)最優(yōu)值。在圖2中當(dāng)噪聲強(qiáng)度σ=0.15W/Hz時(shí),神經(jīng)元個(gè)數(shù)N=10所對(duì)應(yīng)的平均互信息量I=1.414 bits最大,而N=100時(shí)所對(duì)應(yīng)的平均互信息量I=1.392 bits。這一實(shí)驗(yàn)結(jié)果和經(jīng)典的超閾值隨機(jī)共振[8]現(xiàn)象不同,經(jīng)典的超閾值隨機(jī)共振[8]現(xiàn)象是指隨著內(nèi)部噪聲強(qiáng)度的增加,語(yǔ)音信號(hào)的傳輸存在最優(yōu)的噪聲環(huán)境,相同噪聲強(qiáng)度下,神經(jīng)元數(shù)目與互信息成正比例增加,而本文實(shí)驗(yàn)結(jié)果表明在給定噪聲強(qiáng)度下(不再?gòu)?qiáng)調(diào)最優(yōu)噪聲環(huán)境),有時(shí)平均互信息表明信息的增益不需要很多的神經(jīng)元群體[14],僅僅需要有限數(shù)目的神經(jīng)元就可提高信息傳輸效率,比如噪聲強(qiáng)度σ=0.15W/Hz,10個(gè)神經(jīng)元所得到互信息比100個(gè)神經(jīng)元所獲得互信息要大,最大互信息與無(wú)內(nèi)部噪聲相比大約提高10%。圖2還可以看出,當(dāng)噪聲強(qiáng)度進(jìn)一步增大時(shí)(如σ=0.4W/Hz),獲得相同的信息增益則需要增加神經(jīng)網(wǎng)絡(luò)中神經(jīng)元數(shù)目。
圖1 語(yǔ)音信號(hào)“The girl lost in the forest”的波形Fig.1 Speech waveform of “The girl lost in the forest”
圖2 不同并聯(lián)神經(jīng)元數(shù)和隨噪聲強(qiáng)度下的平均互信息量
圖3 N=10時(shí)的刺激條件信息量
圖3a為σ=0.15W/Hz,N=10時(shí),神經(jīng)元網(wǎng)絡(luò)對(duì)含噪語(yǔ)音信號(hào)響應(yīng)的刺激條件信息分布,橫坐標(biāo)代表響應(yīng)所對(duì)應(yīng)的刺激條件信息量大小,縱坐標(biāo)為產(chǎn)生相同刺激條件信息量所對(duì)應(yīng)的激勵(lì)個(gè)數(shù)。由圖3a可以看出,最大刺激條件信息為Issi=1.74 bits,對(duì)應(yīng)此刺激條件信息的含噪語(yǔ)音信號(hào)的幅值范圍為-0.97~-0.93 V。從圖2已知此時(shí)平均互信息量I=1.414 bits,統(tǒng)計(jì)刺激條件信息Issi≥1.414bits所對(duì)應(yīng)的幅值范圍有-0.97~-0.86 V、-0.49~-0.13 V和1.05~1.12 V 3個(gè)區(qū)間。與不含噪聲的語(yǔ)音刺激信號(hào)情況下的刺激條件信息圖3b比較,可以看出加入噪聲雖然使最大刺激條件信息量減少,但是刺激條件信息分布的空間增加了,因此加噪聲后的平均互信息量也同時(shí)增加。圖3中刺激條件信息分布反映了內(nèi)部噪聲在隨機(jī)共振機(jī)制中所起的積極作用是一種統(tǒng)計(jì)意義下的平均信息增益,對(duì)于刺激信息個(gè)體的響應(yīng)編碼效率可能是負(fù)面的。
圖4 N=50,σ=0.3(W/Hz)時(shí)的刺激條件信息量
圖5 N=100,σ=0.3(W/Hz)時(shí)的刺激條件信息量
圖6 神經(jīng)網(wǎng)絡(luò)的協(xié)同發(fā)放
在噪聲強(qiáng)度為σ=0.3 W/Hz時(shí),從圖2可以看出,在我們所考慮的噪聲強(qiáng)度下,神經(jīng)元數(shù)N=50所對(duì)應(yīng)的平均互信息大。圖4和5分別表示了并聯(lián)神經(jīng)元數(shù)N=50和100對(duì)應(yīng)的刺激信號(hào)所產(chǎn)生的刺激條件信息分布,可以看出,神經(jīng)元數(shù)N=50所對(duì)應(yīng)的刺激條件信息在1.2~1.4 bits區(qū)間也多于后者,因此對(duì)于刺激信號(hào)集合進(jìn)行統(tǒng)計(jì)平均所得到的互信息量也會(huì)相對(duì)較大。所以,刺激條件信息分布能夠更加細(xì)致地區(qū)分各刺激信號(hào)分量對(duì)于信息傳輸?shù)呢暙I(xiàn)。同時(shí),在此噪聲強(qiáng)度σ=0.3 W/Hz下,圖6給出了并聯(lián)神經(jīng)元數(shù)N=50的動(dòng)作電位發(fā)放時(shí)間分布,橫坐標(biāo)為積分發(fā)放時(shí)間,縱坐標(biāo)為神經(jīng)元數(shù)目。由圖6可知,在刺激信號(hào)和各個(gè)神經(jīng)元內(nèi)部噪聲的作用下,膜電位從靜息電位升高到閾值電位,導(dǎo)致動(dòng)作電位的產(chǎn)生,特別是0.6ms時(shí)刻,幾乎所有的神經(jīng)元在噪聲和語(yǔ)音信號(hào)的共同作用下進(jìn)行了發(fā)放,使得神經(jīng)網(wǎng)絡(luò)在相應(yīng)時(shí)刻達(dá)到協(xié)同積分發(fā)放。
本文對(duì)于積分發(fā)放感知神經(jīng)網(wǎng)絡(luò)模型中的平均互信息量和刺激條件信息的計(jì)算方法進(jìn)行了研究,對(duì)于不同數(shù)目耳蝸膜電位神經(jīng)元的傳輸性能進(jìn)行了分析。隨著內(nèi)部噪聲強(qiáng)度的增加,平均互信息量的增加證實(shí)了神經(jīng)網(wǎng)絡(luò)中的超閾值隨機(jī)共振現(xiàn)象,且在某些噪聲環(huán)境中,有限數(shù)目的神經(jīng)元就可提高傳輸效率。刺激條件信息分布的實(shí)驗(yàn)結(jié)果能夠清晰地表示出最有編碼效率的分量部分,不僅統(tǒng)計(jì)意義上給出平均互信息的大小,而且能夠清晰地表明刺激信號(hào)中各分量的編碼效率和內(nèi)部噪聲的可利用性。本文只是針對(duì)于并聯(lián)神經(jīng)網(wǎng)絡(luò)做了初步研究,對(duì)于其他神經(jīng)元系統(tǒng)如多層神經(jīng)元網(wǎng)絡(luò)或其他帶有反饋環(huán)的復(fù)雜神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,能否用刺激條件信息準(zhǔn)確衡量刺激信號(hào)中各分量的編碼效率值得深入研究。
[1]Borst A, Theunissen F E. Information theory and neural coding[J]. Nature Neuroscience, 1999, 2(11): 947-957.
[2]Arcas B A Y, Fairhall A L, Bialek W. What can a single neuron compute[J]. Advances in Neural Information Processing Systems, 2000, 13(1):75-81.
[3]DeWeese M R, Meister M. How to measure the information gained from one symbol[J]. Network: Computation in Neural Systems. Neural Syst, 1999, 10(4): 325-340.
[4]Butts D A. How much information is associated with a particular stimulus? [J]. Network: Computation in Neural Systems, 2003, 14: 177-187.
[5]Butts D A, Goldman M S. Tuning curves, neuronal variability and sensory coding[J]. PLOS Biology, 2006, 4(4): 639-646.
[6]Montgomery N, Wehr M. Auditory cortical neurons convey maximal stimulus-specific information at their best frequency[J]. The Journal of Neuroscience, 2010, 30(40): 13362-13366.
[7]Stocks N G. The application of suprathreshold stochastic resonance to cochlear implant coding[J]. Flucatuation and Noise Letters, 2002, 2(3): 169-181.
[8]Stocks N G. Suprathreshold stochastic resonance in multilevel threshold systems[J]. Physical Review Letters, 2000, 84(11): 2310-2313.
[9]祁明,許麗艷,季冰,等. 周期性語(yǔ)音信號(hào)傳輸?shù)某撝惦S機(jī)共振研究[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2013, 3(10): 31-36. Qi Ming, Xu Liyan, Ji Bing, et al. Suprathreshould stochastic resonance phenomenon of periodic voice signal transmission[J]. Complex Systems and Complexity Science, 2013, 3(10): 31-36.
[10] Chacron M J, Longtin A, Pakdaman K. Chaotic firing in the sinusoidally forced leaky integrate-and-fire model with threshold fatigue[J]. Physica D: Nonlinear Phenomena, 2004, 192(1/2): 138-160
[11] Barbi M, Chillemi S,Garbo A D. The leaky integrate-and-fire with noise: a useful tool to investigate SR[J]. Chaos, Solitons & Fractals, 2000, 11(12): 1849-1853.
[12] Cover T M, Thomas J A. Elements of Information Theory[M]. New York: Wiley, 1991:13-37.
[13] 楊一威,徐月晉,廖吉昌,等.人工耳蝸的膜電位積分放電刺激方案及其數(shù)字信號(hào)處理[J].南方醫(yī)科大學(xué)學(xué)報(bào),2012, 32 (10):1435-1439. Yang Yiwei, Xu Yuejin, Miu Jichang, et al. Digital signal processing of a novel neuron discharge model stimulation strategy for cochlear implants[J]. Journal of Southern Medical University, 2012, 32 (10):1435-1439.
[14]Yarrow S, Challis E, Series P. Fisher and Shannon inforamtion in finite neural populations[J]. Neural Computation, 2012, 24(7): 1740-1780.
(責(zé)任編輯 耿金花)
Study of Specific-Stimulus Information for Transmission of Speech Signals in Cochlea Neural Networks
WANG Fengjiao, REN Yuhao, ZHAO Jin, DUAN Fabing
(Institute of Complexity Science, Qingdao University, Qingdao 266071, China)
For decoding information contained in the cochlea neural networks responses to speech signals, it is interesting to address which parts of input stimuli are more efficient. In this paper, the stimulus-specific information associated with a particular stimulus will be adopted to study the decrease of average uncertainties, and its calculation method is developed. We use a leaky integrate-and-fire model to capture the responses of cochlea neurons to the input speech signal, and calculate the stimulus-specific information caused by each speech signal part. It is shown that the weighted average of stimulus-specific information over the stimulus ensembles yields the mutual information, and the stimulus-specific information is also useful in clearly indentifying the stimuli that are significantly efficient to the cochlea neural network. Moreover, the stimulus-specific information can not only determine which signal component mainly contributes to the mutual information, but also confirms the availability of internal noise in the neural networks. There is a non-monotonic relationship between the noise intensity and the maximum stimulus-specific information. These results indicate that the applicability of the integrate-and-fire neuron model for current cochlear implant decoding technology deserves to be further investigated.
cochlea neural network; speech signal; integrate-and-fire model; stimulus-specific information
1672-3813(2015)04-0104-05;
10.13306/j.1672-3813.2015.04.015
2014-12-25;
2015-05-11
山東省科技發(fā)展計(jì)劃項(xiàng)目(2014GGX101031)
王風(fēng)嬌(1988-),女,山東聊城人,碩士研究生,主要研究方向?yàn)樾盘?hào)處理與復(fù)雜性分析。
段法兵(1974-),男,山東鄒城人,博士,教授,主要研究方向?yàn)殡S機(jī)共振。
TN911.7;N945.12
A