朱崇愷
想象一下當你參加派對的時候,周圍播放著音樂,有很多人在跳舞,但是,你還是可以和你想要交流的人對話。是不是很神奇?我們的大腦具有可以在嘈雜的環(huán)境中篩選出某個人的聲音的卓越能力,而即使最高端的助聽器也做不到這一點。哥倫比亞大學電氣工程專業(yè)副教授梅斯卡拉尼(Nima Mesgarani)博士說:“在擁擠的地方,比如喧鬧的街道上使用助聽器時,會同時放大周圍所有的聲音。雖然一些高級的助聽器可以抑制特定類型的背景噪聲(例如交通),但還是會將周圍的對話音量無差別放大。這嚴重阻礙了佩戴者的有效交流?!币恍┤斯ぶ悄芙换ピO備,例如手機上的語音對話軟件和智能音箱也有著同樣的困擾??茖W家將其稱為“雞尾酒會問題”,名字來源于在喧鬧的聚會中混合在一起的刺耳聲音。
“我們發(fā)現(xiàn),當兩個人開始交談時,說話者的腦電波會逐漸接近聽者的腦電波?!泵匪箍ɡ岵┦空f。利用這些知識,該團隊將強大的語音分離算法與神經(jīng)網(wǎng)絡結合,從而創(chuàng)建了一個系統(tǒng):首先從一組聲音中分離出單個說話者的聲音,然后將每個說話者的聲音與聽者的腦電波進行比較,再將聲音模式與聽者腦電波最為匹配的說話者的聲音放大。
為了測試該算法的有效性,研究人員與神經(jīng)外科醫(yī)生(同時也是該論文合著者)梅塔博士(Ashesh Dinesh Mehta)合作。在梅塔博士負責治療的癲癇患者中,一些人必須定期接受手術。梅斯卡拉尼博士說:“這些患者自愿在我們通過植入患者大腦的電極監(jiān)測他們的腦波時,聽取多個發(fā)言者的聲音,然后我們將新開發(fā)的算法應用于這些數(shù)據(jù)?!笔艿窖芯拷Y果的鼓舞,研究人員正在研究如何將它轉(zhuǎn)變?yōu)闊o創(chuàng)設備,屆時只需將其置于頭皮外部或耳朵周圍就可以工作。
“到目前為止,我們只在室內(nèi)環(huán)境中進行了測試,”梅斯卡拉尼博士說。“但我們希望確保它也能在繁華的城市街道或嘈雜的餐廳中工作,這樣無論走到哪里,使用者都可以充分地感受周圍的世界和人群。”