王輝
【摘要】近年來,隨著信息科學(xué)技術(shù)的迅速發(fā)展,音頻與聲學(xué)信號的分析逐漸成為當(dāng)前音樂領(lǐng)域的研究熱點。在機器聽覺的研究領(lǐng)域中,基于聲學(xué)特征的樂器識別是當(dāng)代音樂分析工作的重要應(yīng)用。本文主要茶樹了近年來基于聲學(xué)特征的樂器研究領(lǐng)域中所取得成果,希望能夠有所幫助
【關(guān)鍵詞】聲學(xué)特征;音樂;模式識別;樂器
從廣義上來說,樂器泛指那些可以通過各種方法演奏出聲音的工具,樂器又可以分為民族樂器和西方樂器兩大類,本文主要涉及的是西方樂器。傳統(tǒng)意義上,西方樂器主要分為弦樂器、銅管樂器以及木管樂器二大類,每種樂器的發(fā)聲方法也都有所不同,還有很多樂器在聲音上的差別不大,人耳很難將它們順利分辨出來,但是如果借助于計算機技術(shù)的幫助,樂器的識別工作也變得更加簡單,樂器識別的精度也大大提高。
一、聲學(xué)特征的研究現(xiàn)狀分析
由于樂器識別過程巾有很大的相似性,所以樂器識別的方法是建立在語音識別和聲帶識別的基礎(chǔ)上逐漸發(fā)展起來的,樂器識別的方法和語音識別的方法也有所類似。20世紀90年代之前,在音樂領(lǐng)域關(guān)于基于聲學(xué)特征的樂器研究還比較少,但是90年代之后,這項工作就有了很大的進展,在學(xué)術(shù)界,基于聲學(xué)特征的樂器研究論文數(shù)目也進一步增加。
特征抽取。特征抽取是近年來學(xué)術(shù)界關(guān)于聲學(xué)特征在樂器識別中的運用研究中得出的一項成果。對于不同樂器的演奏或者是不同的音樂片段都會用不同的聲學(xué)特征加以識別,由于工作誤差,識別的精度差別也會比較大,通常情況下,工作人員并不能找到有效的聲學(xué)特征提高樂器識別的精度,所以在樂器識別過程中需要涉及劍多種聲學(xué)特征。抽取的聲學(xué)特征主要有時域特征、能量特征、波譜特征、和聲特征、感知特征等等。時域特征是將樂器演奏的音頻信號作為一個整體進行計算;能量特征則是跟樂器演奏時包含的能量有關(guān)系;波譜特征是基于信號在短時問內(nèi)的傅立葉變換得到的特征,比如波譜的斜度等等;和聲特征則是建立在信號的止弦和聲模型的基礎(chǔ)上計算出來的;感知特征的計算則需要利用工作人員在聽覺機制巾建立出來的模型。
在聲學(xué)特征的抽取過程中,涉及的算法也比較多,比如倒譜系數(shù)、MFCC系數(shù)、線性預(yù)測倒譜參數(shù)、振幅包絡(luò)特征、波譜質(zhì)心等等。倒譜系數(shù)作為共振峰值的一種表示方法,她也是語音識別的一項重要信息,同時也是樂器聲學(xué)的重要特征之一。相關(guān)工作人員可以通過同態(tài)處理的方法得到倒譜系數(shù),研究證明使用倒譜系數(shù)確實可以在一定程度上提高樂器聲學(xué)特征參數(shù)的穩(wěn)定性。MFCC系數(shù)則是通過人耳的聽覺機制提煉出來的,近年來MFCC系數(shù)也在語音識別工作中得以廣泛應(yīng)用。線性預(yù)測倒譜系數(shù)則是以人的發(fā)生機理為出發(fā)點,進一步研究聲道的短管級聯(lián)模型,在研究過程中通常認為系統(tǒng)傳遞函數(shù)符合全極點數(shù)字濾波器的基本形式。從內(nèi)容上來看,振幅的包絡(luò)特征包含了聲音的很多相關(guān)信息,比如音量、時問、振幅、頻率等等,在這個基礎(chǔ)上,聲音的振幅可以通過信號的半波整流、低通濾波等形式加以計算。頻譜質(zhì)心作為一種簡單而實用的聲學(xué)特征,他能夠幫助相關(guān)工作人員得到樂器聲音的音樂和聲波譜。
除此之外,聲學(xué)特征的研究成果還涉及到其他一些領(lǐng)域,這些研究成果都在很大程度上為相關(guān)工作人員的工作提高了便利,比如波譜平整度、常量系數(shù)等等。
樂器識別是樂器研究工作中的一項重要內(nèi)容,而樂器的識別工作又是模式識別的一種形式,是將一組測試集模式劃分為兩大類。在樂器識別工作中,相關(guān)工作人員首先要建立一個關(guān)于不同樂器聲音的主觀描述,然后再在汁算機軟件巾提取樂器聲音的基本特征向量,然后在通過相似度的對比進行樂器的識別。通常情況下,樂器的識別工作方法主要有兩大類,分別是基于距離和可能性的兩種分類方法,在速項工作中,相關(guān)工作人員還會用到一些基本模型,比如高斯混合模型、支持向量機模型、最近鄰模型等。
二、樂器的聲學(xué)特征原理
樂器作為音樂的載體,它隨著人類音樂素質(zhì)的提高而發(fā)生了本質(zhì)性的變化,現(xiàn)代人類社會對樂器的聲學(xué)特征品質(zhì)也提出更高的要求,所以相關(guān)工作人員更應(yīng)該根據(jù)聲學(xué)的基本特征盡可能地提高樂器的聲學(xué)品質(zhì)。
從樂器的構(gòu)造來看,不同的樂器也有不同的構(gòu)造形態(tài),即機械構(gòu)造形態(tài)和聲學(xué)構(gòu)造形態(tài)兩種。其巾樂器的聲學(xué)構(gòu)造形態(tài)就是建立在聲學(xué)特征基礎(chǔ)上構(gòu)造出來的。樂器的聲學(xué)狗仔是由不同的聲學(xué)特征元在沒有特殊情況下愛組成的,在這里元的概念主要是指各種聲學(xué)功能。
樂器根據(jù)聲學(xué)的基本原理也有不同的分類。到現(xiàn)在為止,人們對樂器的認知還不全面,其根本原因就是很難找到一種適用性比較強的分類方法。本文主要是在聲學(xué)特征的基礎(chǔ)上進行樂器的研究,所以本文提出的分類方法也是建立在聲學(xué)特征基礎(chǔ)上。根據(jù)聲學(xué)特征,樂器可以分為弦樂器、管樂器、簧樂器、棒樂器、板樂器、膜樂器六大類。
調(diào)查發(fā)現(xiàn),目前基于聲學(xué)特征的樂器研究主要是集中在樂器識別工作領(lǐng)域,然而在樂器識別工作中也確實存在一些困難,如果儀儀從金魚分割的方法對聲學(xué)進行研究,那么這將會為工作人員的工作帶來很多困難,所以筆者認為未來,樂器識別與音樂的處理都會在聲學(xué)特征基礎(chǔ)上利用媒體數(shù)據(jù)進行分析,進而提高樂器數(shù)據(jù)分割的工作效率和工作精度。
三、結(jié)語
本文對基于聲學(xué)特征的樂器研究進行了全面的概括。從目前看來基于聲學(xué)特征的樂器識別工作將會成為樂器處理領(lǐng)域巾的研究熱點,但是由于樂器自身的特點,樂器研究工作也將會更加困難,這種困難程度可以體現(xiàn)在樂器的研究內(nèi)容及形式等方面,同時這也為樂器的研究工作帶來更大的挑戰(zhàn)。從目前來看,在未來幾年,基于聲學(xué)特征的樂器識別將會和計算機軟件系統(tǒng)結(jié)合起來,發(fā)揮更大的作用。