楊美萍 尚海燕 周靜
藝術嗓音是衡量歌手歌唱水平的重要指標,在選拔和培養(yǎng)歌手的過程中對藝術嗓音的評價占據著重要的位置。特別是藝術院校,在招生和教學、考核環(huán)節(jié)對藝術嗓音進行客觀和公正的評價更為重要。
在選拔與培養(yǎng)歌手的過程中,對嗓音的評價非常重要。傳統(tǒng)的評價方式是通過幾位評委來給歌手評價,這種方法主觀性強,難以做到對每一個歌手客觀、公正地評價。客觀定量的評價嗓音、藝術嗓音的報道隨著計算機在各領域的開發(fā)與應用而日漸增加。平野實1990年在《人類聲音的客觀評價》一文中指出目前發(fā)聲機能檢查的其中一個目的就是為了評價發(fā)聲機能(平野實,人類聲音的客觀評價[J],臨床方面,國外醫(yī)學耳鼻咽冊,1990,14(5):274.);胡維平、王修信等1998年《嗓音客觀評價的探討》中得到正常成人/a/音的頻域呈穩(wěn)定的分布(胡維平,王修信,嗓音客觀評價的探討[J],聽力學及言語疾病志,1998,6(04):193-195.)。這些研究都說明了可以利用科學手段客觀評價藝術嗓音。
聲樂教學是復雜的系統(tǒng)工程,目前采用的是教師個人面對面的技藝傳授形式,如果能輔以利用計算機對歌唱信號的共振峰、基頻、音域、平均能量等聲學參數進行定量的分析,以穩(wěn)定可靠的科學手段觀察、測量、分析人發(fā)音時的各種影響因素,給歌唱者以客觀的評價,并通過上述參數定量反映學生嗓音發(fā)聲機能的狀態(tài)、嗓音發(fā)揮是否理想,并探索其中存在的規(guī)律性,將大大改善聲樂教學的質量。同時利用計算機技術可以將聲音以圖形的方式顯示,從而間接地了解聲道的變化。歌唱者不僅能聽到自己的聲音,還能通過計算機看到自己的聲音,并通過聲譜樣板進行比較,來發(fā)現自身的不足,從而進行自我強化訓練,提高自己的歌唱水平。
本文通過采集藝術嗓音的聲學信號,用三種不同的方法分析提取基頻參數,并分析基頻參數的變化規(guī)律及其對藝術嗓音評價的量化影響,然后將結果應用于聲樂教學中,取得了很好的效果。
一、評價藝術嗓音的聲學參數
評價藝術嗓音的聲學參數包括基頻、共振峰、平均能量和音域等,在研究這些參數與歌唱水平的關系之前,研究這些參數的正確提取與估計方法是十分重要的。共振峰主要用來評價歌手的音質、音域,反映歌手的發(fā)聲能力,是藝術嗓音研究的重要指標;平均能量主要用來反映在相同環(huán)境下歌聲信號的大小。基音是每個樂音中頻率最低的純音,其強度最大,基音的頻率即為基頻,決定整個音的音高,在藝術嗓音評估時是非常重要的一個參數。本文主要研究藝術嗓音聲學信號的基頻參數的估計方法,并將研究成果在聲樂教學中進行驗證。
1、基頻定義
基頻是發(fā)濁音時聲帶振動的基本頻率;除與聲帶本身的基本特征(長度、質量、張力等)有關外,還受環(huán)甲肌、甲杓肌及聲門下壓的調節(jié)。由于發(fā)聲器官生理方面的差異,男性和女性的基頻范圍不同,一般地,成年男性的基頻范圍為50~250Hz;成年女性的基頻范圍為120~500Hz。
2、基頻提取原理
基音是指發(fā)濁音時聲帶振動所引起的周期性,而基音周期是指聲帶振動頻率的倒數。語音信號處理中基頻的提取和估計可以分為三類:時域的方法、頻域的方法和統(tǒng)計的方法。頻域的方法一般采用倒譜法來提取,即:將語音信號變換到頻域或者倒譜域來估算基音周期,基音周期的倒數就是基音頻率,簡稱之基頻。時域方法主要包括過零率、自相關函數法、峰值率和平均幅度差函數法等,本文在相同的歌唱信號采樣樣本基礎上分別采用倒譜法、過零率、自相關函數法和平均幅度差函數法來提取語音信號的基頻并將結果進行比較。文中以音高/do/為基準來提取基頻,采樣樣本中所唱的最低的音高是|do|。
3、倒譜法
語音信號可看做是音高基準信號通過不同的發(fā)聲系統(tǒng)而產生的輸出,將發(fā)聲系統(tǒng)看作線性時不變系統(tǒng),語音信號就卷積信號。為了能用線性方法對其進行后續(xù)處理,先用卷積同態(tài)系統(tǒng)對其進行加工分解。設原語音序列為x(n),根據時域卷積定理時域卷積相當于頻域乘積,故首先對原序列取傅立葉變換,再取對數,將輸入與系統(tǒng)關系以線性疊加關系描述出來,再經過傅立葉擬變換恢復為時域序列。這樣經過卷積同態(tài)系統(tǒng)后輸出的是偽時域序列,稱之為原序列的“復倒頻譜”(王曉亞,倒譜在語音的基音和共振峰提取中的應用[J],無線電工程,2004,34(1):57-61.),用x(n)表示。它的定義式表示如下:
歌手在歌唱發(fā)濁音時,設聲門發(fā)出的是一有限長沖激序列,它是以基音周期為周期的序列,經過求倒譜得到的偽時間序列也是一個周期沖激序列,并且周期不變。由定義可知倒譜的偽時間序列的衰減速度比原序列要快。另外,由于倒譜是復倒譜的偶對稱分量,它具有與復倒譜相同的基音周期,由于計算方便而更容易精確獲得,基音周期的倒數就是待估計的基頻。
4、過零率法
過零率是通過觀察語音信號的波形重復自己的頻率來估計出基頻(張杰,龍子夜,張博等,語音信號處理中基頻提取算法綜述[J],電子科技大學學報,2010,39(4):99-101.)。這些方法的理論依據是,如果語音信號是周期的,那么事件就會隨著時間不斷重復出現,將單位時間內的發(fā)生次數統(tǒng)計出來,就能估計出基頻。簡單的說,過零率就是單位時間內波形通過零點的次數?;l是過零率的一半,過零率求出來之后再除以2就能得到基頻。但是這樣的方法提取基頻有一定的誤差,如果信號的能量都集中在基頻的附近,那么一個周期內它將兩次穿過零。但是如果信號包含了高頻能量,在一個周期內它穿過零的次數將大于2。所以如果使用過零率檢測基頻,要先濾掉高頻成分。確定濾波器的截止頻率,盡可能多地去掉高頻成分,得出的結果才更接近真實值。
5、自相關函數法
以兩個信號之間的相關函數來度量它們之間的相似性,如果兩個信號波形開始時間的延遲發(fā)生變化則相關函數的結果也將發(fā)生改變。自相關函數是信號自身的相關函數,以自相關函數度量信號自身的相似性。對于無限長的離散信號x(n),自相關函數的定義為:
其中y為信號的延時。若x(n)為長度為N的離散信號,則自相關函數的定義為:
若x(n)是周期函數,則自相關函數也是周期性函數,并且在基音周期的各個整數點上有很大的峰值。因此只要計算出自相關函數峰值的周期,再取周期的倒數就能得到基頻。
6、平均幅度差函數法
平均幅度差函數法的計算公式為:
這種方法與自相關函數法相同,對于周期性的函數,平均幅度差函數也呈現周期性,不同點在于自相關函數法的結果在基音周期的各個整數點有很大的峰值,而平均幅度差函數法在基音周期的各個整數點有谷值。
二、基頻參數的估計
1、藝術嗓音聲學信號的采樣
本文使用的藝術嗓音聲學信號的采集在專業(yè)錄音棚中進行,分別請一個班30位男女歌手唱出不同音高,不同元音聲音信號,以44100Hz為采樣頻率對歌聲信號進行采集,文件以wav形式存貯。
2、倒譜法基頻估計
倒譜法估計基頻屬于頻域方法。利用倒譜算法提取基頻的步驟如下:首先讀入歌手的語音信號序列并截取所需的信號段,然后對其進行傅立葉變換,取幅度譜的對數后再做傅立葉逆變換。估計的目的是求得基頻信號,最后一步傅立葉逆變換得到偽時間序列,其具有與原時間序列相同的基音周期,求得周期也就得到了基頻。從信號處理角度而言,在頻域估計偽時間序列的基頻信噪比更高,估計更為準確。因此,倒譜估計基頻的過程中,不再進行最后一步的傅立葉逆變換,直接在頻域估計基頻信號。根據先驗知識,女性基頻信號的范圍為120~500Hz,因此在此頻段搜索偽時間序列的最大值,它所對應的頻率位置就是所求的基頻。
下面對女歌手Md_yang的歌聲信號應用倒譜法估計基頻,歌唱為小字一組do的/a/持續(xù)時間波形如圖1所示,總持續(xù)時間約5.6秒。按照上述求倒譜步驟,利用每1秒鐘的數據計算基頻,結果如表1所示。
每秒鐘的基頻最大相差約10Hz,這5.6秒數據的基頻均值為266.20Hz。圖2第一組為0-1秒時間數據的傅里葉變換頻譜圖,其中縱坐標根據倒譜定義取幅度譜的自然對數;圖3為第一組4-5秒時間數據的傅里葉變換頻譜圖,其中縱坐標定義同上;對比圖2和圖3。圖2的表現諧波性更強,聲音更加的干凈。圖3信號的傅立葉變換的頻譜更加的豐富,聲音信號中也可以聽出來略有顫音。每組各時間段基音頻率的估計值都在合理的范圍之內。雖然利用不同的時間段估計基頻值略有不同,但結果也是合理的,因為發(fā)聲的聲腔本身也是時變的,但對于一個音高來說,應該是越穩(wěn)定越好。該歌手依次3組錄音,由第二組和第三組的基頻估計值來看,不同時間段基頻的差異越來越小,聲音信號漸漸穩(wěn)定的。由同一音高上不同的三組數據估計的基頻數值也非常接近,這三組數據估計的基頻均值為264.89Hz。
3、過零率法基頻估計
過零率法假設語音信號是周期的,通過估計波形的重復率計算基頻,即統(tǒng)計單位時間內的語音波形的重復發(fā)生次數。此方法比較簡單,屬于時域估計方法,實用中只要統(tǒng)計出單位時間內波形的過零率,過零率就是單位時間內波形通過零點的次數。如果信號的能量都集中在基頻的附近,那么一個周期內它將兩次穿過零,基頻等于過零率的一半。為提高估計精度,首先要濾除信號中高頻分量,可根據歌手特征分別設計低通濾波器,也可以根據所有歌手的統(tǒng)一聲音特征設計低通濾波器。仿真中采用配合歌手特征設計低通濾波器,通帶頻率為500Hz,截止頻率選為600Hz,衰減40dB。采用時域相關原理可以很容易計算出單位時間內波形穿過零點的次數,估計出語音信號的基頻。
下面仍采用歌手Md_yang歌聲信號,應用過零率法估計基頻。估計結果如表2所示。
三組數據的估計結果的趨勢與倒譜法具有一致性。第二組與第三組數據估計基頻的穩(wěn)定性較好,三組數據過零率法提取的基頻均值為291.21Hz。
4、自相關函數法基頻估計
此方法屬于時域的方法,同樣是通過觀察語音信號的波形重復自己的頻率來估計出基頻。如果語音信號是周期的,那么自相關函數也呈周期性,并且在基音周期的各個整數點上有很大的峰值。在自相關波形中找出幾個峰值算出基音周期,取倒數后就得到基頻,由于自相關函數的峰值非常顯著,這種方法對低信噪比信號更為有效。仍對歌手Md_yang聲音信號利用自相關函數法進行基頻估計,估計結果如表3所示。
圖4是從原語音波形中截取0-1秒數據進行自相關波形,放大自相關波形的峰值,可見是周期性變化的,峰值周期的倒數就是基頻值。自相關函數法對三組信號進行基頻估計的均值為265.01Hz。由圖4可以看出,由于自相關信號處理方法,增強了信噪比,圖中信號的周期性十分的明顯,信號估計精度會較過零率法更高。
5、平均幅度差函數法基頻估計
此方法也是時域的方法,與自相關函數法相類似,不同點在于自相關函數法的結果在基音周期的各個整數點有很大的峰值,而平均幅度差函數法在基音周期的各個整數點有谷值。應用這種方法對歌手Md_yang進行基頻估計,估計結果如表4所示。
圖5為平均幅度差波形的放大圖。從圖中可以看出波形是周期性變化的,求得谷值周期,其倒數就是基頻,表4中平均幅度差法估計的基頻均值為263.98Hz。
三、結果分析與總結
將30個歌手的數據進行分析,將三組數據的四種基頻估計方法求得的基頻平均值與方差總結于同一表格中,方便進行比較,并表5所示。由方差可以看出,平均幅度法的方差最小,基頻估計值最為穩(wěn)定,過零率法的方差最大,估計最不穩(wěn)定。同時從程序的計算量角度來說,四種方法中,過零率法計算量用時最少,因為運算方法簡便,而平均幅度差法的計算用時最多。
將四種方法基頻估計的平均值再一次平均,得到基頻值為271.27Hz,方差為13.30。如果不包含過零率方法,將另外三種方法進行平均,則得到基頻值為264.63Hz,方差為0.56。即四種方法中,除過零率方法外,三種方法的估計方差非常小,說明三種方法基本相當。另外三種方法均值與總均值的相對誤差分別為:0.10%,0.14%,0.25%。因此綜合基頻估計方差和三種方法均值的相對誤差及編程的計算量來看,倒譜法與自相關法比較適用。
藝術嗓音是職業(yè)歌手的第二生命,在選拔與培養(yǎng)歌唱人才的過程中,對嗓音的評價占了非常重要的位置。因此對藝術嗓音正確客觀地評價是十分重要的。利用現代計算機和聲學知識原理對藝術嗓音信號進行分析與評價,是一種評估歌唱信號的有效方法,具有無侵入性、數字化、形象化、科學化等優(yōu)點。對藝術嗓音信號基頻正確穩(wěn)定的估計,必會對嗓音評價打下堅實的理論基礎。