陳藝彤
(暨南大學華文學院,廣東廣州510000)
句末“陽平+去聲”詞語重讀時的音高變化
陳藝彤
(暨南大學華文學院,廣東廣州510000)
韻律處理是語言合成技術的重要部分,了解韻律特征及建立韻律模型是提高合成語言自然度的前提。實驗利用Praat軟件,在分析了32組語音實驗材料,建立音高數(shù)據庫的基礎上,研究句末“陽平+去聲”詞語重讀時的音高變化,初步得出重讀時高音點的音高會有明顯提高,且變化幅度大于低音點,陽平聲調低音點的音高會有所下降的結論。
韻律特征;句末“陽平+去聲”;詞語重讀;音高變化
語音是語言的物質外殼,是人類通過發(fā)音器官發(fā)出來的、具有一定意義的、目的是用來進行社會交際的聲音。隨著信息時代的到來,語音合成技術應運而生,它是一項通過機械的、電子的方法產生人造語音的技術。然而,漢語的韻律特征十分復雜,因此,韻律處理是語音合成技術的重要部分。
語流中“韻律特征”(prosodic feature),是通過音高、音長和音強的變化,即“超音段特征”(supra segmental feature)表現(xiàn)出來。韻律特征對合成言語的自然度關系極大,并且也會影響言語(speech)的可懂度[1]。
提高合成語音自然度的前提,就是建立和完善韻律模型。而這一工作的基礎,就是要對自然對話的音高模式有一個清楚的認識[2]。音高是構成語音的要素之一,就是聲音的高低,主要取決于物體振動的頻率。說話者通常通過提高音高,加長時長傳遞有關句子重音的信息[3]。
所以,筆者在利用Praat軟件(www.praat.org),分析了32組語音實驗材料,建立音高數(shù)據庫的基礎上,以重音對句末“陽平+去聲”調詞語音高的影響為重點對語音材料進行了詳細的考察。
(一)實驗材料
實驗共選用四組實驗句,每組實驗句中共9個問句和9個答句,句子的平均長度為5個字,句子內部沒有明顯的停頓,可以看作是一個完整的韻律短語。采用問答匹配的方式,引導句末“陽平+去聲”調詞語被重讀或不被重讀。實驗句的順序隨機排列。例如:誰答謝韓笑?林慧答謝韓笑。王浩答謝誰?王浩答謝龐迅。陳靜答謝誰?陳靜答謝唐倩。(劃線詞語為重讀詞語)
(二)發(fā)音人
在校具有良好普通話背景的北方方言區(qū)學生8人,調查對象男女各半。錄音時首先給發(fā)音人播放問句,要求發(fā)音人朗讀對應的答句,并將應該被強調的內容正確地、自然地表達出來。發(fā)音時要求讀音準確,否則及時讓其更正重讀。本實驗報告主要分析其中4名北方學生的發(fā)音(以下簡稱為男一、男二、女一、女二)。
(三)錄音
錄音在隔聲效果良好的語音實驗室進行,使用專業(yè)錄音話筒錄音,信號經外置聲卡進入電腦,采樣率為16kHz,保存為wav文件。
(四)實驗過程
1.人工標注音節(jié)邊界。為了確保研究數(shù)據的科學、準確,筆者使用Praat軟件(www.praat.org)對音節(jié)邊界進行了人工標注,利用波形、語圖及聽感的幫助準確地標注出音節(jié)的邊界。
2.剔除倍頻值?;l提取中會出現(xiàn)基頻的倍頻值,需要處理。筆者利用Praat軟件剔除那些平滑段內偏離均值過大的值,最后對音高曲線進行人工校驗,若發(fā)現(xiàn)不合理的結果,對原始數(shù)據進行糾正或重新測量。
The history of Sino-US space cooperation can be roughly divided into three phases.
3.建立音高數(shù)據庫。用統(tǒng)計的方法,建立音高數(shù)據庫,記錄句末詞語音高的最小值和最大值,觀察句末重讀音節(jié)與非重讀音節(jié)的音高起止點和音高走勢的差異,分析句末詞語音高變化模式。
(一)通過建立音高數(shù)據庫,并經過統(tǒng)計分析,筆者發(fā)現(xiàn)在重讀與非重讀情況下的句末“陽平+去聲”調詞語音高變化模式基本有以下三種:
1.重讀音節(jié)高音點升高,低音點下降
圖1 男一“唐倩”重讀與非重讀的音高情況
圖2 女二“龐迅”重讀與非重讀的音高情況
上圖為男一和女二的音高數(shù)據,其中,“唐”、“龐”為上聲,“倩”、“迅”為去聲,因此前字起點與后字終點為低音點,前字終點與后字起點為高音點。從音高走勢圖可以看出,句中同一位置的同一詞語,在非重讀情況下,走勢比較平緩;在重讀情況下,波動幅度比較大,并且高音點的音高升高,低音點的音高降低。
2.重讀音節(jié)高音點升高,低音點趨近
圖3 男二“龐迅”重讀與非重讀的音高情況
從上圖可以看出,男二的高音點的音高在重讀情況下明顯高于非重讀音節(jié),而低音點的音高無論是重讀情況還是非重讀情況都非常相近,即重讀音節(jié)高音點升高,低音點趨近。
3.重讀音節(jié)高音點升高,低音點升高
圖4 女一“韓笑”重讀與非重讀的音高情況
上圖中,前字起點、前字終點、后字起點的音高變化模式皆與變化模式1相似,即高音點音高升高,低音點音高降低,而后字終點(低音點),在重讀情況下,音節(jié)的音高升高。
(二)數(shù)據統(tǒng)計
筆者一共選取了24組實驗數(shù)據,分別進行歸類統(tǒng)計,結果如下:
表1 實驗數(shù)據結果統(tǒng)計
(三)數(shù)據分析
通過分析音高數(shù)據材料,筆者基本可以得出以下三個結論:
首先,當句末音節(jié)被重讀時,音高波動幅度較大;當句末音節(jié)未被重讀時,音高走勢比較平穩(wěn)。如圖5所表示:
圖5 男一“龐迅”音高變化(上為重讀音節(jié),下為非重讀音節(jié))
圖6 調查者高音點重讀與非重讀情況高音對比(以龐迅為例)
圖7 調查者低音點重讀與非重讀情況高音對比(以龐迅為例)
其次,當句末音節(jié)被重讀時,主要體現(xiàn)為高音點的提高。通過分析24組實驗數(shù)據,筆者發(fā)現(xiàn)在三種音高變化模式中,高音點的音高在重讀時都有明顯的提高,非重讀音節(jié)音高高于重讀音節(jié)的概率為0。
同時,高音點的升高幅度大于低音點。王蓓等(2002)認為,重讀音節(jié)音高升高不受位置的限制,即使在韻律短語末高音點也可以升到很高。低音點在韻律短語末即使升高,升高的程度也很有限。低音點的變化不如高音點自由,受漸降的低音線限制,或者說低音點是被低音線綁住的[4]。
再次,音節(jié)重讀時,低音點并不是一定表現(xiàn)為升或降。陽平聲被重讀時低音點下降,而去聲調音高時降時升。王蓓等曾提出高音線一低音線漸降的語調模式[4],認為在非重讀的情況下,音節(jié)在韻律短語首時高音點和低音點更高,在韻律短語末高音點和低音點都相應下降。同時,他們通過問答匹配法,發(fā)現(xiàn)當音節(jié)被重讀時,低音點音節(jié)在句末顯著升高。認為這可能是句末的低音點,在非重讀情況下音高會高于重讀情況的原因之一。此外,通過比較幾組不同數(shù)據之間的音高差異,筆者可以看出陽平低音點(前字起點)在重讀情況下往往音高更低,因此重讀去聲低音點(后字終點)也有可能是受到高音點被重讀時音高上升的影響,帶動了重讀低音點音高的升高。
本實驗采用統(tǒng)計的方法,通過分析北方方言區(qū)在校大學生的語音材料,考察了他們在發(fā)音過程的音高變化。其中,具體分析重音對高音點、低音點的音高變化的影響。
通過進行語音實驗分析,基本可以確定,重讀時高音點的音高會有明顯提高,且變化幅度大于低音點,陽平聲低音點的音高會有所下降。因此在建立韻律模型時,應注意重音對音節(jié)的影響,遵循韻律規(guī)則,以此提高合成語音的自然度和清晰度。
參考文獻:
[1]許潔萍,初敏,賀琳,等.漢語語句重音對音高和音長的影響[J].聲學學報,2000(4):335-339.
[2]王茂林,林茂燦,李愛軍.漢語自然對話音高研究[J].聲學學報:中文版,2008(2):97-101.
[3]EADY S J,COOPER W E.Speech intonation and focus location in matched statements and questions[J].Journal Acoustic of Social America,1986,80(2):402-415.
[4]王蓓,楊玉芳,呂士楠.漢語語句中重讀音節(jié)音高變化模式研究[J].聲學學報,2002(3):234-240.
The Impact of Stress on the Pitch of the Words with“the Rising tone”and“the Falling Tone”at the End of a Sentence
CHEN Yi-tong
(School of Chinese,Jinan University,Guangzhou 510000,Guangdong,China)
Prosody processing is an important part of the speech synthesis technology.Understanding the prosodic features and building the prosodic model are the prerequisites for improving the naturalness of speech synthesis.Based on the variances of pitch of pronunciation through a set of experiments,and the analysis of three basic models of stressed and unstressed words with“the rising tone”and“the falling tone”at the end of a sentence and the variances ofpitch of those models,we can conclude that“the rising tone”will rise in stressed words with higher amplitude of variantion than“the falling tone”,and the“the falling tone”will decrease.
the prosodic features;“the rising tone”and“the falling tone”at the end of a sentence; stressed words;pitch change
H116.4
A
1007-5348(2014)05-0120-04
(責任編輯:吳有定)
2014-03-09
陳藝彤(1993-),女,湖南郴州人,暨南大學華文學院本科生,主要從事語言學研究。