譚菊英
(上海大學 文學院,上海 寶山200444)
音高處理方法的比較研究
譚菊英
(上海大學 文學院,上海 寶山200444)
聲調(diào)的音高主要取決于基音中的頻率(基頻),基頻負載著聲調(diào)的主要區(qū)別特征。然而處理音高(基頻)的方法有很多種。文章以普通話為例,通過T值法、LZ值法和基頻直接分析法發(fā)現(xiàn)T值法、LZ值法分析聲調(diào)的結果一樣。但是基頻直接分析法消除了對數(shù)取值本身帶來的差異,結果更接近于聲調(diào)本身。
聲調(diào);聲學語音學;T值;LZ值法;基頻直接分析法
聲調(diào)又叫字調(diào),是音節(jié)中具有區(qū)別意義的音高變化,是有聲調(diào)語言的一項基本語音特征,聲調(diào)的調(diào)型和調(diào)值成為漢語語音學研究的重要課題,引起了人們的廣泛關注。
雖然我國古人很早的時候就已經(jīng)認識到漢語是有聲調(diào)的語言,但是如南朝沈約的“四聲八病”也只是提出了漢語聲調(diào)的語音現(xiàn)象。到了20世紀20年代,漢語聲調(diào)研究有了迅速的發(fā)展。趙元任于1922年發(fā)表了《中國言語字調(diào)底實驗研究方法》,主張用實驗的方法研究聲調(diào)。劉復是中國實驗語音學的先驅(qū),他于1924年出版了中國第一部實驗語音學專著《四聲實驗錄》,揭開了用實驗的方法研究漢語語音的序幕,至此,人們才開始認識到聲調(diào)的實質(zhì)問題。
從劉復開始,很多學者將語言中單字調(diào)的調(diào)型曲線畫在同一個圖里來研究聲調(diào)[1-4]。聲調(diào)的研究涉及聲調(diào)數(shù)據(jù)的處理,聲調(diào)的音高主要取決于基音中的頻率(基頻),基頻負載著聲調(diào)的主要區(qū)別特征,因此目前的聲調(diào)研究都是通過基頻分析得出的。處理音高(基頻)的方法有很多種,主要有石鋒[5]的T值法以及z-score、頻域分數(shù)、頻域比例、對數(shù)半音化、對數(shù)z-score(LZ)和對數(shù)頻域比例等聲調(diào)研究方法。z-score、頻域分數(shù)、頻域比例、對數(shù)半音化、對數(shù)z-score(LZ)和對數(shù)頻域比例這六種方法都強調(diào)基頻歸一化[6-7],前三種方法是線性的,后三種方法是對數(shù)的。后四種方法是朱曉農(nóng)[8-10]發(fā)展出來的,通過證明和比較,他認為對數(shù)z-score(LZ)方法是最好的。這幾種方法的具體含義下文將進行闡釋。
無論是石鋒的T值法,還是以上的六種基頻歸一研究聲調(diào)的方法,都是取對數(shù)的方法。這里存在一個問題,正如劉復在《四聲實驗錄》一文中聲音與對數(shù)一章講到的,以2為底或者以10為底的對數(shù)只是為了現(xiàn)成的便利,但是我們用對數(shù)表示音的高低,結果只是近似正確。另一方面,上文提到的六種聲調(diào)研究方法都注重基頻歸一化,認為歸一化能消減錄音時發(fā)音風格的差異,消除人際隨機差異,提取恒定參數(shù),濾掉個人特性,獲得具有語言學意義的信息。并且個人各自的歸一化以個人的頻域為坐標,顯示的是個人的各個聲調(diào)在空間中的分布。但歸一化對基頻數(shù)據(jù)取對數(shù)會不會帶來新的問題呢?比如說一個人的頻域范圍是100~400 Hz,那么他的頻域上限和頻域下限的差值就是300 Hz,如果取了以10為底的對數(shù)進行歸一化,那么頻域的差就是log10400(log10400=2.6)減去log10100(log10100=2),結果是0.6。這300 Hz和0.6是不同的處理方法得出的結果,基頻歸一的目的是要消減差異,這本身又會不會帶來新的差異呢?此外,個人各自的基頻歸一就是以個人的頻域為坐標進行聲學分析,而如果采用基頻進行直接分析,將每個人的頻域上限和下限之間的頻域范圍直接轉(zhuǎn)換為聲調(diào)的分布區(qū)域來進行描寫,也能達到個人基頻歸一化的目的,所以為什么還需要個人基頻歸一呢?
本文將采用石鋒的T值法、對數(shù)z-score法(六種基頻歸一的方法都是取對數(shù),實質(zhì)是一樣的,并且朱曉農(nóng)推衍了各方法之間的關系,證明了六種方法中對數(shù)z-score法是最好的,因此在這六種方法中本文只選取對數(shù)z-score法一種)和基頻的直接分析三種方法對音高數(shù)據(jù)進行處理,研討不同的方法之間是否存在差異?本文均以普通話為例進行分析,即用不同的方法對同一數(shù)據(jù)進行分析,這樣可以避免不同數(shù)據(jù)之間的差異性對實驗結果的干擾,也許更能窺見其間的差異。
(一)發(fā)音人
譚菊英,女,24歲,四川省儀隴縣人,所說方言為西南官話。上學開始學說普通話,今普通話水平一級乙等。
(二)調(diào)查材料
實驗材料的選字均為單字,字表設計的原則主要是:(1)選取單元音韻母a、i、u,一般來說這三個元音是語言中最常見的韻母;(2)從聲韻拼合的角度看,能和a、i、u都相拼的只有p、ph、m、t、th、n、l和零聲母,因此選取的范圍是p、ph、m、t、th、n、l和零聲母;(3)在這些能夠與a、i、u全部相拼而且陰陽上去四聲齊備的只有p、t、l,考慮到t、l的發(fā)音部位相同,于是選了同為不送氣的p和t聲母;(4)除了考慮聲韻之外,根據(jù)實際的語言狀況,還分別選取了a、i、u的零聲母字。根據(jù)在設計實驗字表時,橫向上調(diào)類一致,縱向上聲韻一致,以避免不同韻母由于發(fā)音方法和發(fā)音部位不同而引起聲調(diào)的變化。每個調(diào)類選取9個字,共36個字,盡量選取常用字(有的聲韻調(diào)只有一字便只能選此一字),不選多音字。本文單字調(diào)的調(diào)查材料選字如表1所示。
表1 聲調(diào)調(diào)查字表
(三)錄音方法
發(fā)音人在錄音之前,對表1中的例字進行反復練習,熟悉每個字的讀音,避免讀錯或讀為方言音,力求獲得準確自然的發(fā)音。錄音過程在安靜的房間進行,錄音的采樣率為44 100 Hz單聲道,解析度為16位。錄音時,用Praat軟件進行錄入,每個字讀1遍,時間間隔為2~3秒,用Praat軟件進行切音并保存為wav音頻格式,每個調(diào)類有9個樣本。
(四)實驗數(shù)據(jù)處理方法
以上各字的錄音,通過Praat語音軟件pitch選項提取樣本的基頻F0數(shù)值,實驗條件如下:
采樣率:44 100 Hz
聲道:單聲道
頻率范圍:75~500 Hz
具體方法:首先確定整個聲調(diào)的起始范圍,起點和終點之間的部分即為接下來提取聲調(diào)基頻的時長范圍。使用Praat軟件“View”菜單中的“Time Steps Setting”功能設置取點距離大致為整個時長的1/10,從起始端至末尾端每個例字共提取11個點。在本文中,提取每個樣本0%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%各時刻點的基頻值F0,單位為Hz。在提取時,取相對時刻的基頻值,即相對百分時刻值的各調(diào)類的基頻值放在同一橫軸點上進行比較,使得基頻值有可比性。為了避免Praat間隔取點造成的基頻錯誤,采用窄帶語圖進行驗證對比,如圖1和圖2所示是窄帶圖和寬帶圖間隔取點顯示的陰平“啊”在1.637 s的基頻。
圖1 窄帶圖
圖2 寬帶圖
如上圖所示,在同一時刻點,窄帶圖的基頻226.6 Hz和寬帶圖的基頻226.9 Hz頻率差異很小,0.6 Hz的差異在聽感上是沒有差異的,所以在基頻分析時,統(tǒng)一采用寬帶圖所取的時刻點的數(shù)據(jù)。另一方面,三種方法都采用所取時刻點的數(shù)據(jù),若有差異,也只是基頻本身的差異,而并不是分析方法帶來的差異。
此外,聲調(diào)分域的方法有五度制和四度制之分。趙元任的五度制,用來記錄聲調(diào)是夠用的,有些場合三度、四度也行,而且有人對世界上的語言做過統(tǒng)計,認為人類所有的語言調(diào)位等級沒有超過五度的。朱曉農(nóng)根據(jù)六種發(fā)聲態(tài)使用四度制。本文并不研究發(fā)聲態(tài),因此采用趙元任的五度制。
(五)實驗數(shù)據(jù)的處理
本文旨在分析T值法、對數(shù)z-score(LZ)法和基頻的直接分析三種不同的方法在音高處理上的差異,下面介紹這三種方法。
1.T值法
其中,a為調(diào)域上限頻率,即全部音高數(shù)據(jù)中的最大值;b為調(diào)域下限頻率,即全部音高數(shù)據(jù)中的最小值;x為測量點的頻率。石鋒是這樣得出T值的:0~1.0相當于五度值的1度,1.0~2.0相當于2度,2.0~3.0相當于3度,3.0~4.0相當于4度,4.0~5.0相當于5度[5]。
2.對數(shù)z-score(LZ)法
LZ=(log10(基頻值)-對數(shù)平均值)/對數(shù)標準差
先求出各調(diào)類各個時刻點的基頻平均值,即是各聲調(diào)各個百分時刻的基頻值;然后求出各聲調(diào)11個百分時刻點的基頻對數(shù)值,即換算成以10為底的對數(shù)值;再算出所有對數(shù)值的平均值和標準差;最后用歸一化公式求出其LZ值,并轉(zhuǎn)換為五度值。
3.基頻直接分析法
根據(jù)各聲調(diào)各字在各時刻點的基頻,計算出各聲調(diào)各時刻點基頻值的平均值,然后用調(diào)域上限頻率a減去調(diào)域下限頻率b再除以5,分域五度,建立和五度制之間的關系,便得出聲調(diào)的五度值。
(六)實驗數(shù)據(jù)分析
普通話陰平、陽平、上聲、去聲四類聲調(diào)的各時刻點基頻的平均值 (基頻平均值采用四舍五入法,但在excel計算時仍采用原始數(shù)據(jù))如表2所示。得到的基頻曲線如圖3所示。
表2 基頻值(單位:Hz)
圖3 基頻曲線圖
接下來用不同的方法對基頻進行數(shù)據(jù)處理。
1.T值法的數(shù)據(jù)分析
整個四聲的基頻值中,調(diào)域上限頻率 (最大值)為380 Hz(380.897 Hz),調(diào)域下限頻率(最小值)為204 Hz(203.635 Hz),根據(jù)T值計算公式得出T值,如表3所示。
根據(jù)T值轉(zhuǎn)換為五度值,如圖4所示。
圖4 T值轉(zhuǎn)換為五度值
2.對數(shù)z-score(LZ)法的數(shù)據(jù)分析
根據(jù)LZ值的計算公式,得出LZ值如表4所示。
表3 T值
表4 LZ值
LZ值轉(zhuǎn)換為五度值,如圖5所示。
圖5 LZ值轉(zhuǎn)換為五度值
3.基頻直接分析法的數(shù)據(jù)分析
整個四聲的基頻值中,調(diào)域上限頻率 (最大值)為380 Hz(380.897 Hz),調(diào)域下限頻率(最小值)為204 Hz(203.635 Hz),二者基頻相差大致為176 Hz,根據(jù)基頻作圖如圖6所示。
圖6 基頻直接分析法
從圖上看,我們實驗所得的普通話的聲調(diào)調(diào)值是:陰平11(或22)、陽平25(或35)、上聲212(或313)、去聲53(或52)。聲調(diào)調(diào)型和資料上的普通話聲調(diào)調(diào)型一樣,調(diào)值有很大差異。像11或22、25或35、212或313、53或52這樣的差異,如石鋒所說,“聲調(diào)格局中,每一聲調(diào)所占據(jù)的不是一條線,而是一條帶狀的聲學空間”,可見聲調(diào)的起始位置都不同,更遑論聲調(diào)的帶狀空間了;另一方面在確定聲調(diào)調(diào)值的時候,我們會考慮調(diào)頭和調(diào)尾的因素,可能得出的聲調(diào)調(diào)值差異不大,但這是我們在確定調(diào)值認為處理差異之后的結果,而聲調(diào)本身的差異我們是不能忽視的。造成實驗所得調(diào)值和普通話調(diào)值55、35、214、51差異大的原因,一方面可能是發(fā)音人方言聲調(diào)對普通話聲調(diào)的影響,另一方面發(fā)音人數(shù)量太少造成統(tǒng)計意義不顯著。這里需要說明的是,本文旨在考察不同處理音高的方法之間的差異,而不是實驗研究普通話的調(diào)值,所以通過對同一發(fā)音人的數(shù)據(jù)進行分析,便窺見不同方法之間的差異,這并不受發(fā)音人數(shù)量以及發(fā)音人本身的影響。
從圖4、圖5和圖6來看,圖4和圖5完全相同,即圖4、圖5反映的聲調(diào)調(diào)型和調(diào)值完全相同。T值法和LZ值法雖然計算方式不一樣,但它們的實質(zhì)是相同的,都是采用對數(shù)后的基頻數(shù)據(jù)進行比較分析,這也就是二者相同的原因。
圖6顯示的聲調(diào)調(diào)型的形態(tài)和圖4、圖5是一樣的,但仔細觀察發(fā)現(xiàn)圖6中聲調(diào)的調(diào)值不一樣,尤其是聲調(diào)起始點的位置。陰平都是低平調(diào),但圖6中的陰平在1度的上部,未到2度的位置,而圖4和圖5中的陰平都在2度的下部。陽平都是升調(diào),圖6中陽平聲調(diào)大概有1/3的部分處于1度區(qū)間的中上部,而圖4和圖5中陽平全部在2度及其以上的范圍內(nèi)。上聲都是曲折調(diào),圖6中上聲的起點位置在2度區(qū)間的中上部,中間最低點大致有1/6的位置在1度的底部,結束的位置在2度與3度的交界處,而圖4和圖5的上聲起點位置在3度的下部,中間最低點接近1度的底部,但未到底部的位置,而結束的位置在靠近三度中部的位置。去聲都是降調(diào),圖6中去聲結束的位置在五度值中的2度的上部位置,而圖4和圖5中去聲的結束位置在3度的中下部位置。
通過比較分析,我們發(fā)現(xiàn)T值法和LZ值法分析處理聲調(diào)音高的結果是一樣的,即聲調(diào)的調(diào)型和調(diào)值是一樣的,但是二者都采用了取對數(shù)的方法,使得二者的調(diào)型雖與基頻的直接分析法相同,但在調(diào)值尤其是聲調(diào)的起始位置上有很大差異,所以我們認為基頻的直接分析法對音高的處理消除了對數(shù)化帶來的差異,更接近于聲調(diào)本身。
[1]黃伯榮,廖序東.現(xiàn)代漢語增訂第四版:上冊[M].北京:高等教育出版社,2007.
[2]焦立為,冉啟斌,石鋒.二十世紀的中國語音學[M].太原:書海出版社,2004.
[3]林燾,王理嘉.語音學教程[M].北京:北京大學出版社,2013.
[4]屈梅娟.東平方言聲調(diào)的實驗研究[J].科教文匯,2014(3):83-84.
[5]石鋒,廖榮蓉.語音叢稿[M].北京:北京語言學院出版社,1994.
[6]宋益丹.漢語聲調(diào)實驗研究回望[J].語文研究,2006(1):41-45.
[7]吳宗濟.趙元任先生在漢語聲調(diào)研究上的貢獻[J].清華大學學報(哲學社會科學版),1996,11(3):58-63.
[8]朱曉農(nóng).上海聲調(diào)實驗錄[M].上海:上海教育出版社,2004.
[9]朱曉農(nóng).基頻歸一化——如何處理聲調(diào)的隨機差異?[J].語言科學,2004(3):3-19.
[10]朱曉農(nóng).語音學[M].北京:商務印書館,2013.
責任編輯:吳強
Com paring Study on Pitch Analysis M ethods
TAN Juying
(School of Liberal Arts,ShanghaiUniversity,Baoshan Shanghai200444,China)
The pitch of a tone mainly depends on the fundamental frequency,which loads the main distinguishing features of tones.Nonetheless,there aremany methods to analyze the pitch.Taking Mandarin as an example,by using the T valuemethod, LZ value method and fundamental direct analysis it shows that the result of the tones between T value method and LZ value method are the same.But the pitch direct analysismethod eliminates the differences of the logarithmic values and the result is more close to the tone itself.
tone;acoustic phonetics;T value;LZ valuemethod;the pitch directanalysismethod
H172.3
A
1673-8004(2016)04-0044-05
2016-03-14
譚菊英(1990— )女,四川儀隴人,碩士研究生,研究方向?qū)嶒炚Z音學。