黃 瑋, 于 爽, 史晴琳, 冉啟斌
(1 南開大學(xué) 漢語言文化學(xué)院, 天津 300350; 2 天津職業(yè)技術(shù)師范大學(xué) 外國語學(xué)院, 天津 300222;3 天津天獅學(xué)院 外國語學(xué)院, 天津 301700; 4 南開大學(xué) 文學(xué)院, 天津 300071)
音高、音強(qiáng)和音長等語言要素,在語句中的情況與在音節(jié)中的情況往往有所不同。 學(xué)界對(duì)語句中音高的研究也比較充分。 文獻(xiàn)[1-2]較早指出英語中具有音高下傾(pitch declination)現(xiàn)象;文獻(xiàn)[3-4]的研究表明,在日語、約魯巴語中也存在音高下傾的現(xiàn)象;文獻(xiàn)[5]中曾對(duì)音高下傾做過系統(tǒng)的介紹;文獻(xiàn)[6-8]的研究者指出,漢語句子也存在音高下傾和音高重置的語調(diào)特征。 而音強(qiáng)作為語音的4 要素之一,在漢語句子中是否具有與音高類似的下傾特征,是一個(gè)值得關(guān)注并探究的問題。 文獻(xiàn)[9]中指出,音強(qiáng)為重音的感知提供了重要的聲學(xué)依據(jù)。 但學(xué)界對(duì)音強(qiáng)的研究并不太多,往往被視為韻律或語調(diào)研究中較為次要的一個(gè)參考因素進(jìn)行研究。 已有對(duì)音強(qiáng)的研究大多使用計(jì)算音量比的方式,如文獻(xiàn)[10]中提出了語調(diào)格局的方法,使用計(jì)算音量比的方式,對(duì)廣義語調(diào)的音強(qiáng)進(jìn)行定量考察;文獻(xiàn)[11-12]將音強(qiáng)作為焦點(diǎn)的韻律表現(xiàn)之一進(jìn)行研究等等。 語句中的音強(qiáng)變化具有怎樣的特點(diǎn),是否具有一定的模式,是值得研究的問題。
本文基于“民族地區(qū)地方普通話語音調(diào)查及聲學(xué)數(shù)據(jù)庫建設(shè)”項(xiàng)目中的標(biāo)準(zhǔn)漢語句子(Standard Chinese Sentence,SCS)語料與中文標(biāo)準(zhǔn)女生音庫(Data-Baker Sentence,DBS)語料兩種句子錄音材料,使用語音分析軟件提取出每個(gè)句子100 個(gè)點(diǎn)位上的音強(qiáng),對(duì)句子音強(qiáng)的整體變化模式、變化速率、最值等進(jìn)行量化考察,以期促進(jìn)對(duì)句子音強(qiáng)變化模式的認(rèn)識(shí)。
SCS 語料的句子多為日常生活內(nèi)容,其中包括陳述句40 個(gè),疑問句38 個(gè),感嘆句和祈使句各11個(gè),共100 句;單句音節(jié)數(shù)量最少7 個(gè),最多32 個(gè)(均值14.39,標(biāo)準(zhǔn)差5.89)。 語料發(fā)音人均是來自北方方言區(qū)、普通話水平達(dá)到二級(jí)甲等以上的在校大學(xué)生,數(shù)量為5 男5 女,共10 人。 錄音采集在安靜的語音實(shí)驗(yàn)室中進(jìn)行。 錄音之前,發(fā)音人有充足的時(shí)間了解實(shí)驗(yàn)情況,熟悉語料和實(shí)驗(yàn)要求。 錄音時(shí),發(fā)音人根據(jù)句子語境,以日常語速和音量發(fā)音,以確保錄音具有較高的自然度和真實(shí)度。 錄音采用單聲道錄制,采樣率為22 050 Hz,采樣精度為16 bit。 各句子單獨(dú)保存為一個(gè)聲音文件,存儲(chǔ)格式為WAV。 最終,SCS 語料成功采集10 位發(fā)音人讀100個(gè)漢語句子的1 000 條錄音文件。
DBS 語料包含1 萬個(gè)漢語句子,是“標(biāo)貝科技”開源公布的數(shù)據(jù)產(chǎn)品之一。 DBS 語料句子的內(nèi)容涵蓋各類新聞、小說、科技、娛樂、對(duì)話等領(lǐng)域。 其中包括陳述句9 154 個(gè),疑問句550 個(gè),感嘆句233 個(gè),祈使句63 個(gè)。 DBS 語料包含162 864 個(gè)音節(jié),單句音節(jié)數(shù)量最少3 個(gè),最多34 個(gè)(均值16.29,標(biāo)準(zhǔn)差5.39)。DBS 語料錄音的采集在專業(yè)錄音棚中使用專業(yè)錄音設(shè)備和錄音軟件完成,錄音采樣率為48 KHz,采樣精度為16 bit,采用單聲道錄制。 每個(gè)句子單獨(dú)保存為一個(gè)聲音文件,存儲(chǔ)格式為WAV。DBS 語料的發(fā)音人均是女性,年齡在20 ~30 歲,普通話標(biāo)準(zhǔn)、聲音清晰、語速適中。
SCS 語料與DBS 語料在句類比例、音節(jié)數(shù)量、錄音質(zhì)量和自然度等方面各有特點(diǎn)。 DBS 語料絕大部分是陳述句,其他3 種句類占比極?。欢鳶CS 語料適當(dāng)提高了疑問句、感嘆句和祈使句的比例。 在句子音節(jié)數(shù)量上,DBS 語料比SCS 語料平均多近2 個(gè)音節(jié),并且數(shù)量跨度比SCS 語料更大,句子長度更多樣,且DBS 語料音節(jié)的標(biāo)準(zhǔn)差較SCS 語料小一些,內(nèi)部數(shù)量的波動(dòng)幅度更小,這得益于DBS 語料所含句子數(shù)量更龐大。 在錄音質(zhì)量上,DBS 語料的錄音在采樣率、錄音環(huán)境和設(shè)備上都更為優(yōu)質(zhì)、專業(yè),語料內(nèi)容涉及領(lǐng)域更廣泛。 但是,以錄音的自然度來講,DBS 語料在聽感上較為機(jī)械,與日常會(huì)話語言差別較大;而SCS 語料更為自然,更能反映日常生活中的語言使用情況,并且將男性發(fā)音人也納入其中,做到了性別上的平衡。 綜合考慮以上情況,本文將以分析自然度更優(yōu)的SCS 語料為主,以分析樣本量更大的DBS 語料為輔。 在提取音強(qiáng)時(shí),SCS 語料和DBS 語料所使用的方法和處理步驟有所不同。
在進(jìn)行音強(qiáng)數(shù)據(jù)提取之前,本文使用語音分析軟件Praat 對(duì)SCS 語料進(jìn)行了預(yù)處理。 首先,使用腳本自動(dòng)插入句子標(biāo)注層,并根據(jù)音強(qiáng)閾值,自動(dòng)對(duì)齊句子層邊界生成標(biāo)注文件;然后,借助另一腳本,將句子文本插入到對(duì)應(yīng)位置;最后,由有經(jīng)驗(yàn)的標(biāo)注者對(duì)標(biāo)注邊界進(jìn)行逐句調(diào)整,以確保數(shù)據(jù)準(zhǔn)確、有效。
由于DBS 句子數(shù)量龐大,本文使用腳本在Praat中自動(dòng)生成句子邊界以后,沒有進(jìn)行人工校對(duì)。 原因在于DBS 語料錄音雜音極少,腳本自動(dòng)標(biāo)注的句子邊界較為準(zhǔn)確,足以滿足DBS 語料作為輔助分析材料的條件。
音強(qiáng)數(shù)據(jù)的提取也是在Praat 中運(yùn)行腳本完成的。 腳本對(duì)每個(gè)句子等比例提取100 個(gè)音強(qiáng)。 需要說明的是,由于SCS 語料的句子首尾邊界由人工進(jìn)行調(diào)整、核對(duì),為保證數(shù)據(jù)的科學(xué)、客觀,在進(jìn)行數(shù)據(jù)分析時(shí),將首點(diǎn)(1 號(hào)點(diǎn))和末點(diǎn)(100 號(hào)點(diǎn))的數(shù)據(jù)排除在外,即每個(gè)句子有效的點(diǎn)位是98 個(gè)。 提取出數(shù)據(jù)后,在Excel2019 和SPSS26.0 中進(jìn)行數(shù)據(jù)處理和統(tǒng)計(jì)分析。
下面首先報(bào)告SCS 語料的分析結(jié)果。 在Excel中,分別求出各發(fā)音人100 個(gè)句子中98 個(gè)點(diǎn)位上音強(qiáng)的均數(shù),得到代表各發(fā)音人句子音強(qiáng)走勢的數(shù)據(jù)。隨后,為觀察句子音強(qiáng)的走勢,在Excel 中繪制出每位發(fā)音人的句子音強(qiáng)散點(diǎn)圖。 從散點(diǎn)圖看到,10 位發(fā)音人的句子音強(qiáng)走勢均呈現(xiàn)為“峰-谷-峰”的雙峰“M”形。 具體來說,在句子開始時(shí),音強(qiáng)在一個(gè)較低的值,然后升高達(dá)到第一個(gè)峰,隨后下降到某一值以后呈小幅的上下波動(dòng),波動(dòng)將會(huì)持續(xù)一段時(shí)間。句子結(jié)束之前,音強(qiáng)會(huì)有一個(gè)較大幅度的回升,形成第二個(gè)峰值,最后句子結(jié)束時(shí)音強(qiáng)急促下降。 文獻(xiàn)[13]中認(rèn)為,句子的總體音強(qiáng)模式基本遵循從弱到強(qiáng)、再由強(qiáng)變?nèi)醯脑瓌t。 本文觀察到的現(xiàn)象與之不同。 限于篇幅,本文僅列出F3 和M5 兩位發(fā)音人的音強(qiáng)散點(diǎn)示意如圖1 所示。
圖1 SCS 語料音強(qiáng)散點(diǎn)示意圖Fig.1 Scatterplot of SCS corpus sound intensity
10 位發(fā)音人的句子音強(qiáng)走勢均呈現(xiàn)為“M”形,但在“峰”、“谷”之間的相對(duì)模式上各有不同。 例如,發(fā)音人M5 的“峰”與“谷”之間的差距較F3 更為明顯。 總的來看,10 位發(fā)音人句子音強(qiáng)的變化模式存在共性。 將句子長度分為5 等分,前20%是句首音強(qiáng)上升段和第一個(gè)“峰”所在段,通常也是整個(gè)句子中出現(xiàn)音強(qiáng)最大值的階段;20%~40%是第一個(gè)音強(qiáng)下降段(即“下降段”);40%~60%是“谷”,這一段中的音強(qiáng)呈小幅上下波動(dòng),具有穩(wěn)態(tài)特征,可視為穩(wěn)態(tài)段;60%~80%是第二個(gè)音強(qiáng)上升段(即“回升段”);最后的80%~100%是第二個(gè)“峰”,以及第二個(gè)音強(qiáng)下降段所在的階段。 實(shí)際上這5 個(gè)階段所對(duì)應(yīng)的是句子語流的5 段時(shí)間,本文將其分別稱做1、2、3、4 和5。 為了更清楚地描寫句子音強(qiáng)的變化模式,從1、3 和5 中提取3 個(gè)音強(qiáng)參數(shù)進(jìn)行分析。 在1 和5 中,分別提取出該段中的音強(qiáng)最大值1 和2;3 是音強(qiáng)穩(wěn)態(tài)段,計(jì)算出該段中音強(qiáng)的均值。 由于10 位發(fā)音人的1 和2 可能出現(xiàn)在不同的位置,為便于比較,設(shè)定1 均出現(xiàn)在10的位置,2 出現(xiàn)在90的位置。的位置應(yīng)該在3段中,但為便于計(jì)算,設(shè)定3 的起點(diǎn)(40處) 和末點(diǎn)(60處) 值均為,因而1、2 到之間的時(shí)間跨度均是句子總長的30。 利用1、2 和繪制出10 位發(fā)音人的音強(qiáng)下降與回升模式圖,如圖2 所示。
圖2 SCS 語料10 位發(fā)音人句子音強(qiáng)的下降與回升模式Fig.2 Decline and recovery patterns of sentence intensity of 10 speakers in SCS corpus
由圖2 可見,10 位發(fā)音人音強(qiáng)的下降、回升模式各有不同。 為量化這種音強(qiáng)的下降和回升模式,本文提出下降率和回升率兩個(gè)參數(shù)進(jìn)行分析。 音強(qiáng)下降率的計(jì)算公式是:1(1)30,音強(qiáng)回升率的計(jì)算公式是:2(2)30。1 和2代表下降的速率,其絕對(duì)值越大則速率越大。
表1 中分別列出了SCS 語料中10 位發(fā)音人音強(qiáng)的下降率、回升率及平均值。1 的最小值是-35.59,最大值是-20.81,均值是-28.22;2 的最小值是5.37,最大值是27.19,均值是15.49。 總體來看,漢語句子音強(qiáng)下降段的速率要大于回升段的速率,即句子在達(dá)到第一個(gè)峰值之后下降的速度大于由穩(wěn)態(tài)段上升至第二個(gè)峰值的速度。 而且,從跨度來看,在10 位發(fā)音人之間,音強(qiáng)回升段的差異大于下降段的差異,即句子音強(qiáng)在達(dá)到第一個(gè)峰值之后較急促下降的情況,在發(fā)音人之間具有較高的一致性,而從穩(wěn)態(tài)段上升到第二個(gè)峰值時(shí)人際差異較大,有的發(fā)音人較“急”(如2), 有的發(fā)音人則“不急”(如3)。 但是,盡管存在差異,還是有較明顯的回升趨勢。
表1 SCS 語料10 位發(fā)音人音強(qiáng)下降率與回升率Tab.1 Decline rate and recovery rate of sound intensity of 10 speakers in SCS corpus
上文主要介紹了漢語語句在句中的音強(qiáng)下降模式和回升模式,是將句首的上升和句末的下降兩段排除在外的。 句首的上升段和句末的下降段在分析中的困難在于時(shí)間短,占比往往小于句子全長的10%,而且變化速率大。 該現(xiàn)象如圖1 所示,首尾兩段中相鄰兩個(gè)點(diǎn)位之間的間隔較大,正是由于變化速率較大,等距點(diǎn)位之間音強(qiáng)的差異較大。 因此,本文不再單獨(dú)對(duì)句首段和句尾段進(jìn)行分析,而是對(duì)整句做回歸分析,以回歸方程的形式對(duì)句子音強(qiáng)的變化模式進(jìn)行數(shù)學(xué)表達(dá)。 回歸分析是在統(tǒng)計(jì)軟件SPSS26.0 中完成的,分為相關(guān)性分析、曲線估算和建立回歸模型3 步。
在相關(guān)性分析中,將98 個(gè)點(diǎn)位() 按出現(xiàn)順序(即句子語流的時(shí)間先后順序)排列,將之與相應(yīng)的音強(qiáng)進(jìn)行相關(guān)性分析。 表2 中摘錄了10 位發(fā)音人的斯皮爾曼(Spearman)相關(guān)分析結(jié)果。 可見,10位發(fā)音人的點(diǎn)位與音強(qiáng)之間都在0.01 水平相關(guān)性顯著,并且均是負(fù)相關(guān)。 相關(guān)性最大的是4,最小的是2。 從相關(guān)性角度來講,句子音強(qiáng)總體呈下傾趨勢,音強(qiáng)隨句子語流時(shí)間的前進(jìn)而變小。
表2 SCS 語料音強(qiáng)與語流時(shí)間斯皮爾曼相關(guān)性Tab.2 Spearman correlation between sound intensity and flow time of SCS corpus
在滿足點(diǎn)位與音強(qiáng)之間相關(guān)性顯著的前提后,分別對(duì)10 位發(fā)音人的音強(qiáng)進(jìn)行曲線估算。 根據(jù)曲線估算的結(jié)果,綜合考慮、F 和顯著性數(shù)值來看,10 位發(fā)音人的句子音強(qiáng)曲線與二次函數(shù)和三次函數(shù)擬合程度較高。 二者相比,三次函數(shù)在優(yōu)度()上僅提升0.001 ~0.04 不等。 圖3 是F3 和M5 兩位發(fā)音人的二次函數(shù)和三次函數(shù)擬合曲線,可見二次函數(shù)和三次函數(shù)的擬合效果相差不大。 但二次函數(shù)在F 值上平均比三次函數(shù)大30 左右。 考慮到回歸模型的簡約性,適宜使用二次函數(shù)對(duì)10 位發(fā)音人的音強(qiáng)曲線進(jìn)行擬合。
圖3 F3 和MS 音強(qiáng)的二次函數(shù)(實(shí)線)和三次函數(shù)(點(diǎn)線)擬合曲線Fig.3 Fitting curve of quadratic function (solid line) and cubic function (dotted line) of sound intensity of F3 and MS
在選定二次函數(shù)作為回歸曲線后,進(jìn)一步求出10 位發(fā)音人的回歸模型,模型參數(shù)見表3。 其中,表示非標(biāo)準(zhǔn)化系數(shù),表示一次項(xiàng),表示二次項(xiàng),、值均在0001 水平上具有顯著性。 二次函數(shù)中,二次項(xiàng)系數(shù)的正負(fù)決定曲線開口的朝向,系數(shù)為正則開口朝上;二次項(xiàng)系數(shù)的大小決定開口的大小,系數(shù)越大則開口越小,曲線越陡。代表模型的擬合優(yōu)度,是回歸分析的決定參數(shù),用于表示自變量與因變量形成的散點(diǎn)與回歸曲線的接近程度。 例如,F(xiàn)1句子音強(qiáng)曲線回歸模型的等于0573,表明該回歸模型能解釋音強(qiáng)曲線中573的信息。 在10 位發(fā)言人句子音強(qiáng)的擬合優(yōu)度中, 最大的是M3(753),最小的是M5(556),平均擬合優(yōu)度為652。 總體來看,擬合情況在可接受的范圍內(nèi)。最終,根據(jù)系數(shù)和常數(shù),可以得到音強(qiáng)曲線的回歸模型。 例如F1 的音強(qiáng)曲線回歸方程是:音強(qiáng)6081402090002。 限于篇幅,10 位發(fā)音人句子音強(qiáng)的回歸方程不再逐個(gè)列出。
表3 SCS 語料10 位發(fā)音人回歸模型摘錄Tab.3 Excerpt of regression model of 10 speakers in SCS corpus
為便于比較,將SCS 語料中10 位發(fā)音人的音強(qiáng)數(shù)據(jù)合并后取均值,形成一組代表SCS 語料中10 人音強(qiáng)共性的音強(qiáng)數(shù)據(jù),放在此處對(duì)比分析。
圖4 左邊為DBS 中10 000 句語料98 個(gè)點(diǎn)位的音強(qiáng)均值散點(diǎn)圖,右邊為SCS 語料1 千句語料98 個(gè)點(diǎn)位的音強(qiáng)均值散點(diǎn)圖。 由圖4 可見,由于DBS 語料句子數(shù)量龐大,散點(diǎn)分布較SCS 語料更為平滑;第一個(gè)峰值的位置更為明顯且偏前,第二個(gè)峰值也非常明顯且偏后。 DBS 語料在2 和4 階段音強(qiáng)的下降和回升更為平緩,在3 階段上語料的波動(dòng)特征不如SCS 語料明顯,且句中音強(qiáng)的最小值出現(xiàn)在50%左右。 此外,DBS 語料的音強(qiáng)較SCS 語料平均高出近10 dB(注意左右兩圖縱坐標(biāo)標(biāo)度不同),且非參數(shù)檢驗(yàn)結(jié)果表明,這種差異在統(tǒng)計(jì)學(xué)上具有顯著性(Mann-Whitney Test,0001)。
如圖4 所示,前面句中音強(qiáng)的下降與回升模式仍然存在。 根據(jù)公式,計(jì)算出DBS 語料與SCS 語料的下降率(1) 與回升率(2),結(jié)果見表4。 可見,DBS 語料的1 和2 絕對(duì)值均大于SCS 語料,即DBS 語料句中的下降與回升速度均比SCS 語料大。
圖4 DBS 語料與SCS 語料音強(qiáng)均值散點(diǎn)圖Fig.4 Scatterplot of mean sound intensity of DBS corpus and SCS corpus
表4 DBS 語料與SCS 語料下降率與回升率Tab.4 Decline rate and recovery rate of DBS corpus and SCS corpus
DBS 語料與SCS 語料的點(diǎn)位與音強(qiáng)之間的斯皮爾曼相關(guān)性見表5。 二者都呈負(fù)相關(guān)關(guān)系。 DBS語料的點(diǎn)位與音強(qiáng)之間的相關(guān)系數(shù)絕對(duì)值比SCS語料小,甚至比最小的2 還要?。ㄒ姳?)。 這說明DBS 語料的音強(qiáng)與句子語流時(shí)間的關(guān)系存在負(fù)相關(guān),但是相關(guān)性比較弱。
表5 DBS 語料與SCS 語料點(diǎn)位與音強(qiáng)之間斯皮爾曼相關(guān)性Tab.5 Spearman correlation between point position and sound intensity of DBS corpus and SCS corpus
綜合考慮散點(diǎn)的分布情況以及曲線估算的結(jié)果,仍然選用二次函數(shù)對(duì)DBS 語料和SCS 語料進(jìn)行曲線擬合。 回歸模型參數(shù)摘錄見表6。 DBS 語料的擬合優(yōu)度達(dá)到74%,比SCS 語料高出4.2%左右,DBS 語料句子音強(qiáng)曲線較SCS 語料更接近二次函數(shù)。 此外,SCS 語料的優(yōu)度也要比第3 節(jié)中10 人的平均擬合優(yōu)度更高一些。
表6 DBS 語料與SCS 語料回歸模型摘錄Tab.6 Excerpt of regression model of DBS corpus and SCS corpus
本文對(duì)SCS 語料10 位發(fā)音人100 個(gè)普通話語句進(jìn)行了重點(diǎn)分析,同時(shí)使用DBS 語料進(jìn)行了輔助分析。 結(jié)果顯示,漢語普通話句子音強(qiáng)變化模式存在一定共性。 首先,SCS 語料10 位發(fā)音人的句子音強(qiáng)模式均呈現(xiàn)為雙峰“M”形,“峰”與“谷”之間有著明顯的區(qū)別;兩個(gè)“峰”之間的相對(duì)關(guān)系非常穩(wěn)定,即第一個(gè)峰值總是大于第二個(gè)峰值。 DBS 語料同樣符合以上特點(diǎn),且散點(diǎn)分布更加平滑。 其次,本文通過對(duì)句中下降率與回升率的分析看到,下降率絕對(duì)值皆大于回升率絕對(duì)值,即句中的音強(qiáng)下降速度要大于回升速度。 此外,在句子音強(qiáng)曲線的擬合方面,漢語普通話句子音強(qiáng)能被二次函數(shù)較好擬合,SCS語料10 位發(fā)音人的擬合優(yōu)度均在50%以上,其中8人在60%以上,有的甚至達(dá)到了75%以上;DBS 語料音強(qiáng)曲線擬合優(yōu)度也高達(dá)74%。 值得注意的是,較大容量的DBS 語料不論是在句中下降率與回升率,還是在二次函數(shù)的擬合優(yōu)度上,都比對(duì)10 位發(fā)音人音強(qiáng)均值分析得出的數(shù)據(jù)更加理想,即1 萬句樣本的DBS 語料要比1 千句的SCS 語料的分析結(jié)果更好。 由此可見,樣本量越大則越能體現(xiàn)出句子音強(qiáng)模式的共性。
除共性外,句子音強(qiáng)在下降與回升模式以及整個(gè)音強(qiáng)曲線的回歸模型上也具有一定的個(gè)體差異:
(1)在句中下降率與回升率上,雖然下降速度快于回升速度,但發(fā)音人之間的緩急程度不一;
(2)在T3 階段不同發(fā)音人的音強(qiáng)均值也不同;
(3)10 人的二次函數(shù)擬合優(yōu)度具有差異,有的發(fā)音人句子音強(qiáng)曲線更接近二次函數(shù),而有的發(fā)音人的擬合情況則稍差。
以上現(xiàn)象表明,受發(fā)音人發(fā)音時(shí)的狀態(tài)和日常說話的音量大小影響,句子音強(qiáng)變化模式具有一定的個(gè)體差異。 盡管如此,本文句子音強(qiáng)變化模式的共性大于個(gè)性。
音強(qiáng)的變化與說話時(shí)氣息的強(qiáng)弱有密切的關(guān)系,氣息越強(qiáng)則聲音強(qiáng)度越大,氣息越弱則聲音強(qiáng)度越小。 文獻(xiàn)[14]中提出,言語時(shí)的呼吸已經(jīng)超越了生理需求的層面,其隨著言語任務(wù)的不同而受上位語言系統(tǒng)的調(diào)節(jié)。 本文提出的雙峰“M”形音強(qiáng)走勢,能從已有的關(guān)于言語呼吸機(jī)制的研究中得到印證。 文獻(xiàn)[15]的研究表明,胸呼吸的主要作用是保證足夠的氣息量,腹呼吸的主要作用是控制氣流持續(xù)釋放,以獲得連續(xù)的語音,句子的起始處對(duì)應(yīng)一個(gè)胸呼吸和腹呼吸的重置。 通過觀察文獻(xiàn)[15]中報(bào)道的呼吸信號(hào)圖可見,在發(fā)音之前有一個(gè)大幅的吸氣動(dòng)作,緊隨其后的是一個(gè)較大速率的呼氣信號(hào),隨后是較平緩的呼氣信號(hào)(尤其是胸呼吸),在句末時(shí)胸呼吸和腹呼吸的信號(hào)都下降到最低值,為下一個(gè)呼吸重置做準(zhǔn)備,且小句中的停頓處通常也會(huì)有較小的呼吸重置。 這與本文的雙峰“M”形音強(qiáng)曲線相符,兩個(gè)峰正好對(duì)應(yīng)呼氣信號(hào)速率較大的階段,該階段呼出氣息較快,聲音強(qiáng)度相應(yīng)較大。
文獻(xiàn)[16]中指出,漢語信息的編碼往往遵循從舊到新的原則,越靠近句末,信息內(nèi)容就越新。 文獻(xiàn)[17]也認(rèn)為,說話人有意讓自己想突出的成分占據(jù)自然焦點(diǎn)即句末的位置,并舉例說明了漢語尾焦點(diǎn)的特點(diǎn)。 文獻(xiàn)[18]中引介了“線性增量”原則,說明在沒有干擾因素的情況下,隨著句子由左向右移動(dòng),句子成分負(fù)載的意義越來越重要。 可見,漢語句末是自然焦點(diǎn)的重要句法位置。 文獻(xiàn)[12]的研究表明,從焦點(diǎn)詞本身的音量凸顯程度上看,句中、句首、句末3 種焦點(diǎn)位置上,信息焦點(diǎn)均明顯大。 盡管其文獻(xiàn)中所說的信息焦點(diǎn)與自然焦點(diǎn)在定義上有些不同,但焦點(diǎn)在音量上的凸顯程度較高這一現(xiàn)象值得關(guān)注。 本文使用的語料都是單獨(dú)的句子,句子焦點(diǎn)多是無標(biāo)記的自然焦點(diǎn),占據(jù)句尾的位置,這可能也是造成第二個(gè)音強(qiáng)峰值的原因。
文獻(xiàn)[12]在討論漢語信息焦點(diǎn)和對(duì)比焦點(diǎn)區(qū)分的語調(diào)證據(jù)時(shí),使用了“李超每夜點(diǎn)炸雞”等句子進(jìn)行實(shí)驗(yàn)。 實(shí)驗(yàn)結(jié)果顯示,音節(jié)的音強(qiáng)大小,隨焦點(diǎn)位置的變化而變化(對(duì)照組沒有明顯變化)。 這與本文提出的雙峰“M”形變化模式不同,除焦點(diǎn)確實(shí)起作用外,或有另外原因:
(1)因?yàn)槲墨I(xiàn)中使用的句子較短,只有7 個(gè)音節(jié),而本文中使用的SCS 語料音節(jié)數(shù)目平均在14 個(gè)以上,句子更長,句子音強(qiáng)變化模式更豐富;
(2)更為重要的是,文獻(xiàn)中使用的實(shí)驗(yàn)句,與本文中的日常語句有較大區(qū)別。 本文的目的在于探究漢語普通話句子音強(qiáng)變化的普遍模式,發(fā)音人在錄音時(shí)不知曉實(shí)驗(yàn)?zāi)康模耆鶕?jù)語感和語境發(fā)音,這與具有專門目的的實(shí)驗(yàn)語料有著本質(zhì)上的不同。
本文中SCS 語料的句子音節(jié)數(shù)目由7 ~32 個(gè)不等,沒有嚴(yán)格控制音節(jié)數(shù)或者進(jìn)行分組分析,這和本文的研究目的有關(guān)。 漢語的日常會(huì)話中,句子總是有長有短,但一般長度到底是多少,目前還少有研究成果可以參考。 句子太短則體現(xiàn)不出句子音強(qiáng)的變化模式,句子太長則容易脫離實(shí)際,所以使用音節(jié)數(shù)量多樣的語料是一個(gè)折中的選擇。 本文使用的音強(qiáng)提取腳本是等距提取100 點(diǎn)的音強(qiáng),不論句子音節(jié)數(shù)量多少,都是依據(jù)時(shí)間順序提取100 個(gè)音強(qiáng)數(shù)據(jù),這實(shí)際上對(duì)句子的時(shí)長做了歸一化處理。 但是,在求出句子音強(qiáng)的普遍模式后,根據(jù)音節(jié)數(shù)目對(duì)漢語句子進(jìn)行分類,再細(xì)致探究其音強(qiáng)變化模式,至少對(duì)確定出于專門目的而設(shè)計(jì)的實(shí)驗(yàn)句的音節(jié)上限,具有重要的參考意義。
此外,句子由音節(jié)組成,句子的音強(qiáng)也是由每個(gè)音節(jié)的音強(qiáng)組成的。 但句子整體的音強(qiáng)并非內(nèi)部音節(jié)音強(qiáng)的簡單加和。 音節(jié)的音強(qiáng)在句子里會(huì)受到句子音強(qiáng)變化模式的制約。 由此可以得到啟示,出于專門目的的實(shí)驗(yàn)句不宜太長,否則難以擺脫句子音強(qiáng)變化模式的影響。
雖然句類也會(huì)對(duì)句子音強(qiáng)的變化模式產(chǎn)生一定的影響,但目前研究漢語口語中各句類占比情況的成果比較少見。 因此,本文統(tǒng)計(jì)了文獻(xiàn)[19-21]研究中的語料數(shù)目。 這些語料都是短視頻、廣告、口語教材中的語料,可以作為漢語日常使用句類占比的參考。 統(tǒng)計(jì)結(jié)果顯示,陳述句占45.2%,疑問句占13.6%,感嘆句占23.3%,祈使句占18%。 兩相對(duì)比,本文中陳述句、感嘆句和祈使句的占比偏少,疑問句的占比偏高。 在SCS 語料中,陳述句、疑問句、感嘆句和祈使句的占比分別為40%、38%、11%和11%,這個(gè)比例大致接近漢語日常使用的比例,基本滿足本文探求句子音強(qiáng)普遍變化模式的條件。 此外,文獻(xiàn)[11]的研究表明,音強(qiáng)受生理因素的影響,句子音強(qiáng)以詞為界遞減,但疑問句的音強(qiáng)整體大于陳述句,且句末音強(qiáng)有回升趨勢。 本文中疑問句的占比偏高,可能會(huì)對(duì)研究結(jié)果產(chǎn)生一定的影響。 但應(yīng)該看到,在DBS 語料中有91%以上是陳述句,然而不論是句中的下降率、回升率,還是二次函數(shù)的擬合優(yōu)度都要比SCS 語料更高。 由此,疑問句音強(qiáng)有句末回升趨勢未能影響本文對(duì)句子音強(qiáng)的分析結(jié)果,其他句類的音強(qiáng)也有句末回升趨勢。 如要進(jìn)一步明確句類對(duì)句子音強(qiáng)模式的影響,仍需做進(jìn)一步的研究。 文獻(xiàn)[23-24]的研究表明,不同情感在句子的音強(qiáng)模式上也有不同的表現(xiàn)。 由于本文語料在實(shí)驗(yàn)室中錄制,發(fā)音人發(fā)音時(shí)情感穩(wěn)定,因此未做情感方面的分析。
本文旨在探究漢語普通話句子音強(qiáng)變化的普遍模式。 通過分析較小樣本的SCS 語料與較大樣本的DBS 語料看到,普通話句子音強(qiáng)曲線呈雙峰“M”形,音強(qiáng)最高點(diǎn)通常出現(xiàn)在句子長度的前20%,音強(qiáng)的次高點(diǎn)通常出現(xiàn)在80%~100%,音強(qiáng)在40%~60%階段上下波動(dòng),具有穩(wěn)態(tài)特征,而20%~40%和60%~80%段通常是音強(qiáng)的下降段和回升段。 通過計(jì)算句中音強(qiáng)的下降率和回升率看到,10 位發(fā)音人之間具有一定的個(gè)體差異,但下降速度總是大于回升速度。 此外,二次函數(shù)能夠較好地對(duì)句子音強(qiáng)變化模式進(jìn)行擬合,且樣本量越大擬合優(yōu)度越好。 至于句末音強(qiáng)回升的原因,可以從話語中的呼吸特征以及漢語句子自然焦點(diǎn)的后置等方面得到一定的解釋,但深層次的原因還有待進(jìn)一步研究。