毛佩文
摘要:為了探究性別差異對(duì)漢語情緒語音韻律特征產(chǎn)生的影響,本研究采用角色扮演的誘導(dǎo)式方法,設(shè)計(jì)并采集了含有高興、憤怒、悲傷、驚奇四種基本情緒的語音語料,分析它們的時(shí)長、基頻曲線的特征,并通過不同性別的同種情緒語音信號(hào)對(duì)比,得到漢語情緒語音韻律特征分布變化規(guī)律,在此基礎(chǔ)上發(fā)現(xiàn)了女性話語所包含的情緒較男性更易被感知的原因:(1)男性情緒語音中的無聲部分,削減了語音的連續(xù)性并且增加了情緒的時(shí)長,導(dǎo)致識(shí)別率降低;(2)女性的情緒基頻值總體上高于男性;(3)女性基頻的變化率高于男性。情緒語音具有如下傾向:基頻的變化越明顯,變化率越高,情緒的表現(xiàn)力越強(qiáng);(4)女性的基頻最高值位置較前。
關(guān)鍵詞:情緒語音 性別差異 時(shí)長 基頻曲線 Praat語音學(xué)軟
緒論
說話人性別識(shí)別是當(dāng)前語音識(shí)別領(lǐng)域一個(gè)非常重要的課題,目前在限定條件下以基音為判別標(biāo)準(zhǔn)的說話人性別識(shí)別已經(jīng)可以獲得較為滿意的效果,但與實(shí)際的應(yīng)用要求還有一定的差距。在目前的使用環(huán)境中,說話人情緒是造成這種差距的主要因素之一。同時(shí),我們發(fā)現(xiàn),在面向不同情緒語音的說話人性別識(shí)別時(shí),女聲的識(shí)別率普遍高于男聲。在日常對(duì)話中,女性話語所傳達(dá)的情緒也更易被感知。
本研究將對(duì)不同性別的同種情緒語音信號(hào)對(duì)比,以期獲得:(1)不同性別的漢語情緒語音韻律特征(時(shí)長、基頻)分布變化情況;(2)女性話語所包含的情緒較男性更易被感知的原因。
1.研究綜述
1.1情感、情緒與態(tài)度
人們?cè)谘哉Z交際中表現(xiàn)出的情感,包含了對(duì)外部信息認(rèn)知加工的兩個(gè)不同層面(Auberge & Gestalt,2002):一是不自主控制的情感,即“情緒”;二是自主控制的情感,即態(tài)度。我們認(rèn)為,情緒和態(tài)度是兩種截然不同的心理狀態(tài)。情緒與生俱來,是對(duì)外部刺激的本能反應(yīng);而態(tài)度與語言、文化有非常密切的聯(lián)系,在不同的社會(huì)文化環(huán)境中會(huì)表現(xiàn)出一定的差異,某些態(tài)度的表達(dá)方式需要后天的學(xué)習(xí)。
本研究只考察漢語情緒語音韻律特征分布變化規(guī)律。
1.2兩類主流情緒描述模型
情緒的描述有多種方法,大致可分為離散和連續(xù)兩種形式。
前者將情緒描述為離散的、形容詞標(biāo)簽的形式,如高興、悲傷等,在人們的日常交流過程中被廣泛使用,同時(shí)還被普遍運(yùn)用于早期的情緒相關(guān)研究中。
后者是做連續(xù)的描述。這種觀點(diǎn)認(rèn)為,情緒的描述不應(yīng)局限于那些典型的基本情緒,還需考慮更精細(xì)的連續(xù)性變化。于是,往往在一個(gè)二維或三維的連續(xù)空間上描寫情緒。
我們以表格的形式對(duì)兩種情緒描述模型之間的區(qū)別進(jìn)行了總結(jié)和展示,見表1-1。
一般認(rèn)為,那些能夠跨越不同人類文化,甚至能夠?yàn)槿祟惡途哂猩鐣?huì)性的哺乳動(dòng)物所共有的情緒類別為基本情緒?!盎厩榫w”的說法屬于離散情緒描述模型,表1-2列舉了不同學(xué)者對(duì)基本情緒的定義和劃分。
在表1-2中,“高興”(happiness,joy,pleasure等)出現(xiàn)次數(shù)最多,為11次;其后分別為憤怒、悲傷、恐懼。同時(shí),這四種基本情緒的頻次明顯高于其他情緒。因此,我們認(rèn)為一共有四種基本情緒,即高興、憤怒、悲傷、恐懼。
1.3小結(jié)
綜上所述,本文仍然沿用傳統(tǒng)的離散情緒描述模型,研究基本情緒??紤]到“恐懼”在現(xiàn)實(shí)生活中出現(xiàn)頻率很低、在語音對(duì)話系統(tǒng)中很少需要,而且相比而言最難在實(shí)驗(yàn)中誘導(dǎo),所以我們的研究沒有包括“恐懼”,而代之以“驚奇”。于是,我們的研究對(duì)象為以下四種基本情緒:高興、憤怒、悲傷、驚奇。
2.實(shí)驗(yàn)方案
2.1情緒語料設(shè)計(jì)
2.1.1設(shè)計(jì)思想
從國內(nèi)外研究文獻(xiàn)來看,設(shè)計(jì)和采集情緒語音的方法??梢苑譃槿悺0凑鎸?shí)性和自然度由低到高(可控性則由高到低)的順序,依次為:
(1)簡單模仿式(模仿語料):不設(shè)計(jì)語境,由被試簡單模仿,一般選取較專業(yè)的被試;
(2)場(chǎng)景誘導(dǎo)式(誘導(dǎo)語料):設(shè)計(jì)一定語境,在角色扮演中誘導(dǎo)出被試的情緒:
(3)完全自發(fā)式(自發(fā)語料):在真實(shí)情景下的情緒表達(dá)。
我們認(rèn)為模仿式語料的語義與情緒之間缺乏內(nèi)在關(guān)聯(lián),錄音時(shí)難以保證情緒到位,且尋找符合要求的被試難度較大,因此未采用簡單模仿式方法。
從真實(shí)性和自然度考慮,最好當(dāng)然是自發(fā)式語料。但這類語料的采集和后續(xù)處NT作量巨大,而且在自發(fā)話語中變化因素太多。即使僅考慮情緒因素,也很可能是多種情緒的混合,不適合直接用于對(duì)比研究。
綜合考慮語料自然度、實(shí)驗(yàn)可控性和數(shù)據(jù)處理等多個(gè)因素,我們決定采用角色扮演的誘導(dǎo)式方法。
2.1.2設(shè)計(jì)原則
在正式設(shè)計(jì)語料前,我們先確立了以下的目標(biāo)句設(shè)計(jì)原則:
(1)單句,長度適中:6-11個(gè)音節(jié);
(2)句焦點(diǎn):①今天星期四;②今天星期四;
(3)句類:陳述句、疑問句、祈使句、感嘆句;
(4)聲調(diào):句尾字的聲調(diào)和句調(diào)的交互作用;
①句類相同:以陳述句為例
今天星期五。句尾字“五”降升調(diào),整句為升調(diào)
今天星期一。句尾字“一”高平調(diào),整句為降調(diào)
②句尾字的聲調(diào)相同:以中升調(diào)為例
今天正月初十。陳述句,整句為升調(diào)
今天正月初十?疑問句。整句升調(diào)更明顯
(5)不含性別暗示詞語:男朋友、女朋友等;
(6)字面上沒有明顯的情緒傾向;
(7)情緒可塑性大,而且語義自然;
(8)構(gòu)成一個(gè)獨(dú)立的話輪,保證情緒全部落在目標(biāo)句上。
2.2情緒語音采集
我們按照2.1.2節(jié)中的設(shè)計(jì)原則設(shè)計(jì)目標(biāo)句。對(duì)每一個(gè)目標(biāo)句,設(shè)計(jì)四段不同的對(duì)話腳本,分別誘導(dǎo)出高興、憤怒、悲傷、驚奇這四種基本情緒。我們最終確定了8個(gè)目標(biāo)句,每段對(duì)話含有2-5個(gè)話輪。下面以目標(biāo)句“真沒想到你會(huì)這樣”為例,列出四種情緒下的對(duì)話腳本。
(1)高興:
B:你好像和以前不一樣了,知道關(guān)心人了。
A:是啊,以前我挺自私的,現(xiàn)在學(xué)會(huì)為別人考慮了。
B:真沒想到你會(huì)這樣!
(2)憤怒:
A:你怎么了?這么生氣!
B:你是不是打小明了?
A:那家伙太煩了,打他又怎么樣!
B:真沒想到你會(huì)這樣!
(3)悲傷:
A:你叫我來有什么事嗎?
B:就在這兒,你說過你會(huì)一直陪著我。
A:我已經(jīng)不記得了。
B:真沒想到你會(huì)這樣!
(4)驚奇:
A:這個(gè)月我天天去酒吧!
B:真的假的?
A:當(dāng)然啦,我也要好好享受生活了!
B:真沒想到你會(huì)這樣!
實(shí)驗(yàn)被試者為南京師范大學(xué)漢語言專業(yè)的一名女生和一名男生。在兩名被試熟悉腳本內(nèi)容并模擬對(duì)話以后,進(jìn)入專業(yè)錄音棚(科奧克聲學(xué)錄音室)內(nèi)錄音,輪流扮演目標(biāo)句發(fā)出者B。錄音設(shè)備為手持式數(shù)碼錄音機(jī)(Handy Recorder),錄音采樣率取44100Hz。錄制對(duì)話時(shí),目標(biāo)句以外的內(nèi)容可以輕微改變,但目標(biāo)句必須與腳本一致。為保證語料質(zhì)量和情緒連續(xù)性,同類情緒的對(duì)話安排在同一時(shí)間段連續(xù)錄制,每種情緒錄制之間有休息時(shí)間。最后,我們得到男女各32個(gè)樣本。
2.3語音信號(hào)切分
為了提取樣本中的目標(biāo)句,我們需要使用Adobe Audi-tion聲音處理軟件進(jìn)行語音信號(hào)的切分。并將切分后僅含有目標(biāo)句的音頻保存為Praat軟件可讀取的,wav格式。圖2-1是Adobe Audition聲音處理軟件的工作界面。
2.4語音韻律特征的提取
2.4.1時(shí)長提取
我們通過Praat軟件提取不同性別的同一情緒目標(biāo)句的持續(xù)時(shí)間,對(duì)由性別引起的持續(xù)時(shí)間的變化進(jìn)行分析和比較。本文計(jì)算出每一情緒語句從開始到結(jié)束的持續(xù)時(shí)間,這一時(shí)間包括句中的無聲部分。因?yàn)闊o聲部分本身對(duì)情緒是有貢獻(xiàn)的。
2.4.2基頻曲線提取
基頻是反映情緒信息的重要特征之一。而且通常情況下男女兩性的聲音的基頻有著比較明顯的區(qū)別。通過Praat軟件提取目標(biāo)句的基頻值。然后手工檢查并做必要的修正。其后,對(duì)基頻曲線做輕微平滑,最終得到全句連續(xù)的基頻曲線。
3.實(shí)驗(yàn)結(jié)果
3.1時(shí)長分析
由圖3-1可以看出,對(duì)于一個(gè)8音節(jié)的目標(biāo)句而言:(1)四種基本情緒的時(shí)長都在1300ms到1850ms之間,差別不明顯:(2)男性四種基本情緒的時(shí)長都高于女性;(3)對(duì)于男性而言,悲傷的時(shí)長最高,而后分別是高興、憤怒、驚奇;(4)對(duì)于女性而言,高興的時(shí)長最高,而后分別是驚奇、悲傷、憤怒;(5)相對(duì)于男性而言,女性發(fā)音時(shí)長受情緒因素影響的變化不明顯;(6)悲傷的時(shí)長受性別因素影響的變化最顯著,而后分別是高興、憤怒、驚奇。
我們認(rèn)為。除了性別間語速的差異。男性在生活中更傾向于使用停頓來表達(dá)情緒,因此男性的情緒語音中包含的無聲部分明顯多于女性。因?yàn)闊o聲部分本身對(duì)情緒是有貢獻(xiàn)的,因此我們?cè)谔崛r(shí)長的過程中并未刪除無聲部分,這就導(dǎo)致男性四種基本情緒的時(shí)長都高于女性。于是,我們大膽推斷。正是由于男性情緒語音中所包含的無聲部分,削減了語音的連續(xù)性并且增加了情緒的時(shí)長。導(dǎo)致男性情緒的識(shí)別率降低。
3.2基頻曲線分析
圖3-2、圖3-3、圖3-4、圖3-5展示了四種基本情緒各自在不同性別基礎(chǔ)上的基頻曲線(以目標(biāo)句“真沒想到你會(huì)這樣”為例),其中時(shí)間未做歸一化處理。
綜合分析上述4張圖。我們可以發(fā)現(xiàn):
(1)①無論男女,四種基本情緒的基頻曲線都很清楚地聚為兩組:一組是憤怒和驚奇,另一組是高興和悲傷。前一組的基頻值總體上明顯比后一組高;②男女對(duì)比,女性的四種基本情緒基頻值總體上高于男性:
(2)①無論男女,驚奇狀態(tài)的音高范圍最寬,一方面全句基頻最高值通常較其他情緒高,另一方面全句基頻最低值在基頻值總體較高的兩種情緒中也較憤怒為低。與其他情緒形成對(duì)照的是,驚奇總是在某個(gè)音節(jié)上拉高基頻值到全句的最高值;②男女對(duì)比,男性的基頻最高值總是高于女性。而且晚于女性出現(xiàn):
(3)無論男女,悲傷的基頻值最低,范圍也最窄(基頻曲線最為平坦):
(4)男女對(duì)比,四種基本情緒中男性的基頻曲線較女性更為平坦:
(5)男女對(duì)比,男性的基頻變化范圍較女性更大,但變化率則低于女性:
除了以上發(fā)現(xiàn)外,我們進(jìn)一步考察了語調(diào)。在四種基本情緒中,除了憤怒,其他情緒的基頻曲線都有一定的下傾趨勢(shì),語調(diào)下傾的幅度呈現(xiàn)以下順序:驚奇>高興>悲傷。這也表明:積極情緒>消極情緒。
字調(diào)和語調(diào)在當(dāng)前階段是密不可分的兩個(gè)概念,因此我們也對(duì)尾字調(diào)進(jìn)行了考察。我們可以發(fā)現(xiàn):(1)無論男女,憤怒和悲傷(消極情緒)目標(biāo)句的尾字調(diào)呈上升趨勢(shì),驚奇和高興(積極情緒)目標(biāo)句的尾字調(diào)呈下傾趨勢(shì);(2)男女對(duì)比,男性的目標(biāo)句尾字調(diào)上升趨勢(shì)和下傾趨勢(shì)較女性都更為明顯。
于是,我們認(rèn)為,女性話語所包含的情緒更容易被感知的原因在于:
(1)基頻值:由于聲帶構(gòu)造的差別,女性的情緒基頻值總體上高于男性,而人類更易感知基頻值較高的話語中的情緒:
(2)基頻的變化率:男性的基頻曲線較女性更為平坦,女性基頻的變化率高于男性。我們認(rèn)為,情緒語音具有如下傾向:基頻的變化越明顯,變化率越高,情緒的表現(xiàn)力越強(qiáng),也更易被感知:
(3)基頻最高值的位置:在四種基本情緒的基頻曲線上,雖然男女的基頻最高值都出現(xiàn)在目標(biāo)句中后段,但女性的基頻最高值總是先于男性出現(xiàn)。我們認(rèn)為,基頻最高值位置較前也是導(dǎo)致女性的情緒更易被感知的原因。
4.結(jié)語
4.1研究結(jié)論
本研究考察了基于性別差異的漢語情緒語音韻律特征分布變化情況。我們采用角色扮演的誘導(dǎo)式方法,設(shè)計(jì)并采集了含有高興、憤怒、悲傷、驚奇四種基本情緒的語音語料,分析它們的時(shí)長、基頻曲線的特征,并通過不同性別的同種情緒語音信號(hào)對(duì)比,發(fā)現(xiàn)了女性話語所包含的情緒較男性更易被感知的原因:
(1)無聲部分:除語速因素外,由于男性情緒語音中所包含的無聲部分,削減了語音的連續(xù)性并且增加了情緒的時(shí)長,導(dǎo)致男性情緒的識(shí)別率降低;
(2)基頻值:由于聲帶構(gòu)造的差別,女性的情緒基頻值總體上高于男性,而人類更易感知基頻值較高的話語中的情緒:
(3)基頻的變化率:男性的基頻曲線較女性更為平坦,女性基頻的變化率高于男性。我們認(rèn)為,情緒語音具有如下傾向:基頻的變化越明顯,變化率越高,情緒的表現(xiàn)力越強(qiáng),也更易被感知:
(4)基頻最高值的位置:在四種基本情緒的基頻曲線上,雖然男女的基頻最高值都出現(xiàn)在目標(biāo)句中后段,但女性的基頻最高值總是先于男性出現(xiàn)。我們認(rèn)為,基頻最高值位置較前也是導(dǎo)致女性的情緒更易被感知的原因。
4.2研究展望
本研究存在一些不足,有待日后進(jìn)一步彌補(bǔ)和探索。
(1)增加樣本量。由于對(duì)情緒的理解還停留在淺層,我們無法設(shè)計(jì)出大量符合要求的對(duì)話腳本。導(dǎo)致本研究樣本數(shù)量過少,對(duì)數(shù)據(jù)分析的準(zhǔn)確性有一定的影響。希望日后能對(duì)情緒有進(jìn)一步研究,設(shè)計(jì)出更多理想的目標(biāo)句。
(2)增加被試量。本研究的被試僅為南京師范大學(xué)漢語言專業(yè)的一名女生和一名男生,數(shù)量少且不具有代表性。希望日后能增加被試量,選取不同年齡段的被試進(jìn)行深入研究。
(3)改善情緒誘導(dǎo)方法。雖然本研究采用的角色扮演誘導(dǎo)式方法優(yōu)于簡單模仿式,但未能保證目標(biāo)句上有飽滿的情緒表達(dá),且銜接不自然。導(dǎo)致四種基本情緒的數(shù)據(jù)差別不明顯。希望日后有機(jī)會(huì)使用真實(shí)性和自然度都更高的自發(fā)式語料進(jìn)行深入研究。
(4)增加聲學(xué)參數(shù)。本研究僅對(duì)語音語料進(jìn)行了時(shí)長和基頻曲線的特征分析,希望日后能增加對(duì)共振峰、頻譜、能量等參數(shù)的提取和分析,以獲得全面的數(shù)據(jù)。