Reclus Florence(孫鄉(xiāng)),楊學(xué)智,李海燕,朱慶文,牛 欣
(北京中醫(yī)藥大學(xué)基礎(chǔ)醫(yī)學(xué)院,北京 100029)
在高級(jí)動(dòng)物中,嗓音是一個(gè)很好的生理和心理信號(hào),可以辨別個(gè)體差異。人類的研究證明,語音音高與年齡、性別、體積[1]、激素變化、情緒等相關(guān)。中醫(yī)的聞診研究主要集中在各種疾病或證候所導(dǎo)致的異常語言及聲音,而在體質(zhì)方面著重研究的是《黃帝內(nèi)經(jīng)·靈樞》中的陰陽二十五人對(duì)應(yīng)的二十五音[2]。本研究探索了多種語音特征與現(xiàn)代中醫(yī)9種體質(zhì)的相關(guān)性。
古代音樂學(xué)按照“三分損益法”[3]所生成的五音“宮徵商羽角”在中醫(yī)學(xué)中分別與五行“土火金水木”和人體的五臟“脾心肺腎肝”相對(duì)應(yīng),用于疾病的診斷與治療。但五音的內(nèi)涵遠(yuǎn)遠(yuǎn)超出我們限制于5個(gè)音高的理解,包括了音色與語調(diào)的動(dòng)態(tài)情況,以及在心理層次上所產(chǎn)生的或?qū)?yīng)的情緒[4]。因此,我們提出了用聲學(xué)技術(shù)對(duì)語音進(jìn)行多種特征的研究思路。
我國目前最常用的現(xiàn)代體質(zhì)分類法是9種體質(zhì)[5](即平和質(zhì)、陰虛質(zhì)、陽虛質(zhì)、痰濕質(zhì)、濕熱質(zhì)、氣虛質(zhì)、瘀血質(zhì)、氣郁質(zhì)、特稟質(zhì))。其中只有氣虛體質(zhì)有明確的語音特征(“語音低弱,短氣懶言”),其他體質(zhì)只有一些能體現(xiàn)在語音上的人格或行為特點(diǎn)。
自然表達(dá)雖是“理想”的錄音內(nèi)容,但在實(shí)驗(yàn)條件或今后高度自動(dòng)化的診斷程序中比較難得且并不規(guī)范。況且“不自然”的錄音內(nèi)容也能提供豐富的信息。于是,我們的研究分析了多種錄音內(nèi)容所提供的語音參數(shù)。不同內(nèi)容各有利弊,部分內(nèi)容的優(yōu)點(diǎn)與缺陷簡(jiǎn)列入表格1。
表1 錄音內(nèi)容比較
基于上述考慮,我們利用現(xiàn)代聲學(xué)技術(shù)[4]和中醫(yī)辨證體質(zhì)分類(9種體質(zhì))研究了成人語音特征與體質(zhì)的相關(guān)性,并建立了回歸模型。
18歲~38歲的40位女性和10位男性,受試者皆以普通話為母語或常用語,均為健康或亞健康狀態(tài)的北京中醫(yī)藥大學(xué)學(xué)生,平均年齡23歲。
軀體或心理病變、聽覺障礙、語言障礙、語音障礙患者,鼻子有(或有過)骨折或手術(shù),外感病或其他影響語音疾病,患咽喉疾病或咽喉做過手術(shù)者,妊娠婦女,1周吸煙超過1包,受試日有特殊語音或其他疲勞或不適,情緒激動(dòng)或精神創(chuàng)傷,飲酒過度,服激素類或抗膽堿類藥物、服大量熱性或燥性中藥等。
實(shí)驗(yàn)在安靜的室內(nèi)進(jìn)行(噪音小于40dB),測(cè)試人員先把話筒掛在受試者的脖子上讓受試者習(xí)慣并能盡量忽視設(shè)備(話筒在嘴的斜下方,45度角,距離5cm),測(cè)試人員距離被測(cè)試者1.5m~2m與他聊天,請(qǐng)他取舒適站立體態(tài),待他情緒穩(wěn)定、呼吸均勻且能夠達(dá)到自然發(fā)聲。
數(shù)據(jù)采納方法為:測(cè)試人員用電容性全方位全譜話筒 Superlux ECM999,連在外接聲卡 M-audio 610和筆記本電腦,采取了16bit的精度及44.1kHz抽樣頻率的數(shù)碼錄音,并用聲圖分析軟件 Praat 4.2.07[6]獲得了特征參數(shù)。
錄音內(nèi)容:發(fā)出最舒服的 a(?。踑])音,連續(xù)做3次,隔10min再做1次;用440Hz的固定唱名A=la音高發(fā)出a:(啊)音 ;發(fā)出1個(gè)最舒服有持續(xù)最長(zhǎng)的a(啊)音,連續(xù)做2次取最佳;發(fā)普通話四聲 a(啊)ā á ǎ à;從 1 數(shù)到 10;定音域:從舒適音發(fā)到最高音,再從舒適音發(fā)到最低音,朗讀一小段故事,回答2個(gè)問題。
所取參數(shù):通過 Praat軟件獲得的客觀語音參數(shù)如下[7]。
表2 本研究所利用的語音聲學(xué)參數(shù)
測(cè)試人員通過9種體質(zhì)量表獲得了受試者的中醫(yī)體質(zhì)參數(shù)。
然后利用SPSS17統(tǒng)計(jì)軟件分析語音特征和體質(zhì)特征、體質(zhì)參數(shù)和語音參數(shù)的單獨(dú)相關(guān)性、最后用R統(tǒng)計(jì)軟件進(jìn)行回歸研究。
所用錄音方法被所有受試者接受,錄音設(shè)備、分析軟件能夠提供64個(gè)語音參數(shù)。
3.2.1 語音特征 我們?yōu)槊恳活悈?shù)都做了描述性統(tǒng)計(jì)分析,并研究了男女差異和女性受試者的長(zhǎng)幼差異(幼組為18歲~24歲的本科生,長(zhǎng)組為25歲 ~38歲的研究生),表3只提供[a]音的基本參數(shù),關(guān)于其他變量詳情請(qǐng)見2012年本作者的同名博士論文。音基本參數(shù)
表3 [a]
3.2.2 體質(zhì)特征 在本實(shí)驗(yàn)的49位受試者中(1位女性受試者的臨床信息不符合問卷所得的“平和體質(zhì)”,所以其數(shù)據(jù)沒有被納入結(jié)果分析),11位的問卷結(jié)果屬絕對(duì)平和體質(zhì)(平和分?jǐn)?shù)高于60且其他體質(zhì)偏頗分?jǐn)?shù)低于30),5位屬幾乎平和體質(zhì)(平和分?jǐn)?shù)高于60而有1個(gè)不超于39分的體質(zhì)偏頗趨向),共16位平和體質(zhì),占總受試者的32%,符合研究年齡段的體質(zhì)分部。有體質(zhì)偏頗(平和分?jǐn)?shù)不足60分并有1個(gè)超于40分的體質(zhì)偏頗趨向)的人數(shù)與比例列在表格4。
表4 受試者的體質(zhì)偏頗分布
陰虛體質(zhì)的比例偏高可能是因?yàn)樗惺茉囌叨际悄贻p學(xué)生,生活方式容易導(dǎo)致陰虛。超過60分的比例(12.1%)的比較小,說明受試群體總體不處于病態(tài)。
很多語音參數(shù)都各自與體質(zhì)參數(shù)有關(guān)系性,大體符合中醫(yī)體質(zhì)理論,在男女、長(zhǎng)(25~38歲)幼(18~24歲)有別。在此提供39位女性的語音參數(shù)和個(gè)體質(zhì)參數(shù)的相關(guān)性研究結(jié)果:(1)平和參數(shù)越高:持續(xù)a音的能量付出越小(r(37)=-0.342*,p=0.033),音域越窄(r(37)= -0.358*,p=0.032),朗讀速度越快(r(37)=0.370*,p=0.021),朗讀音高標(biāo)準(zhǔn)差越小(r(37)=-0.386*,p=0.015);(2)氣虛參數(shù)越高:第2個(gè)持續(xù) a音的音長(zhǎng)越長(zhǎng)(r(31)=0.381*,p=0.029),朗讀音高標(biāo)準(zhǔn)差越大,接近顯著性(r(37)=0.315,p=0.051)在幼者顯著(r(26)=0.543**,p=0.003),朗讀語速越慢(r(37)=-.456**,p=0.004);(3)陽虛參數(shù)越高:音域越廣(r(37)=0.368*,p=0.027),朗讀音高標(biāo)準(zhǔn)差越大(r(37)=0.468**,p=0.003),朗讀語速越慢,接近顯著性(r(37)= -0.310,p=0.054),在 長(zhǎng) 者 顯 著(r(9)= - 0.768**,p=0.006);(4)陰虛參數(shù)越高,i的第3共振峰越高(r(31)=0.375*,p=0.031),持續(xù) a音音高越低(r(37)=-0.355*,p=0.026),朗讀音高標(biāo)準(zhǔn)差越大(r(37)=0.345*,p=0.031),回答的音強(qiáng)越大(r(31)=0.319*,p=0.048);(5)痰濕參數(shù)越高:a音共振峰平均值(r(37)=0.393*,p=0.013)和 a音第 3 共振峰(r(37)=0.371**,p=0.02)越高,朗讀音高標(biāo)準(zhǔn)差越大(r(37)=0.521**,p=0.001),朗讀語速越慢(r(37)=0-.320*,p=0.047);(6)濕熱參數(shù)越高:i音的第3共振峰越高(r(37)=0.418*,p=0.015),朗讀音強(qiáng)微擾越多(r(37)=0.316*,p=0.05),回答音強(qiáng)越大(r(37)=0.332*,p=0.039);(7)血瘀參數(shù)越高:i音第3共振峰越高(r(37)=492**,p=0.004),朗讀音高標(biāo)準(zhǔn)差越大(r(37)=0.369*,p=0.021),朗讀語斷越多(r(37)=0.416**,p=0.008);(8)氣郁參數(shù)越高:音域越寬(r(37)=0.368*,p=0.027),朗讀音高標(biāo)準(zhǔn)差越大(r(37)=0.371*,p=0.02),朗讀語速越慢(r(37)=-0.319*,p=0.047);(9)特稟參數(shù)在整體女組里沒有顯著的相關(guān)性。因?yàn)檎Z音參數(shù)有內(nèi)部相關(guān)性,所以簡(jiǎn)單的相關(guān)性研究不足以建立預(yù)測(cè)模型。
在探討語音特征和體質(zhì)參數(shù)的相關(guān)性過程中,我們看到體質(zhì)參數(shù)之間和語音參數(shù)之間本身皆存在相關(guān)性,所以我們根據(jù)方差分析(analysis of variance,ANOVA)和 Akaike information criterion(AIC)①Akaike,Hirotugu(1974).A new look at the statistical model identification.IEEE Transactions on Automatic Control 19(6):716-723.準(zhǔn)則對(duì)變量進(jìn)行逐步回歸,以便挑選出統(tǒng)計(jì)上相對(duì)獨(dú)立并有顯著貢獻(xiàn)的語音參數(shù)作為解釋變量。我們發(fā)現(xiàn),通過34個(gè)語音參數(shù)的線性回歸能夠非常好的建立模型,預(yù)測(cè)39位女性受試者的體質(zhì)參數(shù):測(cè)定系數(shù)R2很高,模型 p值分很低。平和:R-squared=0.8114,p=0.022;氣虛:R-squared=0.9506,p=0.004;陽虛:R-squared=0.9082,p=0.0017;陰虛:R-squared=0.9239,p=0.0016;痰濕:R-squared=0.9032,p=0.0248;濕熱:R-squared=0.9922,p=0.0003;血瘀:R-squared=0.9399,p=0.0013;氣郁:R-squared=0.9606,p=0.0016;特稟:R-squared=0.9121,p=0.0002。34個(gè)獨(dú)立語音參數(shù)主要來自于 a音、持續(xù) a音、四聲、朗讀、回答5個(gè)錄音內(nèi)容,其中11個(gè)在5種體質(zhì)參數(shù)以上的預(yù)測(cè)有顯著性,如平均 a音音高、平均 a音音強(qiáng)、平均 a音音強(qiáng)微擾、a音音強(qiáng)標(biāo)準(zhǔn)差、朗讀平均音高、朗讀音高標(biāo)準(zhǔn)差、朗讀最低音高回答平均音高、回答最高音高、回答音高微擾、回答音強(qiáng)微擾和回答語速。
本實(shí)驗(yàn)樣本量較小、來源單一、缺乏代表性,所以回歸模型的有效性限于研究對(duì)象人群。如欲進(jìn)一步深入研究,則需要通過更有代表性的大樣本實(shí)驗(yàn)來修改和擴(kuò)展模型。
研究的相關(guān)性結(jié)果提示我們,體質(zhì)偏頗雖然與一些證候同名,但性質(zhì)、癥狀和嚴(yán)重程度與病態(tài)有差異,語音表現(xiàn)也有所不同。根據(jù)回歸的結(jié)果、語音特征與體質(zhì)的關(guān)系部分符合9種體質(zhì)理論。(1)平和與非平和:多種語音參數(shù)在平和與非平和參數(shù)里的回歸影響是相反的,符合邏輯;(2)音高:平和參數(shù)越高,3個(gè)a音音高平均值、第2a音的第2和第4共振峰越低,第2a音的基礎(chǔ)頻率越高。朗讀最低音高越低,朗讀音高標(biāo)準(zhǔn)差越低,與非平和相反;(3)音強(qiáng)的前后變化:平和參數(shù)越高,3個(gè)a音的音強(qiáng)標(biāo)準(zhǔn)差越高;(4)語速和連貫性:平和參數(shù)越高,回答語速越慢,語斷越少,與非平和相反;(5)微擾與波動(dòng)性:平和參數(shù)越高,回答音高微擾越多(朗讀也有同樣趨向),音強(qiáng)微擾越少;(6)與高平和參數(shù)相應(yīng)的語音特征符合“身體健康,性格隨和開朗”:發(fā) a音自然(音高較低),需要重復(fù)時(shí)認(rèn)真(音高略有提高),朗讀也比較自然,允許自己發(fā)出較低音,但情緒穩(wěn)定,語調(diào)較平。平和參數(shù)高時(shí),錄音過程開始發(fā)的2個(gè)a音和最后發(fā)出的a音的音強(qiáng)有差異(發(fā)音比較靈活),表達(dá)從容連貫,音高微擾多表現(xiàn)聲帶不緊張、彈性好,音強(qiáng)微擾少表示氣流穩(wěn)定。
氣虛參數(shù)越高,a音音高平均值、朗讀音高標(biāo)準(zhǔn)差、朗讀最低音高、朗讀最高音高越高,平均a音音強(qiáng)和a音音強(qiáng)標(biāo)準(zhǔn)差越低,回答語速越快,回答音高微擾越少,回答音強(qiáng)微擾越多。氣虛體質(zhì)參數(shù)高時(shí),語音偏高,朗讀音高幅度大,音強(qiáng)及其變化幅度不大但并不穩(wěn)定,音高的自然波動(dòng)少,持續(xù)a音更長(zhǎng),音強(qiáng)大。語調(diào)幅度大、付出能量多,看似缺乏內(nèi)斂,可能是導(dǎo)致氣虛的行為原因之一。這些特征不完全符合“喜靜懶言,語音低弱,氣短、容易疲乏”,體質(zhì)偏頗嚴(yán)重或有明顯氣虛癥狀時(shí)可能才會(huì)充分符合中醫(yī)體質(zhì)理論。
陽虛參數(shù)和多個(gè)語音內(nèi)容的音高和音強(qiáng)都是反性的,但與自然回答的音高和音強(qiáng)、持續(xù)a音的音長(zhǎng)是正性的,所以也不完全符合“性格多沉靜、內(nèi)向”,部分表現(xiàn)與氣虛相似,可能也屬導(dǎo)致陽虛的行為因素。
回答語速快,音斷多,部分符合“外向好動(dòng)、活潑”。
多種相關(guān)性,難以評(píng)價(jià)是否符合“性格偏溫和、穩(wěn)重”。
大體與音高、音強(qiáng)、語速皆有正性相關(guān)性,符合實(shí)證的“容易心煩急躁”。
與自然回答的語速和語斷的正性相關(guān)性符合“易煩”的特征。
與音調(diào)幅度、語速和語段的正性相關(guān)性大體符合“性格內(nèi)向不穩(wěn)定、敏感多慮”,可理解為包括自身抵御氣郁趨向反映的氣郁癥狀。
用聲學(xué)技術(shù)獲得的客觀語音特征和體質(zhì)參數(shù)的相關(guān)性是豐富而密切的,大體符合中醫(yī)傳統(tǒng)認(rèn)識(shí)和現(xiàn)代知識(shí)。用本研究的語音參數(shù)可以建立比較有效的回歸模型。我們希望能夠用更大的樣本量建立一個(gè)更可靠的、適合不同年齡段、不同社會(huì)背景、不同地域男女的有效模型,并且在這個(gè)基礎(chǔ)上繼續(xù)探索不同人群和不同體質(zhì)的差異性,繼續(xù)研究不同人格、情緒、勞累程度、體征、癥狀、證候與疾病對(duì)語音特征的影響,通過客觀化和量化聞診信息,進(jìn)一步發(fā)揮中醫(yī)四診合參的診治意義,使得中西心身整合醫(yī)學(xué)更好地服務(wù)于人類健康。
[1]Laetitia Bruckert.Women use voice parameters to assess men’s characteristics[J].Proc Biol Sci.,2006 January 7,273(1582):83-89.
[2]高也陶,李捷瑋,潘慧巍,等.五臟相音——《黃帝內(nèi)經(jīng)》失傳2000多年的理論和技術(shù)的現(xiàn)代研究[J].醫(yī)學(xué)與哲學(xué):人文社會(huì)醫(yī)學(xué)版,2006,27(9):51-53.
[3]Van Aalst.chinese music,shanghai 1884.
[4]肖相如,倪青,張靜.中華醫(yī)學(xué)聞診大全[M].太原:山西科學(xué)技術(shù)出版社,1998.
[5]王琦.中醫(yī)體質(zhì)學(xué)[M].北京:人民衛(wèi)生出版社,2005:2.4.15.
[6]Praat 4.2.07 software(P.Boersma and D.Weenink,http://www.praat.org).
[7]Adrian Fourcin著.張家脲譯.嗓音質(zhì)量評(píng)價(jià)與測(cè)量.Journal of Audiology and Speech Pathology,2008,16(4):350.