賈麗文
(中國政法大學(xué) 研究生院,北京100088)
我國從1989年第一起運用語音鑒定的案件至今,聲紋鑒定逐步從單一依靠圖譜比對分析,發(fā)展成綜合運用嗓音音質(zhì)、言語特征和頻譜數(shù)據(jù)的多種定性定量分析,一步步揭開了其神秘面紗,使聲紋鑒定日趨規(guī)范化和標(biāo)準(zhǔn)化。伴隨對語音、語言研究的深入,以及語音處理軟件的升級換代,有的鑒定者在聲紋鑒定中,多依賴于頻譜的分析和數(shù)據(jù)的提取及處理上,卻忽視了鑒定中聽音過程,或減少了聽音次數(shù)。然而,聽音才是聲紋鑒定之王,只有在聽音基礎(chǔ)上的分析和判斷,才能成為聲紋鑒定的正確導(dǎo)向。
目前使用的聲紋鑒定方法,主要是通過語圖儀或語音工作站實現(xiàn)語音聲學(xué)特征比對進(jìn)行鑒定。聲紋鑒定的步驟,主要是“聽-看-測-析”?!奥牎奔绰犚簦翱础保ㄍㄟ^語圖觀察特定音節(jié)的各方面形態(tài)特征)、“測”(對各方面特征參數(shù)的定量檢測)、“析”(綜合分析判斷)都是在“聽”的基礎(chǔ)之上進(jìn)行。
聽音,就是聽辨檢材和樣本的全部語音材料,對有關(guān)方言、語音速度、言語習(xí)慣、鼻音輕重、音高、變音、變調(diào)、節(jié)奏、聲源譜特性(聲音的厚薄、余音的強弱)、清晰度、流暢度、口頭語、贅語、虛詞、言語缺陷(口吃、大舌頭等),以及是否偽裝等進(jìn)行辨別。此外,還要聽辨語義、詞匯、語法及其表達(dá)方式的異同。
聽音是聲紋鑒定的首要步驟,也是聲紋鑒定的必經(jīng)程序,聲紋鑒定離不開聽音這一過程。離開聽音,僅僅依靠對語圖的觀察和特征參數(shù)的測量,將使聲紋鑒定變得沒有方向,會浪費大量的鑒定資源,得出不可靠的鑒定意見。
1.決定了聲紋鑒定的方向。在一段語料中,并不是所有的詞語和音節(jié)都有鑒定價值。聽音是對整體語料的感知,同時也是對特征音節(jié)的篩選,進(jìn)而對語圖分析和參數(shù)測量有了方向和依據(jù)。
2.有助于得出正確的鑒定結(jié)論。不同的軟件和算法的選擇及不同的參數(shù)設(shè)置,會造成“同一”的假象,再使用聽音進(jìn)行判斷和檢查,假象就會露出破綻,避免單一依靠語圖和數(shù)據(jù)帶來的鑒定失誤。
3.有助于彌補現(xiàn)有技術(shù)對語圖和參量數(shù)據(jù)無法反映的語音特征。人類對聲紋鑒定技術(shù)的認(rèn)識仍處在不斷的深化之中,現(xiàn)有的鑒定技術(shù)難免有其系統(tǒng)性的弊端。好在人的聽覺感知系統(tǒng)與生俱來且功能強大,其奧妙之處,就在于人們能感知檢材與樣本是否為同一人所說。
刑事物證鑒定的一般理論,揭示了被鑒定客體具有特定性、穩(wěn)定性和反映性。聲音之所以可進(jìn)行話者的同一認(rèn)定,亦是依賴聲音的特定性、穩(wěn)定性和反映性,其中最主要的是聲音的特定性。聲音的特定性,首先表現(xiàn)在語音產(chǎn)生的生理機制上,即人呼吸器官的生理結(jié)構(gòu)、聲帶的生理結(jié)構(gòu)(包括質(zhì)量、幾何形狀、勁度、周圍肌群等)、聲道的生理結(jié)構(gòu)(包括長度、截面積、機能等);其次表現(xiàn)在話者的言語習(xí)慣定型,即話者言語的社會性,話者處在一定的社會環(huán)境和社會條件下,會形成獨特的言語搭配習(xí)慣和語音表達(dá)習(xí)慣(如:方言)。因此,聲音的特定性不是單一的生理結(jié)構(gòu)特點或是話者的語言習(xí)慣定型決定的,而是二者結(jié)合的結(jié)果,導(dǎo)致聲紋鑒定比指紋鑒定、筆跡鑒定更加復(fù)雜,影響鑒定的因素也更加多樣化。無論是指紋鑒定還是筆跡鑒定,都是直觀的檢材和樣本的比對,而聲音之所以能進(jìn)行比對,是依賴將聲音轉(zhuǎn)化為語圖。然而,不同的軟件所轉(zhuǎn)化的語圖,會因其自身的屬性或參數(shù)設(shè)置的不同而丟失,或者無法反映一些語音信息,使反映語音生理特點的特定性產(chǎn)生偏差。因此,語圖的比對要以聽音為基礎(chǔ),排除聽音以單一語圖比對將會產(chǎn)生錯誤。而對于話者言語習(xí)慣定型的特定性的反映,聽音是最好的選擇。話者是否有地方口音,是否有特殊的詞語搭配習(xí)慣,幾乎一聽便知。
在日常生活中,人們能很輕易地辨別出家人、朋友、同事的聲音,甚至當(dāng)對方在憤怒、哭泣、大聲喊叫、使用方言時,也能很快地辨別出是某人發(fā)出的聲音,而不是他人發(fā)出的聲音。就是很多年沒有交往的朋友,接電話聽到聲音時還能聽辨出對方是誰。甚至對不熟悉的陌生人其少年時和老年期說同樣一段話,人們也能分辨出哪個是其少年時所說,哪個是其老年期所說。這種先天具有的功能,源于人類自身所具備的聽覺系統(tǒng)。人類的聽覺系統(tǒng)既是靈敏的聲音接收系統(tǒng),也是高度的語音綜合分析系統(tǒng)。
人類的聽覺系統(tǒng)對聲音具有很強的解析、綜合和分析判斷能力,聽覺系統(tǒng)的這些能力和特點總稱為聽覺特性。聽覺特性可進(jìn)一步細(xì)分為聲學(xué)感受性和主觀感受性。聲學(xué)感受性可通過各種聲學(xué)參數(shù)(如:頻率)來表述。但是,主觀感受性在聲紋鑒定研究中,要想如聲學(xué)感受性一樣得以量化表示和衡量,還有很長一段路要走。此外,就音質(zhì)和音色而言,人類的聽覺系統(tǒng)具有奇妙的感知能力,人們能夠輕易地區(qū)分不同人的聲音且不混淆,就是聽覺具有差別感受性。也正是聽覺的差別感受性,使聲音鑒定有據(jù)可循,最早的話者識別,就是依靠聽音來完成。因此,聽音在聲紋鑒定中具有其得天獨厚的優(yōu)勢,它是人類的聽覺系統(tǒng)與生俱來的,任何工具不可替代。
人類的生活離不開語言。語言是生理現(xiàn)象、心理現(xiàn)象和社會現(xiàn)象三者的結(jié)合和統(tǒng)一。語音的生理性、心理性和社會性構(gòu)成了語音的特性。言語交流實際上是一系列生理、心理、物理轉(zhuǎn)換的復(fù)雜過程,它可分為發(fā)音、傳遞和感知三個階段。發(fā)音和傳遞在聲紋鑒定過程中是既定的,而感知過程是語音通過聽音者聽覺系統(tǒng)獲得專一信號,這是一個從生理現(xiàn)象到心理現(xiàn)象的轉(zhuǎn)換過程,它具有很強的獨立性。正因如此,依據(jù)同樣一段語圖進(jìn)行聽音,有些人聽后可得出同樣的結(jié)論,有些人聽后則得出不同的結(jié)論。之所以會產(chǎn)生這樣的情況,源于不同的人有不同的感知過程。在這種情況下,不僅要重視語圖和參量數(shù)據(jù),更要加強反復(fù)聽音和多次聽音。理由很簡單:這種差異根本沒有反映在語圖上!正如筆跡鑒定尋找差異點需要反復(fù)比對一樣,聲紋鑒定也需要反復(fù)地聽音來尋找差異點,尤其在聲紋鑒定還沒有成熟化的今天,聽音更不可捨棄。
目前,聲紋鑒定主要使用語音學(xué)分析法,即綜合運用嗓音音質(zhì)、口頭語言和頻譜等特征綜合評斷的一種方法。此外,還有聲紋自動識別法和綜合方法(即語音學(xué)分析法和聲紋自動識別法相結(jié)合的方法)。鑒定方法的發(fā)展在逐步信賴科學(xué)技術(shù)的同時,也很自然地逐步鞏固了聽音的重要地位。因為:
1.對現(xiàn)有科學(xué)技術(shù)的認(rèn)識存在局限性。在聲紋鑒定中,最重要的一點是對共振峰的提取,這方面的研究已經(jīng)頗為豐富,但是,不同軟件和不同參量的選擇,在提取的過程中都會面臨自身方法的弊端。人們在認(rèn)識的過程中還不能達(dá)到盡善盡美,而聽音能聽出原聲態(tài)。
2.在某些情況下,聽音比使用科學(xué)技術(shù)更加便利,能夠省去參量選擇和數(shù)據(jù)處理等技術(shù)要求的大量繁瑣過程,而直接得出可靠的意見。由此可見,真正的聲紋鑒定,永遠(yuǎn)不會摒去聽音,如同指紋鑒定離不開“看”,聲紋鑒定亦離不開“聽”。
聽音在聲紋鑒定中固然重要,但也會遭遇一些困境。
聽音者的識別能力強度,很大程度上取決于聽音者的感知。而感知會受到聽覺效應(yīng)的影響產(chǎn)生偏差。聽覺效應(yīng)主要有:
1.掩蔽效應(yīng)。即當(dāng)同時聽到兩個聲音時,較響的聲音掩蓋了較輕的聲音,使人聽起來好像只有一個聲音。這種掩蔽效應(yīng),又分為純音對純音的掩蔽和噪音對純音的掩蔽。
2.哈斯效應(yīng),又稱時間效應(yīng)。即當(dāng)方向不同的兩個聲源發(fā)出同樣的聲音時,由于到達(dá)的時間為同一時刻、或相差5~35ms、或相差35~50ms、或相差50ms以上,會感覺聲音來源方向是兩個聲源之間的一個假聲源、先到達(dá)的聲源、后到達(dá)的聲源,得出聲源來自不同方向的結(jié)果。
3.德·波埃效應(yīng),又稱響度效應(yīng)。即兩個聲源對稱的置于聽音者的前方時,當(dāng)反饋給兩個聲源的聲音信號相同時,聽音者感覺聲音來自兩個聲源的中間,而且似乎是只有一個聲源。
4.勞氏效應(yīng),又稱相位效應(yīng)。勞氏效應(yīng)產(chǎn)生假立體聲效果,即將信號延時后以反相疊加在直達(dá)聲信號上,立即就會產(chǎn)生明顯的空間印象,聲音似乎來自四面八方,聽音者有置于樂隊之中的感受。
聽覺效應(yīng)所產(chǎn)生的困境,主要是聽音者感知失真。這種失真,聽音者不可控制,也不可避免。對于掩蔽效應(yīng)帶來的困境,學(xué)術(shù)界已有人提出并研究了統(tǒng)計模型算法、譜減法、聽覺掩蔽算法、短時譜估計算法、子空間算法、小波變換算法等,用作降低錄音資料的噪音信號、增強語音信號。其余的效應(yīng)在日常生活中不常見,在此不作研究。
聽音為聲紋鑒定服務(wù),聲紋鑒定的最終目的是要鑒別檢材與樣本的說話人是否同一。就像指紋認(rèn)定同一一樣,要以本質(zhì)符合點占絕對多數(shù),且少數(shù)差異點得到科學(xué)解釋為判斷依據(jù)。聲紋鑒定能夠進(jìn)行同一認(rèn)定,也要有值得令人信服的判斷依據(jù)。而聽音是一個主觀性很強的活動,很難以“我認(rèn)為兩個語料是同一人所說”來取得他人的信服。即使兩個或三個聽音者持同一意見,也很難保證沒有其他聽音者持不同意見,這就使聽音的結(jié)論很難在認(rèn)定聲音同一時得到體現(xiàn)。
對于這一困境,可以將主觀的聽音判斷轉(zhuǎn)化為客觀的參數(shù)反映和語圖反映方式來解決。目前,國內(nèi)外學(xué)者對聲紋研究已經(jīng)日趨擴大,從基本的音強特征、音高模式的研究,已經(jīng)逐步細(xì)化到情緒語音、情感語音及具體的地區(qū)方言(如廣州話、上海話等)的研究上,使聽音所得的結(jié)論可通過具體的參數(shù)和形態(tài)(如共振峰頻率、基頻、語圖形態(tài)等)得以量化。雖然具體的研究還有待于進(jìn)一步探索,但聽音在認(rèn)定同一中的體現(xiàn)也有了方向可循。
在提供偵查線索、縮小偵查范圍上,聲紋鑒定起到的作用有目共睹。但是,在法庭上作為證據(jù)使用,要具備證據(jù)力。在美國,聲紋鑒定作為證據(jù)使用不是沒有,但并不常見。之所以如此,主要質(zhì)疑聲紋鑒定的可靠性,往往要從鑒定人是否具有經(jīng)驗,鑒定過程是否存在主觀性,語音自身的易變性等諸多問題,對聲紋鑒定是否具有可采性提出質(zhì)疑。在日本、德國和英國等國家,聲紋鑒定作為證據(jù)也較少見。我國聲紋鑒定起步晚于西方國家,在之前的訴訟程序中,聲紋證據(jù)也不作為定案的根據(jù)。但是,伴隨新刑訴法的修改,鑒定結(jié)論改為鑒定意見,鑒定人出庭制度得到進(jìn)一步的完善,聲紋作為訴訟程序中的證據(jù)指日可待。不過盡管如此,完善聲紋鑒定的證據(jù)能力,還要經(jīng)過很長的路程對其探索。
聲紋鑒定過程中,聽音是必不可少的重要步驟,鑒定人要高度重視聽音。要多注重做好專業(yè)的聽音訓(xùn)練,夯實語音學(xué)基礎(chǔ),以此提高聲紋鑒定質(zhì)量。
[1]徐立根.物證技術(shù)學(xué)[M].北京:中國人民大學(xué)出版社,2008.
[2]楊俊杰.司法話者識別[M].北京:中國人民公安大學(xué)出版社,2009.
[3]楊英倉,徐毓文,歐榮安,李文瑞,王英利.聽辨在聲紋鑒定中的作用[J].刑事技術(shù),2012:43-45.
[4]唐暢,廖翔.淺談司法語音鑒定中的綜合技術(shù)應(yīng)用[J].警察技術(shù),2011:30-32.
[5]王英利,李敬陽,曹洪林.聲紋鑒定技術(shù)綜述[J].警察技術(shù),2012(4):5 4-56.
[6]伍浩鵬.聲紋鑒定及其證據(jù)效力[J].甘肅政法學(xué)院學(xué)報,2000(4):99-102.
[7]文宇.一聲定音[J].檢查風(fēng)云,2004(6):36-38.
[8]宋淼,李敬陽.淺談聲紋檢驗鑒定技術(shù)[J].北京人民警察學(xué)院學(xué)報,2005(2):35-36.
[9]閻萍.聲紋鑒定及其在偵查破案中的作用[J].遼寧警專學(xué)報,200 8(1):70-72.