摘 要 隨著科學(xué)技術(shù)的發(fā)展,聲紋證據(jù)已成為公安和司法機(jī)關(guān)破案?jìng)刹榈闹匾C據(jù)之一。實(shí)施聲紋鑒定的基本要求是程序必須科學(xué)和規(guī)范。本文認(rèn)為要正確提取嫌疑對(duì)象的樣本,按程序?qū)彶榘讣z材,重視搜集和應(yīng)用聲紋鑒定基礎(chǔ)資料,設(shè)計(jì)科學(xué)合理、切合實(shí)際的應(yīng)用系統(tǒng),采用背景音庫(kù)比對(duì)模式和實(shí)時(shí)語(yǔ)音流監(jiān)控、識(shí)別模式。深化聲紋識(shí)別技術(shù)研究,在實(shí)踐中逐步擴(kuò)大聲紋技術(shù)的識(shí)別應(yīng)用范圍。
關(guān)鍵詞 聲紋 識(shí)別技術(shù) 司法實(shí)踐
作者簡(jiǎn)介:鄭永紅,湖北警官學(xué)院偵查系教授,研究方向:公安情報(bào)學(xué)。
中圖分類號(hào):D918.9 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.19387/j.cnki.1009-0592.2017.10.360
隨著現(xiàn)代科學(xué)技術(shù)的發(fā)展,聲紋證據(jù)已成為公安和司法機(jī)關(guān)破案?jìng)刹榈闹匾C據(jù)之一。聲紋識(shí)別技術(shù)為案件偵查提供了關(guān)鍵證據(jù)和調(diào)查方向。我們應(yīng)結(jié)合工作實(shí)際,努力發(fā)揮聲紋識(shí)別技術(shù)的優(yōu)勢(shì),努力提高工作效率。
一、聲紋識(shí)別技術(shù)的發(fā)展
眾所周知,每個(gè)人發(fā)聲都是身體幾大器官多重配合的結(jié)果,通過(guò)鼻腔、口舌、聲道、胸肺最終形成看不見(jiàn)的聲波和聽(tīng)得見(jiàn)的聲音。而通常所說(shuō)的聲紋,是指人的聲音的頻譜圖,是借助科學(xué)儀器描繪出來(lái)的說(shuō)話人聲音的圖像。聲紋識(shí)別技術(shù),是一項(xiàng)通過(guò)語(yǔ)音信號(hào)提取代表說(shuō)話人身份的相關(guān)特征,進(jìn)而識(shí)別出說(shuō)話人身份的技術(shù) 。聲紋具有人的個(gè)性特征,與指紋類似。
(一)聲紋識(shí)別技術(shù)的早期應(yīng)用
隨著科學(xué)技術(shù)的發(fā)展,科學(xué)家們?cè)?0世紀(jì)30年代開(kāi)始了說(shuō)話人的識(shí)別研究。1945年,這項(xiàng)研究取得了突破性的進(jìn)展,貝爾實(shí)驗(yàn)室的科學(xué)家經(jīng)過(guò)多次科學(xué)實(shí)驗(yàn),完成語(yǔ)譜圖匹配,提出了“聲紋”的概念。1966年,美國(guó)法院采用“聲紋”取證,聲紋技術(shù)開(kāi)始走上了司法實(shí)踐舞臺(tái)。這種技術(shù)開(kāi)發(fā)之初,主要秘密應(yīng)用于軍事情報(bào)領(lǐng)域,后來(lái)逐漸被司法以及金融等領(lǐng)域采用。
(二)我國(guó)聲紋識(shí)別技術(shù)的發(fā)展
我國(guó)聲紋識(shí)別技術(shù)首先是從公安、司法系統(tǒng)開(kāi)始研究與應(yīng)用。從20世紀(jì)80年代末起步的我國(guó)聲紋鑒定技術(shù)的研究,至今已經(jīng)取得顯著成就。多種聲紋智能鑒定系統(tǒng),在許多案件的偵查中發(fā)揮了重大作用,其功能被人們逐漸認(rèn)識(shí)。在說(shuō)話人辨認(rèn)領(lǐng)域的應(yīng)用有:刑偵破案、罪犯跟蹤、個(gè)性化應(yīng)用等等;在說(shuō)話人確認(rèn)領(lǐng)域的應(yīng)用有:銀行交易、證券交易、公安取證、身份證、信用卡的認(rèn)證等。
(三)聲紋識(shí)別技術(shù)特點(diǎn)
以指紋、人臉、虹膜、語(yǔ)音等生理特征為識(shí)別對(duì)象的生物識(shí)別技術(shù)快速發(fā)展,在眾多領(lǐng)域獲得了應(yīng)用。例如,蘋(píng)果手機(jī)運(yùn)用指紋識(shí)別替代密鑰,一些單位的門(mén)禁系統(tǒng)也應(yīng)用了人臉和指紋相結(jié)合的認(rèn)證技術(shù)。這是因?yàn)橹讣y、人臉、虹膜、語(yǔ)音等人體生理特征具有穩(wěn)定性、相對(duì)唯一性的特點(diǎn),識(shí)別率較高,備受用戶喜愛(ài)。美國(guó)圣何塞州立大學(xué)國(guó)家生物特性測(cè)評(píng)中心的專家曾對(duì)各種生物特征進(jìn)行了比較,總結(jié)出各種生物特征在現(xiàn)階段因?yàn)榧夹g(shù)等各種原因,在易用性和應(yīng)用成本上存在較大差異。如技術(shù)成熟的指紋識(shí)別因?yàn)闃颖静杉щy,應(yīng)用成本增加;虹膜、人臉識(shí)別因其技術(shù)原因易用性不強(qiáng)。相對(duì)而言,聲紋識(shí)別的應(yīng)用有一些特殊優(yōu)勢(shì):語(yǔ)音獲取自然,聲紋提取便捷,識(shí)別成本低廉,適合遠(yuǎn)程身份確認(rèn),聲紋辨認(rèn)和確認(rèn)的算法復(fù)雜度低,與說(shuō)話語(yǔ)言、方言無(wú)關(guān),適應(yīng)人群范圍很廣等。
(四)聲紋識(shí)別技術(shù)的兩個(gè)關(guān)鍵問(wèn)題
聲紋識(shí)別的過(guò)程是先通過(guò)錄音設(shè)備采集聲音信號(hào),之后利用電子設(shè)備將聲音信號(hào)轉(zhuǎn)換成電信號(hào),再用信號(hào)處理算法提取音頻特征,最后綜合運(yùn)用多種聲紋識(shí)別技術(shù)來(lái)識(shí)別說(shuō)話人的身份。聲紋識(shí)別技術(shù)應(yīng)用,需要解決兩個(gè)關(guān)鍵問(wèn)題:即特征提取和模式識(shí)別。
與語(yǔ)音識(shí)別不同的是,聲紋識(shí)別的聲紋特征必須是“個(gè)性化”特征。而這種“個(gè)性化”的根本要求在于提取對(duì)象人語(yǔ)音信號(hào)的基本特征,以便有效地區(qū)分不同的說(shuō)話人。目前,多種聲紋識(shí)別系統(tǒng)并存,雖各有千秋,但有一個(gè)共同點(diǎn),即識(shí)別方式主要依靠聲學(xué)特征進(jìn)行。體現(xiàn)個(gè)人聲學(xué)特征的是多層面的,如鼻音、帶深呼吸音、沙啞音、笑聲等,還有受到教育水平、出生地等環(huán)境影響的發(fā)音、言語(yǔ)習(xí)慣等以及個(gè)人特點(diǎn),受父母影響的語(yǔ)調(diào)、速度、節(jié)奏等特征。聲紋自動(dòng)識(shí)別模型目前可以使用包括聲學(xué)特征、詞法特征、韻律特征、語(yǔ)種、方言和口音信息、通道信息等特征。
聲紋識(shí)別技術(shù)要求選擇適合的識(shí)別方法。聲紋識(shí)別常用方法可以分為動(dòng)態(tài)時(shí)間規(guī)整法、矢量量化法、隱馬爾科夫模型、人工神經(jīng)網(wǎng)絡(luò)法等。近年來(lái),一些專家在傳統(tǒng)高斯混合模型-通用背景模型的方法上,先后提出了聯(lián)合因子分析和i-vector模型 ,將說(shuō)話人模型映射到低維子空間中,顯著提高了聲紋識(shí)別技術(shù)的性能。
二、聲紋鑒定的重要環(huán)節(jié)
實(shí)施聲紋鑒定的基本要求是程序必須科學(xué)和規(guī)范。聲紋鑒定涉及的樣本提取、檢材審查、聲紋鑒定數(shù)據(jù)庫(kù)應(yīng)用、鑒定應(yīng)用系統(tǒng)的運(yùn)用等各環(huán)節(jié),都必須嚴(yán)格遵守操作程序。
(一)科學(xué)提取嫌疑對(duì)象的樣本
運(yùn)用先進(jìn)技術(shù)進(jìn)行科學(xué)采樣,是聲紋鑒定的首要環(huán)節(jié)。采樣前要選好錄音設(shè)備和地點(diǎn),盡量減少和避免噪音。采樣有自由交談錄音和聽(tīng)說(shuō)錄音兩種。實(shí)施交談錄音時(shí),嫌疑對(duì)象并不知曉被錄音,發(fā)音自然。但是,尋找與樣本相同的語(yǔ)句則困難較多。
聽(tīng)說(shuō)錄音則是有意讓對(duì)方說(shuō)與樣本相同的語(yǔ)句,目的是為了便于對(duì)比鑒定,但嫌疑對(duì)象有的因?yàn)榫o張,有的可能刻意偽裝,反而增加了鑒定難度。因此,具體辦案時(shí),往往自由交談錄音和聽(tīng)說(shuō)錄音兩種方式都要采用。
(二)按程序?qū)彶榘讣z材
聲紋鑒定前,必須對(duì)案件錄音檢材進(jìn)行審查,首先審查檢材語(yǔ)音連續(xù)性、背景噪聲連貫性、信號(hào)的波形頻譜正常性,認(rèn)定檢材是否原件,有無(wú)經(jīng)過(guò)剪輯。同時(shí),還要注意檢材的時(shí)效性。只有認(rèn)定檢材確為原件,沒(méi)有剪輯痕跡,并且具有時(shí)效性,才可進(jìn)行一定的處理。通過(guò)濾波措施和減低噪聲,增強(qiáng)相關(guān)語(yǔ)音的識(shí)別度。然后,辨聽(tīng)檢材,選定辨識(shí)性較高的語(yǔ)音段作為樣本。根據(jù)要求,采用先進(jìn)技術(shù)妥為保管樣本。endprint
(三)搜集和應(yīng)用聲紋鑒定基礎(chǔ)資料
聲紋特征提取是在現(xiàn)實(shí)環(huán)境中進(jìn)行的。其環(huán)境的復(fù)雜性既包括聲紋識(shí)別的說(shuō)話人,也包括客觀的生活環(huán)境。作為說(shuō)話人,其語(yǔ)音聲學(xué)特征不可避免地具有發(fā)展性和變異性,既便是同一個(gè)人,被采集到的兩段語(yǔ)音內(nèi)容都是相同的,但是在不同的時(shí)期或特殊的情境下,由于情緒、語(yǔ)速、疲勞程度等原因,聲紋特征也不盡一致,語(yǔ)音都會(huì)有一些差異性。
因此,要隨著工作任務(wù)的拓展,不斷充實(shí)各種語(yǔ)音庫(kù),包括重點(diǎn)人口、不同地域、不同場(chǎng)合人群的語(yǔ)音庫(kù)等。語(yǔ)音資料的搜集應(yīng)像指紋搜集一樣,結(jié)合日常工作,長(zhǎng)期不懈地進(jìn)行。語(yǔ)音資料的搜集應(yīng)注重質(zhì)量,能反映相關(guān)人的準(zhǔn)確語(yǔ)音信息。語(yǔ)音資料的整理堅(jiān)持信息化、專業(yè)化原則,形成特怔鮮明、覆蓋面大、實(shí)用性強(qiáng)的語(yǔ)音資料體系。
(四)設(shè)計(jì)科學(xué)合理、切合實(shí)際的應(yīng)用系統(tǒng)
應(yīng)用現(xiàn)代管理理論,采用系統(tǒng)工程的方法和信息技術(shù),建立層次分明、互相聯(lián)系、匹配有序的系統(tǒng)結(jié)構(gòu)。聲紋識(shí)別應(yīng)用系統(tǒng)要著眼實(shí)踐工作需要,既要有全國(guó)性的聲紋識(shí)別系統(tǒng),也可有區(qū)域性或具體部門(mén)的小型聲紋識(shí)別系統(tǒng)。注意各類聲紋系統(tǒng)信息的互聯(lián)互通,并同有關(guān)部門(mén)的人口管理系統(tǒng)、犯罪情報(bào)系統(tǒng)等相連接,最大限度的實(shí)現(xiàn)資源共享共用。充分利用各方科技人力資源,努力解決背景噪音處理、失真信號(hào)補(bǔ)償和由年齡變化引起的自然變調(diào)等問(wèn)題。
三、聲紋鑒定的應(yīng)用策略
聲紋鑒定聲紋識(shí)別通常有兩種對(duì)比方式,即1:1和1:N方式。在案件偵查中,辦案人員通過(guò)兩段錄音音素的對(duì)比分析,來(lái)判斷兩個(gè)音素是否屬同一人,這也就是說(shuō)話人的確認(rèn)。此外,還可以運(yùn)用1:N的方式來(lái)進(jìn)行聲紋對(duì)比,也就是說(shuō)是將一個(gè)人的聲音與聲紋庫(kù)中的聲紋數(shù)據(jù)進(jìn)行對(duì)比,進(jìn)而找出最有可能的說(shuō)話人,即判斷語(yǔ)音是誰(shuí)說(shuō)的,這被稱為說(shuō)話人辨認(rèn)。
(一) 兩種對(duì)比方式
將兩段語(yǔ)音檢材直接比對(duì)應(yīng)用,被稱為1:1方式。在偵查中應(yīng)用這種方式,可將案件現(xiàn)場(chǎng)采集到的語(yǔ)音檢材和嫌疑錄音樣本進(jìn)行比對(duì),確認(rèn)嫌疑人是否為作案人。這是1:1方式的應(yīng)用。
人員語(yǔ)音庫(kù)比對(duì)模式,即1:N方式。在偵查中,將案件語(yǔ)音檢材與重點(diǎn)人口語(yǔ)音庫(kù)連接、與語(yǔ)音庫(kù)中語(yǔ)音模型比對(duì),會(huì)出現(xiàn)在庫(kù)中和不在庫(kù)中兩種情況。受檢語(yǔ)音的說(shuō)話人在庫(kù)中,則確定匹配人,據(jù)此確定其身份。如不在庫(kù)中,則采取其它措施,繼續(xù)深入偵查。這種方式應(yīng)用較多,如在重點(diǎn)人群監(jiān)控、犯罪嫌疑人排查以及案件司法證據(jù)鑒定等方面。
(二)背景音庫(kù)比對(duì)模式
聲紋識(shí)別并不僅僅是靜態(tài)檢測(cè),更多的是動(dòng)態(tài)檢測(cè)。背景環(huán)境復(fù)雜性和傳輸信道等的差異性,對(duì)語(yǔ)音信息會(huì)造成不同程度的影響,為聲紋識(shí)別增添了不少的問(wèn)題 。如何降噪以及去混響依然是聲紋識(shí)別的一大難題。聲紋識(shí)別的核心介質(zhì)是聲音,為了獲取純粹和真實(shí)聲紋素材,客觀上要求最大限度地降低雜音。雖然運(yùn)用相關(guān)技術(shù),能夠過(guò)濾雜音,但這只是相對(duì)而言。外界的雜音干擾,很可能帶來(lái)誤判。為了突出說(shuō)話人的聲音,在一般的聲紋識(shí)別中,采取技術(shù)方法降低噪聲是必要的。
但是在有些案件偵查中,應(yīng)用聲紋識(shí)別系統(tǒng)又不能單純地“去噪”。因?yàn)樵S多重要的辦案線索很可能隱含于“噪聲”之中。遇有相關(guān)案情,應(yīng)在聲紋鑒定前,先對(duì)背景聲音進(jìn)行分離和鑒別。如在綁架案的偵查中,通過(guò)音頻資料的鑒定,便可以從各種噪聲中,發(fā)現(xiàn)案發(fā)時(shí)間、地點(diǎn)及相關(guān)人員的重要線索。
(三)實(shí)時(shí)語(yǔ)音流監(jiān)控、識(shí)別模式
近年來(lái),各地公安部門(mén)結(jié)合工作實(shí)際,努力發(fā)揮聲紋識(shí)別技術(shù)的優(yōu)勢(shì),有力地維護(hù)了社會(huì)治安。一些地方公安部門(mén)的聲紋鑒定系統(tǒng)與相關(guān)部門(mén)監(jiān)控、采集設(shè)備結(jié)合使用,運(yùn)用實(shí)時(shí)語(yǔ)音流監(jiān)控、識(shí)別系統(tǒng),發(fā)揮出重要作用。只要“犯罪嫌疑人”接通電話,通過(guò)監(jiān)控、識(shí)別系統(tǒng)同“犯罪嫌疑人”的語(yǔ)音樣本比對(duì),便可迅速提供通話人身份、地點(diǎn)等信息,為破案提供了重要線索。有的地方公安機(jī)關(guān)建立了“110”報(bào)警聲紋采集與輔警系統(tǒng),也取得了較好的社會(huì)效益。
總之,應(yīng)加強(qiáng)總體規(guī)劃,加強(qiáng)專業(yè)技術(shù)隊(duì)伍建設(shè),深化包括聲紋識(shí)別在內(nèi)的生物特征識(shí)別技術(shù)研究,進(jìn)一步建立和健全相應(yīng)的聲紋庫(kù),在實(shí)踐中逐步擴(kuò)大聲紋技術(shù)的識(shí)別應(yīng)用范圍,為提高破案率提供技術(shù)支撐。聲紋識(shí)別技術(shù)與其它高新技術(shù)高度融合是未來(lái)的發(fā)展趨勢(shì),如大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能以及地理信息技術(shù)、虛擬現(xiàn)實(shí)技術(shù)、區(qū)塊鏈和深度學(xué)習(xí)等技術(shù),都可與聲紋識(shí)別技術(shù)加以融合,大大提升聲紋識(shí)別的精確性。
注釋:
陳擁權(quán)、張羽、胡翀豪、楚瑾.聲紋識(shí)別技術(shù)及其應(yīng)用前景分析.網(wǎng)絡(luò)安全技術(shù)與應(yīng)用.2013,11(24).
Dehak N,Kenny P,Dehak R,et al.Front-end factor analysis for speaker verification.IEEE Trans on Audio,Speech,and Language Processing,2011,19(4).
鄭方、李藍(lán)天、張慧、艾斯卡爾·肉孜.聲紋識(shí)別技術(shù)及其應(yīng)用前景.信息安全研究.2016,1(44-57).endprint