劉 枚 李茜茜
(河北公安警察職業(yè)學(xué)院,河北 石家莊 050091)
聲紋是利用電聲學(xué)儀器顯示的一種聲波頻譜,這種聲波頻譜攜帶著個人的言語信息。大量的科學(xué)研究表明,聲紋和指紋一樣有著特定性和穩(wěn)定性的特點(diǎn)。當(dāng)個體在成年之后其聲紋特征可以保持相當(dāng)長的穩(wěn)定性,且不會因?yàn)槟7?、輕聲或大喊而發(fā)生改變。在偵查破案中,偵查人員基于聲紋的這兩個特征可以對樣本和檢材進(jìn)行對比檢驗(yàn),認(rèn)定同一,為偵破刑事案件提供可靠的依據(jù)。聲紋鑒定分為專家鑒定和自動識別兩個大類,當(dāng)前我國能夠開展聲紋鑒定的機(jī)構(gòu)大多都是采用專家鑒定這一方式,即通過語音工作站的測量,使用語音學(xué)的分析方法,同時依據(jù)應(yīng)用語音學(xué)和統(tǒng)計分析的方法,分析個體的語音學(xué)特征從而對是否同一作出判別。
聲紋自動識別技術(shù)可以看作是一種語音信號的處理方法,這種處理的具體方法是由相關(guān)系統(tǒng)對特定語音的所有特征參數(shù)進(jìn)行分離和提取,通過線性或非線性的處理創(chuàng)建語音模型,然后由該系統(tǒng)進(jìn)行模式匹配,找出最為接近的若干語音資料。如果匹配結(jié)果是非單選的,還可以對其進(jìn)一步進(jìn)行劃分,如說話人辨認(rèn)和說話人確認(rèn)。
聲紋自動識別技術(shù)與專家鑒定不同,后者主要依靠頻圖的比對,不僅耗時耗力而且對分析人員的從業(yè)要求也比較高,一個合格的分析人員至少需要三年的實(shí)踐經(jīng)驗(yàn),而且對于分析人員個人來講是無法同時處理大量的聲紋數(shù)據(jù)的。聲紋自動識別技術(shù)則很好地解決了這一問題,其在識別的準(zhǔn)確性和群體識別的自動性上具有極高的優(yōu)勢,通過大規(guī)模的聲紋特征數(shù)據(jù)庫的建設(shè)可以呈現(xiàn)聲音檢索和識別的快速性、遠(yuǎn)程性和自動性。
我國刑事訴訟法將“鑒定意見”視為一種獨(dú)立的證據(jù)形式,可見聲紋的鑒定是可以作為認(rèn)定案件事實(shí)、作出合法判決的依據(jù)的。
首例利用語音進(jìn)行案件偵破的刑事案件發(fā)生在1963 年的日本。當(dāng)年日本發(fā)生了一起拐賣兒童案件,在這起案件中,犯罪人曾經(jīng)打電話對被害人進(jìn)行威脅,偵查人員通過犯罪人的語音對其年齡和職業(yè)進(jìn)行了判斷,并以此為根據(jù)很快找到了犯罪人。但當(dāng)時還沒有聲紋鑒定的概念,隨著科學(xué)技術(shù)的發(fā)展,人們也認(rèn)識到了聲音的唯一與穩(wěn)定,可以借助儀器將只能“聽”的聲音轉(zhuǎn)化為可以“看”的圖譜。聲紋的鑒定更加令人信服進(jìn)而使其完全可以成為定罪量刑的客觀依據(jù)。
在刑事訴訟的各個環(huán)節(jié)中,人類的聲音可以得到更廣泛的運(yùn)用。刑事案件的偵查過程中,人類聲音的內(nèi)容以事實(shí)為基礎(chǔ),反映了案件事實(shí)的一部分,偵查人員通過挖掘聲音內(nèi)容的信息找到關(guān)于案件的線索和證據(jù)。同時由于人類聲音本身就是客觀的,偵查人員在偵辦案件的過程中可以利用其自身的唯一性和穩(wěn)定性來認(rèn)定同一,找到特定的人與案件之間的關(guān)系從而進(jìn)一步擴(kuò)大線索和證據(jù)的來源。聲紋鑒定除了本身可以成為刑事證據(jù)以外,還可以成為認(rèn)定其他證據(jù)真?zhèn)蔚氖侄?,比如在視聽資料、電子證據(jù)的鑒定方面,聲紋的自動識別就發(fā)揮著巨大的作用。我們以視聽資料為例,視聽資料作為案件證據(jù)的優(yōu)勢是十分明顯的,它能夠非常生動、客觀地反應(yīng)案件的事實(shí)情況,但由于其的產(chǎn)生和展現(xiàn)特別依賴于儀器設(shè)備導(dǎo)致其容易被刪減、拼接和篡改。我們完全可以利用聲紋的自動識別對視頻中的聲音進(jìn)行檢驗(yàn),進(jìn)而審查視聽資料的真實(shí)性。
近幾年來,西方發(fā)達(dá)國家對聲紋的自動識別技術(shù)非常重視。其中最有代表性的恐怕就是由美國國家標(biāo)準(zhǔn)與技術(shù)研究院主辦的NIST SRE 了,這個測評最早舉辦于1996 年,目前被譽(yù)為國際層面最為權(quán)威的聲紋識別技術(shù)測評。作為全球范圍內(nèi)規(guī)模最大的測試平臺,它吸引了全球的聲紋研究機(jī)構(gòu)。競賽主要包含兩個模塊,主要考察電話信道和音視頻兩類語音材料中的聲紋識別,設(shè)置這兩個考察項(xiàng)目的目的在于通過兩種探索尋找對人類聲音識別的新的技術(shù)和新的方法,尋找和提升識別系統(tǒng)的性能。
我國在深度開發(fā)科技產(chǎn)品,尤其是將人工智能融入安防技術(shù)領(lǐng)域上做出了相應(yīng)的成績。一段時期以來,智慧公安在公安工作中發(fā)揮了重要的作用,公安機(jī)關(guān)和科技企業(yè)的合作日益加深,將科學(xué)技術(shù)融入公安工作,警企人才、科技與數(shù)據(jù)等資源的合作也日益緊密,在一個層面上提升了社會面安全治理能力的同時也提升了公安機(jī)關(guān)服務(wù)公眾的水平。其中我國某科技旗下的科學(xué)團(tuán)隊(duì)在2016 年的NIST SRE 上獲得了中國第一、國際第三的好成績,其開發(fā)的聲紋模型精度目前已經(jīng)處于同行業(yè)的領(lǐng)先水平。人工智能與聲紋技術(shù)的結(jié)合能夠?yàn)楣补ぷ鲙砀玫膮f(xié)助和推進(jìn)效果。2020年,清華大學(xué)聯(lián)合幾個機(jī)構(gòu)組成的聯(lián)隊(duì)也在該賽事上取得了國際前十、亞洲地區(qū)第一的好成績。
我國公安機(jī)關(guān)“三項(xiàng)建設(shè)”的重要內(nèi)容之一就是要加強(qiáng)公安信息化建設(shè),其中公安部聲紋庫的建設(shè)工作就是信息化建設(shè)的重要組成部分。我國已經(jīng)建成了比較成熟的指紋庫與DNA 庫,這兩個庫的存在為刑事案件的破獲提供了優(yōu)良的技術(shù)支撐。聲紋的采集有著指紋和DNA 都無法比擬的優(yōu)勢,即它可以實(shí)現(xiàn)非接觸式的采集。聲紋庫將與指紋、DNA 庫相互結(jié)合,一旦建成便可形成一個立體式的生物特征庫,不僅可以為多警種直接服務(wù)而且在偵破刑事案件和提高刑事訴訟效率上也會顯示出巨大的威力。
聲紋庫的建設(shè)與使用可以比照指紋庫的建設(shè)和使用方式。簡單來說,聲紋庫需要采集人員的聲紋信息,將采集人員的聲音進(jìn)行技術(shù)處理,取得標(biāo)準(zhǔn)的聲紋信息并將其錄入聲紋庫中。當(dāng)遇到需要比對的檢材時,就將檢材與聲紋庫中存在的信息進(jìn)行比對從而獲得若干候選條目,然后再由鑒定專家利用自己的實(shí)戰(zhàn)技術(shù)與經(jīng)驗(yàn)對這些候選條目進(jìn)行進(jìn)一步的篩選,進(jìn)而確定目標(biāo)人或者目標(biāo)范圍。
1.公安機(jī)關(guān)聲紋技術(shù)的應(yīng)用與發(fā)展是一段時期以來的重要課題。聲紋信息的識別是一項(xiàng)非常重要的工作,是公安部目前非常重視的一項(xiàng)任務(wù),各級公安機(jī)關(guān)及其部門都要高度重視這項(xiàng)工作,把該項(xiàng)工作做細(xì)做扎實(shí)。
其次,要充分重視聲紋的采集質(zhì)量。在實(shí)際的聲紋采集過程中,由于使用的設(shè)備配置標(biāo)準(zhǔn)不一,使用的信道有差異等等,使得所采集的聲紋質(zhì)量參差不齊,這些標(biāo)準(zhǔn)并不統(tǒng)一的數(shù)據(jù)將會嚴(yán)重影響算法模型的建立,給下一步進(jìn)行準(zhǔn)確識別的工作帶來了困難。為了進(jìn)一步確定入庫數(shù)據(jù)的質(zhì)量,就需要公安機(jī)關(guān)結(jié)合各科研單位進(jìn)行系統(tǒng)的、有效的研究,共同制定聲紋采集的標(biāo)準(zhǔn)儀器和科學(xué)流程。
最后,聲紋的采集工作要有序推進(jìn)。從領(lǐng)導(dǎo)層面來講,領(lǐng)導(dǎo)要親力親為,明確工作的各個環(huán)節(jié)的負(fù)責(zé)人員,設(shè)立工作進(jìn)程的具體時間表,建立切實(shí)有效的監(jiān)督、獎懲機(jī)制,確保聲紋采集的數(shù)量與質(zhì)量。
2.社會公共安全是與我國人民生命財產(chǎn)安全密切相關(guān)的重要領(lǐng)域,隨著人工智能技術(shù)的產(chǎn)生和發(fā)展,將人工智能運(yùn)用于社會公共安全建設(shè)的科學(xué)技術(shù)也應(yīng)運(yùn)而生。以生物特征為基礎(chǔ)的人員身份識別的認(rèn)證技術(shù)也高度依賴于人工智能的運(yùn)用,聲紋作為非常重要的人類生物特征,它的自動識別正在社會安全生活中起著重要的作用。
(1)重點(diǎn)場所聲紋門禁系統(tǒng)。在重要的安防場所加入聲紋門禁,能夠非常有效地遏制非法闖入。聲紋自動識別具有快、準(zhǔn)、穩(wěn)等特點(diǎn),用于門禁系統(tǒng)可以實(shí)現(xiàn)快速識別、精準(zhǔn)準(zhǔn)入和遠(yuǎn)程操作的一系列動作,相對于傳統(tǒng)的其他生物特征的識別,其有效地規(guī)避了因?yàn)樯眢w出現(xiàn)異常而導(dǎo)致不能準(zhǔn)確識別的缺陷。另外,在一些敏感的公共場所也可以安裝聲紋自動識別系統(tǒng),有利于快速篩查重點(diǎn)人員,最大限度地消除治安隱患。
(2)金融場所的使用。聲紋自動識別技術(shù)在金融場所的使用更多地表現(xiàn)在對銀行系統(tǒng)的應(yīng)用上,它的存在有利于幫助銀行及其客戶提高抵抗財產(chǎn)被侵犯的能力。我國的國家信用認(rèn)證體系還有待完善,這就需要銀行方面建立起自己的一套科學(xué)的信用體系,以規(guī)避一定的經(jīng)營上的風(fēng)險。近年來屢屢出現(xiàn)的銀行內(nèi)部人員利用銀行自身監(jiān)管的體制漏洞肆意侵犯人民財產(chǎn)的案件就彰顯了建立這種信用體系的重要性。聲紋的自動識別技術(shù)為這一體系的建立提供了非常高效的認(rèn)證選項(xiàng)。從客戶方面來說,他們也希望銀行可以提供更為可靠和牢固的信息安全屏障,以提升客戶對于銀行的信賴度。對于金融場所來講,安全系統(tǒng)越牢靠客戶才會越多,銀行才能更好地提供金融服務(wù)。
1.對于恐怖類犯罪的預(yù)防??植乐髁x犯罪都存在隱蔽性的特征,表現(xiàn)在犯罪人身上就是他們在進(jìn)行恐怖活動的策劃和實(shí)施時大多會對自己的身份和外貌進(jìn)行隱藏和偽裝。在身份和外貌雙重偽裝的前提下,將其真正的身份與其形象進(jìn)行比對就成為預(yù)防與控制恐怖活動的一個重要課題。聲紋的自動識別是不需要用肢體接觸的方式進(jìn)行的,這對于快速有效識別恐怖嫌疑人身份而不暴露我方偵查意圖有著巨大的幫助作用。
2.對違法重點(diǎn)人員的聲紋進(jìn)行采集,以便建立聲紋樣本庫。通過社會面上的聲紋采集系統(tǒng)不僅可以掌握其活動軌跡,還可以對若干軌跡進(jìn)行分析研究,結(jié)合其自身特點(diǎn)(涉案性質(zhì)、高危地區(qū)、特殊身份)等進(jìn)行綜合研判,從而達(dá)到對刑事案件的預(yù)防和在偵案件的戰(zhàn)果擴(kuò)大的效果。
3.在居民身份證中加入聲紋信息。將持證人的聲紋信息錄入身份證,一方面提升了身份證的防偽技術(shù),另一方面提高了公安機(jī)關(guān)在日常管理中進(jìn)行人證比對的工作效率。
在偵查破案的實(shí)踐中,聲紋的自動識別技術(shù)是需要一定的條件的,除了我們前面提到的需要數(shù)量龐大的聲紋資源庫還需要在采集和使用中注意對聲音的標(biāo)準(zhǔn)化處理。
1.在對人類聲音采集的時候,除了需要有效排除聲音背景中的各類噪音的干擾還需要對采集的形式進(jìn)行規(guī)范。一般情況下采集使用自由談話和刻意聽說兩種方式。第一種方式是讓說話者在一種自由的情形下自如地講話,這種談話的方式一般會在被采集者不知情的情況下進(jìn)行,其會在較為自然的情況下進(jìn)行發(fā)音;第二種方式是刻意地讓被采集者說出需要比對的特定語言。
2.由于我國對證據(jù)真實(shí)性、客觀性的要求,在收集證據(jù)時不僅要求證據(jù)的形式要合法還要求證據(jù)收集的方式要合法。這就要求在對聲紋自動識別前,要按照法定程序?qū)β暭y的檢材進(jìn)行客觀性和真實(shí)性的審查,確保語音載體沒有被剪接和偽造,如果能保證語音的連續(xù)性和真實(shí)性則要對其進(jìn)行濾波處理,以增強(qiáng)語音部分的信號,并有針對性地進(jìn)行摘抄。
3.聲紋資源庫內(nèi)的聲紋資料的數(shù)量足夠龐大且質(zhì)量標(biāo)準(zhǔn)統(tǒng)一可靠。在刑事案件偵破的工作中,偵查人員總結(jié)出了眾多的偵查方法,隨著信息導(dǎo)偵的理念越來越深入人心,偵查人員會將偵查方法與信息收集很好地結(jié)合起來,因此形成了很多固定的分析模塊。公安機(jī)關(guān)可以根據(jù)這些模塊對聲紋信息進(jìn)行分類,從而使得聲紋的自動識別更加具有針對性。
1.對“人”的特征進(jìn)行識別。有的刑事案件是以聲音為首要線索的,如綁架案件、電信詐騙案件、敲詐勒索案件等。除了分析犯罪行為人與被害人之間的關(guān)系外,確定犯罪人的個人特征就成為了這些案件的突破口。根據(jù)聲紋的識別,可以海量地對于說話人的性別、年齡、文化水平、職業(yè)特點(diǎn)、生活區(qū)域、甚至身體特征等進(jìn)行范圍劃定,然后根據(jù)這些范圍的交集進(jìn)一步對犯罪人的個人特征進(jìn)行圈定,繼而縮小偵查范圍。
在偵查這一類案件的過程中,我們除了關(guān)注犯罪行為人的個人特征以外還可以把關(guān)注點(diǎn)放在其他人的身上。比如,在綁架案件中,如果“被綁架人”也發(fā)過聲,偵查人員就可以對該聲音與直接受害人的聲音進(jìn)行識別,從而達(dá)到確定身份的目的。再比如,如果聲音背景中有其他人的聲音,也可以對背景人物進(jìn)行分析,該人如果是同伙,則可以使用多個嫌疑人的信息進(jìn)行交叉分析;如果是與案件無關(guān)的人員,由于這類人是生活中的自然表達(dá),偽裝的可能性極小且心態(tài)正常,則可據(jù)此獲得更加精準(zhǔn)的分析結(jié)果。
2.對組織架構(gòu)進(jìn)行識別。對于一些集團(tuán)性、系列性案件,查明團(tuán)伙的組織架構(gòu)、認(rèn)定某個特定的人在整個案件中的作用是非常重要的,如黑社會性質(zhì)組織案件、販毒案件、制售假藥案件。由于當(dāng)前的通訊技術(shù)和物流行業(yè)的高速發(fā)展,在很多案件中,同案犯就是從未見面的熟人。他們在聯(lián)系的過程中從不見面,從不暴露自己的真實(shí)姓名,但這并不妨礙他們之間的配合與交易。甚至有的犯罪人同時使用幾十個手機(jī)號碼,同時擁有幾個不同的姓名和身份,甚至還有的犯罪人自己都記不清用哪個號碼、用何種身份和哪個犯罪人接觸過。因此在偵破這些案件的過程中,認(rèn)定某個特定的人在案件中的身份和所起的作用就特別重要。聲紋自動識別技術(shù)就解決了這樣的難題,通過對微信或通話錄音中的語音識別,能夠從眾多的聲音中分辨出特定人的聲音,為固定證據(jù)提供了科學(xué)的依據(jù)。
在有組織犯罪的偵查中,犯罪人往往避重就輕,對于自己組織或參與的活動進(jìn)行推諉和狡辯。最常見的就是矢口否認(rèn)自己曾經(jīng)對其他犯罪嫌疑人“發(fā)號施令”。如果我們能夠取得該人和其他人之間的通話記錄,就能夠證明該人在整個犯罪組織中的作用,從而為其定罪量刑提供依據(jù)。如果沒有通話記錄,偵查人員也可以通過技術(shù)手段從現(xiàn)場的監(jiān)控視頻中提取語音信息,將該人的聲音從眾多的語音信息中提取出來,再對語音的內(nèi)容加以分析和固定,一樣可以對其在組織結(jié)構(gòu)中的位置進(jìn)行認(rèn)定。
3.對串并案件進(jìn)行識別。有的犯罪人將某種犯罪行為作為一種“職業(yè)”,這就導(dǎo)致某類案件具有鮮明的個人特征。由于犯罪人在長期的犯罪過程中會總結(jié)出最適合、最高效的犯罪手段,一旦犯罪手段成熟就很難更改,所以在串并案件的過程中,這些鮮明的個人特征就成為了多起案件進(jìn)行串并的指標(biāo),如電信詐騙案件。在電信詐騙的過程中,犯罪人總要與被害人進(jìn)行言語上的交流。由于我國在防治電信詐騙方面做了大量的宣傳活動,有的群眾在接到詐騙電話時有十分準(zhǔn)確的辨別能力,有的群眾還會給騙子進(jìn)行錄音。偵查機(jī)關(guān)就可以根據(jù)這些錄音對一些未遂案件進(jìn)行收集并以此作為基礎(chǔ)資料,一旦有案件發(fā)生就可以將既遂案件與未遂案件進(jìn)行自動識別,結(jié)合電信詐騙的內(nèi)容和作案手段,對這些案件進(jìn)行串并。這種方法還可以運(yùn)用到其他系列性案件如盜竊、尋釁滋事、黑社會性質(zhì)組織等案件的偵破活動中。
科學(xué)技術(shù)的發(fā)展在改變?nèi)藗兩罘绞降耐瑫r也改變著違法犯罪的作案手段,作為保護(hù)人民生命財產(chǎn)安全主要力量的公安機(jī)關(guān)也要將科技和偵查手段結(jié)合起來。聲紋自動識別技術(shù)作為偵查手段與信息技術(shù)的結(jié)合體在以后的公安工作中必將發(fā)揮出令人矚目的重要作用。為此,進(jìn)一步開發(fā)聲紋技術(shù),研究聲紋識別處理方式,用聲紋自動識別技術(shù)開創(chuàng)刑事案件偵查的新理念是當(dāng)前值得探討的課題。