摘 要 錄音內(nèi)容辨聽(tīng)司法鑒定是聲像資料司法鑒定中常見(jiàn)的鑒定事項(xiàng),但是由于其難度較大并且缺乏科學(xué)性保障,因此在司法鑒定的實(shí)務(wù)中并未給予足夠的重視。本文對(duì)錄音內(nèi)容辨聽(tīng)司法鑒定的有關(guān)內(nèi)容進(jìn)行介紹,并闡述了錄音內(nèi)容辨聽(tīng)的方法,同時(shí)針對(duì)錄音內(nèi)容辨聽(tīng)司法鑒定實(shí)務(wù)中存在的問(wèn)題進(jìn)行歸納,并對(duì)未來(lái)的發(fā)展方向進(jìn)行展望。
關(guān)鍵詞 錄音內(nèi)容 辨聽(tīng) 司法鑒定 方法 發(fā)展
基金項(xiàng)目:本論文受公安部科技強(qiáng)警基礎(chǔ)工作專項(xiàng)項(xiàng)目《面向網(wǎng)絡(luò)語(yǔ)音的聲紋特征與識(shí)別關(guān)鍵技術(shù)研究》資助,項(xiàng)目編號(hào):2017GABJC33。
作者簡(jiǎn)介:張曉,公安部第三研究所,助理研究員,研究方向:信息網(wǎng)絡(luò)安全、電子數(shù)據(jù)司法鑒定。
中圖分類號(hào):D918.9 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.19387/j.cnki.1009-0592.2018.01.171
錄音內(nèi)容辨聽(tīng)司法鑒定是聲像資料司法鑒定的一種。錄音內(nèi)容辨聽(tīng)是指通過(guò)聽(tīng)辨,必要時(shí)借助錄音處理等技術(shù)手段,書面整理錄音資料所反應(yīng)的對(duì)話內(nèi)容。公安機(jī)關(guān)在偵查網(wǎng)絡(luò)暴恐音頻的案件中,需要到對(duì)音頻中的內(nèi)容進(jìn)行辨聽(tīng)以作為立案審查的證據(jù)。法院在審判階段,會(huì)對(duì)雙方當(dāng)事人提交的對(duì)錄音內(nèi)容有爭(zhēng)議的錄音證據(jù)委托鑒定機(jī)構(gòu)進(jìn)行司法鑒定。
一、錄音內(nèi)容辨聽(tīng)司法鑒定概述
聲像資料司法鑒定的鑒定事項(xiàng)一般包括聲音資料的同一性、完整性鑒定、錄音內(nèi)容辨聽(tīng),以及圖像資料人像同一鑒定、真實(shí)性鑒定等。錄音內(nèi)容辨聽(tīng)司法鑒定是常見(jiàn)的鑒定事項(xiàng)。
(一)錄音內(nèi)容辨聽(tīng)司法鑒定
錄音內(nèi)容辨聽(tīng)是聲像資料司法鑒定中常見(jiàn)的鑒定事項(xiàng),它是指聽(tīng)辨錄音資料中談話者語(yǔ)音文字內(nèi)容,整理相關(guān)人士在實(shí)踐中用語(yǔ)言表達(dá)的思想內(nèi)容,以及從錄像資料的背景圖像中提取有關(guān)案件的線索信息。
現(xiàn)代語(yǔ)言學(xué)中的方言,通常指的是地區(qū)方言,也就是指地方話。它是一種全民語(yǔ)言的地域性變體,是一種語(yǔ)言分化的結(jié)果,在語(yǔ)音、詞匯、語(yǔ)法上具有不同于其他親屬語(yǔ)言的特征,他的內(nèi)部發(fā)展規(guī)律服從于全民共同語(yǔ)。
現(xiàn)代漢語(yǔ)的全民共同語(yǔ)是普通話。方言與普通話不是對(duì)立的關(guān)系,而是個(gè)別與一般的關(guān)系。新中國(guó)成立以后,國(guó)家政治、經(jīng)濟(jì)高度集中、統(tǒng)一,文化、教育逐漸普及,交通和通信日益現(xiàn)代化,加之推廣普通話工作的不斷加強(qiáng),漢語(yǔ)方言停止了平行發(fā)展,正在向民族共同語(yǔ)——普通話集中、靠攏。《中華人民共和國(guó)憲法》第19條規(guī)定:“國(guó)家推廣全國(guó)通用的普通話”。使用國(guó)家通用的語(yǔ)言文字,是每個(gè)公民應(yīng)當(dāng)履行的權(quán)利(非義務(wù))。我國(guó)是一個(gè)多民族、多方言的國(guó)家,推廣普及普通話有利于增進(jìn)我國(guó)各民族的交流與往來(lái),增強(qiáng)中華民族的凝聚力。因此,錄音內(nèi)容辨聽(tīng)司法鑒定中一項(xiàng)很重要的內(nèi)容就是把方言整理成為普通話,以解決司法實(shí)踐中存在的問(wèn)題,同時(shí)為公安機(jī)關(guān)偵查提供便利。
(二)錄音內(nèi)容辨聽(tīng)司法鑒定的法律依據(jù)
聲像資料司法鑒定的產(chǎn)生和發(fā)展具有社會(huì)發(fā)展必然性,2005年通過(guò)的《全國(guó)人民代表大會(huì)常務(wù)委員會(huì)關(guān)于司法鑒定管理問(wèn)題的決定》(以下簡(jiǎn)稱《決定》)中規(guī)定了聲像資料鑒定這一鑒定類別。2010年發(fā)布的司法鑒定技術(shù)規(guī)范《聲像資料鑒定通用規(guī)范》中規(guī)定了錄音資料鑒定分為錄音資料真實(shí)性(完整性)鑒定、錄音內(nèi)容辨聽(tīng)和語(yǔ)音同一性鑒定。2010年發(fā)布的司法鑒定技術(shù)規(guī)范《錄音資料鑒定規(guī)范》中規(guī)定了錄音內(nèi)容辨聽(tīng)的步驟和方法。標(biāo)準(zhǔn)的發(fā)布使得這項(xiàng)鑒定工作有據(jù)可依有規(guī)可循,使得這項(xiàng)鑒定工作的開(kāi)展更加規(guī)范。
(三)錄音內(nèi)容辨聽(tīng)司法鑒定的目的
委托機(jī)關(guān)委托鑒定機(jī)構(gòu)做錄音內(nèi)容辨聽(tīng)司法鑒定一般是出于幾方面原因的考慮:一是由于某些地區(qū)將普通話考試作為司法工作人員的職業(yè)準(zhǔn)入標(biāo)準(zhǔn)之一,所以這些地方的司法工作人員在工作過(guò)程中使用普通話交流,因此將方言翻譯成普通話既有利于司法工作,又減少了訴訟當(dāng)事人交流的語(yǔ)言障礙;二是由于當(dāng)事人提供的錄音證據(jù)背景噪音太大、語(yǔ)音內(nèi)容不清楚難以辨識(shí),致使當(dāng)事人提交的這份錄音證據(jù)難以充分發(fā)揮其作用;三是由于雙發(fā)當(dāng)事人對(duì)錄音資料的內(nèi)容有爭(zhēng)議,需要提交司法鑒定對(duì)錄音有爭(zhēng)議的部分進(jìn)行內(nèi)容的辨聽(tīng)。
因此,基于以上原因,偵查起訴和審判工作會(huì)要求將用方言表達(dá)或者模糊不清的說(shuō)話錄音內(nèi)容,具體地辨識(shí)出來(lái)。錄音的內(nèi)容是語(yǔ)音證據(jù)的重要方面,可起到書證的作用,它關(guān)系到證據(jù)的價(jià)值。一份完整的語(yǔ)音內(nèi)容整理證據(jù)可以為民事訴訟案件的審判、刑事訴訟案件的偵破提供很大的幫助。因此對(duì)模糊不清的錄音內(nèi)容進(jìn)行辨識(shí)成為聲像資料司法鑒定的一項(xiàng)任務(wù)和內(nèi)容。
二、錄音內(nèi)容辨聽(tīng)的方法
錄音內(nèi)容辨聽(tīng)司法鑒定可以采用語(yǔ)音學(xué)、語(yǔ)用學(xué)以及專業(yè)分析軟件等多種方法綜合進(jìn)行。案件鑒定過(guò)程中遇到的錄音大致分為模擬錄音和數(shù)字錄音。例如磁帶中的錄音就屬于模擬錄音,磁帶每播放一次,音質(zhì)就會(huì)損耗一點(diǎn),播放的次數(shù)久了音質(zhì)就會(huì)明顯下降,因此鑒定時(shí)不適合對(duì)磁帶進(jìn)行反復(fù)辨聽(tīng)。而數(shù)字錄音則不存在損耗的問(wèn)題,它的復(fù)制和傳播都是100%無(wú)失真、無(wú)品質(zhì)下降的。因此在鑒定過(guò)程中,當(dāng)遇到檢材為模擬錄音時(shí),通常都會(huì)將其轉(zhuǎn)換為數(shù)字錄音再進(jìn)行辨聽(tīng)。
根據(jù)《錄音資料鑒定規(guī)范》中的第2部分,錄音內(nèi)容辨聽(tīng)規(guī)范,語(yǔ)音內(nèi)容辨聽(tīng)有以下幾種基本方法:
(一)在無(wú)外界干擾條件下,通過(guò)高質(zhì)量的回放系統(tǒng),反復(fù)放音聽(tīng)辨,對(duì)錄音內(nèi)容進(jìn)行書面整理
反復(fù)辨聽(tīng)是一個(gè)很重要的步驟。根據(jù)原來(lái)所使用錄音機(jī)的性能,采用更高性能的錄音機(jī)或功放機(jī)放音,可改善語(yǔ)音的聽(tīng)覺(jué)效果。辨聽(tīng)過(guò)程中應(yīng)采用頭戴式耳機(jī)進(jìn)行辨聽(tīng),以排除外界干擾。同時(shí)在播放過(guò)程中選擇具有循環(huán)播放功能的播放軟件。
(二)對(duì)微弱的、受干擾的、不清晰的語(yǔ)音,通過(guò)錄音處理,改善聽(tīng)覺(jué)效果
送檢的錄音文件經(jīng)常會(huì)出現(xiàn)聲音太小聽(tīng)或者背景噪聲太大而導(dǎo)致聽(tīng)不清語(yǔ)音內(nèi)容的情況。此類錄音文件在進(jìn)行內(nèi)容的辨聽(tīng)之前,先要對(duì)其進(jìn)行處理以利于聽(tīng)辨。例如使用VS99語(yǔ)音工作站、智能聲紋鑒定工作站、音頻處理軟件Cool Edit 、Gold Wave等工具對(duì)錄音進(jìn)行處理以利于聽(tīng)辨。endprint
對(duì)于微弱的語(yǔ)音,采用語(yǔ)音增益可以起到增強(qiáng)或衰減語(yǔ)音,并能起到濾波(高通、低通、帶通)效果。
對(duì)于含有背景噪音的錄音文件,可以采取自適應(yīng)降噪或者人工降噪的方法。自適應(yīng)降噪可設(shè)定噪聲抑制強(qiáng)度,處理后得到降噪后的文件,可以通過(guò)疊加操作并反復(fù)視聽(tīng)以達(dá)到最終效果,并保存降噪的結(jié)果。人工降噪需要人工采集噪音樣本,并設(shè)定噪音范圍后,對(duì)整個(gè)或多個(gè)語(yǔ)音段參照噪音樣本進(jìn)行降噪。
通常會(huì)綜合使用上述手段并同時(shí)使用多種軟件,進(jìn)行反復(fù)處理并視聽(tīng),以求達(dá)到最佳辨聽(tīng)效果。
(三)對(duì)語(yǔ)義不是十分明確的語(yǔ)音,對(duì)說(shuō)話人的語(yǔ)音特點(diǎn)進(jìn)行分析,了解與某種發(fā)音對(duì)應(yīng)的語(yǔ)義
由于中國(guó)文化的博大精深和語(yǔ)言的復(fù)雜性,每個(gè)人由于生長(zhǎng)環(huán)境、教育背景、性別、年齡、職業(yè)的不同而具有個(gè)人的語(yǔ)音人身特征。當(dāng)在辨聽(tīng)過(guò)程中遇到語(yǔ)義不是十分明確的語(yǔ)音時(shí),需要對(duì)說(shuō)話人的語(yǔ)音特點(diǎn)進(jìn)行分析,了解當(dāng)?shù)氐奈幕?,確定與某種發(fā)音對(duì)應(yīng)的語(yǔ)義。
三、錄音內(nèi)容辨聽(tīng)司法鑒定存在的問(wèn)題
由于錄音內(nèi)容辨聽(tīng)司法鑒定起步比較晚,況且當(dāng)前并未對(duì)其引起足夠的重視,因此語(yǔ)音內(nèi)容辨識(shí)司法鑒定存在一定的問(wèn)題。這些問(wèn)題應(yīng)當(dāng)及時(shí)解決,否則將會(huì)阻礙該類鑒定的進(jìn)一步發(fā)展。本人認(rèn)為當(dāng)前錄音內(nèi)容辨聽(tīng)司法鑒定存在的問(wèn)題可以歸納為以下幾點(diǎn):
(一)認(rèn)識(shí)不夠
實(shí)踐中對(duì)錄音內(nèi)容辨聽(tīng)司法鑒定并未給予足夠的重視,沒(méi)有認(rèn)識(shí)到其重要性,認(rèn)為語(yǔ)音內(nèi)容辨識(shí)司法鑒定是很容易的甚至無(wú)關(guān)緊要。從上海某家鑒定機(jī)構(gòu)2017年聲像資料司法鑒定案件的分類統(tǒng)計(jì)數(shù)據(jù)來(lái)看,該鑒定機(jī)構(gòu)的錄音內(nèi)容辨聽(tīng)司法鑒定案件的數(shù)量占聲像資料司法鑒定案件總數(shù)的比例接近15%,根據(jù)這一顯示的數(shù)據(jù),說(shuō)明錄音內(nèi)容辨聽(tīng)司法鑒定在聲像資料司法鑒定中起著至關(guān)重要的作用。因此應(yīng)當(dāng)充分的認(rèn)識(shí)到錄音內(nèi)容辨聽(tīng)司法鑒定所起的重要作用。
(二)技術(shù)復(fù)雜
錄音內(nèi)容辨聽(tīng)司法鑒定的技術(shù)涉及語(yǔ)言學(xué)、計(jì)算機(jī)學(xué)、物理學(xué)、法學(xué)等多個(gè)學(xué)科,其所運(yùn)用到的知識(shí)比較綜合,因此該鑒定技術(shù)具有復(fù)雜性。對(duì)于含有背景噪聲的錄音文件,需要根據(jù)噪聲的種類,采用相應(yīng)的方法并綜合運(yùn)用多種工具和手段進(jìn)行降噪,以達(dá)到辨聽(tīng)的最佳效果。
(三)輔助人員易失控
由于語(yǔ)音辨識(shí)的內(nèi)容往往會(huì)涉及到方言,而我國(guó)的漢語(yǔ)方言十分復(fù)雜,目前通行的說(shuō)法是分為7種:北方方言、吳方言、湘方言、贛方言、粵方言、客家方言、閩方言。所以方言的復(fù)雜性和多樣性給鑒定工作帶來(lái)很大的困難,因此常常需要聘請(qǐng)相關(guān)的方言專家來(lái)進(jìn)行輔助鑒定。但是輔助人員畢竟不是司法鑒定人,目前對(duì)于輔助人員的責(zé)任范圍沒(méi)有明確的規(guī)定,對(duì)其能力的認(rèn)定也沒(méi)有一定的標(biāo)準(zhǔn),因此為確保鑒定結(jié)果的科學(xué)性,需要對(duì)輔助人員進(jìn)行嚴(yán)格的控制和審查。
四、未來(lái)發(fā)展方向預(yù)測(cè)
錄音內(nèi)容辨聽(tīng)司法鑒定是一項(xiàng)技術(shù)復(fù)雜、內(nèi)容繁瑣的鑒定工作,對(duì)鑒定人的計(jì)算機(jī)技能、方言水平、辨聽(tīng)能力、耐心程度等多方面的能力都是巨大的考驗(yàn)。目前行業(yè)內(nèi)對(duì)此類司法鑒定案件的做法主要還是通過(guò)人工辨聽(tīng)的方法,將錄音中的內(nèi)容聽(tīng)辨出來(lái)然后一句一句翻譯出來(lái),整理成文字。對(duì)于時(shí)間較長(zhǎng)的錄音文件,此項(xiàng)鑒定工作將會(huì)花費(fèi)鑒定人巨大的時(shí)間和精力,對(duì)鑒定人的耐心是一種極大的考驗(yàn)。
在高科技迅速發(fā)展的今天,依靠信息技術(shù)解決鑒定中的技術(shù)問(wèn)題已然成為一種發(fā)展趨勢(shì)。市面上的語(yǔ)音轉(zhuǎn)文字類軟件按照應(yīng)用環(huán)境大致可以分為語(yǔ)音喚醒、語(yǔ)音聽(tīng)寫、語(yǔ)音轉(zhuǎn)寫等三種。語(yǔ)音喚醒多用于設(shè)備(手機(jī)、家電等)在休眠或鎖屏狀態(tài)下檢測(cè)到用戶的聲音(設(shè)定的語(yǔ)音指令,即喚醒詞),讓處于休眠狀態(tài)下的設(shè)備直接進(jìn)入到等待指令狀態(tài),以開(kāi)啟后續(xù)進(jìn)程。語(yǔ)音聽(tīng)寫一般支持短時(shí)間(一分鐘以內(nèi))的音頻,多適用于人機(jī)對(duì)話。語(yǔ)音轉(zhuǎn)寫可以支持較長(zhǎng)時(shí)間的音頻,使用場(chǎng)景更自然地貼近日常交流。
科大訊飛于今年在開(kāi)放平臺(tái)推出一項(xiàng)語(yǔ)音轉(zhuǎn)寫服務(wù),該服務(wù)基于科大訊飛獨(dú)立研究的深度全序列卷積神經(jīng)網(wǎng)絡(luò)語(yǔ)音識(shí)別框架,針對(duì)語(yǔ)音的長(zhǎng)時(shí)相關(guān)性進(jìn)行語(yǔ)言建模,將音頻數(shù)據(jù)轉(zhuǎn)換成文本數(shù)據(jù),為后續(xù)的信息處理和數(shù)據(jù)挖掘提供基礎(chǔ)。具體表現(xiàn)形式為,將多種格式的長(zhǎng)段音頻文件(5小時(shí)以內(nèi))轉(zhuǎn)換成包含時(shí)間戳、詞句置信度、詞屬性以及句子標(biāo)志的文字信息。文字信息提供分詞形式以及整段文字形式。使用語(yǔ)音轉(zhuǎn)寫服務(wù)可以減輕錄音辨聽(tīng)鑒定的工作量,由于是對(duì)于時(shí)間較長(zhǎng)的錄音文件,可以先使用此項(xiàng)服務(wù)對(duì)錄音內(nèi)容進(jìn)行預(yù)辨識(shí),識(shí)別率一般在80%以上,然后再根據(jù)預(yù)處理的結(jié)果做進(jìn)一步的完善工作。
五、結(jié)語(yǔ)
在我國(guó),有關(guān)聲像資料司法鑒定中的錄音內(nèi)容辨聽(tīng)司法鑒定的研究,不論是在理論和技術(shù)方面,還是在司法應(yīng)用的實(shí)踐方面,都處于起始階段。錄音內(nèi)容辨聽(tīng)司法鑒定需要解決其在鑒定過(guò)程中存在的技術(shù)難題,在實(shí)踐中還需要不斷探索新的方法和研究領(lǐng)域,促進(jìn)該類司法鑒定朝著更加合理化和規(guī)范化的方向發(fā)展。
參考文獻(xiàn):
[1]霍憲丹主編.司法鑒定通論.法律出版社.2009.
[2]王永全.淺談撰寫計(jì)算機(jī)司法鑒定文書的一般原則//司法鑒定論叢I.北京大學(xué)出版社.2008.
[3]楊俊杰編著.司法話者識(shí)別.中國(guó)人民公安大學(xué)出版社.2009.
[4]公安部政治部編.言語(yǔ)識(shí)別與鑒定.中國(guó)人民公安大學(xué)出版社.2007.
[5]李利華.法醫(yī)鑒定文書制作應(yīng)注意的問(wèn)題//司法鑒定論叢I.北京大學(xué)出版社.2008.
[6]司法鑒定技術(shù)規(guī)范《錄音資料鑒定規(guī)范》SF/Z JD0301001-2010.中華人民共和國(guó)司法部司法鑒定管理局.2010.endprint