李運(yùn) 趙凱
摘? 要:為了依法有效提取音頻資料證據(jù),保護(hù)人民群眾合法權(quán)益和財(cái)產(chǎn)安全,在法律和技術(shù)層面研究音頻資料作為證據(jù)的有效提取方法。首先在實(shí)戰(zhàn)部門進(jìn)行調(diào)研,并完成模擬場(chǎng)景實(shí)驗(yàn)分析,然后設(shè)計(jì)了包含真實(shí)環(huán)境、實(shí)戰(zhàn)裝備、人物場(chǎng)景模擬等復(fù)雜場(chǎng)景實(shí)驗(yàn)條件,接著進(jìn)行了多場(chǎng)景基于音頻資料的語譜圖實(shí)驗(yàn)分析總結(jié),最終獲得有效的音頻提取方法,并形成一套應(yīng)用較強(qiáng)的提取規(guī)范。研究總結(jié)的方法和規(guī)范可運(yùn)用到公安實(shí)戰(zhàn)工作中,符合執(zhí)法規(guī)范,可操作性強(qiáng),獲取的音頻資料證據(jù)有效,實(shí)戰(zhàn)價(jià)值高。
關(guān)鍵詞:證據(jù);音頻資料;語譜圖;有效提取
中圖分類號(hào):TN912.3 文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號(hào):2095-2945(2020)27-0035-03
Abstract: This paper studies the effective extraction method of audio data as evidence. The purpose of the research is to extract audio data evidence effectively and protect people's legitimate rights and property safety. First of all, the investigation is carried out and the simulation scene experiment is analyzed. Then, the complex experimental scene conditions are designed. And it contains the real environment, combat equipment, character scene simulation and other content. Second, the paper analyzes and summarizes the multi-scene speech spectrogram based on audio data. Finally, this paper obtains an effective audio extraction method, and forms a set of extraction specifications with strong application. The methods can be applied to the actual work of the public security, which are in line with the law enforcement norms, with strong operability and high practical value.
Keywords: evidence; audio data; speech spectrum; effective extraction
1 概述
在2018年新修正的《中華人民共和國刑事訴訟法》第五章證據(jù)中的第五十條中,視聽資料被列為第八種證據(jù)。說明證據(jù)必須經(jīng)過查證屬實(shí),才能作為定案的根據(jù),凸顯了視聽資料的重要性,同時(shí)也表明視聽資料作為證據(jù)必須查證屬實(shí),也就是通常所說的有效,才能作為證據(jù)。
隨著信息技術(shù)的迅猛發(fā)展,指紋、人臉識(shí)別、聲紋等生物特征識(shí)別技術(shù)被廣泛應(yīng)用于公安機(jī)關(guān)案件偵破工作中。隨著便攜式錄音設(shè)備越來越普及,音頻資料作為證據(jù)的一種,能夠反映案件發(fā)生過程中的事實(shí),但音頻資料在查證和檢驗(yàn)鑒定過程中,對(duì)音頻資料的錄制和采集也提出了一定的挑戰(zhàn)。為了達(dá)到訴訟要求,音頻資料必須進(jìn)行檢驗(yàn)鑒定,在檢驗(yàn)鑒定過程中,發(fā)現(xiàn)很多音頻資料受到了質(zhì)疑,有些是沒有獲取到關(guān)鍵信息,有些是存在噪聲過大,無法檢驗(yàn),有些是在轉(zhuǎn)存或證據(jù)采集過程中真實(shí)性或完整性遭到破壞。在公安工作中音頻證據(jù)重要性日漸凸顯,如何保證有效地收集音頻證據(jù)成為公安“電子數(shù)據(jù)”證據(jù)走向科學(xué)化、規(guī)范化的中重要關(guān)鍵一環(huán),研究如何規(guī)范化收集有效音頻證據(jù)應(yīng)對(duì)日?;鶎庸补ぷ髦陵P(guān)重要。
2 音頻資料研究現(xiàn)狀
對(duì)于音頻資料的檢驗(yàn)鑒定,在司法語音業(yè)界內(nèi)稱之為“聲紋”鑒定,主要包含兩方面的內(nèi)容,音頻資料的同一性鑒定和音頻資料的真實(shí)性鑒定。聲紋作為人類生物特征的一種,是每個(gè)人語音聲學(xué)特征圖譜的集合[1]。每個(gè)人的聲紋是個(gè)體的長期穩(wěn)定的語音特征信號(hào),聲紋鑒定就是把未知人的語聲和已知人的語聲,通過語圖儀分別制成聲紋圖譜,再依據(jù)聲紋圖上的特征進(jìn)行分析、比較和判斷,完成音頻資料的檢驗(yàn)鑒定。
在音頻資料的檢驗(yàn)鑒定中,針對(duì)音頻資料作為證據(jù)當(dāng)成審判的依據(jù),其有效的提取研究相對(duì)較少。音頻資料的提取方法和技巧的研究是聲紋鑒定技術(shù)與公安業(yè)務(wù)工作相結(jié)合的研究課題。在音頻資料的檢驗(yàn)鑒定中,一般經(jīng)司法行政機(jī)關(guān)進(jìn)行委托,再獲得司法鑒定資格的鑒定機(jī)構(gòu)進(jìn)行檢驗(yàn)鑒定。在檢驗(yàn)鑒定工作中,發(fā)現(xiàn)司法行政機(jī)關(guān)提供的音頻資料,常出現(xiàn)不規(guī)范、失效等問題,這也是由于業(yè)務(wù)部門欠缺對(duì)音頻資料的提取和保存的相關(guān)技術(shù)研究和培訓(xùn)??偟膩碚f,目前實(shí)戰(zhàn)單位關(guān)于音頻資料的相關(guān)應(yīng)用較多,但研究實(shí)戰(zhàn)規(guī)范性和有效性研究還較薄弱。
3 語音頻譜在音頻資料有效性檢驗(yàn)中的運(yùn)用
在我國的聲紋檢驗(yàn)鑒定中,聲紋鑒定過程通過綜合分析判斷聽覺評(píng)價(jià)、語音頻譜比較和定量比對(duì)分析,得出檢驗(yàn)鑒定的結(jié)論。無論是在同一性檢驗(yàn)和真實(shí)性檢驗(yàn)中,語音的頻譜分析都是重要的檢驗(yàn)鑒定環(huán)節(jié)。在語音的頻譜分析中,使用的最主要的圖譜就是語音的寬帶語譜圖。語音的寬帶語譜圖,主要采用了“短時(shí)分析技術(shù)”,將語音的時(shí)間、強(qiáng)度和頻譜信息綜合在一起形成的圖譜,主要反映了話語人語音的共振峰特征信息。
語音共振峰反映聲道諧振特性的重要特征,是聲紋檢驗(yàn)鑒定中的重要特征參數(shù),包含了話語人的生物特征和行為特征的重要信息。共振峰中心的高低、濃淡和寬窄等參數(shù)表示了語音的音延(duration)、音頻(frequency)和音強(qiáng)(intensity)等因素的變化。聲道中的共鳴作用使一個(gè)音的加強(qiáng)區(qū)有別于另一個(gè)音的加強(qiáng)區(qū),共振峰在頻譜圖上顯示為水平方向的黑帶,共振峰的形態(tài)和條數(shù)是檢驗(yàn)鑒定中的重要參數(shù)。
在音頻資料同一性鑒定分析中,認(rèn)定同一的鑒定結(jié)論就需要以下內(nèi)容作為支撐:此結(jié)論要求檢材、樣本中可供比對(duì)的音節(jié)有10個(gè)以上,每個(gè)音節(jié)有3條以上有效共振峰;所有可供比對(duì)音節(jié)的特征符合率超過90%?;蛘呖晒┍葘?duì)的音節(jié)有6個(gè)以上,一般是一個(gè)句子,每個(gè)音節(jié)有4條以上有效共振峰,特征符合率超過95%。如果檢材、樣本有偽裝,則不能下此結(jié)論。由此可以看出,每個(gè)音節(jié)中的有效共振峰的條數(shù)是同一性檢驗(yàn)鑒定的主要因素。為了達(dá)到檢驗(yàn)鑒定的目的,音頻資料有效提取的首個(gè)重要參數(shù)就是共振峰的條數(shù)。
在音頻資料完整性檢驗(yàn)鑒定分析中,頻譜的檢驗(yàn)也是至關(guān)重要的。對(duì)頻譜的連續(xù)性和完整性的分析檢驗(yàn)是檢驗(yàn)結(jié)論的重要支撐。
4 語音有效提取的實(shí)驗(yàn)和分析
為貼近實(shí)戰(zhàn),總結(jié)不同場(chǎng)景中語音有效提取的難點(diǎn)和要點(diǎn),通過模擬場(chǎng)景方法,獲取兩個(gè)比較典型的場(chǎng)景案例進(jìn)行分析總結(jié)。第一個(gè)場(chǎng)景是公共場(chǎng)所,如火車站、廣場(chǎng)和餐廳等背景比較嘈雜的場(chǎng)景。第二個(gè)場(chǎng)景是室內(nèi)環(huán)境,如小區(qū)房、寫字樓、密閉酒店背景較為安靜場(chǎng)景。
為達(dá)到一線民警較容易進(jìn)行分析的目的,實(shí)驗(yàn)軟件分析沒有采用專業(yè)的司法語音鑒定軟件,而采用較容易獲取的語音分析軟件praat進(jìn)行語音頻譜分析,達(dá)到了預(yù)期實(shí)驗(yàn)?zāi)康?。下面將通過兩個(gè)部分分別對(duì)兩個(gè)不同場(chǎng)景的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析總結(jié)。
4.1 嘈雜公共場(chǎng)所的語音有效提取和分析
在嘈雜的公共場(chǎng)所完成語音提取難度較大,主要是由于嘈雜的公共場(chǎng)所語音的混響較大和不確定的隨機(jī)噪聲較多兩個(gè)因素。為達(dá)到較好的實(shí)驗(yàn)效果,采用模擬場(chǎng)景的實(shí)驗(yàn)方法。模擬乘車人員和工作人員由于糾紛產(chǎn)生爭(zhēng)吵的場(chǎng)景。鐵路民警在控制現(xiàn)場(chǎng)、排解糾紛過程中,王某情緒激動(dòng),周圍圍觀人員較多,并使用隨身攜帶的維修工具將民警打傷,但在被制服后,說民警先對(duì)其進(jìn)行無端毆打,被迫自衛(wèi)還手。由于現(xiàn)場(chǎng)混亂隨身攜帶警用執(zhí)法儀器在勸阻過程中被打落,因此現(xiàn)場(chǎng)的錄音成為還原事件的關(guān)鍵證據(jù)。
實(shí)驗(yàn)選取了語音中的“犯罪”兩個(gè)字作為分析對(duì)象,將在上述模擬場(chǎng)景中的語音檢材與同樣環(huán)境但噪聲較小時(shí)獲取語音檢材的圖譜數(shù)據(jù)進(jìn)行對(duì)比。圖1是模擬場(chǎng)景中提取到的語音檢材語譜圖。圖1語譜圖中有高音強(qiáng)噪聲,時(shí)域圖譜中有明顯噪聲波形,頻譜中噪聲圖譜充滿整個(gè)圖譜頻域。圖2語譜圖中噪聲較小,圖譜清晰。圖1在噪聲條件下關(guān)鍵語音圖譜被噪聲覆蓋且不滿足有效共振峰的個(gè)數(shù),提取的音頻資料不能作為證據(jù),屬音頻資料的無效提取。圖2噪聲環(huán)境較小,關(guān)鍵語音圖譜清晰,且具備三條以上的有效共振峰條件,屬音頻資料的有效提取。根據(jù)多次反復(fù)實(shí)驗(yàn),在高音強(qiáng)噪聲環(huán)境下,提取的音頻資料中的關(guān)鍵語句60%以上共振峰數(shù)目不足或存在語音重疊的情況,不能作為有效證據(jù)[2]。
當(dāng)案件發(fā)生地點(diǎn)出現(xiàn)在這類特殊噪聲環(huán)境中時(shí),公安執(zhí)法人員應(yīng)當(dāng)首先勸離圍觀群眾,形成一定執(zhí)法區(qū)域或在環(huán)境噪聲較小場(chǎng)地進(jìn)行執(zhí)法,執(zhí)法過程中應(yīng)減少多人同時(shí)說話造成的語音重疊,維持雙方的對(duì)話秩序。當(dāng)外界自然狀態(tài)音頻(比如火車站火車鳴笛聲)振動(dòng)無法規(guī)避時(shí),公安人員應(yīng)按照公安部關(guān)于印發(fā)《公安機(jī)關(guān)現(xiàn)場(chǎng)執(zhí)法視音頻記錄工作規(guī)定》規(guī)范進(jìn)行音頻收集,同時(shí)在保障自身安全的前提下進(jìn)行音頻證據(jù)的獲取,最重要的是需要執(zhí)法人員在音頻證據(jù)提取時(shí)一定要保留原始載體,避免錄音證據(jù)證明力不足的情況[3]。特殊情況下執(zhí)法人員可收集相應(yīng)環(huán)境下的噪音數(shù)據(jù),并移交司法鑒定部門使用音頻資料處理技術(shù)手段,對(duì)噪聲進(jìn)行分解去除,提高辦案效率和司法部門的鑒定效率[4]。
4.2 安靜場(chǎng)景中語音有效提取分析
在較安靜場(chǎng)景下對(duì)音頻資料提取的有效性影響較小。音頻資料的有效提取關(guān)鍵在于聲源距離和角度、執(zhí)法規(guī)范、關(guān)鍵信息獲取、錄音設(shè)備等[5]。案件發(fā)生時(shí),執(zhí)法人員作為主動(dòng)取證方,應(yīng)執(zhí)法規(guī)范,保持與被采集人盡量近的距離,遠(yuǎn)離噪聲源,合理調(diào)動(dòng)被采集人的情緒,運(yùn)用較好的音頻資料錄制設(shè)備。
實(shí)驗(yàn)?zāi)M某民警住宅房間內(nèi)執(zhí)法的情景,在執(zhí)法過程中某男不滿執(zhí)法結(jié)果,公然妨礙民警執(zhí)法,使用侮辱性詞匯攻擊民警,并動(dòng)手推搡執(zhí)法人員,導(dǎo)致民警手部挫傷,執(zhí)法記錄儀掉落。在回看執(zhí)法視頻時(shí),由于民警距離該男距離稍遠(yuǎn),錄音角度沒有正對(duì),且執(zhí)法儀被打落于沙發(fā)下,導(dǎo)致推搡視頻未被錄上。同樣場(chǎng)景下,民警應(yīng)保持與該男合理距離和角度,冷靜控制該男情緒,發(fā)生肢體接觸時(shí)有效保護(hù)執(zhí)法記錄儀。
通過兩個(gè)不同場(chǎng)景實(shí)驗(yàn),對(duì)音頻資料中的“混蛋”一詞進(jìn)行對(duì)比分析。圖3為前一場(chǎng)景下獲取的音頻資料。語音圖譜分析范圍在0-5000Hz,“混”音長約1.57s。圖3中,聲源距離較遠(yuǎn)、錄音角度未正對(duì)時(shí),語圖中“混”的音強(qiáng)很小,寬帶語圖不清晰,檢測(cè)不出共振峰。圖4為后一場(chǎng)景下獲取的音頻資料。語音圖譜分析范圍在0-5000Hz,“混”音長約1.76s。圖4中,聲源距離和角度合適,語圖中“混”的音強(qiáng)較大,寬帶語圖清晰,共振峰大于3條。分析上述兩種場(chǎng)景,圖3場(chǎng)景中關(guān)鍵語句音強(qiáng)較小,混響較大,共振峰不清晰,條數(shù)不滿足鑒定條件。圖4場(chǎng)景中,關(guān)鍵語句音強(qiáng)較大,語圖清晰,共振峰條數(shù)滿足鑒定條件。
安靜場(chǎng)景中對(duì)音頻資料提取時(shí),有效提取難度較小,但也存在無效提取的現(xiàn)象。執(zhí)法人員首先要注意保持執(zhí)法記錄儀的狀態(tài)穩(wěn)定,在音頻資料提取中要注意以下幾點(diǎn)。第一與聲源的距離合適,角度要正對(duì);第二執(zhí)法規(guī)范,控制對(duì)方情緒;第三語音不能重疊,關(guān)鍵信息反復(fù)詢問;第四保持執(zhí)法記錄儀的正常狀態(tài)。
根據(jù)上述典型實(shí)驗(yàn)和數(shù)據(jù)對(duì)比分析,執(zhí)法人員在采集音頻資料作為證據(jù)時(shí)應(yīng)當(dāng)注意的規(guī)范包括[6]:(1)確定收集犯罪嫌疑人表達(dá)其犯罪的內(nèi)容;(2)避免語音重疊,盡量讓犯罪嫌疑人發(fā)聲;(3)引導(dǎo)犯罪嫌疑人重復(fù)關(guān)鍵信息;(4)
確保犯罪嫌疑人語義連貫;(5)遠(yuǎn)離產(chǎn)生噪聲的物體;(6)防止錄音設(shè)備震動(dòng)導(dǎo)致錄音中斷;(7)錄音距離在保證自
身安全的情況下,接近犯罪嫌疑人。
為了避免丟失較多共振峰特征,達(dá)到音頻資料的有效提取,錄音設(shè)備選用規(guī)范為[7]:(1)選擇PCM無損編碼格式;(2)采樣率大于8kHz;(3)含有動(dòng)圈麥克風(fēng),如果室內(nèi)環(huán)境工作辦案多于室外環(huán)境選擇電容麥克風(fēng),電容麥克風(fēng)抗阻指數(shù)參照100-250Ω,電容麥克風(fēng)抗阻指數(shù)參照500-550Ω;(4)頻率范圍參照20-10kHz;(5)動(dòng)態(tài)范圍達(dá)60dB。
5 結(jié)束語
本文研究了音頻資料在證據(jù)中的作用,分析了語音頻譜在音頻資料有效性檢驗(yàn)中的運(yùn)用,運(yùn)用模擬場(chǎng)景方法通過對(duì)音頻資料的有效提取進(jìn)行了實(shí)驗(yàn),總結(jié)了音頻資料采集和有效提取時(shí)的注意事項(xiàng)和一般規(guī)范。通過音頻資料的有效提取,可還原案件發(fā)生時(shí)真實(shí)場(chǎng)景,提高執(zhí)法人員執(zhí)法時(shí)的工作效益,推動(dòng)公安工作的執(zhí)法規(guī)范進(jìn)程,促進(jìn)以“審判為中心”的注重證據(jù)的司法制度改革。
參考文獻(xiàn):
[1]王英利,李敬陽,曹洪林.聲紋鑒定技術(shù)綜述[J].警察技術(shù),2012(4):53-56.
[2]何少巖,陳蕉容,陳舜兒.基于錄制環(huán)境檢測(cè)的數(shù)字音頻取證研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2013(12):4142-4145.
[3]楊銳.數(shù)字音頻取證方法研究[D].廣州:中山大學(xué),2010.
[4]賈麗雯.芻議聽音與司法鑒定[J].湖北警察學(xué)院學(xué)報(bào),2013(4):183-185.
[5]黃曉丹.音頻司法鑒定的研究[D].廈門:廈門大學(xué),2012.
[6]黃燕芳.聲紋樣本收集過程中存在的問題和解決方法[J].鐵道警察學(xué)院學(xué)報(bào),2007(10):95-96.
[7]秦天蕓.加性噪聲下錄音設(shè)備來源取證研究[D].寧波:寧波大學(xué),2019.