国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

聲紋識別和語音識別技術(shù)應(yīng)用在公安領(lǐng)域的可行性分析

2021-11-24 19:59:24
法制博覽 2021年36期
關(guān)鍵詞:聲紋識別公安系統(tǒng)音頻

向 菲

(湖北省恩施州公安局,湖北 恩施 445000)

人類的機(jī)體構(gòu)成十分復(fù)雜難以解釋,俗話說“世界上沒有兩片相同的葉子”,無論是人臉分析,還是指紋、DNA等標(biāo)志性的分析,都是經(jīng)過了長期發(fā)展而產(chǎn)生的技術(shù)。人類的發(fā)聲是一個(gè)神奇復(fù)雜的生理功能,每個(gè)人的聲帶構(gòu)成不同,所形成的聲線也完全不同,受到神經(jīng)系統(tǒng),基因等多個(gè)復(fù)雜因素的共同控制。同時(shí),每個(gè)人的聲線,還與成長環(huán)境,外界因素等影響息息相關(guān),使得每個(gè)人的聲音構(gòu)成都完全不同,且聲學(xué)上的聲譜特征穩(wěn)定且唯一。從這個(gè)角度來看,對個(gè)人的聲線進(jìn)行分析并進(jìn)行身份識別是可行的。此外,近年來,人工智能技術(shù)不斷地發(fā)展,云計(jì)算、大數(shù)據(jù)處理等技術(shù)不斷涌現(xiàn),因此,從技術(shù)上,聲紋識別和語音識別技術(shù)應(yīng)用到公安領(lǐng)域,可行性就大大增加了。

不僅如此,該技術(shù)不僅用于政府單位,也被企業(yè)家們發(fā)掘并商用。在國家的積極投入下,近年來培養(yǎng)出了大批的大數(shù)據(jù)應(yīng)用人才,技術(shù)在不斷提升,聲紋識別和語音識別技術(shù)正在逐步商業(yè)化,經(jīng)典的應(yīng)用場景有:公安偵查、智能家電、手機(jī)語音識別、金融保密行業(yè)等,代替復(fù)雜難記的密碼,安全高效。

近年來,在公安機(jī)關(guān)偵辦電信詐騙、涉恐涉毒等復(fù)雜案件時(shí),語音識別和聲紋識別技術(shù)起到了相當(dāng)大的輔助作用,相關(guān)技術(shù)人員對案件偵破作出了重大貢獻(xiàn)。[1]

綜上所述,相比現(xiàn)在比較完善發(fā)達(dá)的語音交互來說,聲紋識別的技術(shù)需要更高的入行門檻,目前處在穩(wěn)步發(fā)展的階段。通過該技術(shù),可以精準(zhǔn)識別人與人之間的區(qū)別。本文將介紹該技術(shù)的原理和目前的應(yīng)用現(xiàn)狀,并闡述其在公安領(lǐng)域發(fā)揮的重大作用。

一、技術(shù)原理

聲紋指的是經(jīng)過相關(guān)儀器測試現(xiàn)實(shí)的攜帶語言信息的聲波頻譜,有波長頻率等多種特征組成,受到發(fā)聲器官(舌頭,口腔,牙齒,肺,鼻腔尺寸)、心理、環(huán)境干擾等多種因素的影響。盡管如此,每個(gè)人的具體構(gòu)造不同,因此在一般情況下,還是能通過聲音特征和聲譜來判斷是否是同一個(gè)人。在這個(gè)角度上,聲紋識別的意義就是獲取一個(gè)人具體的發(fā)聲方式和發(fā)生特征。主要體現(xiàn)在人的發(fā)聲共鳴方式特征、嗓音純度特征、音高特征以及音域特征等。語音識別略有不同,主要體現(xiàn)的是識別語言中的字符和語言信息,并加以解讀,從本質(zhì)上不是為了識別說話人的身份,關(guān)注的是傳達(dá)的信息內(nèi)涵。兩者相結(jié)合,能通過聲音對說話的人有一個(gè)基本輪廓的了解。目前兩個(gè)技術(shù)應(yīng)用都各自形成了較為完善的應(yīng)用流程和方式:

(一)聲紋識別

聲紋識別的應(yīng)用主要經(jīng)過三個(gè)步驟:預(yù)處理,特征提取以及識別。預(yù)處理指的是從一段語音信息中提取出干凈便于數(shù)字識別的人聲信息,將非人聲的信息過濾掉,防止后期分析時(shí)候造成不必要的干擾,是整個(gè)識別過程中最基礎(chǔ)的部分。往往最基礎(chǔ)的部分是最重要的,可以分為數(shù)字信號處理以及機(jī)器學(xué)習(xí)。第二部分就是進(jìn)行特征提取,通過專業(yè)的技術(shù)分析人員的操作,識別過程進(jìn)入到核心部分,進(jìn)行信息提取,提取后再進(jìn)行分析。該部分需要的信息包括上文所提到的所有基本特征信息,聲音特征的提取一般具有泛化特征,在較長時(shí)間跨度下還能表現(xiàn)出一定的穩(wěn)定性,因此對于公安領(lǐng)域的應(yīng)用來說是十分有利的。

最后一步就是識別部分,作為壓軸流程,所需要的技術(shù)就比較關(guān)鍵,要求具有較高的準(zhǔn)確性,需要通過模型對提取出的聲紋進(jìn)行分析,目前也已經(jīng)存在較為成熟的幾種模型和技術(shù)。

(二)語音識別

綜上所述,語音識別與聲紋識別的主要區(qū)別在于語音識別是提取內(nèi)容信息,聲紋識別是針對特征提取身份信息。語音識別技術(shù)的核心是將聲音內(nèi)容變?yōu)槲谋具M(jìn)行輸出,以便公安系統(tǒng)在進(jìn)行案件偵辦時(shí)作為參考。包括語音合成、識別和理解三個(gè)方面的內(nèi)容。

第一部分要在技術(shù)限制內(nèi)盡可能地提取并保留完整的原始語音,保證清晰度,是整個(gè)識別工作的基礎(chǔ);第二部分是要進(jìn)行語音的識別,基于內(nèi)容對語音進(jìn)行處理,將復(fù)雜的語境轉(zhuǎn)換為能夠理解的文本或命令,作為可識別的參考證據(jù);第三部分工作作為收尾,前兩步已經(jīng)基本將所有的前期基本工作鋪墊好,最后的理解部分就是在相應(yīng)的語境之中,對應(yīng)邏輯關(guān)系,通過不斷地變化語境進(jìn)行語義推理。

(三)結(jié)合

兩者在單獨(dú)使用的時(shí)候,是針對不同的內(nèi)容和效果,但是在公安領(lǐng)域內(nèi)的應(yīng)用,通常是兩者結(jié)合應(yīng)用。在公安領(lǐng)域中,利用兩種技術(shù)的結(jié)合,以及實(shí)戰(zhàn)時(shí)的信息采集技術(shù),幾乎可以達(dá)到聲音找人、聲音定人的效果。隨著大數(shù)據(jù)的不斷發(fā)展,我國的公安系統(tǒng)也形成了龐大的內(nèi)部數(shù)據(jù)庫,將收集、分析過的聲音數(shù)據(jù)和聲音信息作為歷史檔案儲存與數(shù)據(jù)庫,再次利用時(shí)可以直接進(jìn)行匹配對比,節(jié)省了大量的翻閱檔案的人力物力和時(shí)間資源。提升了公安辦案的效率、便捷度和可信度。

兩者相結(jié)合不僅僅是各司其職,一般兩項(xiàng)內(nèi)容會對同一則音頻同時(shí)進(jìn)行,兩者需要實(shí)現(xiàn)同一且真實(shí)。與此同時(shí),對公安內(nèi)部技術(shù)人員的要求也更高,需要盡到維護(hù)系統(tǒng)安全、保證系統(tǒng)健康運(yùn)行的職責(zé),并且在進(jìn)行數(shù)據(jù)分析的時(shí)候,要盡量做到快速準(zhǔn)確,減少操作失誤,以對案件偵辦盡到相應(yīng)的責(zé)任。

二、技術(shù)發(fā)展及其現(xiàn)狀

(一)發(fā)展過程

關(guān)于聲音處理的相關(guān)技術(shù)最早出現(xiàn)于40年代末的美國貝爾實(shí)驗(yàn)室,其最早開發(fā)的目的是將其應(yīng)用于軍事情報(bào)領(lǐng)域。此后,技術(shù)不斷成熟發(fā)展,不少人發(fā)現(xiàn)了其中的潛力,將其應(yīng)用于商業(yè)等其他領(lǐng)域。[2]如,60年代后期應(yīng)用于美國的法證領(lǐng)域,經(jīng)過幾十年的發(fā)展,該項(xiàng)技術(shù)的成熟程度已經(jīng)可以達(dá)到公安部的標(biāo)準(zhǔn),其可信度是可以作為證據(jù)進(jìn)行當(dāng)庭提供的。目前較為成熟的應(yīng)用方法是模板匹配法、最近鄰方法、神經(jīng)元網(wǎng)絡(luò)方法以及聚類法等。

以上提到的幾種方法,雖然操作方式上存在差異,但本質(zhì)上沒有什么變化,采用的基本原理都是相似的,目前公安系統(tǒng)采用的就是將聲譜圖提取出來,并將其與已存在的數(shù)據(jù)對比進(jìn)行聲紋識別。目前無論是國內(nèi)還是國外都有不少企業(yè)在相關(guān)領(lǐng)域進(jìn)行研究,設(shè)備的先進(jìn)程度得到不斷提高,公安部專門為采購相關(guān)設(shè)備頒布了《安防聲紋識別應(yīng)用系統(tǒng)技術(shù)要求》的行業(yè)標(biāo)準(zhǔn),以識別市面上設(shè)備是否達(dá)到公安部的采購要求。

(二)局限性

聲音的識別技術(shù)分為動態(tài)檢測和靜態(tài)檢測兩個(gè)方式,目前應(yīng)用的許多靜態(tài)檢測的方法存在很大的弊端,其實(shí)時(shí)性是無法與動態(tài)方法相比較的,很顯然動態(tài)檢測的實(shí)際需求更大。

上文提到的識別過程中,十分關(guān)鍵的一步是對聲音進(jìn)行提前處理,目的不是檢測聲音,而是將音頻降噪和排除環(huán)境干擾,該步驟對于語音識別來說至關(guān)重要,這一步出現(xiàn)問題,將會對識別內(nèi)容的有效性產(chǎn)生巨大影響。無論是進(jìn)行聲紋識別還是語音識別,都要事先建立數(shù)據(jù)庫,目前最為龐大的就是公安系統(tǒng)下的聲紋庫。然而,該識別方式存在兩個(gè)局限性:龐大數(shù)據(jù)庫不易建立和管理和聲音處理是否順利進(jìn)行存在很多不確定因素。此外,還存在許多不確定的物理和計(jì)算等相關(guān)問題。

即使聲音存在唯一性,音頻數(shù)據(jù)的穩(wěn)定性也非常好,但是目前的技術(shù)局限性下,還是存在很多難以掌握的因素,比如人聲的易變性很強(qiáng),與年齡性別甚至情緒都息息相關(guān);上文也提到,若音頻錄制所處的環(huán)境以及采集數(shù)據(jù)的設(shè)備不利于分析,聲音特征的建模和分析也存在局限性。因此,筆者認(rèn)為這種技術(shù)不應(yīng)單獨(dú)使用,應(yīng)結(jié)合相關(guān)認(rèn)證手段一并,提高數(shù)據(jù)的可信度。

三、公安領(lǐng)域的應(yīng)用

在國家的大力扶持下,公安系統(tǒng)在案件偵破上可以使用的技術(shù)手段越來越多,也越來越先進(jìn),然而相應(yīng)的犯罪手段也在不斷現(xiàn)代化,存在很多的涉網(wǎng)新型犯罪手段。如語音電信詐騙、恐嚇、涉黑涉毒涉恐等案件類型,都涉及聲音數(shù)據(jù)的收集,聲音數(shù)據(jù)都可以用于案件的辦理。新型犯罪頻發(fā)的當(dāng)代社會,公安系統(tǒng)不斷迎來全新的挑戰(zhàn)。因此,先進(jìn)的鑒定技術(shù)是以上幾類刑事案件偵破的關(guān)鍵一步,也是取證的重要手段:

(一)犯罪分子的個(gè)人音頻分析

筆者查閱資料,了解到目前該技術(shù)應(yīng)用較多的案件類型有敲詐勒索,綁架勒索,陷害恐嚇等性質(zhì)惡劣的事件。以上提到的案件多以音頻和電話錄音為關(guān)鍵性證據(jù),不僅僅是通過通信手段對犯罪分子的所在地點(diǎn)進(jìn)行確定,對未知的犯罪分子身份確定的唯一途徑就是聲音鑒別,包括電話背景音、環(huán)境音。運(yùn)用聲紋和語音識別技術(shù),判斷是否是再犯人員,判斷人的性別年齡體態(tài)等多種特征,進(jìn)行畫像描述,刻畫特征,為刑偵人員的判斷提供依據(jù)。

除了上述的基本信息以外,還可以根據(jù)聲譜和語言內(nèi)容的分析,進(jìn)行說話習(xí)慣,口音,受教育級別等特征的分析,是案件進(jìn)一步偵查的關(guān)鍵道路。

(二)識別聲音

隨著技術(shù)的進(jìn)步,犯罪手段不斷創(chuàng)新,變聲器等干擾措施層出不窮,通過上文提到的幾個(gè)步驟的處理,通過對已經(jīng)變異過的聲音提取出聲譜,獲取較為穩(wěn)定不變的聲音特征,得到一定的規(guī)律,識別聲音材料是否有偽造的可能性,以確保證據(jù)的真實(shí)性。在與犯罪分子斗智斗勇的同時(shí),我國的公安系統(tǒng)也在不斷提升和突破。

(三)改善證據(jù)質(zhì)量

根據(jù)上文所述,語音識別技術(shù)要將語音材料經(jīng)過精密的處理,鑒于犯罪證據(jù)的特殊性,大量的語音材料并不是那么完美,存在很多噪音和錄音設(shè)備質(zhì)量問題,導(dǎo)致達(dá)不到刑偵工作所需的標(biāo)準(zhǔn)。經(jīng)過處理之后,將語音內(nèi)涵從音頻之中提取出來,并將關(guān)鍵信息進(jìn)行聲音放大和清晰處理,從而解決上述問題,改善證據(jù)的質(zhì)量,使其成為刑偵過程中的得力助手。

(四)聲音辨別

所謂聲音辨別,就是同一性的另一種表達(dá)方式,先前熱播的《人民的名義》真實(shí)地反映了識別技術(shù)在同一性方面的作用。通過語音材料的分析對比,確定該證據(jù)是否對應(yīng)正確的嫌疑人。[3]該技術(shù)的應(yīng)用在確定嫌疑人身份上起到了很大作用,為刑偵人員下結(jié)論提供了多一條道路,在龐大的公安機(jī)關(guān)數(shù)據(jù)庫中查詢是否存在再犯的情況,為判斷量刑提供了又一依據(jù)。

(五)真實(shí)性檢驗(yàn)

在一些恐嚇陷害的惡性事件中,當(dāng)事人會將語音材料作為證據(jù)提供。為了保證法律的公平公正性,公安機(jī)關(guān)的職責(zé)是分辨該音頻的真實(shí)性,不僅要進(jìn)行上述的同一性檢測,分析音頻是否為人工合成。是否存在增加刪減惡行剪輯等情況。利用相關(guān)技術(shù)進(jìn)行聲譜的識別,檢查音頻是否為合理存在,從技術(shù)上辨別真?zhèn)?,證明數(shù)據(jù)的真實(shí)性。

以上僅為大致的應(yīng)用,實(shí)際上該技術(shù)有更多的益處,如提高應(yīng)用語音材料的案件偵破速度??梢詫⒄Z音作為數(shù)據(jù)材料跨區(qū)域進(jìn)行傳輸,更高效率地協(xié)助跨區(qū)域辦案,不斷豐富公安機(jī)關(guān)的數(shù)據(jù)庫,作為歷史數(shù)據(jù),能加強(qiáng)對有案底的相關(guān)人員的監(jiān)控和管理,快速檢索嫌疑人身份,減少了大量的人工成本及物資耗費(fèi),但同時(shí)對于技術(shù)人員的培養(yǎng)要求也更高。

四、應(yīng)用前景

綜上,已知本文提到的相關(guān)技術(shù)已經(jīng)廣泛應(yīng)用于公安領(lǐng)域,但鑒于技術(shù)發(fā)展存在局限性,其普及度也有待提高,為了讓科技在助力案件偵破、提高公安系統(tǒng)智能化方面繼續(xù)做貢獻(xiàn),[4]將相關(guān)技術(shù)在公安領(lǐng)域中廣泛普及是十分有必要的:

(一)協(xié)助警務(wù)工作

警務(wù)的主要任務(wù)還是為人民服務(wù),為基層人民提供安全健康的區(qū)域管理,是區(qū)域警務(wù)的最基本要求,理應(yīng)達(dá)到“案件量少,秩序好,社會安全,群眾安心”等基本目標(biāo)。將相關(guān)技術(shù)普及到社區(qū)警務(wù),對于區(qū)域人口的信息管理方面,有助于警務(wù)人員更加全面便捷地了解區(qū)域人口的情況,對于安全事故的處理效果也會大幅提高。構(gòu)建區(qū)域該技術(shù)數(shù)據(jù)庫,豐富智慧社區(qū)警務(wù)的建設(shè),方便群眾配合警務(wù)工作,完善公安系統(tǒng)服務(wù)機(jī)制。

(二)日常治安防控

該技術(shù)數(shù)據(jù)庫的建立,方便警務(wù)人員在日常治安巡邏中,發(fā)現(xiàn)并確定在逃嫌疑人,消除社區(qū)安全隱患,有助于通過設(shè)備進(jìn)行身份確認(rèn),及時(shí)處理相關(guān)事務(wù)。

根據(jù)涉恐涉毒等數(shù)據(jù)庫的信息,以及隨身配備的語音識別設(shè)備,集中管理集中查詢,助力公安機(jī)關(guān)有效打擊犯罪分子,維持管轄區(qū)域的和諧穩(wěn)定,保證居民人身安全。

總而言之,筆者認(rèn)為聲紋識別和語音識別技術(shù)在公安領(lǐng)域中,是傳統(tǒng)偵辦手段與現(xiàn)代科技融合的成果,是公安領(lǐng)域與高科技犯罪不斷斗智斗勇得出來的智慧結(jié)晶,是預(yù)防犯罪、快速結(jié)果犯罪的有效手段之一。語音材料數(shù)據(jù)庫的構(gòu)建,為公安領(lǐng)域的工作減少了許多錯(cuò)誤的發(fā)生以及人力物力資源的浪費(fèi)。本文結(jié)合應(yīng)用場景進(jìn)行描述,探究了該技術(shù)具體如何發(fā)揮作用。

綜上,雖然該技術(shù)上還存在一些缺陷,但是為了進(jìn)一步實(shí)現(xiàn)普及和高效使用,應(yīng)該不斷完善設(shè)備和數(shù)據(jù)庫的建設(shè),助力公安領(lǐng)域與科技進(jìn)步的結(jié)合,為廣大公民爭取幸福平安的生活環(huán)境。

猜你喜歡
聲紋識別公安系統(tǒng)音頻
必須了解的音頻基礎(chǔ)知識 家庭影院入門攻略:音頻認(rèn)證與推薦標(biāo)準(zhǔn)篇
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
聲紋識別中的區(qū)分性訓(xùn)練
淺談一種基于聲紋識別的教室上課點(diǎn)名系統(tǒng)
基于i—vector聲紋識別上課點(diǎn)名系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
音頻分析儀中低失真音頻信號的發(fā)生方法
電子制作(2017年9期)2017-04-17 03:00:46
新入職警察心理壓力、應(yīng)對方式及工作倦怠關(guān)系研究
商情(2016年49期)2017-03-01 20:44:34
面向移動終端的語音簽到系統(tǒng)
公安系統(tǒng)十大落馬高官大盤點(diǎn)
黨史天地(2016年22期)2016-05-30 10:48:04
Pro Tools音頻剪輯及修正
人間(2015年8期)2016-01-09 13:12:42
湖北省| 宝鸡市| 安阳县| 宾阳县| 徐州市| 伊通| 长岛县| 东丽区| 开阳县| 体育| 五指山市| 如东县| 从江县| 读书| 孟连| 滦平县| 游戏| 乳源| 刚察县| 青铜峡市| 佛坪县| 和硕县| 康马县| 望谟县| 安多县| 额尔古纳市| 德州市| 廊坊市| 子洲县| 随州市| 克什克腾旗| 镶黄旗| 柳江县| 塘沽区| 册亨县| 肃北| 嵊泗县| 洪江市| 苍溪县| 张家界市| 梅州市|