張宇華 中國信息通信研究院技術與標準研究所工程師
劉樂 北京得意音通技術有限責任公司工程師
泰爾檢測
聲紋密保技術和測試方法淺析
張宇華 中國信息通信研究院技術與標準研究所工程師
劉樂 北京得意音通技術有限責任公司工程師
介紹了聲紋和聲紋識別的含義,概述了聲紋密保系統(tǒng)及其聲紋接口調用過程,并詳細描述了相應的測試方法和測試工具的使用。
Avalanche Voiceprint Verification
伴隨著信息技術和網(wǎng)絡技術的迅猛發(fā)展,人們對身份識別技術的需求越來越多,對其安全可靠性的要求也越來越嚴格?;趥鹘y(tǒng)密碼認證的身份識別技術在實際信息網(wǎng)絡應用中已經(jīng)暴露出許多不足之處,而基于生物特征辨別的身份識別技術近年來也日益成熟并在實際應用中展現(xiàn)出極大的優(yōu)越性。其中,聲紋識別技術便是近年來發(fā)展起來的一種新的更有效的身份識別技術之一。
1.1 聲紋
所謂聲紋(Voiceprint),是用電聲學儀器顯示的攜帶言語信息的聲波頻譜?,F(xiàn)代科學研究表明,聲紋不僅具有特定性,而且有相對穩(wěn)定性的特點。成年以后,人的聲音可保持長期相對穩(wěn)定不變。試驗證明,無論講話者是故意模仿他人聲音和語氣,還是耳語輕聲講話,即使模仿得惟妙惟肖,其聲紋卻始終不相同。在實際生活中,每個人說話時的語聲,都有自己的特點。很熟悉的人之間,可以只聽聲音而相互辨別出來,這就是語聲人各不同的特性。
人的發(fā)聲具有特定性和穩(wěn)定性。從理論上講,它同指紋一樣具有身份識別(認定個人)的作用。雖然由于技術和經(jīng)驗的問題,暫時不能說完全達到了指紋那樣的精確程度,但它已經(jīng)被越來越多的國家認可為一種人身識別的科學方法。
1.2 聲紋識別
聲紋識別(VoiceprintRecognition,VPR),也稱為說話人識別(SpeakerRecognition),有兩類,即說話人辨認(SpeakerIdentification)和說話人確認(SpeakerVerification)。前者用以判斷某段語音是若干人中的哪一個所說的,是“多選一”問題;而后者用以確認某段語音是否是指定的某個人所說的,是“一對一判別”問題。不同的任務和應用會使用不同的聲紋識別技術,如縮小刑偵范圍時可能需要辨認技術,而銀行交易時則是確認技術。不管是辨認還是確認,都需要先對說話人的聲紋進行建模。
聲紋密保系統(tǒng)是基于對說話人的語音識別或辨認的應用軟件系統(tǒng),它是根據(jù)人所說語音信息而表征出來的說話人的生理和行為特征來自動識別或辨認說話人身份的技術系統(tǒng),是一款聲紋身份驗證服務。
本文定義了相關術語及其說明,具體參見表1。
表1術語和定義
聲紋密保系統(tǒng)包括3個基礎聲紋接口,即聲紋預留、身份認證和聲紋信息管理接口。
2.1 聲紋預留接口調用過程
本組接口用于進行聲紋信息預留操作,過程包括8個HTTPWebservice交互過程,分別由8個TCP連接承載。
如圖1所示,本接口第一個TCP連接用于獲取一個聲紋ID(GetVoiceprintId),此聲紋ID具有一定的時效性,在有效時間內,本組其它接口可將此ID作為唯一標識進行相關操作;聲紋信息預留成功后,此聲紋ID將作為對應聲紋信息的唯一標識,供其它組接口使用;在超過有效時間后,獲取的聲紋ID將作廢。
圖1 聲紋信息預留:第一個TCP連接
如圖2所示,本接口第二個TCP連接根據(jù)傳入的聲紋ID獲取一組聲紋預留文本(GetTrainingText)。調用者應根據(jù)此接口返回的建模文本進行錄音。
圖2 聲紋信息預留:第二個TCP連接
如圖3所示,本接口第三~七個TCP連接根據(jù)聲紋預留文本錄制完語音后上傳(UpLoadTrainingVoice上傳建模語音)。此步驟每次上傳一條語音,需要被調用多次,直至所有的建模語音正確上傳完成后,才能開始聲紋信息預留。
如圖4所示,本接口第八個TCP連接執(zhí)行聲紋信息預留操作(Train聲紋信息預留)。
2.2 身份認證接口調用過程
本組接口用于進行身份認證操作,每個用戶的身份認證過程包含4個HTTPWebservice交互過程,分別由4個TCP連接承載。
如圖5所示,聲紋身份認證接口第一個TCP連接用于獲取一個身份驗證ID(GetVerificationId),此ID具有一定的時效性,在有效時間內,本組其它步驟可將此ID作為唯一標識進行相關操作;在超過有效時間后,獲取的身份驗證ID將作廢。
如圖6所示,聲紋身份認證接口第二個TCP連接根據(jù)傳入的身份驗證ID獲取一個隨機的身份驗證文本(GetVerificationText)。調用者應根據(jù)此接口返回的身份驗證文本進行錄音。
如圖7所示,聲紋身份認證接口第三個TCP連接根據(jù)身份驗證文本錄制完語音后上傳(UpLoadVerificationVoice上傳身份驗證語音)。語音正確上傳完成后,才能進行身份驗證。
如圖8所示,聲紋身份認證接口第四個TCP連接執(zhí)行身份驗證操作(Verify身份驗證)。
2.3 聲紋信息管理接口調用過程
圖3 聲紋信息預留:第三~七個TCP連接
如圖9所示,本組接口用于對聲紋信息進行管理,包含2個獨立的HTTPWebservice交互過程,分別是查詢聲紋ID指定的聲紋信息是否存在(IsVoiceprint Existed)和刪除聲紋ID指定的聲紋信息(Remove-Voiceprint)操作。
圖4 聲紋信息預留:第八個TCP連接
聲紋密保系統(tǒng)的核心功能目標是通過用戶聲紋特征的唯一性來實現(xiàn)用戶識別和鑒權,因此可以初步判定系統(tǒng)三大基礎接口中,身份認證接口的調用過程是其核心,對于系統(tǒng)性能指標的確認應重點基于身份認證接口進行。
從系統(tǒng)實際應用角度看,聲紋預留接口一次調用,按用戶所購買的服務可實現(xiàn)長期有效;身份認證接口需頻繁調用,且每次調用驗證ID(VerificationId)隨機產(chǎn)生;而聲紋信息管理接口從邏輯功能上屬于獨立功能模塊。身份認證接口無論從調用頻度,還是從對服務器產(chǎn)生的負載壓力上看,身份認證接口都是最大的,更容易產(chǎn)生性能瓶頸,因此對于系統(tǒng)性能指標的確認應重點基于身份認證接口進行。
從三大基礎接口調用流程上看,聲紋預留接口和身份認證接口的調用過程和模型都基本相同。
因此,本文對于聲紋密保系統(tǒng)的系統(tǒng)性能指標的確認重點基于身份認證接口進行。測試方法主要為通過測試儀表有狀態(tài)的完全仿真用戶在身份認證中的4個進程,并最終判斷認證狀態(tài)進行。
3.1 測試工具的選擇
Avalanche和LoadRunner測試工具分別是思博倫公司和惠普公司的產(chǎn)品,前者是一套測試儀器,后者是一套測試軟件,都需要相應的License支持。
圖5 聲紋身份認證:第一個TCP連接
圖6 聲紋身份認證:第二個TCP連接
圖7 聲紋身份認證:第三個TCP連接
LoadRunner是需要被安裝在高性能的服務器(俗稱壓力機)上進行性能能力測試,LoadRunner所處的壓力機性能越好LoadRunner可運行的能力上限就越高,一般遇到性能壓力不夠也可以通過多臺壓力機組合環(huán)境解決。有缺點就有優(yōu)點,LoadRunner作為客戶端是可以通過各類主流程序編寫腳本進行模擬客戶端的行為模式,具有較好的靈活性和適應性,同時也對腳本程序編寫要有一定的功底。
Avalanche是思博倫公司專門針對有狀態(tài)的應用層性能測試所推出的旗艦產(chǎn)品,其普通C100型號的HTTP每秒新建連接數(shù)可達70W,并發(fā)連接數(shù)可到4000W。有優(yōu)點就有缺點,Avalanche在靈活性和適應性上由于其是測試儀器,當前的應用版本所支持的功能不一定滿足用戶前沿技術的需求,需要與思博倫公司反饋需求但需要時間以支持。
例如,Avalanche目前不支持SSL國密SM2算法的運算,LoadRunner通過編輯腳本可實現(xiàn),但是商密RSA方面的算法Avalanche處理的性能要好于LoadRunner(不包括3臺以上高性能服務器疊加情形)。
基于以上分析進行判斷,測試工具Avalanche和LoadRunner都能勝任對身份認證接口的系統(tǒng)性能指標的驗證。由于研究院已購有一些Avalanche儀器,因此選擇了Avalanche去完成。
3.2 測試思路
任何OSI應用層性能壓力測試工具都無法在完全模擬功能的條件下進行既滿足全進程又達到全特性的測試,只能盡力滿足各方面的需求。這里使用的是思博倫公司的Avalanche應用層性能測試儀,為實現(xiàn)完整測試,需要了解和考慮測試儀使用方式和被測系統(tǒng)特性進行制定具體的測試方案。
圖8 聲紋身份認證:第四個TCP連接
首先,身份認證接口調用過程初始需要一個VoiceprintId。該ID是在聲紋預留接口調用過程中得到,因此第一步需要通過一套服務器(安裝有聲紋密保系統(tǒng)+數(shù)據(jù)庫)和客戶端(手機APP或PC安裝客戶軟件+麥克風)進行聲紋建模。
其次,完成聲紋建模的同一個人需要繼續(xù)進行第二步身份認證接口操作,并且在此過程中使用交換機鏡像功能或者客戶端PC抓包,保存下完整的聲紋建模的8個TCP交互數(shù)據(jù)包和聲紋身份認證的4個TCP交互數(shù)據(jù)包的Pcap文件,后者的抓包文件將作用于Avalanche使用。
最后,將聲紋身份認證的4個TCP交互過程的分析結果呈現(xiàn)為Avalanche測試儀可使用的方式進行傳載和修改,操作Avalanche完成各項系統(tǒng)性能指標。
3.3 測試難點
難點1:聲紋ID(VoiceprintId)具有一定的時效性,在有效時間內不一定完成全部測試。
難點2:系統(tǒng)性能壓力測試時身份認證接口將被頻繁調用,且每次調用獲取的驗證ID(VerificationId)隨機產(chǎn)生每次不同,因此每次獲取的認證文本內容同樣不相一致。
難點3:Avalanche將在測試時上傳的認證文本語音為Pcap文件里的語音,其語音內容是固定不變的。
3.4 預置條件
被測聲紋密保系統(tǒng)需要做出調整以便于測試:
●將VoiceprintId的有效時長改為長期有效,測試完畢后刪除。
●將文本內容和聲紋語音同步認證的認證方式改為僅認證聲紋語音,不關注文本內容。
3.5 Avalanche測試
測試儀表Avalanche即可模擬客戶端,也可同步模擬客戶端和服務器。由于被測聲紋密保系統(tǒng)就是服務器,因此根據(jù)系統(tǒng)性能指標需求本次測試Avalanche僅模擬客戶端即可。
因為配置難點主要集中在Actions界面的上半部分和下半部分,其它界面與普通HTTP測試方法沒有不同,這里不再進行說明,值得注意的是在Loads界面使用的模型單位為SimUsers和SimUsers/second。
圖9 聲紋信息管理接口調用
Actions界面的上半部分就是執(zhí)行行為的配置,根據(jù)2.2章節(jié)內容的分析,將相關指令寫入其中。
Actions界面的下半部分是配合上半部分執(zhí)行行為相關調用的配置,本次涉及有塑造變量(Forms)、搜索條件(SearchCriteria)和內容填充(HTTPContent)功能。以下對3個功能模塊配置進行說明:
●Forms:塑造Voiceprintid變量,ID號被填寫其中,且被身份認證過程的第一個TCP連接使用。
●SearchCriteria:搜索條件是Prefix:verificationid和Postfix:verificationid,配合Actions上半部分的相關指令將從服務器方每次隨機反饋的Verificationid搜索出來并在第二~四個TCP連接中將Pcap文件中的Verificationid替換,使每一次的身份認證交互真實、合理;否則身份認證必失敗。
●HTTPContent:將Pcap文件中第一~第四個TCP連接的HTTP內容拷貝并填入該處,配合Forms和SearchCriteria內容、Actions上半部分相關指令使身份認證交互過程盡量實現(xiàn)聲紋密保系統(tǒng)滿足全進程又達到全特性的測試思路。以第一個TCP連接內容為例,將
如表2所示,Actions界面上半部分的執(zhí)行行為配置:
#行是不執(zhí)行的指令,一般被作者用為注釋,在這里是為了讀者方便理解。
綜上所述,當聲紋身份認證接口調用結束后,服務器反饋verify success和表示身份認證已成功且聲紋匹配得分為84分(見圖10)。
圖10 聲紋身份認證:成功和得分
表2 Actions:執(zhí)行行為配置
聲紋是指說話人語音頻譜的信息圖。由于每個人的發(fā)音器官不同,所發(fā)出來的聲音及其音調各不相同,因此,聲紋作為基本特征來實現(xiàn)人的身份識別具有實際的不可替代性和穩(wěn)定性。
本文第3章節(jié)的測試方法可直接對系統(tǒng)性能指標包括:全部會話訪問成功條件下的最大并發(fā)用戶數(shù)、一定并發(fā)用戶數(shù)下的單用戶平均訪問時間、最大并發(fā)用戶數(shù)下的帶寬、最大每秒新建用戶數(shù),負載上限(系統(tǒng)不能提供服務時的并發(fā)用戶數(shù)),穩(wěn)定性測試(一定并發(fā)用戶數(shù)時長時間持續(xù)訪問下服務器提供服務的成功率)等進行測試和取值。
此外,可根據(jù)該測試方法引申和擴展進行更加細節(jié)的需求測試,例如從系統(tǒng)實際應用角度出發(fā),作為客戶端的使用者來說,其是否在意獲取聲紋建模文本、獲取聲紋驗證文本的平均耗時。
1 聲紋.百度百科
2 聲紋識別.百度百科
3 聲密保WebService接口說明文檔.得意音通
中興通訊獨家中標越南Vinaphone擴容項目
近日,中興通訊和越南運營商Vinaphone簽訂了U900 Refarming&U2100擴容合同。中興通訊為其提供GSM900和UMTS900頻率重用解決方案,在保證現(xiàn)有GSM網(wǎng)絡運營的前提下,重整頻譜資源,實現(xiàn)高效重復利用。
中興通訊的GSM900和UMTS900頻率重用解決方案,包括了其先進的SDR分布式基站,架構統(tǒng)一的MicroTCA平臺,以及全新分布式射頻拉遠模塊,統(tǒng)一的硬件平臺和網(wǎng)管。整個方案集成度高、安裝快捷、網(wǎng)絡維護簡化。項目預計將于2016年完工,建成后將覆蓋越南全國約1/3的面積,覆蓋用戶數(shù)將達2000萬。
中興首發(fā)端到端商用系統(tǒng)雙連接測試
近日,在匈牙利首都布達佩斯舉行的第14屆GTI研討會上,中興通訊TDD產(chǎn)品副總韓鋼在其主題發(fā)言時透露,中興通訊率先開展了基于LTE端到端商用平臺的雙連接性能測試。基于Marvell的商用終端芯片和中興通訊商用TDLTE系統(tǒng),測試結果顯示,在多種業(yè)務模式下,雙連接均倍增了終端用戶速率。與LTE載波聚合的測試結果對比,兩者在速率性能方面并無差異。
韓鋼表示,由于TDD和FDD雙連接技術不要求理想傳輸,適配全球絕大多數(shù)現(xiàn)有傳輸條件,更適用于未來融合網(wǎng)絡部署密集,宏微協(xié)同需求急劇增加的趨勢。而且,其構建的靈活網(wǎng)絡架構將更好兼容FDD和TDD技術發(fā)展節(jié)奏差異,并為建立更為健康的產(chǎn)業(yè)伙伴關系打下基礎。
Introduction of Voiceprint Identification andTestMethod
This paper introduces the meaning of the voiceprint and voiceprint identification, an overview of speech security system based on Voiceprint and system working procedure, and describes in detail the corresponding testing methods and tools.
avalanche, voiceprint, verification
2015-09-10)