中國(guó)移動(dòng)通信集團(tuán)江蘇有限公司網(wǎng)絡(luò)部 王玉申
現(xiàn)有騷擾電話治理中,存在的主要問題是:識(shí)別的號(hào)碼數(shù)量多與客服撥測(cè)人員工作量大之間的矛盾。相比于目前通常采用的人工撥測(cè)方式,計(jì)算機(jī)自動(dòng)處理有著速度快、效率高、誤差率低等特點(diǎn),尤其是針對(duì)重復(fù)內(nèi)容的自動(dòng)撥測(cè)和處理技術(shù)更是具有不可替代的作用。近年來,語音識(shí)別技術(shù)已經(jīng)得到了長(zhǎng)足的發(fā)展,通過引入語音識(shí)別技術(shù)對(duì)錄音文件進(jìn)行甄別,可以極大提高騷擾電話的撥測(cè)效率。
通過新增1套騷擾電話撥測(cè)識(shí)別系統(tǒng),實(shí)現(xiàn)騷擾電話的自動(dòng)撥測(cè)、識(shí)別、錄音和取證功能。該系統(tǒng)與現(xiàn)有騷擾電話治理各系統(tǒng)間的關(guān)系如圖1所示。
該系統(tǒng)通過文件接口從騷擾電話識(shí)別系統(tǒng)采集需要撥測(cè)的號(hào)碼清單,對(duì)號(hào)碼進(jìn)行撥測(cè)、錄音、語音識(shí)別,撥測(cè)結(jié)果輸出到攔截系統(tǒng)和客服系統(tǒng)進(jìn)行后續(xù)處理。通過騷擾電話自動(dòng)撥測(cè)識(shí)別系統(tǒng)代替客服的人工撥測(cè)和審核,提升騷擾電話人工審核的效率和準(zhǔn)確度,提高騷擾電話治理效果。
騷擾電話撥測(cè)系統(tǒng)的處理流程見圖2。
騷擾電話自動(dòng)撥測(cè)識(shí)別系統(tǒng)的業(yè)務(wù)流程主要分為4步,分別是:待撥測(cè)號(hào)碼的采集分析、對(duì)號(hào)碼進(jìn)行撥打呼叫、對(duì)騷擾電話的識(shí)別和判斷、結(jié)果輸出。
撥測(cè)錄音模塊設(shè)計(jì)了2個(gè)方案供選擇:測(cè)試卡方案或模擬主叫號(hào)碼方案。測(cè)試卡方案:利用自動(dòng)撥測(cè)系統(tǒng)的撥測(cè)儀進(jìn)行撥打。模擬主叫號(hào)碼方案:利用自動(dòng)撥測(cè)系統(tǒng),采用PBX(專用小交換機(jī))撥測(cè)設(shè)備進(jìn)行撥打。
1.2.1 方案一 測(cè)試卡方案
為滿足多張本省和外省測(cè)試卡在撥測(cè)儀上進(jìn)行測(cè)試,設(shè)計(jì)采用自動(dòng)撥測(cè)系統(tǒng)上已配備的SUM(服務(wù)器集中監(jiān)控管理)設(shè)備集中插放SIM(用戶識(shí)別模塊)卡,通過遠(yuǎn)程調(diào)用的方式實(shí)現(xiàn)SIM卡自動(dòng)切換撥測(cè),以達(dá)到測(cè)試的目的。系統(tǒng)構(gòu)架圖見圖3。
1.2.2 方案二 模擬主叫號(hào)碼方案
在現(xiàn)有自動(dòng)撥測(cè)系統(tǒng)基礎(chǔ)上,使用PBX中繼撥測(cè)儀實(shí)現(xiàn)自動(dòng)撥測(cè)與錄音功能,以達(dá)到測(cè)試的目的。保持現(xiàn)網(wǎng)自動(dòng)撥測(cè)系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)不變,新增的專業(yè)撥測(cè)儀采用IP方式接入,接受自動(dòng)撥測(cè)系統(tǒng)管理。組成拓?fù)湟妶D4。
本方案中新增1臺(tái)(PBX)中繼撥測(cè)儀,通過TCP/IP(傳輸控制協(xié)議/網(wǎng)際協(xié)議)方式接入自動(dòng)撥測(cè)系統(tǒng),接受CMS(內(nèi)容管理系統(tǒng))的管理和維護(hù)。中繼撥測(cè)設(shè)備通過E1中繼專線方式連接匯接局或MSC(移動(dòng)交換中心)、且與STP(信令轉(zhuǎn)接點(diǎn))間開鏈路。使中繼撥測(cè)儀成為移動(dòng)MSC下的一個(gè)專用PBX用戶端局。通過匯接局或MSC可以實(shí)現(xiàn)與MSC、GMSC(網(wǎng)關(guān)移動(dòng)交換中心)以及其他運(yùn)營(yíng)商網(wǎng)絡(luò)的用戶通信。為專用的E1(2.048 Mb/s數(shù)字同步傳輸)中繼電路配置專用OPC(源信令點(diǎn)編碼),并設(shè)置為免費(fèi),解決計(jì)費(fèi)問題。
為了提高騷擾電話撥測(cè)系統(tǒng)的識(shí)別準(zhǔn)確率,降低騷擾電話誤識(shí)別率,我們采用了多種組合算法進(jìn)行騷擾電話的識(shí)別。具體的算法說明如下。
1)先進(jìn)行較小文件過濾。通過對(duì)騷擾電話的錄音分析,發(fā)現(xiàn)騷擾電話都有較長(zhǎng)的通話時(shí)長(zhǎng)(約30~100 s),錄音文件也都比較大(起碼大于800KB)。因此先將一部分較小的文件過濾掉(都是關(guān)機(jī)、停機(jī)、暫時(shí)無法接通等),這些小文件的幾乎都可以確定都是非騷擾電話。獲得較小文件大小的經(jīng)驗(yàn)值為450KB,小于450KB的認(rèn)為是非騷擾電話。
2)騷擾電話號(hào)碼識(shí)別庫過濾。騷擾電話號(hào)碼識(shí)別庫可以通過歷史的自動(dòng)撥測(cè)系統(tǒng)平臺(tái)全國(guó)共享,避免同一個(gè)號(hào)碼重復(fù)識(shí)別,節(jié)約系統(tǒng)資源,提高騷擾電話的判斷效率和準(zhǔn)確性。
3)PESQ(語音質(zhì)量的感覺評(píng)定)過濾(過濾掉長(zhǎng)時(shí)間的振鈴、無人接聽和來電提醒等)。參考文件為常見的非騷擾電話,score(ITU-TP.862)speech分?jǐn)?shù)大于2,認(rèn)為評(píng)估文件是非騷擾電話。
PESQ語音評(píng)估軟件其本質(zhì)就是一個(gè)相似度比對(duì)系統(tǒng),原理是把無法自動(dòng)判斷的錄音文件,比如怪異的接聽?wèi)?yīng)答音,先通過人為判定是否是騷擾電話,然后設(shè)取比對(duì)值,作為一個(gè)文件藍(lán)本庫保存。當(dāng)下次撥測(cè)產(chǎn)生與之相似度高的錄音文件時(shí),自動(dòng)判斷成藍(lán)本庫所屬內(nèi)容,確定是不是騷擾電話。因此,隨著不斷的開展撥測(cè)工作,樣本庫文件會(huì)不斷的豐富,最終的識(shí)別率也會(huì)不斷提高。
4)語音識(shí)別。使用一系列常見的騷擾電話關(guān)鍵字進(jìn)行識(shí)別,同時(shí)對(duì)正常帶彩鈴的號(hào)碼進(jìn)行識(shí)別。語音識(shí)別系統(tǒng)其本質(zhì)是一套通過對(duì)錄音文件中的關(guān)鍵字匹配來確認(rèn)是否是騷擾電話的系統(tǒng)。關(guān)鍵字如“公證處”“抽獎(jiǎng)”“中獎(jiǎng)”“獎(jiǎng)金”等,其內(nèi)容庫可以通過語音訓(xùn)練不斷豐富,以提高最終的識(shí)別率。
語音識(shí)別軟件采用定制的InterReco語音識(shí)別系統(tǒng),是一款與說話人無關(guān)的語音識(shí)別系統(tǒng),能夠完成電話應(yīng)用環(huán)境下的語音識(shí)別功能。定制的語音識(shí)別系統(tǒng)采用了ASR(自動(dòng)語音識(shí)別)技術(shù)。它是一種使計(jì)算機(jī)能夠識(shí)別人通過麥克風(fēng)或者電話輸入的詞語或語句的技術(shù)。簡(jiǎn)單地說,就是能夠讓計(jì)算機(jī)聽懂人說話。它的最終目標(biāo)是使得計(jì)算機(jī)在不受詞匯量限制,在各種噪聲環(huán)境、語音信道下,能夠?qū)崟r(shí)、準(zhǔn)確地識(shí)別不同方言、口音等特點(diǎn)的說話人的語句。包含了騷擾電話特征詞,如:中獎(jiǎng)、公證處、賭博、六合彩等。
由語音識(shí)別模塊對(duì)經(jīng)過“騷擾電話號(hào)碼庫”過濾的錄音文件進(jìn)行自動(dòng)識(shí)別,判斷出具有騷擾電話特征的錄音文件,并判斷為騷擾電話,隨錄音文件一起送至輸出接口模塊。語音識(shí)別中不符合騷擾電話特征的錄音文件繼續(xù)轉(zhuǎn)交下一步處理。
5)PESQ語音再評(píng)估(語音識(shí)別的識(shí)別率只有70%~80%,還有20%~30%的疑似騷擾電話沒有被識(shí)別出來)。我們對(duì)這些沒有被識(shí)別出來的20%~30%的疑似騷擾電話進(jìn)行PESQ語音評(píng)估,目的是提高被降低的語音識(shí)別漏判率。
騷擾電話撥測(cè)系統(tǒng)于2013年3月底完成平臺(tái)的搭建,實(shí)現(xiàn)了對(duì)騷擾電話的撥測(cè)測(cè)試。撥測(cè)系統(tǒng)初期對(duì)江蘇移動(dòng)提供過的三批共計(jì)2 758個(gè)騷擾電話樣本做了識(shí)別判斷,具體測(cè)試情況見表1。
?
采用基于語音識(shí)別的騷擾電話撥測(cè)系統(tǒng)對(duì)1 000個(gè)號(hào)碼進(jìn)行撥測(cè)和識(shí)別,需要的時(shí)間約為20min,存儲(chǔ)空間約為12GB,大大提升了騷擾電話的人工審核效率。同時(shí),對(duì)于無法確認(rèn)的號(hào)碼輸出撥測(cè)錄音,供客服人員人工判斷,有效解決了部分號(hào)碼無法通過系統(tǒng)進(jìn)行識(shí)別的問題。
我們把完成1~5項(xiàng)步驟的判斷機(jī)制定義為“模式一”,把僅完成1~3項(xiàng)步驟的判斷機(jī)制定義為“模式二”。模式一是對(duì)模式二識(shí)別出來的疑似騷擾電話號(hào)碼再進(jìn)行一次語音識(shí)別和PESQ再評(píng)估,目的是降低誤判率,而語音識(shí)別和PESQ再評(píng)估沒有100%地將騷擾電話識(shí)別出來,因此,漏判率增加了。
模式二的思路是排除非騷擾電話,剩下的認(rèn)為是騷擾電話;模式一的思路是排除非騷擾電話,剩下的進(jìn)行語音識(shí)別和PESQ再評(píng)估,識(shí)別出來的是騷擾電話,沒有識(shí)別出來的是非騷擾電話。因此,模式一比模式二誤判率低,漏判率高。
在實(shí)際使用中,可能還會(huì)存在正常帶彩鈴的錄音文件,這個(gè)必須要借助語音識(shí)別系統(tǒng)來判斷,所以說必須要用模式一的判斷機(jī)制來進(jìn)行撥測(cè)。當(dāng)然模式二的測(cè)試結(jié)果給了我們一些參考,比如在測(cè)試當(dāng)中發(fā)現(xiàn)和論證了這樣一個(gè)問題:模式一比模式二誤判率低,漏判率高。如果不使用語音識(shí)別軟件(即模式二),漏判率反倒有明顯的降低。結(jié)合上述三批測(cè)試,模式二測(cè)試情況見表2。
?
經(jīng)過反復(fù)比對(duì)和論證,查明的原因是:第三方的語音識(shí)別軟件本身也存在一定的不足,語音識(shí)別率只有70%~80%,即使我們已經(jīng)通過PESQ語音評(píng)估進(jìn)行補(bǔ)漏,也不能達(dá)到100%的識(shí)別率,會(huì)漏掉很多的騷擾電話,只能不斷來優(yōu)化完善它,后續(xù)需不斷進(jìn)行改進(jìn)。
從理論上分析,使用語音識(shí)別后可以減少誤判的發(fā)生,隨著語音識(shí)別軟件的日益完善,這方面的效果會(huì)越來越得到體現(xiàn)。本著盡可能減低騷擾電話誤判率(為此可以犧牲部分的漏判)的原則,體現(xiàn)真實(shí)的判斷效果,且正確判斷正常帶彩鈴的號(hào)碼,建議繼續(xù)使用語音識(shí)別系統(tǒng),即模式一這樣的全程判斷機(jī)制來做騷擾電話撥測(cè)。
基于語音識(shí)別的騷擾電話撥測(cè)系統(tǒng),除了能夠準(zhǔn)確識(shí)別騷擾電話外,還可以廣泛應(yīng)用于基于語音識(shí)別的語音撥測(cè)系統(tǒng),如:來電提醒系統(tǒng)的撥測(cè)、10086客服系統(tǒng)的撥測(cè)等,從而極大地提升系統(tǒng)撥測(cè)的效率,提高系統(tǒng)的運(yùn)行穩(wěn)定性。 ◆