金郁 張建坤 范海華 施衛(wèi)國(guó) 浙江省嘉興市公安局經(jīng)濟(jì)開(kāi)發(fā)區(qū)(國(guó)際商務(wù)區(qū))分局
公安服務(wù)與群眾生活息息相關(guān),隨著公安“放管服”改革持續(xù)深化,便民新舉措不斷落地落實(shí),使得群眾滿意度不斷提升。便民服務(wù)的提升,不僅依賴機(jī)制的改革,更加依賴蓬勃發(fā)展的新技術(shù),正是新型技術(shù)的不斷引入,使得便民服務(wù)的革新存在新的可能。
人機(jī)對(duì)話技術(shù)是近年來(lái)人工智能技術(shù)的熱點(diǎn)之一,其可以讓機(jī)器理解人類語(yǔ)言并和人自由對(duì)話[1],這與公安便民服務(wù)的大量場(chǎng)景匹配度非常高。但是傳統(tǒng)人機(jī)對(duì)話平臺(tái)存在交互呆板和程式化問(wèn)題,極度影響群眾使用體驗(yàn)。
針對(duì)上述問(wèn)題,本文利用新一代人機(jī)對(duì)話技術(shù),以突出的多輪對(duì)話能力、大規(guī)模預(yù)訓(xùn)練對(duì)話模型帶來(lái)的快速冷啟動(dòng)、低成本知識(shí)構(gòu)建、自訓(xùn)練的語(yǔ)義模型等技術(shù)優(yōu)勢(shì),借助在公安便民服務(wù)豐富場(chǎng)景下積累的領(lǐng)域經(jīng)驗(yàn)和應(yīng)用,創(chuàng)新探索新型智能便民服務(wù)模式,進(jìn)一步提高為民辦事的成效力度,降低警務(wù)人員工作強(qiáng)度,為公安“放管服”改革的持續(xù)深化提供相關(guān)參考。
人機(jī)對(duì)話技術(shù)一直以來(lái)被認(rèn)為是人工智能領(lǐng)域的核心挑戰(zhàn)。國(guó)內(nèi)外較多專家學(xué)者對(duì)此進(jìn)行了相關(guān)深度研究。如XU J在2020年研究了開(kāi)放領(lǐng)域中多回合對(duì)話策略的學(xué)習(xí)框架問(wèn)題,LI R在2018年發(fā)表的論文中創(chuàng)新性采用人工標(biāo)注構(gòu)建出真實(shí)的對(duì)話推薦數(shù)據(jù),使得人機(jī)對(duì)話系統(tǒng)可提供建議等[2]。然而遺憾的是,傳統(tǒng)的人機(jī)對(duì)話平臺(tái)大部分只能局限特定場(chǎng)景,很難適應(yīng)復(fù)雜多變的公安便民服務(wù)需求??偨Y(jié)來(lái)說(shuō),傳統(tǒng)人機(jī)對(duì)話技術(shù)的技術(shù)難點(diǎn)主要集中在如下幾個(gè)方面:
要讓機(jī)器聽(tīng)懂并理解人所說(shuō)的話,那前提是機(jī)器要像人一樣預(yù)先具備大量的知識(shí),這些知識(shí)也需要是結(jié)構(gòu)化的[3]。這里的結(jié)構(gòu)化知識(shí)主要包括兩類:以特定目標(biāo)為中心的對(duì)話流程知識(shí)和知識(shí)圖譜。要構(gòu)建圍繞給定場(chǎng)景的較完備的對(duì)話邏輯流程(動(dòng)態(tài)知識(shí))預(yù)計(jì)需要花費(fèi)1~2周的人力,構(gòu)建給定場(chǎng)景的Schema和知識(shí)圖譜(靜態(tài)知識(shí))預(yù)計(jì)需要2周左右的人力,因此知識(shí)構(gòu)建的成本是非常高的。
機(jī)器人從啟動(dòng)到符合上線標(biāo)準(zhǔn)需要進(jìn)行多批次的優(yōu)化打磨,每一批次都需要收集真實(shí)情況下的對(duì)話數(shù)據(jù)、標(biāo)注數(shù)據(jù)、訓(xùn)練模型、調(diào)試模型、測(cè)試對(duì)話效果、分析問(wèn)題背后的原因,然后再進(jìn)行下一輪次的優(yōu)化,前后預(yù)計(jì)需要2~3月;類似的,知識(shí)圖譜問(wèn)答效果迭代優(yōu)化需要2周。
機(jī)器人在成熟場(chǎng)景下由于有較多的真實(shí)對(duì)話數(shù)據(jù)可供加工和利用,對(duì)話體驗(yàn)是可以不斷優(yōu)化的。但遷移到小樣本和新場(chǎng)景后的對(duì)話體驗(yàn)就有非常明顯的效果下降。比如目前電商的在線機(jī)器人、快遞電話機(jī)器人等運(yùn)用都不錯(cuò),但在公安便民服務(wù)小場(chǎng)景下,傳統(tǒng)的機(jī)器人會(huì)出現(xiàn)較差的對(duì)話體驗(yàn)[4]。
鑒于上文所述技術(shù)難點(diǎn),新一代人機(jī)對(duì)話技術(shù)平臺(tái)主要從如下三個(gè)層面進(jìn)行突破:
(1)從知識(shí)層面,采用結(jié)構(gòu)化知識(shí)的半自動(dòng)構(gòu)建技術(shù),降低知識(shí)構(gòu)建的成本;
(2)從對(duì)話模型層面,融入知識(shí)的預(yù)訓(xùn)練對(duì)話模型,從而縮短機(jī)器人從啟動(dòng)到符合上線標(biāo)準(zhǔn)的優(yōu)化周期;
(3)從對(duì)話引擎層面,采用具備拓展和增強(qiáng)對(duì)話能力的引擎,使其具備不斷學(xué)習(xí)演進(jìn)能力。
新一代人機(jī)對(duì)話技術(shù)平臺(tái)技術(shù)框架的其核心主要是5層(如圖1所示):數(shù)據(jù)層、知識(shí)層、預(yù)訓(xùn)練對(duì)話問(wèn)答模型層、引擎層、平臺(tái)層。其中核心3層,分別為知識(shí)層提供可擴(kuò)展性的知識(shí)圖譜構(gòu)建;預(yù)訓(xùn)練對(duì)話問(wèn)答模型層包括預(yù)訓(xùn)練對(duì)話模型、預(yù)訓(xùn)練圖譜問(wèn)答模(KGBert)、預(yù)訓(xùn)練表格問(wèn)答模型(TableBert);引擎層包括Dialog Studio多輪對(duì)話引擎、KBQA圖譜問(wèn)答引擎、TableQA表格問(wèn)答引擎、FAQ問(wèn)答引擎、MRC機(jī)器閱讀引擎。
國(guó)1 平臺(tái)技術(shù)架構(gòu)國(guó)
知識(shí)來(lái)源主要分為兩類,一類是人人對(duì)話日志,另一類是工作文檔。相對(duì)應(yīng)的知識(shí)構(gòu)建也分兩個(gè)方面,一方面是基于人人對(duì)話日志的對(duì)話流進(jìn)行構(gòu)建,從傳統(tǒng)的手工配置升級(jí)為自動(dòng)挖掘意圖,從人工標(biāo)注變成自動(dòng)的挖掘和半自動(dòng)標(biāo)注;另一方面是基于文檔的知識(shí)圖譜構(gòu)建。文檔本身就具備一定的結(jié)構(gòu)化信息,做了結(jié)構(gòu)化后可以讓問(wèn)答更加精準(zhǔn)。圍繞基于文檔的知識(shí)圖譜構(gòu)建,筆者采用半結(jié)構(gòu)化長(zhǎng)文檔的預(yù)訓(xùn)練文檔模型、基于文檔的粗粒度三元組抽取、針對(duì)文本的細(xì)粒度三元組抽取,設(shè)計(jì)了一套可擴(kuò)展性的知識(shí)圖譜構(gòu)建方案,如圖2所示。
圖2 可拓展性的知識(shí)圖滑構(gòu)建
(1)文檔預(yù)訓(xùn)練模型,將文檔表示分為物理結(jié)構(gòu)、邏輯結(jié)構(gòu)和語(yǔ)義結(jié)構(gòu)三個(gè)層次,使用百萬(wàn)級(jí)的無(wú)標(biāo)文檔數(shù)據(jù),基于其文本語(yǔ)義、版面信息、視覺(jué)特征來(lái)構(gòu)建自監(jiān)督學(xué)習(xí)任務(wù),使得模型能夠更好地理解文檔語(yǔ)義和結(jié)構(gòu)信息;
(2)粗粒度三元組抽取,通過(guò)輸入整篇文檔的物理組件的有序序列,再將其物理組件如標(biāo)題、正文識(shí)別出來(lái),再根據(jù)這些信息生成文檔樹(shù),最終根據(jù)一些簡(jiǎn)單的規(guī)則即可得到文檔的所有粗粒度三元組;
(3)細(xì)粒度三元組抽取,基于雙線性三維稀疏、損失函數(shù)等技術(shù)的細(xì)粒度三元組知識(shí)抽取,降低了模型復(fù)雜性,提高了魯棒性。
設(shè)計(jì)了半監(jiān)督預(yù)訓(xùn)練的方式來(lái)解決對(duì)話策略的建模難題,將對(duì)話動(dòng)作預(yù)測(cè)任務(wù)改造成半監(jiān)督學(xué)習(xí)任務(wù),并設(shè)計(jì)出預(yù)訓(xùn)練模型。
(1)對(duì)于理解能力,采用回復(fù)選擇作為預(yù)訓(xùn)練目標(biāo),即給定對(duì)話上下文和候選回復(fù)處進(jìn)行二分類判決是否是正確的回復(fù);
(2)對(duì)于生成能力,則使用常見(jiàn)的回復(fù)生成目標(biāo),即給定對(duì)話上下文生成正確回復(fù)語(yǔ)句;
(3)對(duì)于策略部分,采用半監(jiān)督學(xué)習(xí)中十分高效的一致性正則方法來(lái)建模對(duì)話動(dòng)作。
最終對(duì)于模型的預(yù)訓(xùn)練,筆者將整個(gè)模型的理解、策略、生成目標(biāo)加在一起進(jìn)行優(yōu)化,整體提升對(duì)話策略的建模效率。
主要包括針對(duì)流程型知識(shí)的對(duì)話引擎,針對(duì)表格知識(shí)的問(wèn)答引擎,針對(duì)知識(shí)圖譜的圖譜問(wèn)答引擎等。其中,表格問(wèn)答通過(guò)將自然語(yǔ)言直接轉(zhuǎn)換為SQL查詢語(yǔ)言,允許用戶使用自然語(yǔ)言與表格知識(shí)直接交互,從而拓展了對(duì)話機(jī)器人的能力邊界。針對(duì)表格的表格問(wèn)答引擎,主要開(kāi)拓并打造了從單輪到多輪的問(wèn)答和從單表到多表的問(wèn)答能力。
(1)關(guān)于多輪的表格問(wèn)答,筆者提出了一種基于動(dòng)態(tài)上下文模式圖的框架,刻畫(huà)多輪場(chǎng)景下的自然語(yǔ)言和表格之間復(fù)雜的語(yǔ)義鏈接關(guān)系。
(2)多表的問(wèn)答,筆者利用句法關(guān)系建模了自然語(yǔ)言問(wèn)題內(nèi)部的關(guān)系,在句法距離的度量下,數(shù)據(jù)和數(shù)據(jù)的關(guān)系將被拉近,從而生成正確的SQL。
經(jīng)過(guò)大量調(diào)研和分析,對(duì)人機(jī)對(duì)話技術(shù)有較大需求的便民服務(wù)場(chǎng)景包括如下兩個(gè)方面;
1. 便民熱線場(chǎng)景
當(dāng)前較多地區(qū)熱線服務(wù)電話分散,基層公安缺少統(tǒng)一的呼叫中心坐席人員支持,熱線服務(wù)電話一般直接轉(zhuǎn)給了窗口服務(wù)的警務(wù)人員,一方面給窗口警務(wù)人員帶來(lái)了更大的壓力,另一方面群眾在非工作時(shí)間段的咨詢不能有效的承接。
2. 疫情流調(diào)場(chǎng)景
近年來(lái)隨著疫情常態(tài)化,各地公安民警都需要做好疫情的防范和控制。當(dāng)疫情突發(fā)時(shí),需要進(jìn)行大量的流調(diào)來(lái)對(duì)相關(guān)人員進(jìn)行摸排。然而常規(guī)流調(diào)的方式主要基于人工電話來(lái)實(shí)現(xiàn),一方面耗費(fèi)大量寶貴的人力資源,另一方面在在時(shí)效方面無(wú)法保障快速的摸排需求。
根據(jù)上文所述便民服務(wù)場(chǎng)景的聚焦,結(jié)合新一代人機(jī)對(duì)話技術(shù)平臺(tái),確定如下三條技術(shù)融合路徑,即警務(wù)智能在線機(jī)器人、警務(wù)智能熱線導(dǎo)航機(jī)器人和警務(wù)智能外呼機(jī)器人。
1. 警務(wù)智能在線機(jī)器人
智能在線機(jī)器人基于NLP和AI技術(shù)提供智能在線對(duì)話能力,可集成到網(wǎng)站、APP、小程序/微信/微博等渠道中,支持7x24小時(shí)提供智能在線服務(wù),實(shí)現(xiàn)在線問(wèn)答、在線智能導(dǎo)服、業(yè)務(wù)知識(shí)庫(kù)等能力,如圖3所示。
圖3 警務(wù)在線機(jī)器人業(yè)務(wù)邏輯圖
2. 警務(wù)智能熱線導(dǎo)航機(jī)器人
在熱線電話人工受理方面,需考慮智能語(yǔ)音交互功能。通過(guò)自助語(yǔ)音導(dǎo)航能力,分流一部分人工坐席的壓力。
研究基于語(yǔ)音的人機(jī)交互應(yīng)用,開(kāi)發(fā)警務(wù)智能熱線導(dǎo)航機(jī)器人,如圖4所示,當(dāng)群眾電話呼入后,通過(guò)系統(tǒng)中的語(yǔ)音引導(dǎo),以自由說(shuō)的方式提交咨詢要求,如群眾提問(wèn)“我身份證丟失了怎們辦?”,機(jī)器人可識(shí)別理解用戶表達(dá)的語(yǔ)義并作為正確的語(yǔ)音引導(dǎo)。
圖4 警務(wù)智能熱線導(dǎo)航機(jī)器人業(yè)務(wù)邏輯圖
在出入境、戶籍、交警等方面,熱線導(dǎo)航機(jī)器人可將各個(gè)熱線座機(jī)的統(tǒng)一集成,由機(jī)器人提供智能化的服務(wù)指引及問(wèn)題解答,同時(shí)也能支持將機(jī)器人無(wú)法解答的問(wèn)題轉(zhuǎn)接到對(duì)應(yīng)的窗口警務(wù)服務(wù)人員。在方便群眾快速咨詢問(wèn)題的同時(shí),也可以有效幫助減輕窗口警務(wù)服務(wù)人員的工作壓力。
3. 警務(wù)智能外呼機(jī)器人
警務(wù)智能外呼機(jī)器人具備自動(dòng)呼出能力的智能語(yǔ)音能力,能夠根據(jù)業(yè)務(wù)方需求,在指定時(shí)間范圍內(nèi),對(duì)指定的用戶發(fā)起主動(dòng)電話外呼任務(wù)。在外呼過(guò)程中,結(jié)合運(yùn)用ASR、TTS語(yǔ)音引擎和機(jī)器人NLP能力,能夠?qū)崿F(xiàn)包含疫情流調(diào)、反詐預(yù)警、滿意度調(diào)研回訪等在內(nèi)的各種復(fù)雜場(chǎng)景的外呼智能問(wèn)答任務(wù),同時(shí)還需支持將外呼過(guò)程中收集的信息和數(shù)據(jù)回流到工單或者其他應(yīng)用系統(tǒng),形成統(tǒng)計(jì)數(shù)據(jù)和日志。該機(jī)器人可以在應(yīng)急時(shí)快速增加同時(shí)外呼的并發(fā)路數(shù),從而進(jìn)一步提升疫情流調(diào)的摸排效率,如圖5所示。
圖5 警務(wù)智能外呼機(jī)器人業(yè)務(wù)邏輯圖
在網(wǎng)絡(luò)承載方面,考慮到公安應(yīng)用場(chǎng)景數(shù)據(jù)的敏感性等,該系統(tǒng)建議在公安信息網(wǎng)內(nèi)進(jìn)行部署。
在部署資源設(shè)計(jì)方面,資源需要在滿足日常使用的基礎(chǔ)上,預(yù)留一定的資源支撐疫情防控等高峰場(chǎng)景使用需求。
在業(yè)務(wù)擴(kuò)展方面,系統(tǒng)需要能支持一定的擴(kuò)展性,在后續(xù)業(yè)務(wù)量增加時(shí)進(jìn)行擴(kuò)展;
在業(yè)務(wù)打通方面,系統(tǒng)需要與公安信息網(wǎng)內(nèi)其他業(yè)務(wù)系統(tǒng)之前具備打通的條件,實(shí)現(xiàn)外呼自動(dòng)觸發(fā)等場(chǎng)景的連通。
在某地實(shí)踐中,基于上文的技術(shù)路徑,根據(jù)各個(gè)場(chǎng)景的應(yīng)用訴求進(jìn)行統(tǒng)一的平臺(tái)規(guī)劃,以新一代人機(jī)對(duì)話技術(shù)構(gòu)建公安便民服務(wù)場(chǎng)景中警務(wù)智能在線機(jī)器人、警務(wù)熱線導(dǎo)航機(jī)器人、警務(wù)智能外呼機(jī)器人,并以支付寶、微信小程序的形式作為面向群眾、企業(yè)、警民的用戶界面,實(shí)現(xiàn)智能化在線辦事、警務(wù)熱線導(dǎo)航、電話熱線服務(wù)以及在防疫、群眾滿意度等場(chǎng)景下的智能外呼等需求。
本節(jié)重點(diǎn)闡述各模塊分階段落地實(shí)施設(shè)計(jì)。
(1)建設(shè)警務(wù)智能外呼平臺(tái),并先后落地實(shí)現(xiàn)了引導(dǎo)申報(bào)外呼、實(shí)名申報(bào)外呼、滿意度回訪外呼、出警通知外呼、反詐通知外呼和疫情調(diào)研外呼等。實(shí)現(xiàn)了常用外呼通知業(yè)務(wù)的自動(dòng)化和智能化,以及疫情調(diào)研類應(yīng)急外呼能力的搭建,并溝通了應(yīng)急智能外呼能力的擴(kuò)展機(jī)制。
(2)落地警務(wù)智能在線機(jī)器人以及智能知識(shí)庫(kù)。智能知識(shí)庫(kù)主要是為滿足智能在線機(jī)器人的知識(shí)管理需求,而搭建的一整套半自動(dòng)知識(shí)構(gòu)建、知識(shí)錄入、知識(shí)編輯、知識(shí)運(yùn)營(yíng)的系統(tǒng),能夠幫助業(yè)務(wù)人員實(shí)現(xiàn)高效的知識(shí)管理和知識(shí)運(yùn)營(yíng)。知識(shí)庫(kù)中涵蓋戶籍類、出入境、流動(dòng)人口、治安、小程序申報(bào)、法律咨詢等數(shù)百條公安政務(wù)知識(shí),以及大量通用政務(wù)知識(shí)來(lái)滿足群眾日常咨詢需求。智能在線機(jī)器人的前端是基于H5技術(shù)搭建的頁(yè)面,如圖6所示,可以方便的集成到網(wǎng)站、APP、小程序等渠道中,通過(guò)流程引導(dǎo)提供對(duì)于戶籍類、出入境、流動(dòng)人口、治安、小程序申報(bào)、法律咨詢等公安政務(wù)知識(shí)的智能服務(wù),用戶可以通過(guò)直接點(diǎn)擊圖標(biāo)按照分類查找自己想要咨詢的問(wèn)題,或者直接通過(guò)文字和語(yǔ)音的方式向機(jī)器人進(jìn)行咨詢。機(jī)器人會(huì)理解用戶輸入的問(wèn)題,并給出解答,對(duì)于答案部分還能支持語(yǔ)音播報(bào)。
圖6 警務(wù)智能在線機(jī)器人對(duì)外服務(wù)界面
(3)建設(shè)警務(wù)智能熱線導(dǎo)航機(jī)器人,一方面實(shí)現(xiàn)多個(gè)派出所出入境、戶籍等多個(gè)服務(wù)大廳電話號(hào)碼的統(tǒng)一,實(shí)現(xiàn)一號(hào)通辦,方便群眾記錄,同時(shí)基于智能導(dǎo)航機(jī)器人實(shí)現(xiàn)了對(duì)常見(jiàn)業(yè)務(wù)的智能咨詢支持,目前建設(shè)覆蓋的業(yè)務(wù)場(chǎng)景主要包括治安、戶籍、出入境、流動(dòng)人口幾大場(chǎng)景。
該地通過(guò)上文所述的分布建設(shè)模式,有效的構(gòu)建了基于新一代人機(jī)對(duì)話技術(shù)的公安便民服務(wù)平臺(tái),實(shí)踐成效如下:
(1)大幅降低疫情流調(diào)等場(chǎng)景下警務(wù)人員的人工資源消耗量;
(2)通過(guò)智能導(dǎo)航機(jī)器人和辦事窗口警務(wù)服務(wù)人員的有效協(xié)同,實(shí)現(xiàn)群眾咨詢100%響應(yīng)或接聽(tīng),服務(wù)好評(píng)率95%以上;
(3)真正實(shí)現(xiàn)了7×24小時(shí)不間斷提供熱線、在線等多渠道智能服務(wù)能力;
(4)提升服務(wù)效率,降低行政成本,節(jié)約辦公成本,更有效引導(dǎo)群眾“掌上辦”“網(wǎng)上辦”,實(shí)現(xiàn)公安政務(wù)服務(wù)全方位提升群眾辦事獲得感和滿意度。
本研究將下一代人機(jī)對(duì)話技術(shù)應(yīng)用于公安便民服務(wù)場(chǎng)景中,通過(guò)對(duì)警務(wù)智能在線機(jī)器人、警務(wù)智能熱線導(dǎo)航機(jī)器人、警務(wù)智能外呼機(jī)器人三種技術(shù)路徑的探索,構(gòu)建出體系化的公安便民服務(wù)平臺(tái),實(shí)現(xiàn)了新一代人機(jī)對(duì)話技術(shù)在公安工作中的真正落地,提升了公安便民服務(wù)的智能化和在線化水平,切實(shí)為基層民警工作減負(fù)提供了有效的技術(shù)支撐。
在可預(yù)見(jiàn)的未來(lái),人機(jī)對(duì)話會(huì)逐步從受限場(chǎng)景拓展到半開(kāi)放場(chǎng)景,從單模態(tài)升級(jí)到“語(yǔ)音+語(yǔ)言+視覺(jué)+情感融合”的多模態(tài),對(duì)話能力從預(yù)定義跨越到具備一定終身學(xué)習(xí)的對(duì)話機(jī)器人[5]。筆者將繼續(xù)研究其與反電信詐騙、案件偵辦等場(chǎng)景高效結(jié)合,進(jìn)一步提升數(shù)字化轉(zhuǎn)型對(duì)基層工作的賦能力度。