馬連峰,湯偲愉
(1.江蘇省特種設(shè)備安全監(jiān)督檢驗(yàn)研究院無錫分院,江蘇無錫,214000;2.中國(guó)電子科技集團(tuán)公司第五十八研究所,江蘇無錫,214000)
隨著人工智能技術(shù)的不斷發(fā)展,集語(yǔ)音識(shí)別、語(yǔ)音合成、自然語(yǔ)言理解等技術(shù)于一體的智能語(yǔ)音識(shí)別技術(shù)得到了人們廣泛的關(guān)注。人們通過對(duì)該項(xiàng)技術(shù)的不斷深入研究,在多種實(shí)際應(yīng)用場(chǎng)景下,賦予產(chǎn)品“能聽、會(huì)說、懂你”式的智能人機(jī)交互體驗(yàn)。其應(yīng)用案例遍及金融、保險(xiǎn)、司法、電商、智慧交通、可穿戴設(shè)備等眾多領(lǐng)域,呈現(xiàn)多元化趨勢(shì),為人們工作生活的各個(gè)方面提供了更為方便快捷的服務(wù)。
在《特種設(shè)備安全監(jiān)察條例》中,特種設(shè)備是指涉及生命安全、危險(xiǎn)性較大的鍋爐、壓力容器(含氣瓶,下同)、壓力管道、電梯、起重機(jī)械、客運(yùn)索道、大型游樂設(shè)施和場(chǎng)(廠)內(nèi)專用機(jī)動(dòng)車輛。電梯,作為八大類特種設(shè)備之一,已經(jīng)成為人們工作生活中不可或缺的“朋友”。在《特種設(shè)備目錄》中給出了電梯的定義,是指動(dòng)力驅(qū)動(dòng),利用沿剛性導(dǎo)軌運(yùn)行的箱體或者沿固定線路運(yùn)行的梯級(jí)(踏步),進(jìn)行升降或者平行運(yùn)送人、貨物的機(jī)電設(shè)備,包括載人(貨)電梯、自動(dòng)扶梯、自動(dòng)人行道等。非公共場(chǎng)所安裝且僅供單一家庭使用的電梯除外。其包含的類別和品種如表1所示。屬于《特種設(shè)備目錄》范疇的電梯應(yīng)按照國(guó)家有關(guān)規(guī)定進(jìn)行檢驗(yàn)。隨著智能語(yǔ)音交互技術(shù)的不斷發(fā)展,結(jié)合電梯檢驗(yàn)工作中的各個(gè)環(huán)節(jié),嘗試將智能語(yǔ)音交互技術(shù)作為輔助融入其中,對(duì)于電梯檢驗(yàn)工作具有一定的推動(dòng)作用。
表1 特種設(shè)備目錄中電梯的范疇
智能語(yǔ)音交互是基于語(yǔ)音輸入的新一代交互模式,通過一定的語(yǔ)音輸入就可以得到相應(yīng)的反饋。智能語(yǔ)音交互技術(shù)綜合了多項(xiàng)關(guān)鍵技術(shù),包括語(yǔ)音識(shí)別、自然語(yǔ)音處理以及語(yǔ)音合成技術(shù),是一項(xiàng)系統(tǒng)性工程。為了更好地實(shí)現(xiàn)語(yǔ)音交互的效果,達(dá)到應(yīng)用目的,需要綜合運(yùn)用以上三種關(guān)鍵技術(shù)。智能語(yǔ)音交互的流程如圖1所示,首先人的語(yǔ)音信號(hào)通過語(yǔ)音識(shí)別技術(shù)轉(zhuǎn)換成文字;然后這些文字通過自然語(yǔ)言處理技術(shù)轉(zhuǎn)換成系統(tǒng)能夠理解的結(jié)構(gòu)化文字,比如記錄語(yǔ)音、尋找答案等;繼而通過人機(jī)對(duì)話技術(shù)、語(yǔ)音合成技術(shù)來實(shí)現(xiàn)交互功能。
圖1 智能語(yǔ)音交互的一般流程
作為智能語(yǔ)音交互的第一步,語(yǔ)音識(shí)別技術(shù)的目標(biāo)是將人類語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為機(jī)器可讀的輸入,是一個(gè)語(yǔ)音信號(hào)到文字內(nèi)容的解碼過程。語(yǔ)音識(shí)別技術(shù)的實(shí)現(xiàn)過程如圖2所示,主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。
圖2 語(yǔ)音識(shí)別的實(shí)現(xiàn)過程
作為智能語(yǔ)音交互技術(shù)的一個(gè)重要環(huán)節(jié),自然語(yǔ)言處理是利用計(jì)算機(jī)對(duì)自然語(yǔ)言文本進(jìn)行理解、處理,并提取文本語(yǔ)義的過程。是計(jì)算機(jī)科學(xué)、人工智能、語(yǔ)言學(xué)和自然語(yǔ)言之間的相互作用的領(lǐng)域。現(xiàn)代自然語(yǔ)音處理算法是基于機(jī)器學(xué)習(xí),尤其是統(tǒng)計(jì)機(jī)器學(xué)習(xí)來實(shí)現(xiàn)的。自然語(yǔ)音處理包含的關(guān)鍵技術(shù)包含漢字編碼詞法分析、句法分析、語(yǔ)義分析、文本生產(chǎn)、語(yǔ)音識(shí)別。在實(shí)際應(yīng)用中,自然語(yǔ)言處理任務(wù)不僅僅只包含文本一種模態(tài),而可能包含音頻、圖像、視頻等多種模態(tài)。多模態(tài)下的自然語(yǔ)言處理有助于對(duì)語(yǔ)言文本信息形成更好的理解。
作為智能語(yǔ)音交互的重要支撐技術(shù),人機(jī)對(duì)話技術(shù)的目的是讓機(jī)器通過與人類的對(duì)話交互,以更自然更為友好的方式幫助用戶高效地完成任務(wù),以及與用戶進(jìn)行一定的情感溝通。在對(duì)用戶的輸入進(jìn)行語(yǔ)音識(shí)別和內(nèi)容理解后,通過人機(jī)對(duì)話技術(shù)管理對(duì)話狀態(tài)、生產(chǎn)合理回復(fù),以實(shí)現(xiàn)連續(xù)的語(yǔ)音智能交互。根據(jù)對(duì)話的性質(zhì)可以將人機(jī)對(duì)話技術(shù)分為任務(wù)型對(duì)話和開放域?qū)υ挼阮愋?。其中任?wù)型對(duì)話是通過人機(jī)對(duì)話的形式幫助用戶高效地完成各種類型的任務(wù),比如在線預(yù)定任務(wù)等。而開放域?qū)υ挼哪繕?biāo)是與用戶進(jìn)行不限主題的自由對(duì)話,以滿足情感溝通等社交要求。
作為智能語(yǔ)音交互的最后一環(huán),語(yǔ)音合成技術(shù)是利用機(jī)器和一些專門裝置制造語(yǔ)音的技術(shù)。該技術(shù)涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理等多個(gè)學(xué)科技術(shù)。廣義上的語(yǔ)音合成,包括語(yǔ)音合成、歌聲合成、音樂和聲音合成等各方面,而狹義的語(yǔ)音合成則是指機(jī)器讀語(yǔ)音。人機(jī)對(duì)話的結(jié)果仍然以語(yǔ)音的方式反饋給用戶,從而實(shí)現(xiàn)智能語(yǔ)音交互系統(tǒng)的完整閉環(huán)。
電梯作為人們?nèi)粘3鲂胁豢苫蛉钡慕煌üぞ撸浅鲩T的第一站,回家的最后一站。為保障電梯的安全運(yùn)行,其中一重要環(huán)節(jié)就是按照電梯相關(guān)法律、法規(guī)、安全技術(shù)規(guī)范的要求進(jìn)行檢驗(yàn)。電梯的檢驗(yàn)包含安裝、改造、重大修理的監(jiān)督檢驗(yàn),以及現(xiàn)行每年一次的定期檢驗(yàn)。電梯的檢驗(yàn)工作依據(jù)對(duì)應(yīng)的作業(yè)指導(dǎo)文件進(jìn)行開展。電梯檢驗(yàn)工作包含了檢驗(yàn)前的準(zhǔn)備、現(xiàn)場(chǎng)檢驗(yàn)及記錄、檢驗(yàn)問題匯總、檢驗(yàn)報(bào)告出具等多個(gè)環(huán)節(jié)。其中現(xiàn)場(chǎng)檢驗(yàn)項(xiàng)目?jī)?nèi)容涵蓋了電梯機(jī)房(機(jī)器設(shè)備間)、井道、底坑中的相關(guān)安全保護(hù)裝置的多項(xiàng)功能試驗(yàn)。為保障現(xiàn)場(chǎng)檢驗(yàn)工作安全順利開展,檢驗(yàn)人員之間需要通過對(duì)講設(shè)備保持聯(lián)系。目前模擬對(duì)講機(jī)使用比較普遍,它是采用模擬通信技術(shù)設(shè)計(jì)的,將存儲(chǔ)的信號(hào)調(diào)制到對(duì)講機(jī)傳輸頻率上,也稱為傳統(tǒng)對(duì)講機(jī)。結(jié)合本人電梯現(xiàn)場(chǎng)檢驗(yàn)工作的經(jīng)歷,部分傳統(tǒng)對(duì)講機(jī)在使用過程中存在信號(hào)干擾、通話質(zhì)量不高、待機(jī)時(shí)間短、攜帶不方便等問題,類似問題的出現(xiàn)會(huì)直接影響檢驗(yàn)人員之間的及時(shí)有效溝通,間接影響電梯檢驗(yàn)工作的質(zhì)量及效率。
鑒于智能語(yǔ)音交互技術(shù)在多領(lǐng)域的成功應(yīng)用,如智能家居產(chǎn)品中的智能門鎖、“天貓精靈等聊天機(jī)器人、自動(dòng)駕駛、可穿戴智能設(shè)備等,將智能語(yǔ)音交互技術(shù)融入電梯檢驗(yàn)中的現(xiàn)場(chǎng)檢驗(yàn)環(huán)節(jié),通過語(yǔ)音記錄、語(yǔ)音查詢調(diào)取等方式輔助現(xiàn)場(chǎng)檢驗(yàn)工作,從而有效彌補(bǔ)對(duì)講設(shè)備通信不良、文字記錄不便等原因引起的短板。檢驗(yàn)語(yǔ)音助手的應(yīng)用場(chǎng)景示意圖如圖3所示。在資料審查、機(jī)房(機(jī)器設(shè)備間)、井道、底坑等環(huán)節(jié),檢驗(yàn)人員均可以通過語(yǔ)音記錄發(fā)現(xiàn)的問題,當(dāng)語(yǔ)音助手通過移動(dòng)網(wǎng)絡(luò)連接到系統(tǒng)后臺(tái)時(shí),檢驗(yàn)人員可以通過后臺(tái)的檢驗(yàn)系統(tǒng)查詢核實(shí)電梯的相關(guān)信息參數(shù),如果后臺(tái)接入作業(yè)人員培訓(xùn)系統(tǒng),即可查詢特種設(shè)備作業(yè)人員證(如安全管理人員證)的相關(guān)信息。在問題匯總環(huán)節(jié),檢驗(yàn)人員可以通過語(yǔ)音助手調(diào)取現(xiàn)場(chǎng)記錄的隱患語(yǔ)音項(xiàng)目,避免因現(xiàn)場(chǎng)溝通不良或記錄不方便引起的問題描述不準(zhǔn)確甚至是遺漏現(xiàn)象。
圖3 檢驗(yàn)語(yǔ)音助手應(yīng)用框架
隨著人工智能技術(shù)的快速發(fā)展和提升,智能語(yǔ)音交互技術(shù)也在不斷拓寬其應(yīng)用范圍。然而,據(jù)有關(guān)調(diào)查發(fā)現(xiàn),智能語(yǔ)音交互技術(shù)的受眾面相對(duì)狹窄,在技術(shù)實(shí)現(xiàn)等方面還存在一定的問題,如何提升語(yǔ)音識(shí)別率、突破語(yǔ)音交互場(chǎng)景限制、降低環(huán)境影響、提高復(fù)雜命令的識(shí)別率等眾多環(huán)節(jié)都將面臨較大的挑戰(zhàn)。本文結(jié)合電梯檢驗(yàn)工作經(jīng)歷,嘗試將智能語(yǔ)音交互技術(shù)與檢驗(yàn)工作場(chǎng)景進(jìn)行了融合,對(duì)智能語(yǔ)音檢驗(yàn)助手的應(yīng)用場(chǎng)景進(jìn)行了探討,盡管在技術(shù)實(shí)現(xiàn)方面還要面臨巨大的挑戰(zhàn),尤其是在復(fù)雜環(huán)境中的語(yǔ)音識(shí)別率以及移動(dòng)網(wǎng)絡(luò)下的語(yǔ)音數(shù)據(jù)查詢等環(huán)節(jié),但是對(duì)于電梯檢驗(yàn)工作而言,更多新技術(shù)、新思路的大膽嘗試,有助于提升電梯檢驗(yàn)工作的高質(zhì)量發(fā)展。
在挑戰(zhàn)中尋找機(jī)遇,在改革中推動(dòng)發(fā)展,才有越是艱難越向前的動(dòng)力和底氣,電梯檢驗(yàn)工作的發(fā)展如此,特檢事業(yè)的發(fā)展亦是如此。