文/李哲 林馳 郭曉明
科學(xué)技術(shù)、計(jì)算機(jī)與網(wǎng)絡(luò)通信技術(shù)的快速發(fā)展,推動(dòng)經(jīng)濟(jì)、社會(huì)、生活等諸多方面的變革。機(jī)器人融合了信息、通信、人工智能技術(shù),其技術(shù)含量較高。服務(wù)型機(jī)器人作為機(jī)器人分類中的重要分支,主要用于服務(wù)人類、為人類的生活提供便利。
智能導(dǎo)覽機(jī)器人作為服務(wù)型機(jī)器人,主要用于各種展覽館、博物館或其他會(huì)展中心,沿固定軌跡引導(dǎo)游客參觀,并進(jìn)行相應(yīng)講解以及簡(jiǎn)單的會(huì)話交流。良好的人機(jī)交互系統(tǒng),有助于帶給用戶更好的體驗(yàn)。
對(duì)于高校校史館而言,包括已經(jīng)逐步建立起的虛擬校史館,是從傳統(tǒng)型向新時(shí)代智能信息化發(fā)展必然,具體可以體現(xiàn)在展館的安全管理信息化、穩(wěn)定的數(shù)字化網(wǎng)絡(luò)環(huán)境部署、對(duì)外展示系統(tǒng)信息化、對(duì)內(nèi)辦公系統(tǒng)自動(dòng)化等方面。
基于這樣的需求,本文著眼于為高校校史館提供更好的個(gè)性化服務(wù)的目標(biāo),設(shè)計(jì)并研究了一款智能導(dǎo)覽機(jī)器人,以大連理工大學(xué)校史館為使用場(chǎng)景,研究面向展館導(dǎo)覽功能的人機(jī)交互系統(tǒng),實(shí)現(xiàn)導(dǎo)覽過(guò)程中的服務(wù)功能,力求將對(duì)外的展示系統(tǒng)通過(guò)服務(wù)型機(jī)器人的方式向訪客提供更直觀的沉浸式體驗(yàn),從而提升校史館的吸引力與服務(wù)水平。
大連理工大學(xué)檔案館(校史館)
作為信息科技時(shí)代的新型產(chǎn)物,高校校史館智能導(dǎo)覽機(jī)器人能夠充分發(fā)揮科學(xué)技術(shù)在文化領(lǐng)域的積極作用。其主要功能針對(duì)館內(nèi)需要解說(shuō)的地點(diǎn)進(jìn)行路徑規(guī)劃,沿固定路線到達(dá)標(biāo)記點(diǎn)后停頓,識(shí)別目標(biāo)處的二維碼并進(jìn)行語(yǔ)音播報(bào)講解。考慮到校史館人來(lái)人往的情況,需要為智能機(jī)器人提供自主避障功能,當(dāng)機(jī)器人感應(yīng)到障礙物時(shí),會(huì)重新規(guī)劃路線,避開障礙物。館內(nèi)需解說(shuō)的信息以二維碼的形式呈現(xiàn),需要為智能機(jī)器人提供二維碼識(shí)別功能,識(shí)別二維碼設(shè)置的文字信息后,智能機(jī)器人將文字信息轉(zhuǎn)成語(yǔ)音播報(bào)。
智能導(dǎo)覽機(jī)器人可投入應(yīng)用的場(chǎng)景包括:
業(yè)務(wù)講解??梢愿鶕?jù)設(shè)定好的線路自動(dòng)運(yùn)行到目的地,帶領(lǐng)訪客游覽校史館,并給出基本的介紹,講解的內(nèi)容根據(jù)二維碼的設(shè)定可以自主定義,展示場(chǎng)館場(chǎng)景、展品特色和相關(guān)服務(wù)內(nèi)容,而真人導(dǎo)覽員則可以輔助回答參觀者隨時(shí)提出的發(fā)散性問題,作為智能導(dǎo)覽機(jī)器人的介紹補(bǔ)充。
主題宣講。在不間斷的團(tuán)體參觀活動(dòng)中,機(jī)器人可根據(jù)展館場(chǎng)景情況自定義的工作方式和行走路線,自動(dòng)循環(huán)運(yùn)作,通過(guò)專業(yè)知識(shí)的輸入和學(xué)習(xí),為參觀團(tuán)體提供相應(yīng)的主題宣講活動(dòng),并做好接待工作。
該智能導(dǎo)覽機(jī)器人選用Core X 控制器,其主要部分有視覺模塊,并搭載了超聲波模塊、測(cè)速電機(jī)、尋線傳感器、語(yǔ)音輸出等模塊,系統(tǒng)框圖如圖1 所示,可實(shí)現(xiàn)定速行駛、巡線避障、語(yǔ)音播報(bào)等功能。由視覺模塊可以實(shí)現(xiàn)二維碼的識(shí)別,再通過(guò)語(yǔ)音輸出模塊將識(shí)別到的信息轉(zhuǎn)化成語(yǔ)音的形式輸出,并經(jīng)由控制器進(jìn)行配置,就能實(shí)現(xiàn)現(xiàn)有的需求,組成一個(gè)簡(jiǎn)化版本的導(dǎo)覽機(jī)器人。
圖1 導(dǎo)覽機(jī)器人系統(tǒng)框
多功能性。服務(wù)型機(jī)器人的特點(diǎn)之一就是具有多項(xiàng)功能。智能導(dǎo)覽機(jī)器人除了具備自主行走、語(yǔ)音合成等基礎(chǔ)功能之外,還具有多媒體播放、二維碼識(shí)別、主動(dòng)迎賓、宣傳講解等功能,此外,智能導(dǎo)覽機(jī)器人還能自主避障、自主充電。
精準(zhǔn)性。由于智能導(dǎo)覽機(jī)器人中內(nèi)置了高精度的芯片,其中的程序都是根據(jù)機(jī)器人服務(wù)對(duì)象的特征和使用需求而設(shè)計(jì)出來(lái)的,因此,智能導(dǎo)覽機(jī)器人投入使用之后,能夠根據(jù)程序的設(shè)定以及人們給予的指令精準(zhǔn)地執(zhí)行各種任務(wù),協(xié)助人類去完成許多可替代/輔助人類的工作。
協(xié)作交互性。服務(wù)型機(jī)器人發(fā)明生產(chǎn)出來(lái)的目的就是為人們提供服務(wù)的,因此,服務(wù)型機(jī)器人會(huì)內(nèi)置許多程序,在實(shí)際的應(yīng)用過(guò)程當(dāng)中,服務(wù)型機(jī)器人還可以與人協(xié)作,在人們需要完成一些具有高難度的工作時(shí),機(jī)器人就可以與人進(jìn)行協(xié)同工作,有人負(fù)責(zé)做出事情的判斷決策,機(jī)器人來(lái)負(fù)責(zé)“定量”計(jì)算和推理,從而讓工作更加出色地完成。
路徑規(guī)劃與自主避障功能的實(shí)現(xiàn)是導(dǎo)覽機(jī)器人的一個(gè)重要問題。它的目標(biāo)是在一個(gè)存在障礙物的環(huán)境中,為導(dǎo)覽機(jī)器人設(shè)計(jì)一條無(wú)碰撞路徑,即使碰到障礙物,也能自主規(guī)避。
為了實(shí)現(xiàn)到目標(biāo)展區(qū)的自動(dòng)導(dǎo)航,需要主次解決機(jī)器人定位、目標(biāo)定位、路徑規(guī)劃、自動(dòng)導(dǎo)航四個(gè)步驟,其中前兩個(gè)步驟分別實(shí)現(xiàn)源點(diǎn)和目標(biāo)點(diǎn)定位,路徑規(guī)劃是核心。規(guī)劃好路徑之后,驅(qū)動(dòng)機(jī)器人的硬件部分,實(shí)現(xiàn)自動(dòng)導(dǎo)航。
實(shí)現(xiàn)機(jī)器人的定位,可采用激光傳感器對(duì)周圍的環(huán)境信息進(jìn)行掃描,之后進(jìn)行全局定位,以便機(jī)器人獲取本身在地圖中的準(zhǔn)確位置。
目標(biāo)定位問題,用戶通過(guò)機(jī)器人人機(jī)交互系統(tǒng)界面上的點(diǎn)擊操作或者語(yǔ)音方式告訴導(dǎo)覽機(jī)器人準(zhǔn)備到達(dá)的目標(biāo)位置。
路徑規(guī)劃與導(dǎo)航問題,可采用包括路徑規(guī)劃以及耗散地圖管理的相關(guān)算法的開源框架。在具體業(yè)務(wù)流程中,數(shù)據(jù)被發(fā)送至程序包,包括機(jī)器人的姿態(tài)、位置順序,再對(duì)目的地進(jìn)行定位,之后通過(guò)內(nèi)部的路徑規(guī)劃與導(dǎo)航功能模塊,實(shí)現(xiàn)對(duì)目標(biāo)位置的最優(yōu)導(dǎo)航與路徑規(guī)劃。
避障系統(tǒng)通過(guò)激光雷達(dá)與深度相機(jī)進(jìn)行全方位的場(chǎng)景掃描,檢測(cè)出機(jī)器人周圍的障礙物分布情況后把障礙物信息傳輸給控制系統(tǒng)。目前主流的機(jī)器人避障方式有激光雷達(dá)避障、單目/雙目視覺避障、3D結(jié)構(gòu)光避障和超聲波避障等。本系統(tǒng)結(jié)合激光雷達(dá)避障反應(yīng)速度快、抗干擾能力強(qiáng)和視覺避障識(shí)別效率高的優(yōu)點(diǎn),在避障性能上要優(yōu)于其他同類產(chǎn)品。
為了使智能導(dǎo)覽機(jī)器人正常工作,需要監(jiān)控智能導(dǎo)覽機(jī)器人的位置、姿態(tài)和系統(tǒng)內(nèi)部狀態(tài)等,同時(shí)還要感知機(jī)器人工作環(huán)境的靜態(tài)和動(dòng)態(tài)信息,使導(dǎo)覽機(jī)器人的行為能適應(yīng)工作環(huán)境的變化。有效獲取智能導(dǎo)覽機(jī)器人內(nèi)部和外部信息,實(shí)現(xiàn)自定位和避障等功能對(duì)提升機(jī)器人工作效率、節(jié)省能源來(lái)說(shuō)具有重要意義。傳感器作為機(jī)器人的“感覺器官”,在其應(yīng)用發(fā)展過(guò)程中起著至關(guān)重要的作用。根據(jù)目前已開發(fā)的各類傳感器在機(jī)器人上應(yīng)用的目的和范圍的不同,可將其分為內(nèi)部傳感器和外部傳感器兩大類。內(nèi)部傳感器用于檢測(cè)機(jī)器人的自身狀態(tài),外部傳感器安裝在機(jī)器人上,用于檢測(cè)機(jī)器人所處的外部環(huán)境信息。
激光雷達(dá)避障原理。激光雷達(dá)是一種利用激光準(zhǔn)確定位障礙物距離的儀器。激光雷達(dá)的發(fā)射器發(fā)射激光脈沖,遇到障礙物時(shí)會(huì)反射回來(lái)并被接收器接收,通過(guò)記錄時(shí)間差來(lái)確定測(cè)試對(duì)象和測(cè)試點(diǎn)之間的距離。激光脈沖從發(fā)射到接收的時(shí)間與激光雷達(dá)與障礙物之間的距離成正比。激光雷達(dá)配合SLAM 技術(shù),可幫助機(jī)器人實(shí)時(shí)定位導(dǎo)航與避障。
視覺傳感識(shí)別二維碼。二維碼識(shí)別主要是通過(guò)調(diào)用視覺傳感器設(shè)備來(lái)快速回調(diào)攝像機(jī)并進(jìn)行相應(yīng)應(yīng)用,當(dāng)一次回調(diào)的圖像無(wú)法識(shí)別時(shí),將執(zhí)行下一次回調(diào),直到識(shí)別出二維碼。
由于二維碼大小和顯示模糊程度不同等原因,攝像機(jī)有時(shí)無(wú)法很好地采集圖像。因此,為了實(shí)現(xiàn)更快的識(shí)別,攝像機(jī)需要能夠自動(dòng)聚焦。識(shí)別完成后,會(huì)提醒用戶并完成機(jī)器人的語(yǔ)音,從而實(shí)現(xiàn)語(yǔ)音解釋功能。
語(yǔ)音合成技術(shù)(Text To Speech)是實(shí)現(xiàn)人機(jī)交互的重要途徑,它是一種從文本中自動(dòng)生成語(yǔ)音的程序,將消息從機(jī)器傳輸給人,目的是傳遞消息中的信息。換句話說(shuō),語(yǔ)音合成就是創(chuàng)建一個(gè)與人類性能相當(dāng)?shù)南到y(tǒng)。在語(yǔ)音合成技術(shù)中,主要分為文本分析階段和語(yǔ)音生成階段,文本分析階段就是文本輸入并將其轉(zhuǎn)錄成語(yǔ)音表征,然后對(duì)語(yǔ)音表征進(jìn)行預(yù)處理;語(yǔ)音生成階段是從文本分析階段所得到的語(yǔ)音表征中生成語(yǔ)音從而實(shí)現(xiàn)發(fā)聲的功能,這也被稱為數(shù)字信號(hào)處理。