李嘉杰
(廣東科技學(xué)院 機電工程學(xué)院,廣東 東莞 523000)
隨著文旅酒店行業(yè)的逐步復(fù)蘇,以及人工智能、5G、大數(shù)據(jù)等新技術(shù)的迭代發(fā)展,特別是《“十四五”機器人產(chǎn)業(yè)發(fā)展規(guī)劃》[1]出臺后,機器人不斷在各行各業(yè)注入更多的智能化基因。如今,越來越多的酒店在傳統(tǒng)基礎(chǔ)服務(wù)上積極拓展智能機器人以深化數(shù)字化和信息化服務(wù),能達到降本增效的目的,市場發(fā)展?jié)摿η熬皬V闊。
當前市面上智能機器人在酒店方面的應(yīng)用[2]主要有以下類型:迎賓機器人,提供前臺客房辦理和餐廳訂餐等服務(wù);配送機器人,提供將行李或餐品配送到餐桌及客房等服務(wù);清潔機器人,提供大廳樓道區(qū)域的清潔服務(wù)。而在客房場景下,智能機器人提供的應(yīng)用服務(wù)并不多。因此,優(yōu)化消費者在客房場景下的交互便利性,獲取更全面、更個性化的服務(wù),對于酒店智能機器人應(yīng)用發(fā)展具有實踐探索意義。
消費者入住酒店后,往往特別關(guān)注酒店客房設(shè)施、安全及餐飲等方面的服務(wù)。為了提高消費者入住后的滿意度,本文搭建一套智能交互系統(tǒng),通過智能交互機器人提供周邊信息查詢服務(wù)。機器人具備與人類開展智能交互的能力,通過圖像識別和處理技術(shù)的改進以及自然語言處理能力的提高,能夠深度感知、智能決策和靈巧執(zhí)行。
智能交互機器人以客房智能電視和智能音箱為媒介,通過物聯(lián)網(wǎng)技術(shù)和人工智能(Artificial Intelligence,AI)技術(shù),為酒店客房構(gòu)建了一套完整的智能交互系統(tǒng),為住客提供全方位的智能交互體驗。機器人感知語音信息,通過信息處理進行邏輯判斷分析,實現(xiàn)在客房內(nèi)部合理地驅(qū)動各種智控設(shè)施設(shè)備。例如,住客進入房間時,房間的燈光、窗簾、電視會自動打開,智能交互機器人會自主喚醒并出現(xiàn)在電視中,向住客介紹酒店相關(guān)信息、設(shè)備使用方法,主動推送飲食、出行等全方位本地信息。住客可以通過語音交互向虛擬管家提出客控、呼叫、購物、娛樂、社交及服務(wù)等各方面的需求。該智能交互系統(tǒng)還具有強大的數(shù)據(jù)處理能力,能夠快速準確地處理各種信息,為酒店和住客提供更加智能化、高效的服務(wù)。
該智能交互系統(tǒng)[3]方案部署于酒店機房,組網(wǎng)拓撲如圖1 所示。除了標準的數(shù)據(jù)通信設(shè)備外,主要部分為部署于酒店機房的智控業(yè)務(wù)服務(wù)器群組和部署于客房內(nèi)部的智控設(shè)施。
圖1 智能交互系統(tǒng)拓撲圖
第一,寬帶路由器接入與部署。通過光纖專線網(wǎng)絡(luò)將寬帶路由器接入酒店機房,為所有智控業(yè)務(wù)服務(wù)器提供網(wǎng)絡(luò)連接。
第二,多媒體基于HTTP 的自適應(yīng)碼率流媒體傳輸(HTTP Live Streaming,HLS)服務(wù)器。路由器具備本地媒資封裝推流能力,可將運營商用戶數(shù)據(jù)報協(xié)議(User Datagram Protocol,UDP)組播流轉(zhuǎn)封裝推流,輸出為更適合局域網(wǎng)的HLS多媒體流文件,提高數(shù)據(jù)傳輸效率,為酒店提供多媒體服務(wù)。
第三,酒店管理系統(tǒng)對接網(wǎng)關(guān)。服務(wù)器上聯(lián)酒店物業(yè)管理系統(tǒng)(Property Management System,PMS),采用HTTP-GET接口方式獲取客房入住信息,采用HTTP-POST 接口方式推送客房點餐或其他服務(wù)等數(shù)據(jù),開啟Web 服務(wù),為客房終端提供信息服務(wù)。
第四,客控系統(tǒng)代理服務(wù)器??头恐强卦O(shè)施數(shù)據(jù)處理中心,主要將收到的音頻文件轉(zhuǎn)發(fā)至智能語音云平臺。智能語音云平臺把語音文件解析成JSON 串返回給本地代理服務(wù)器進行處理。代理服務(wù)器對JSON 串進行封裝處理,封裝成操控信令。
第五,客房智控設(shè)施??头績?nèi)接入Wi-Fi 熱點的智控終端設(shè)備,包括智能電視機、智能音箱、智能窗簾、智能燈泡及空調(diào)伴侶等??头績?nèi)的智能終端設(shè)備通過智能音箱收集交互指令,收錄音頻并編碼為統(tǒng)一的音頻格式,再即時傳輸?shù)皆破脚_處理;通過智能電視進行指令處理和業(yè)務(wù)呈現(xiàn),關(guān)聯(lián)完成后可接收到平臺發(fā)來的對應(yīng)信令信息,通過電視屏展示處理結(jié)果。
酒店客房的電話功能集成通常有藍牙同步或微信賬號同步兩種主要方式??紤]到微信賬號同步涉及更多的個人信息安全問題以及退房時忘記退出的困擾,這里僅對藍牙同步方式進行介紹,重點闡述其在智能音箱上的應(yīng)用。通過藍牙連接手機,智能音箱可以實現(xiàn)語音輸入呼叫聯(lián)系人名字,從而完成電話撥打、掛斷、靜音等操作。實現(xiàn)這一功能,智能音箱需要支持電話免提協(xié)議(Hands-Free Profile,HFP)功能[4]。HFP 是一種藍牙設(shè)備普遍使用的免提協(xié)議,規(guī)定了免提設(shè)備控制電話的相關(guān)操作。
HFP 協(xié)議有音頻網(wǎng)關(guān)(Audio Gateway,AG)和免提單元(Hands-Free unit,HF)兩個角色。在此應(yīng)用中,手機的角色是AG,智能音箱的角色就是HF。兩者之間的藍牙通信協(xié)議棧中,最重要的是邏輯鏈路控制與適配協(xié)議(Logical Link Control and Adaptation Protocol,L2CAP)和屬性協(xié)議(Attribute protocol,ATT)。
L2CAP 是藍牙協(xié)議棧中的一個關(guān)鍵協(xié)議,用于在藍牙設(shè)備之間提供可靠的數(shù)據(jù)傳輸和服務(wù)質(zhì)量控制。其主要目標是在藍牙設(shè)備之間建立邏輯鏈路,以便進行數(shù)據(jù)傳輸。L2CAP 協(xié)議允許上層協(xié)議通過L2CAP 通道進行通信。
ATT 協(xié)議是藍牙協(xié)議棧中的一個重要協(xié)議,用于在藍牙設(shè)備之間管理和交換屬性數(shù)據(jù)。它是在通用屬性配置文件(Generic Attribute Profile,GATT)之上建立的,用于支持設(shè)備之間的屬性讀寫和傳輸。通過ATT 協(xié)議,藍牙設(shè)備可以利用讀取、寫入和通知等操作來訪問和交換屬性數(shù)據(jù)。ATT 協(xié)議提供了一種簡單而靈活的方法來進行設(shè)備之間的屬性數(shù)據(jù)傳輸和交互。ATT協(xié)議在藍牙設(shè)備之間的應(yīng)用廣泛,如傳感器數(shù)據(jù)獲取、設(shè)備配置和控制等場景。
多媒體智控操控應(yīng)用為通過智能音箱操控智能電視呈現(xiàn)多媒體業(yè)務(wù),具體的信令流程分為語音采集、指令解析和業(yè)務(wù)呈現(xiàn)3 個過程。
2.2.1 語音采集
智能音箱通過拾音器模塊采集用戶語音,編碼后將音頻媒體文件上傳到智能語音云平臺。智能語音云平臺進行語音識別處理,轉(zhuǎn)換成文字形式。
2.2.2 指令解析
首先,智能語音云平臺將文字發(fā)回給局域網(wǎng)的代理服務(wù)器用作智控指令顯示,由智能電視接收并呈現(xiàn)出來,主要用于校驗信息準確度。其次,平臺將文字解析成多媒體操控意圖,調(diào)用數(shù)據(jù)庫中意圖信令格式數(shù)據(jù)和智能電視關(guān)聯(lián)信息,封裝成針對智能電視索取媒資的信令的JSON 串,通過代理服務(wù)器轉(zhuǎn)發(fā)給智能電視。云平臺在此過程主要完成從語音識別到轉(zhuǎn)譯成信令的一個完整交互流程,主要包括語音識別(Automatic Speech Recognition,ASR)和語音合成(Text To Speech,TTS)兩個功能模塊[5]。ASR 語音識別是把語音轉(zhuǎn)換成文字,建立文本索引,將非結(jié)構(gòu)化的語音文件轉(zhuǎn)換為結(jié)構(gòu)化的索引信息的過程;而TTS 語音合成是把文字轉(zhuǎn)換為對應(yīng)的音頻的過程,通過TTS 語音播報將結(jié)果傳達給用戶,并且在電視屏幕上給出適合屏幕大小形狀的展示結(jié)果,主要用于校驗用戶輸入語音的精準性。除提供語音服務(wù)之外另內(nèi)嵌數(shù)據(jù)庫服務(wù),數(shù)據(jù)庫存儲智能音箱和智能電視的關(guān)聯(lián)信息和操控信令格式數(shù)據(jù)。
2.2.3 業(yè)務(wù)呈現(xiàn)
智能電視從操控JSON 串中獲取信息后,封裝成平臺操控指令發(fā)送到多媒體HLS 服務(wù)器。服務(wù)器主要包括本地點播服務(wù)平臺和第三方影視平臺。流媒體內(nèi)容服務(wù)提供方可以根據(jù)接口信令,推出標準HLS 協(xié)議的媒體流。
總的來說,智能音箱的藍牙同步電話功能和智能電視的多媒體智控操控應(yīng)用,都充分利用了藍牙通信協(xié)議棧和云平臺的優(yōu)勢,為消費者提供了更加便捷、高效的多媒體業(yè)務(wù)體驗。
本文從智能交互系統(tǒng)和兩種智控終端對智能交互機器人在酒店客房場景的應(yīng)用進行了探索。機器人基本能通過語音操作完成一些對智能終端設(shè)施的控制。在未來智能機器人發(fā)展領(lǐng)域,如何讓服務(wù)有溫度、機器富有“感情色彩”,是更多智能創(chuàng)造者需要突破的方向。人的需求多種多樣,問題也千奇百怪。當前機器人回答的問題大多比較標準化,今后機器人會通過與人交互不斷收集客人的問題,通過大數(shù)據(jù)的積累,其回答將變得更加精準、更體貼。