何進(jìn)松
(上海電子信息職業(yè)技術(shù)學(xué)院通信與信息工程學(xué)院 上海 201411)
隨著互聯(lián)網(wǎng)信息化的發(fā)展,在大數(shù)據(jù)、深度學(xué)習(xí)算法等技術(shù)的推動(dòng)下,人工智能技術(shù)不斷發(fā)展,將對(duì)生活服務(wù)、醫(yī)療、工農(nóng)業(yè)等各個(gè)行業(yè)產(chǎn)生顛覆性影響。目前,我國(guó)正處于中國(guó)制造向中國(guó)智造邁進(jìn)的大背景下,機(jī)器人產(chǎn)業(yè)迎來了全新機(jī)遇。借助人工智能技術(shù),可實(shí)現(xiàn)機(jī)器人領(lǐng)域與醫(yī)療領(lǐng)域的深度融合,醫(yī)療服務(wù)機(jī)器人具有廣闊的市場(chǎng)前景[1~2]。
目前各大醫(yī)院門診患者流量大,大多數(shù)患者缺乏健康認(rèn)知,對(duì)于病癥、醫(yī)院科室及檢查位置導(dǎo)航等常見問題,需要導(dǎo)醫(yī)指導(dǎo)[3~4]。傳統(tǒng)導(dǎo)診模式工作量大,工作效率低,導(dǎo)醫(yī)工作本身也相對(duì)枯燥,服務(wù)態(tài)度有待提高。因此,改善就醫(yī)體驗(yàn),提高患者滿意度,減輕導(dǎo)醫(yī)工作壓力,成為現(xiàn)代化醫(yī)院的工作要求。借助智能化導(dǎo)診機(jī)器人,采用人機(jī)交互方式,根據(jù)患者病癥描述,給出就診建議,提高問診質(zhì)量,是目前互聯(lián)網(wǎng)醫(yī)療服務(wù)領(lǐng)域的主流發(fā)展方向[5~6]。
智能導(dǎo)診機(jī)器人及其綜合管理平臺(tái),要求能夠?qū)C(jī)器人本體進(jìn)行管理,機(jī)器人能夠?qū)崿F(xiàn)人機(jī)語音交流,并且具備連續(xù)監(jiān)聽患者提問的功能[7~8]。管理平臺(tái)能夠?qū)崟r(shí)記錄機(jī)器人與問詢者的交互記錄,通過管理后臺(tái)能對(duì)機(jī)器人發(fā)送相關(guān)操作指令,并允許后臺(tái)管理人員查看及處理人機(jī)對(duì)話內(nèi)容及機(jī)器人前端攝像頭采集的畫面。針對(duì)患者就醫(yī)過程中需要咨詢的問題建立導(dǎo)醫(yī)知識(shí)庫(kù),形成機(jī)器人問答知識(shí)庫(kù),方便實(shí)現(xiàn)與患者的智能語音交互。機(jī)器人能夠?qū)崿F(xiàn)自我記錄和自我學(xué)習(xí),再遇相似問題時(shí)機(jī)器人可自行回復(fù)解決[9~12]。建立導(dǎo)醫(yī)地圖,提供地圖導(dǎo)航功能,通過語音交互能力可解決問詢者有關(guān)咨詢位置信息相關(guān)的問題,并能夠在機(jī)器人屏幕上顯示相關(guān)地圖信息,進(jìn)行路線指引。
針對(duì)智能導(dǎo)診應(yīng)用需求,進(jìn)行智能導(dǎo)診機(jī)器人及其綜合管理平臺(tái)總體設(shè)計(jì)。硬件基于軟銀人形機(jī)器人“Pepper”作為服務(wù)機(jī)器人,軟件基于Lab-VIEW Nao SDK工具包進(jìn)行人機(jī)交互程序設(shè)計(jì),并將其交叉編譯生成Python代碼,結(jié)合前端技術(shù),完成軟件開發(fā)。
智能導(dǎo)診機(jī)器人及其綜合管理平臺(tái)主要包括三個(gè)部分功能:機(jī)器人平臺(tái)、管理后臺(tái)及客戶端三部分,功能框圖如圖1所示。
圖1 平臺(tái)功能框圖
各部分功能如下。
1)機(jī)器人平臺(tái):分為三個(gè)功能模塊。實(shí)現(xiàn)與患者的智能語音交互,根據(jù)診斷情況,提供導(dǎo)診服務(wù);人臉識(shí)別功能能夠?qū)崿F(xiàn)人臉圖像采集,方便下載就診時(shí)識(shí)別患者身份;定位導(dǎo)航功能可實(shí)現(xiàn)點(diǎn)到點(diǎn)自主導(dǎo)航,并進(jìn)行移動(dòng)路線指引[13~14]。
2)管理后臺(tái):分為四個(gè)功能模塊。機(jī)器人管理模塊顯示當(dāng)前機(jī)器人列表,進(jìn)行機(jī)器人狀態(tài)控制;導(dǎo)醫(yī)工作臺(tái)實(shí)時(shí)記錄機(jī)器人與患者的交互記錄;導(dǎo)醫(yī)知識(shí)庫(kù)根據(jù)醫(yī)院數(shù)據(jù)模型和知識(shí)庫(kù)建立,患者咨詢過程中,根據(jù)所述疾病,從導(dǎo)醫(yī)知識(shí)庫(kù)中匹配響應(yīng)的診室和治療醫(yī)生,形成導(dǎo)醫(yī)結(jié)果;數(shù)據(jù)統(tǒng)計(jì)模塊進(jìn)行用戶統(tǒng)計(jì)和問答結(jié)果統(tǒng)計(jì)。
3)客戶端:分為五個(gè)模塊。醫(yī)院概述模塊進(jìn)行醫(yī)院、科室和專家的介紹,方便患者查詢;就醫(yī)指南介紹就診流程、住院須知和出院流程;導(dǎo)醫(yī)地圖模塊,提供地圖導(dǎo)航功能;此外還提供預(yù)約掛號(hào)和相關(guān)診療費(fèi)用查詢功能模塊。
選擇軟銀人形機(jī)器人“Pepper”作為服務(wù)機(jī)器人。“Pepper”是一款人形機(jī)器人,身高120cm,體重28kg,配備10.1英寸觸摸屏,可綜合考慮周圍環(huán)境,并積極主動(dòng)地作出反應(yīng)。通過機(jī)器人頭部的麥克風(fēng)陣列,機(jī)器人可以準(zhǔn)確地對(duì)場(chǎng)景內(nèi)的聲源進(jìn)行定位和識(shí)別。機(jī)器人配備了語音識(shí)別技術(shù),可用表情、動(dòng)作、語音與人類進(jìn)行人機(jī)交互。智能AI數(shù)據(jù)庫(kù)可實(shí)現(xiàn)除人機(jī)交互外的天氣查詢、點(diǎn)歌、聊天等功能。底盤雷達(dá)掃描,構(gòu)建地圖,導(dǎo)航避障,可根據(jù)需求準(zhǔn)確移動(dòng)到目標(biāo)位置[15]。為了擴(kuò)展機(jī)器人的應(yīng)用,Aldebaran Robotics公司也公開發(fā)布了SDK,開發(fā)者可以根據(jù)開發(fā)需求對(duì)機(jī)器人做部署和個(gè)性化設(shè)定。
圖2 人形機(jī)器人“Pepper”
“Pepper”機(jī)器人和其本身配有的平板觸摸屏,分別具有獨(dú)立的處理器,因此針對(duì)機(jī)器人本體控制及平板的人機(jī)交互界面設(shè)計(jì),將軟件分為兩部分,分別運(yùn)行主程序和前端程序。主程序采用開發(fā)和維護(hù)速度較快的LabVIEW進(jìn)行開發(fā),基于NAO SDK for LabVIEW和Voice Cloud工具包,實(shí)現(xiàn)機(jī)器人管理和語音功能。NAO SDK for LabVIEW基于最新的NAOqi2.1軟件架構(gòu)編寫而成,基于該開發(fā)包,可實(shí)現(xiàn)機(jī)器人運(yùn)動(dòng)控制、語音控制、人臉識(shí)別和獲取傳感器數(shù)據(jù)等。VoiceCloud SDK for LabVIEW工具包基于科大訊飛語音服務(wù)功能,能夠完成語音聽寫,語法識(shí)別,語音合成等功能。最后利用工具包中自帶的交叉編譯器,將LabVIEW程序編譯成“Pepper”支持的Python語言,下載到機(jī)器人內(nèi)核中。
主程序軟件設(shè)計(jì)架構(gòu)采用狀態(tài)機(jī)結(jié)構(gòu),設(shè)置關(guān)鍵變量VIRobotics_Page作為Htm l與LabVIEW溝通的重要標(biāo)識(shí),根據(jù)導(dǎo)診平臺(tái)模塊功能,為VIRobotics_Page賦值,也以此作為狀態(tài)跳轉(zhuǎn)的跳轉(zhuǎn)條件。主程序和前端程序交互時(shí),LabVIEW通過發(fā)送JS代碼段,模擬點(diǎn)擊按鈕、網(wǎng)頁跳轉(zhuǎn)、網(wǎng)頁標(biāo)簽文字更新等,實(shí)現(xiàn)對(duì)導(dǎo)診平臺(tái)人機(jī)交互界面的對(duì)應(yīng)界面的控制。前端程序控制LabVIEW時(shí),用JS修改機(jī)器人內(nèi)存中的關(guān)鍵變量VIRobotics_Page,LabVIEW的狀態(tài)機(jī)中,檢測(cè)到該變量的值,則進(jìn)入不同的狀態(tài)分支。主程序流程圖如圖3所示。
圖3 主程序流程圖
主程序執(zhí)行過程為開機(jī)后,首先進(jìn)行機(jī)器人初始化,通過判斷關(guān)鍵變量VIRobotics_Page的值,進(jìn)入對(duì)應(yīng)的狀態(tài)分支。當(dāng)患者選擇醫(yī)院概述、就醫(yī)指南、導(dǎo)醫(yī)地圖和健康宣教功能時(shí),機(jī)器人首先進(jìn)行人臉識(shí)別,識(shí)別后開始與患者進(jìn)行語音交流,此時(shí)利用本地語音識(shí)別功能,根據(jù)語音識(shí)別結(jié)果,響應(yīng)不同的功能。當(dāng)患者選擇智能導(dǎo)診時(shí),依據(jù)導(dǎo)醫(yī)知識(shí)庫(kù),通過“病癥特征提取”的方式,模仿問診過程,為患者給出就診建議。如患者選擇智能問答功能,則進(jìn)入訊飛語音識(shí)別。
根據(jù)系統(tǒng)設(shè)計(jì)需求,采用HTML5+CSS編碼技術(shù),結(jié)合JavaScript進(jìn)行人機(jī)交互界面程序開發(fā)。點(diǎn)擊人機(jī)交互界面網(wǎng)頁上對(duì)應(yīng)的功能圖標(biāo),JS即修改關(guān)鍵變量VIRobotics_Page的值,主程序進(jìn)行狀態(tài)跳轉(zhuǎn),網(wǎng)頁上即響應(yīng)對(duì)應(yīng)的功能。網(wǎng)頁點(diǎn)擊事件框圖如圖4所示。
圖4 網(wǎng)頁點(diǎn)擊事件框圖
本文借助人工智能技術(shù),基于從LabVIEW到python的交叉編譯技術(shù)和前端技術(shù),分別從系統(tǒng)總體設(shè)計(jì)、機(jī)器人硬件功能、軟件設(shè)計(jì)進(jìn)行闡述,完成了智能導(dǎo)診機(jī)器人及其綜合平臺(tái)的設(shè)計(jì)。目前該系統(tǒng)已成功應(yīng)用于醫(yī)療導(dǎo)診中,工作過程中,機(jī)器人運(yùn)行穩(wěn)定,人機(jī)交互性能良好,愉悅患者心情,有效改善了醫(yī)院的導(dǎo)診環(huán)境。該設(shè)計(jì)在醫(yī)療領(lǐng)域具有較好的應(yīng)用價(jià)值。