黃恒一 丁佳樂 黎順 康郢芮 付三麗
摘 要:文中在研究人工智能和物聯(lián)網(wǎng)技術的基礎上,設計了一個簡單的語音識別可控遠程視頻監(jiān)控智能車輛分析判斷機器人。該智能車機器人可以接收用戶發(fā)出的語音指令,并對用戶的語音指令進行分析后響應。此外智能車身搭載的安卓智能機器可采集智能車附近的信息并將采集到的圖像信息通過無線方式反饋至用戶接收設備,從而實現(xiàn)對智能車運動視野范圍內(nèi)圖像信息的監(jiān)控。
關鍵詞:藍牙通信;語音控制;視頻監(jiān)控;物聯(lián)網(wǎng);人工智能;語音指令
中圖分類號:TP393 文獻標識碼:A 文章編號:2095-1302(2019)05-0-05
0 引 言
世界上很多發(fā)達國家都在進行機器人技術的研究。本文在智能小車軍用、民用需求量逐步加大的環(huán)境下,結(jié)合安卓智能手機、移動機器人、人工智能技術中的語音識別技術、人的視覺系統(tǒng)與攝像頭傳感器技術,設計了語音識別可控遠程視頻監(jiān)控智能車輛分析判斷機器人。
1 原 理
當今社會,智能手機作為一個新興領域,正在被越來越多地應用到不同領域,大大提高了工作效率。人工智能機器人技術是當下企業(yè)及科研機構研究的重點,而智能車輛作為移動機器人的一個重要分支也得到了越來越多的關注。本文設計的智能小車是一個集語音識別、無線通信、安卓編程、攝像頭圖像采集、無線傳輸?shù)裙δ苡谝惑w的綜合系統(tǒng),具備簡易思維判斷能力,可以識別出正確與錯誤的語音控制指令。本文對當下幾種常見的無線視頻監(jiān)控技術進行了簡單探討,并在此基礎上設計了采用安卓手機改造的簡易無線監(jiān)控器。文中設計的智能車無線監(jiān)控器可采集智能車附近的實時圖像信息,并反饋至與智能車身安卓機同一局域網(wǎng)內(nèi)的視頻監(jiān)控設備,本文研究的監(jiān)控智能小車實物具有一定的科研及應用價值[1]。
2 設計流程
2.1 智能小車設計思路
智能手機通過調(diào)用手機語音識別器識別漢語詞匯,語音詞匯通過Android手機的語音識別引擎轉(zhuǎn)化為智能車芯片運動狀態(tài)約定字符,當智能手機識別出正確的漢語詞匯后,就會通過Android手機的藍牙客戶端與智能小車的藍牙服務端建立無線信道,傳輸智能車運動狀態(tài)控制指令。當智能小車接收到語音運動狀態(tài)控制指令后,會通過小車的單片機芯片進行解析,驅(qū)動小車電極,從而控制小車運動狀態(tài)的改變。錯誤的語音控制指令無法改變智能車的運動狀態(tài),同時智能車還將把錯誤的語音控制指令通過語音反饋形式傳達給使用者[2]。本文在研究智能車語音識別功能外,還對幾種常見的智能車視頻監(jiān)控技術進行了研究、嘗試和對比,提出了一種基于華為手機分屏技術實現(xiàn)的分析判斷語音識別監(jiān)控智能車。語音視頻監(jiān)控智能車如圖1所示,智能車視頻監(jiān)控流程如圖2所示。
2.2 智能車的動力系統(tǒng)
本文設計的智能車動力供應系統(tǒng)由6節(jié)1.5 V的干電池組成。智能小車的單片機芯片、藍牙接收芯片及智能小車的L298N驅(qū)動芯片所需電壓由5 V電源提供。因此需在智能小車的主板上安裝7805三端穩(wěn)壓模塊,將9 V輸入電壓轉(zhuǎn)換至5 V,供系統(tǒng)單片機、藍牙和L298N電機驅(qū)動模塊使用。智能車俯視圖如圖3所示,側(cè)視圖如圖4所示。
通過圖3可看到智能車前端安裝有一個鐵夾子,可實現(xiàn)車身前端智能手機的搭載及去除。智能車搭配攝像頭主要涉及車身平衡及穩(wěn)定等因素。該設計中由安卓智能機改造的監(jiān)控攝像頭基本可實現(xiàn)智能車二維空間視野范圍內(nèi)圖像信息的采集[3]。
由圖4可知,智能車主板上的器件主要包括單片機芯片,可梳理小車藍牙服務器接收到的運動狀態(tài)控制指令并解碼,通過L298N電機驅(qū)動芯片驅(qū)動智能小車運動。此外,小車前端搭載的安卓智能機用于采集小車視野范圍內(nèi)的圖像信息。
2.3 智能小車APP手機控制端的設計
與智能小車配套的APP控制端通過MIT APP Inventor第三方在線開發(fā)平臺進行設計。智能小車APP控制端主要由藍牙傳感器、語音識別傳感器、文本語音轉(zhuǎn)換器組成,智能車可對用戶的語音控制指令進行分析判斷[4]。
2.3.1 智能車語音答復功能
智能車通過MIT APP Inventor在線開發(fā)平臺中的語音識別傳感器完成對正確的運動狀態(tài)語音的反饋。當安卓智能手機的語音識別引擎解析到正確的語音后,會首先調(diào)動藍牙客戶端發(fā)送智能車運動狀態(tài)控制指令,之后調(diào)動文本語音轉(zhuǎn)換器,念讀設計者預先定義的語音反饋語句。在實際開發(fā)測試過程中,部分安卓手機不具備語音識別引擎模塊,這時開發(fā)者就需要借用第三方語音識別引擎模塊[5]。智能車語音控制端如圖5所示,第三方語音識別引擎如圖6所示,小車語音識別界面如圖7所示,語音識別APP部分代碼如圖8所示。
由圖6可知,由于部分安卓機未配備語音識別引擎,因此文中的語音識別智能車用戶控制端APP需借助第三方語音識別引擎實現(xiàn)智能小車用戶端的語音識別。
由圖7可知,開啟小車語音識別按鈕后,語音識別引擎可以識別用戶發(fā)出的正確的目的詞匯,之后小車APP將其轉(zhuǎn)化成小車運行指令。
由圖8可知,當用戶發(fā)出正確的語音并被APP識別后,APP會通過預先編程設定的指令將用戶發(fā)出的語音指令轉(zhuǎn)換成小車運動指令,并調(diào)動文本語音轉(zhuǎn)換器播放相應的文本信息,產(chǎn)生類似人類對話的人機對話效果。
本文設計的小車語音識別APP模塊可進一步開發(fā),實現(xiàn)全程無觸碰語音控制驅(qū)動小車運動,甚至通過正確的語音密碼指令取得小車的合法權限。小車語音識別模塊的實現(xiàn)具備一定的科研應用價值[5]。
2.3.2 智能車語音分析判斷功能
智能車語音控制指令分析判斷功能通過MIT APP Inventor在線開發(fā)平臺代碼邏輯開發(fā)界面“或”語句內(nèi)置塊完成。當用戶發(fā)出正確的語音控制指令后,會首先通過程序代碼中的“或”語句進行判斷,若屬于智能車運動指令組,則調(diào)用藍牙客戶端發(fā)送相應的智能車運動狀態(tài)指令,之后調(diào)用文本語音轉(zhuǎn)換器念讀相應的語音文本;若用戶發(fā)出的語音控制指令不屬于智能車運動指令組,則會通過程序代碼中的“或”語句進行分析判斷,在不改變智能車運動狀態(tài)的前提下產(chǎn)生語音反饋提示給使用者[6]。
2.4 智能小車圖傳模塊
隨著信息技術的發(fā)展,智能小車在人類科學勘探研究中的作用越來越重要。文中通過選取智能小車科學研究中的圖傳功能模塊,對幾種常見的智能車無線圖傳技術進行研究、探討。本文采用的智能車無線圖傳模塊技術可實現(xiàn)與智能小車處于同一局域網(wǎng)中的多平臺設備對小車監(jiān)控圖像信息的實時共享,此外智能小車視頻監(jiān)控反饋界面還可從PC端移植到手機端。若采用華為手機分屏技術并結(jié)合IP攝像頭,可將小車監(jiān)控畫面窗口和小車控制界面窗口放于同一屏幕,提高設備監(jiān)控的實時反饋性。
2.4.1 智能車無線圖像傳輸比較
作為智能小車重要的核心模塊—無線圖像傳輸,近年來伴隨著智能網(wǎng)聯(lián)汽車的發(fā)展,越來越引起國內(nèi)各大高校的興趣。本文旨在研究利用網(wǎng)上的開源軟件實現(xiàn)安卓手機的改造,將監(jiān)控端、PC等平臺設備作為圖像接收反饋端等常見的智能車圖像傳輸方案,揭開用戶對智能車視頻實時監(jiān)控功能的“神秘面紗”[7]。
2.4.2 DroidCamX無線監(jiān)控方案
DroidCamX是一款可以將安卓手機改造成無線攝像頭的工具。在網(wǎng)絡上下載DroidCamX壓縮包,解壓后的DroidCamX包含兩個軟件,即安卓客戶端APK與電腦圖像接收端exe可執(zhí)行軟件。智能車圖傳選取DroidCamX無線監(jiān)控方案時,應首先啟動安裝在手機端的視頻監(jiān)控APP,由手機攝像頭采集智能車附近的圖像信息,之后PC端DroidCamX連接軟件設置視頻通信配置信息,點擊PC端攝像頭開啟軟件,此時電腦彈出的圖像窗口內(nèi)容就是安卓手機監(jiān)控反饋的實時圖像。智能車PC圖像接收端如圖9所示,智能車安卓圖像監(jiān)控APP如圖10所示,電腦圖像監(jiān)控開啟端如圖11所示,智能車實時監(jiān)控畫面如圖12所示。
由圖9和圖10可知,當安卓智能機監(jiān)控端APP啟動后,視頻監(jiān)控信息配置完畢,啟動電腦上視頻開啟軟件將開啟智能車的視頻監(jiān)控功能。智能小車前端搭配的安卓智能機改造的圖像信息監(jiān)控端將采集到的圖像信息反饋到用戶PC電腦上的圖像窗口。采用DroidCamX無線監(jiān)控方案的智能小車的優(yōu)點是圖像傳輸方便,用戶將通過智能小車采集的實時圖像信息反饋到用戶PC端,相比通過復雜的嵌入式技術實現(xiàn)的圖像傳輸設備而言,該小車的可拓展性、反饋的視頻監(jiān)控信息實時性較差[8]。
2.4.3 Eclipse實現(xiàn)的無線監(jiān)控方案
DroidCamX無線監(jiān)控智能車視頻監(jiān)控方案施行簡單,但圖像反饋端無法根據(jù)用戶需求進行修改。第二類智能車無線監(jiān)控方案基于Eclipse+ADT+Android SDK+JDK(x64),ADT(Android Development Tools)安卓開發(fā)工具,Android SDK實現(xiàn)安卓虛擬機的創(chuàng)建與JDK(x64)安卓Java環(huán)境變量的配置。借助Eclipse實現(xiàn)安卓APP代碼的編輯及編譯工作。
基于Eclipse實現(xiàn)的智能車無線監(jiān)控方案中,圖像采集監(jiān)控端仍舊由安卓手機改造,安卓手機采集的圖像信息通過無線WiFi傳至目的服務器的Java圖像窗口。視頻圖像采集端的APP及Java圖像接收端的窗口可根據(jù)用戶需求進行適當修改。Eclipse監(jiān)控端APP如圖13所示,Eclipse圖像監(jiān)控反饋端如圖14所示,Eclipse圖像監(jiān)控智能車如圖15所示,智能車監(jiān)控圖像保存如圖16所示。
由圖13和圖14可知,采用Eclipse方案實現(xiàn)的監(jiān)控智能車可采集智能車前端改造攝像機視野范圍內(nèi)的信息,之后將采集的圖像信息傳遞至服務器電腦。此外,用戶可以根據(jù)自身需求保存需要的圖像信息。
由圖15可知,采用Eclipse實現(xiàn)的無線監(jiān)控智能車實時圖像采集的過程是Android作為Socket客戶端將采集到的每一幀圖像數(shù)據(jù)發(fā)送出去后,PC作為服務器接收并顯示每一幀圖像從而實現(xiàn)遠程監(jiān)控。安卓智能機客戶端APP獲取了手機攝像頭的權限,安卓APP登錄框獲取用戶填寫的服務器IP信息,安卓手機采集的圖像信息傳遞到服務器端通過Eclipse軟件打開Java圖像顯示窗口。
由圖16可知,采用Eclipse技術實現(xiàn)的智能小車用戶端可通過圖像接收界面窗口實時對小車采集反饋的圖像信息進行抓拍、保存。采用Eclipse和DroidCamX技術實現(xiàn)的智能車監(jiān)控功能均采用安卓進行改造,對比利用復雜的嵌入式知識而實現(xiàn)的監(jiān)控智能車而言是一種簡易方案。本文目前涉及的兩種智能車視頻監(jiān)控方案易于接受,用戶進行簡單的學習即可實現(xiàn)圖像信息的實時監(jiān)控,但采用這兩種技術實現(xiàn)的監(jiān)控智能車,圖像監(jiān)控信息均反饋至用戶PC,而智能車的監(jiān)控反饋信息和智能小車控制端APP不在同一平臺上,因此相比利用專業(yè)嵌入式技術開發(fā)的監(jiān)控小車來說,用戶監(jiān)控小車的實時性體驗較差[9]。
2.4.4 IP攝像頭無線監(jiān)控方案
本文在涉及智能車無線圖像傳輸功能時考慮了幾點因素,即技術的可實現(xiàn)性與監(jiān)控智能車控制端的可移動性。目前可利用專業(yè)的嵌入式技術實現(xiàn)圖像無線傳輸、利用網(wǎng)絡開源軟件實現(xiàn)基于安卓手機改造的無線圖像監(jiān)控器等,本文對網(wǎng)絡開源軟件實現(xiàn)的基于安卓手機改造的無線圖像監(jiān)控器方案技術進行了研究、嘗試,最終決定將安卓手機作為圖像監(jiān)控端,將多平臺瀏覽器作為智能車運動視野二維空間范圍內(nèi)圖像信息接收端IP攝像頭。
2.4.5 智能車客戶端移動性
本文選定的IP攝像頭實現(xiàn)的無線監(jiān)控方案可以將采集的視頻信息實時分享給多平臺用戶,解決了傳統(tǒng)監(jiān)控智能車攝像頭采集的圖像信息與智能車用戶之間的一對一通信局限問題。前文闡述的兩種智能車視頻監(jiān)控方案中,智能車圖像監(jiān)控用戶端可移動性較差。
本文針對如何解決智能車監(jiān)控端可移動性的問題,參考了當下幾種技術方案:
(1)利用專業(yè)知識設計的透明背景APP結(jié)合智能車方向控制按鍵,實現(xiàn)對智能車運動狀態(tài)的實時控制,通過智能車上搭載的攝像頭采集二維空間圖像信息;
(2)利用安卓手機的分屏軟件實現(xiàn)圖像同屏;
(3)利用華為手機成熟的分屏技術實現(xiàn)圖像同屏。
對比上述三種方案,方案1技術繁瑣,耗費時間,需要專業(yè)技術科研人員才能實現(xiàn),但優(yōu)點是可以根據(jù)用戶需求進行量化定做;方案2需要智能小車監(jiān)控手機端ROOT解鎖,為用戶手機安全帶來一定的風險;方案3中,華為手機擁有成熟的分屏技術,可以輕松實現(xiàn)手機屏幕分屏,在手機上半部分顯示智能車監(jiān)控窗口,下半部分顯示智能小車的控制界面。手機分屏控制端如圖17所示,監(jiān)控端IP攝像頭軟件如圖18所示。
由圖17可知,當手機監(jiān)控端開啟視頻監(jiān)控功能后,在智能手機同一局域網(wǎng)環(huán)境中的移動設備瀏覽器地址欄輸入監(jiān)控視頻的地址,即可實現(xiàn)在線信息的實時分享。小車監(jiān)控視頻可分享至同一局域網(wǎng)中的多平臺設備,突破了傳統(tǒng)智能車無線監(jiān)控視頻一對一的用戶通信限制[10]。
由圖18可知,通過結(jié)合華為手機成熟的分屏技術,普通用戶都可將智能小車視頻監(jiān)控實時圖像反饋端從PC機移植到用戶的安卓手機端,使得用戶視頻控制監(jiān)控端設備的可移動性更好。IP攝像頭無線監(jiān)控智能車如圖19所示,小車瀏覽器監(jiān)控端如圖20所示。
由圖19可知,用戶通過華為手機可在操作小車運動的同時觀看智能小車采集的實時圖像信息,此外采用華為手機分屏技術可將智能小車視頻實時監(jiān)控信息界面窗口與小車控制端界面窗口安放于同一屏幕界面。經(jīng)測試,本文小車采用的第三種無線監(jiān)控技術,方案簡單,二次開發(fā)拓展價值大。由圖20可知,與小車車身前端充當攝像頭的安卓機處于同一局域網(wǎng)環(huán)境中的設備可實時分享小車監(jiān)控端采集的圖像信息。
2.5 智能小車設計創(chuàng)新
本文設計的智能車創(chuàng)新點:具有語音動態(tài)無線控制功能,智能小車能解析出用戶發(fā)出的正確與錯誤的語音控制指令并產(chǎn)生相應的反饋和語音提示。本文設計的語音識別智能車針對以往智能車領域按鍵控制的智能車而言,具有一定的突破,在一些生活領域及場合使用智能車技術安全性更佳;其次本文設計的智能車視頻監(jiān)控模塊采用華為手機的分屏技術,使得智能小車監(jiān)控視頻信息反饋端從用戶的PC機移植到手機端,小車監(jiān)控界面窗口與控制界面窗口處于同一屏幕界面,提高了小車操作的實時性;采用IP攝像頭改造的安卓智能機作為小車的攝像頭,實現(xiàn)了小車視頻監(jiān)控端與局域網(wǎng)內(nèi)多平臺設備的實時共享,突破了傳統(tǒng)智能小車視頻監(jiān)控端與用戶端通信之間的一對一限制,此外控制小車運動狀態(tài)的APP基于圖形化界面MIT APP Inventor第三方在線開發(fā),用戶開發(fā)智能小車上位機難度降低。
2.5.1 智能小車核心技術
智能小車用戶將安卓手機作為智能車語音控制端,借用安卓手機具備的藍牙發(fā)射模塊發(fā)送語音控制指令;之后智能車手機端APP采用MIT APP Inventor在線編程開發(fā)平臺進行設計,大大提高了開發(fā)者的效率,智能車語音識別模塊的設計結(jié)合了MIT APP Inventor在線編程開發(fā)平臺中的語音識別傳感器及文本語音轉(zhuǎn)換傳感器,智能車語音分析模塊則結(jié)合了MIT APP Inventor在線編程開發(fā)平臺邏輯開發(fā)中的“或”語句,判斷用戶的語音指令是否屬于智能車的語音控制指令組;最后小車監(jiān)控部分結(jié)合華為手機分頻技術,使得IP攝像頭改造的無線監(jiān)控模塊輕易實現(xiàn)了智能小車監(jiān)控端與控制端處于同一屏幕的目標。
2.5.2 智能小車未來擬研究點
文中設計的智能小車可以由智能安卓手機通過藍牙對小車進行實時動態(tài)控制,智能車識別、分析并響應用戶的語音控制指令,合法的語音指令能夠驅(qū)動智能車運動,不符合規(guī)定的語音指令無法驅(qū)動智能車運動。未來擬結(jié)合嵌入式系統(tǒng)進行智能小車研究,一方面嘗試如何實現(xiàn)智能車攝像頭圖像的高清采集及傳輸;另一方面嘗試如何實現(xiàn)智能車更加復雜的語音識別算法的控制。此外,還會結(jié)合當下智能小車前沿技術探索具有更復雜功能的小車勘探測試新功能。
3 結(jié) 語
本文設計的智能車安卓手機客戶端可以對用戶的語音指令進行簡單的分析、判斷及響應,此外智能車上搭載的安卓智能機改造的攝像頭可實時將采集的圖像信息通過WiFi方式傳送給與小車處于同一局域網(wǎng)中的多平臺視頻監(jiān)控端。本文設計的語音識別可控遠程視頻監(jiān)控智能車具備一定的科研及二次開發(fā)價值。
參 考 文 獻
[1]王詩元,呂子豪,田洪亮.攝像頭組智能車圖像預處理算法研究[J].無線互聯(lián)科技,2014(11):136.
[2]王玲玲,梁勇.基于攝像頭的自主循跡智能車設計[J].計算機與數(shù)字工程,2017,45(11):2314-2316.
[3]程志江,李劍波.基于遺傳算法的智能小車模糊控制系統(tǒng)的研發(fā)[J].自動化儀表,2009,30(8):4-7.
[4]張云洲,師恩義,吳成東,等.基于CCD的智能車導航系統(tǒng)研究[J].東北大學學報(自然科學版),2009,30(2):162-165.
[5]邱鐵,徐子川,江賀.基于模糊控制的智能車路況識別[J].計算機工程與應用,2009,45(14):213-216.
[6]鄭建立,黃麗佳,葛鵬飛,等.基于CCD的智能車尋跡方法[J].東華大學學報(自然科學版),2008,34(6):728-731.
[7]許歡,唐競新.調(diào)制光尋線系統(tǒng)及其在自動行走機器人中的應用[J].清華大學學報(自然科學版),2002(1):115-117.
[8]程鴻芳,錢峰,李敏.基于攝像頭的智能車黑色虛線識別算法研究[J].重慶科技學院學報(自然科學版), 2014,16(1):147-149.
[9]李少偉,程輝,王勝正.智能車運動仿真平臺設計[J].計算機系統(tǒng)應用,2018(3):51-56.
[10]張德干,張婷,高瑾馨.一種面向智能車聯(lián)網(wǎng)的缺失數(shù)據(jù)估計新方法[J].計算機應用研究,2019(11):12-13.