毛艷嶺 艾月 趙明君
(曲阜師范大學工學院 山東省日照市 276826)
近些年來,語音識別準確率和處理能力不斷上升,實現了從單個詞的識別到關鍵詞的識別再到連續(xù)時間內的語音識別的偉大飛躍,進而語音識別的應用也不斷增加,使人們的生活變得更加豐富多彩和更加便利。語音識別和其他控制技術結合,從而實現智能家居、智慧交通等現代化設計。本設計就是想實現能夠通過語音指令實現控制小車運動,除了能夠簡單控制語音小車實現前進、左轉、后退、右轉等操作之外,還能夠實現循黑線行走和規(guī)避周圍環(huán)境中的障礙物的功能。
本次設計方案主要分為三部分:硬件平臺的搭建和設計、語音識別算法的研究和具體實現、智能車系統(tǒng)的軟件的設計。其中硬件平臺的搭建和設計主要包括總體硬件結構、硬件平臺搭建過程、語音模塊硬件設計三部分。
硬件組成主要包括STM32F103C8T6 單片機系統(tǒng)、LM358 雙運算放大器和四個紅外對管組成的四路循跡模塊、超聲波測距模塊加SG90 舵機組成的避障模塊、LD3320 語音識別芯片配備STC11L08XE 單片機組成的語音識別模塊、L298N 雙H 橋電機驅動模塊??傮w硬件設計框圖如圖1 所示。
(1)控制元件:本設計使用的STM32F103C8T6 單片機是擁有ARM 內核的32 位的CPU,其工作電壓為2V~3.6V,最高工作頻率為72MHZ,它因為低功耗、能夠提供優(yōu)越的計算性能和杰出的中斷系統(tǒng)響應而被廣泛應用在醫(yī)療、工業(yè)等領域。考慮到本設計電機驅動模塊輸出電壓為5V,本設計在單片機系統(tǒng)上加了一個穩(wěn)壓芯片,可以實現將驅動提供的5V 電壓轉換為單片機所需的3.3V 工作電壓。
(2)SWD 仿真燒寫接口:電腦可通過JLINK 仿真器利用其對STM32 單片機系統(tǒng)下載編寫好的程序。
(3)晶振:晶振與單片機的某些內部電路共同工作可以為整個單片機系統(tǒng)提供統(tǒng)一的時鐘頻率,并由此使整個系統(tǒng)可以同步工作,系統(tǒng)的工作速度隨著時鐘頻率的增加而加快。其一般包括有源晶振和無源晶振兩部分,有源晶振較穩(wěn)定,成本較高。在本設計中:主晶振為8MHZ 的有源晶振,可以為系統(tǒng)提供工作頻率;備用RTC 晶振為32.768KHZ 的無源晶振,可以為RTC 時鐘提供時鐘頻率。
(4)復位電路:可以使單片機回到初始狀態(tài),在剛接通電源的瞬間,電容器C6 會發(fā)生短路,GND 直接加到了RESET 端,該低電平可以馬上使STM32 單片機回到初始狀態(tài);電容C6 飽和后處于斷開狀態(tài)時,RESET 端接高電平,STM32 單片機則進入正常工作狀態(tài)。若按動SW1 按鈕,可直接把GND 加到RESET 端,實現復位以使單片機系統(tǒng)重新執(zhí)行程序。
圖1:總體硬件設計框圖
圖2:語音識別算法原理圖
(5)BOOT 模式選擇模塊:使用者通過在程序中設置BOOT1和BOOT0 引腳的值,來決定STM32 單片機在初始狀態(tài)時的啟動位置。
(6)循跡模塊:使用兩個LM358 模塊和四個紅外對管,拓展外圍電路之后組建成四路循跡模塊,其中四個紅外對管負責檢測對應位置是否有黑線,LM358 模塊負責處理紅外對管得到的數據,最終結合其他模塊可以實現循黑線的功能。
(7)超聲波避障模塊:TRIG 引腳負責接收單片機發(fā)出的10US 以上的觸發(fā)信號,模塊根據ECHO 引腳的電平信號變化情況來計算障礙物距離。本設計還為超聲波模塊配備了一個SG90 舵機,在將超聲波模塊連接到舵機上并調試好程序之后,若語音車在運動過程中檢測到正前方存在障礙物,舵機就能夠工作以帶動超聲波模塊轉動,實現多角度避障。
圖3:總體流程圖
圖4:語音識別部分程序
(8)電機驅動模塊:整個設計的供電電壓由兩節(jié)3.7V 的干電池來提供,而避障、循跡模塊和STM32 單片機系統(tǒng)的工作電壓都為5V,故此需要在兩部分之間添加穩(wěn)壓芯片以確保各部分正常工作??紤]到可靠性、抗干擾能力和驅動能力等因素,本設計以L298N 為驅動芯片。本設計的7.4V 供電電壓能夠使能板載的5V供電,之后可以引出5V 電壓供STM32 單片機和其他需要5V 工作電壓的模塊使用,模塊的兩個馬達輸出連接了兩個電機,進而實現了模塊可以控制電機工作。
(9)語音識別芯片:LD3320 芯片把語音識別處理器和其他的外部電路集成在了一個模塊上,所以直接在已有的集成芯片中就能夠完成語音識別和其他的拓展性設計。除此之外,芯片中識別的關鍵詞語列表是能夠根據使用者需求隨時修改的。在本設計中,MICP 和MICN 引腳連接了一個咪頭,用來收集周圍環(huán)境的語音信息,再通過LD3320 芯片識別出有用的語音指令,轉化為對應的識別碼,傳送給STC11 單片機,這樣STC11 單片機可通過USART通信將識別碼傳送給STM32 單片機,從而控制小車根據語音指令運動,實現題目要求。
(10)STC11 單片機:為了節(jié)省所用引腳數,用STC11 單片機通過USART 通信給主單片機STM32 單片機傳送LD3320 語音識別芯片的識別結果,使主單片機可以按識別碼控制小車狀態(tài)。
硬件設計主要分為以下幾步:首先根據要實現的題目要求,了解相關知識,繪制硬件原理圖;然后選擇適合的元件以實現要求:將STM32F103C8T6 單片機用做整個設計的主要控制元件,主要負責狀態(tài)控制、串口通信、控制電機輸出等等,是整個設計的核心;循跡模塊采用兩個LM358 雙運算放大器和四個紅外對管組成四路循跡模塊作為紅外檢測模塊,實現了采集黑線功能;避障模塊采用一個搭配了SG90 舵機的超聲波測距模塊,可以實現多角度多方位檢測障礙物;語音識別模塊依靠LD3320 語音識別芯片實現語音指令的檢測和識別以得到對應的識別碼,配備的STC11L08XE 單片機可以通過USART 通信將識別碼傳送給STM32 單片機;電機驅動方面使用L298N 電機驅動模塊以用來給單片機和各模塊提供5V的工作電壓。最后根據原理圖搭建好硬件系統(tǒng),進行仿真測試,調整不合理的地方,實現了硬件平臺的搭建。
為了節(jié)省所用引腳數,用STC11 單片機通過USART 通信給主單片機STM32 單片機傳送LD3320 語音識別芯片的識別結果,使主單片機可以按識別碼控制小車狀態(tài)。在本設計中,MICP 和MICN 引腳連接了一個咪頭,用來收集周圍環(huán)境的語音信息,再通過LD3320 芯片識別出有用的語音指令,轉化為對應的識別碼,傳送給STC11 單片機,這樣STC11 單片機可通過USART 通信將識別碼傳送給STM32 單片機,從而控制小車根據語音指令運動,實現題目要求。
語音識別的工作步驟主要分為三步:首先,語音處理器對通過麥克風接口收集的語音數據進行初步處理。然后,對經過初步處理的語音數據提取一些可以概括語音數據特點的參數。最后,分成兩個階段來處理提取之后的參數:先是系統(tǒng)訓練,主要是建造參數對應庫,人類語音數據中的詞和參考對應庫中的項一一對應;后是識別,將經過兩步處理后得到的參數和對應庫中的項進行比較,得到與各項之間的相似度,其中檢測到相識度最高的就是識別結果。只有在以下兩種情況下,語音識別芯片才會結束相似度識別,得到結果:當語音識別達到設定的時間限的時候,芯片會分析匹配設定時間內的語音信息,結束后就可得到識別結果;開始檢測之后,芯片會一直監(jiān)測到背景音,當芯片檢測到背景音和人聲時,把此時視為檢測人聲開始的時間點,之后當再檢測到設定時間的背景音時,即認為人聲結束,將這段時間的數據進行處理就可得到識別結果。語音識別算法示意圖如圖2 所示。
總體軟件方案為:首先進行系統(tǒng)初始化,隨后檢測周圍環(huán)境中是否有語音指令以及語音指令是否有效,若沒檢測到語音指令或者檢測到無效語音指令,系統(tǒng)會一直檢測直到檢測到有效的語音指令,之后LD3320 芯片會將檢測到的語音指令轉化為對應的語音識別碼,并將其通過USART 通信傳送給STM32 單片機,單片機根據各識別碼對應的指令來實現循跡、避障、前進、后退、左轉、右轉、停止等操作。軟件流程圖如圖3 所示。
本設計通過keil 軟件編寫了程序,通過改變程序中的關鍵字來實現不同語音指令的識別。然而,實際生活中包含的語音信息量比較大,使得要實現全方位的語音識別難度大,因此本設計采用喚醒詞加指令詞的形式,通過對喚醒詞特征參數的提取和訓練,降低了誤動作的發(fā)生率,提高了識別水平。除此之外,本設計還采用了垃圾詞處理,當系統(tǒng)接收到垃圾詞指令時,不作任何操作,借此來防止周圍環(huán)境中的其他人聲對設計造成的不良影響。程序如圖4 所示。
在程序設計成功之后,借助STC-ISP 軟件調試了語音識別模塊。首先當發(fā)出語音指令“滴滴”時,控制LED 燈亮,表示喚醒詞識別成功。然后,通過發(fā)出語音指令“循跡”、“避障”、“左轉”、“右轉”、“前進”、“后退”、“停車”可以分別控制串口發(fā)送對應的文字,當發(fā)出垃圾詞時控制串口輸出字符(如圖5 所示),在接受到控制指令的同時,控制LED 燈滅,表示成功識別控制指令。
整個設計的總體調試方案包括以下七部分:根據題目要求,選擇合適的元器件;在了解了各元器件的工作原理和使用方法之后,繪制系統(tǒng)整體電路圖;在具備一定焊接能力和專業(yè)能力的基礎上,焊接電路板,搭建好硬件平臺;分別根據各模塊需要實現的功能,編寫并調試各模塊的程序;將各模塊程序整合統(tǒng)一,編寫主程序;將編寫好的總程序下載到檢查無誤的硬件平臺中,進行整體調試;發(fā)現整體調試中硬件和軟件存在的問題,解決問題得到最終成功的系統(tǒng)設計。其中較困難的就是解決調試中出現的問題這部分。
在系統(tǒng)調試的時候,出現并解決了一些問題:有時檢測不到語音指令,在調整了語音識別模塊的位置之后,明顯改善了語音識別效果;循跡模塊不能正常工作,通過修改程序和進行仿真解決了此問題。
本次設計實現了能夠通過語音指令實現控制運動狀態(tài)的小車,在加了喚醒語令和垃圾詞處理后,語音識別效果有了較大提高。本設計應用性較強:在醫(yī)療領域,可以用于做智能輪椅和智能病床等醫(yī)療設備;在生活領域,可以用來做各種可活動的智能家居和的車輛。但本設計也存在一些可以完善之處,在今后的學習生活將會加以深入研究:像市面上的能夠識別特定人的語音產品那樣,本設計也可以設計實現識別特定人的聲音;模塊在熱鬧環(huán)境中語音識別效果較差,可以嘗試用手機等通訊設備錄入語音指令;適當拓展設計的功能,比如承重等,借此提高設計的使用價值,拓寬設計的應用范圍。
圖5:語音部分調試圖
圖6:總體硬件系統(tǒng)圖