文/張燁 劉恒
目前市面上的大多數(shù)假肢主要是通過腦電信號與肌電信號來進行控制的,不過,由于腦電信號的信息率低,而肌電信號又需要進行復(fù)雜的信號處理,容易造成殘疾人的肌肉出現(xiàn)酸痛感,這也使目前市面中的假肢都存在一定的不足,這給殘疾人的生活帶來許多不便。為了彌補這些不足,本文將語音識別技術(shù)應(yīng)用于嵌入式假肢中,通過語音識別技術(shù)來對殘疾人的語音信號進行識別,以此實現(xiàn)殘疾人對嵌入式假肢的控制目的。為此,以下便對嵌入式假肢智能控制系統(tǒng)中語音識別技術(shù)進行深入的研究。
在嵌入式假肢智能控制系統(tǒng)中,語音識別技術(shù)在硬件結(jié)構(gòu)上分為語音識別芯片、擴展電路以及功能模塊三個組成部分。由語音識別芯片對殘疾人所發(fā)出的語音信號進行識別,并通過內(nèi)部語音識別程序來對語音信號進行處理,然后將處理結(jié)果發(fā)送給功能模塊進行執(zhí)行。
在嵌入式假肢智能控制系統(tǒng)中,語音識別芯片的型號為SPCE061A,該芯片高度集成了MCU、RAM、A/D、D/A與ROM,該芯片具有內(nèi)積運算功能以及16*16位的乘法運算功能。SPCE061A能夠?qū)Ω鞣N復(fù)雜的數(shù)字信號進行處理,其處理性能強大,價格低廉,而且能夠進行中斷處理。語音識別芯片可對至少10個中斷源及中斷向量進行有效支持,這使其在實時語音識別及處理方面有著非常明顯的應(yīng)用優(yōu)勢,同時其還具有自動增益控制功能,這能夠使殘疾人通過麥克風來進行語音控制,從而大大提高了殘疾人對嵌入式假肢的控制便利性。
在擴展電路中,分布有語音采集電路、電源模塊、程序下載模塊、音頻輸出模塊、擴展存儲模塊以及通信模塊,擴展電路會通過語音采集電路來采集語音信號,然后通過模數(shù)轉(zhuǎn)換存儲至控制芯片中。而音頻輸出信號會將需要輸出的控制指令進行相應(yīng)轉(zhuǎn)換,然后進行語音輸出。電源模塊則能夠為系統(tǒng)的各個功能模塊提供工作電壓。擴展存儲模塊能夠?qū)φZ音信號進行外部Flash存儲。而程序下載模塊則是在控制芯片中寫入事先編好的程序,通信模塊用于實現(xiàn)PC端和控制芯片之間的通信。
在嵌入式假肢智能控制系統(tǒng)中,其功能模塊是通過電機來進行驅(qū)動的,在其功能模塊中,主要包括電機主體、編碼器、位置傳感器、驅(qū)動器以及壓力傳感器。其中,驅(qū)動器負責對語音識別芯片所發(fā)出的信號進行接收,同時還能接收編碼器的反饋信號,并可對電機的轉(zhuǎn)速、轉(zhuǎn)向及啟停進行控制。而壓力傳感器則可對假肢所受到的外界壓力情況進行檢測,并利用轉(zhuǎn)換電路將信號向語音識別芯片,由芯片來處理反饋信息,并下達控制指令來對電機進行相應(yīng)的控制。
在嵌入式假肢智能控制系統(tǒng)中,語音識別技術(shù)的功能實現(xiàn)是通過語音識別程序來完成的。語音識別程序共包括四個組成部分,分別是API函數(shù)、語音源文件、初始化程序以及主控程序。在語音識別時,會先進行初始化程序,然后在主控程序中調(diào)入API函數(shù)與語音源文件,然后由主控程序發(fā)出控制處理信號。在語音錄制過程中,首先要進行語音采樣,該系統(tǒng)在定時中斷控制下通過8kHz來對采樣的語音信號進行A/D轉(zhuǎn)換,然后將轉(zhuǎn)換后的語音信號按照某種算法來進行壓縮編碼,最后將編碼后的語音信號存儲到存儲介質(zhì)當中。該系統(tǒng)在語音識別程序設(shè)計中,應(yīng)用了臺灣凌陽公司所錄制的SCAM-DVR函數(shù)庫,并對相應(yīng)的API函數(shù)進行了調(diào)用。
嵌入式假肢智能控制系統(tǒng)中語音識別功能的實現(xiàn),使其能夠聽懂殘疾人的語音命令,并根據(jù)語音命令的不同做出對應(yīng)的響應(yīng)。該系統(tǒng)可根據(jù)不同對象在說話時的依賴程度,將其劃分成兩種,一種是能夠?qū)μ囟ǖ臍埣踩说恼Z音命令進行識別,其只能對特定的對象語音進行辨認,這需要殘疾人進行相應(yīng)的訓(xùn)練后方可使用。還有一種是能夠?qū)λ袑ο蟮恼Z音命令進行識別,不需要進行特定的訓(xùn)練。此外,根據(jù)不同殘疾人的說話方式差異,語音識別技術(shù)既可進行孤立詞識別,也可進行連續(xù)語音識別,在孤立詞詞別中,只能對單個詞匯進行單次識別,而在連續(xù)語音識別中,則可對正常說話中的語句進行語別。此外,為了使嵌入式假肢智能控制系統(tǒng)的語音識別準確率更高,還應(yīng)用了特定人識別方式。該系統(tǒng)的語音識別功能實現(xiàn)流程如下:在訓(xùn)練過程中,嵌入式假肢智能控制系統(tǒng)啟動后會對RAM進行初始化,并由使用者進行訓(xùn)練,系統(tǒng)會自動獲取訓(xùn)練結(jié)果,并提示訓(xùn)練成功,系統(tǒng)會自動建立使用者的語音特征模型。在識別過程中,嵌入式假肢智能控制系統(tǒng)會在啟動后對識別器進行初始化,并獲得識別結(jié)果,然后識別出語音命令,同時確認語音命令是否能夠被執(zhí)行,當不能執(zhí)行時,會重新獲取識別結(jié)果,如果能夠執(zhí)行,則會自動執(zhí)行相應(yīng)操作,從而完成整個識別過程。
總而言之,本文針對殘疾人人群在日常生活中的種種不便,同時考慮到現(xiàn)有假肢在動作控制上存在的不足,提出一種以語音識別技術(shù)為核心的嵌入式假肢智能控制系統(tǒng),該系統(tǒng)能夠?qū)埣踩怂l(fā)出的語音命令進行自動識別,然后根據(jù)語音識別結(jié)果來做出相應(yīng)的動作,從而實現(xiàn)了殘疾人通過語音來控制假肢的目的,大大提高了殘疾人的生活質(zhì)量,并為殘疾人對假肢的控制帶來了很大便利,使殘疾人能夠具有更強的自信心重返社會。