廣東 楊旭方
基于凌陽單片機(jī)實(shí)現(xiàn)的智能別墅語音控制系統(tǒng)
廣東 楊旭方
本文應(yīng)用凌陽單片機(jī)SPCE061A語音技術(shù)及其相關(guān)算法,以門、電燈、電視、風(fēng)扇等家用日常設(shè)備為被控對象,設(shè)計(jì)了一套智能別墅語音控制系統(tǒng),并以此來展開凌陽單片機(jī)語音技術(shù)的實(shí)際應(yīng)用。
凌陽單片機(jī);智能別墅;語音識別
隨著社會發(fā)展,人們渴望更加人性化、和諧化交流,傳統(tǒng)人機(jī)交流工具——鍵盤、顯示器等越來越不能滿足人們的要求,嚴(yán)重影響了人們的工作質(zhì)量和工作效率,因此,研究工作者提出了一種全新解決方案,即語音識別技術(shù)。
語音是人類最常用和最重要的交流工具之一,語音識別技術(shù)就是讓機(jī)器能識別人類語音并執(zhí)行相關(guān)語音命令,使機(jī)器具有聽力和語言表達(dá)能力,從而實(shí)現(xiàn)人機(jī)更高層次的交流[1]。
智能別墅語音控制系統(tǒng)總體架構(gòu)框圖如圖1所示,它由語音采集模塊、語音前級處理模塊、語音訓(xùn)練模塊、語音識別模塊、語音提示模塊和輸出控制模塊組成。
語音采集模塊主要完成信號調(diào)理和信號采集等功能,它將原始語音信號轉(zhuǎn)換成語音脈沖序列,因此該模塊主要包括聲/電轉(zhuǎn)換、信號調(diào)理和采樣等信號處理過程。
語音前級處理模塊的主要功能是濾除干擾信號、提取語音特征矢量,并將提取的語音特征矢量量化成標(biāo)準(zhǔn)語音特征矢量,因此該模塊主要包括語音預(yù)處理、特征提取、矢量量化等語音信號處理過程。
語音訓(xùn)練模塊的主要功能是將多次采集、提取的語音特征標(biāo)準(zhǔn)矢量進(jìn)行概率統(tǒng)計(jì),提取說話人的最佳語音特征標(biāo)準(zhǔn)矢量,防止因說話人心情、環(huán)境等因數(shù)引起提取特征參數(shù)不準(zhǔn)確而影響語音識別效果,因此該模塊主要包括概率統(tǒng)計(jì)、參數(shù)評估等處理過程,用隱馬爾可夫模型(HMM模型)實(shí)現(xiàn)。
圖1 語音控制系統(tǒng)總體設(shè)計(jì)框圖
語音識別模塊的主要功能是將重新采集的標(biāo)準(zhǔn)語音特征矢量與語音模板庫中的語音模型進(jìn)行比較,判斷當(dāng)前語音命令功能,因此該模塊主要包括矢量比較與參數(shù)評估兩個(gè)過程。
語音提示模塊的主要功能是根據(jù)語音識別的結(jié)果提示用戶進(jìn)行相關(guān)操作或說明當(dāng)前完成的功能,因此該模塊主要包括調(diào)用提示語音資源文件、D/A轉(zhuǎn)換、信號放大等語音處理過程。
輸出控制模塊的主要功能是根據(jù)語音識別的結(jié)果輸出相應(yīng)的控制信號,實(shí)現(xiàn)門、電燈、電視、風(fēng)扇等日常設(shè)備的語音控制功能,因此該模塊主要包括信號驅(qū)動、輸出控制器和被控對象。
語音模板庫的主要功能是存儲訓(xùn)練后的最佳標(biāo)準(zhǔn)語音特征矢量。
本設(shè)計(jì)以家用日常設(shè)備為控制對象,充分利用凌陽單片機(jī)SPCE061A提供的內(nèi)/外部硬件資源、庫函數(shù)和微機(jī)提供的錄音機(jī)工具,構(gòu)建了智能別墅語音控制的系統(tǒng)平臺。
本設(shè)計(jì)采用的凌陽單片機(jī)內(nèi)部資源豐富,且具有體積小、性能好、可靠性高等特點(diǎn),在嵌入式語音控制系統(tǒng)得到了廣泛應(yīng)用,尤其是豐富的語音功能庫函數(shù),更是開發(fā)者的首選[2]。
智能別墅語音控制系統(tǒng)硬件構(gòu)建平臺如圖2所示。
圖2 智能別墅語音控制系統(tǒng)硬件構(gòu)建平臺
本設(shè)計(jì)利用凌陽IDE2.0開發(fā)環(huán)境及其提供的C語言編寫,系統(tǒng)配套的軟件構(gòu)建平臺如圖3所示。
圖3 智能語音控制系統(tǒng)軟件構(gòu)建平臺
系統(tǒng)軟件構(gòu)建平臺主要使用到初始化存儲器函數(shù)BSR_Delete SD Group(0)、播放提示語音函數(shù)Play Respond()、語音訓(xùn)練命令函數(shù)Train Word()、識辨器初始化函數(shù)BSR_Init Recognizer(Audio Source)和獲取語音識別結(jié)果函數(shù)BSR_Get Result(void),各函數(shù)主要功能如下:
該函數(shù)的主要功能是初始化存儲器SRAM。參數(shù)“0”代表選擇SRAM,并初始化。其返回值作為判斷SRAM初始化成功的標(biāo)志,返回0代表初始化成功,返回-1代表初始化失敗。
該函數(shù)的主要功能是播放提示音,“Respond ID”代表播放的語音段(用計(jì)算機(jī)采集)。
該函數(shù)的主要功能是語音訓(xùn)練,其中“Word ID”表示命令序號,“Train-Mode”表示訓(xùn)練次數(shù)(有ONCE和TWICE兩種選擇)。語音訓(xùn)練主要用HMM模型實(shí)現(xiàn)。
該函數(shù)的主要功能是初始化語音識別器,“Audio Source”表示語音資源來源,有BSR_MIC(話筒輸入)BSR_LINE_IN(模擬電壓輸出)兩種選擇,這里選擇BSR_MIC。
該函數(shù)的主要功能是獲取語音識別結(jié)果,若識別成功返回命令序號,否則返回0(無法識別)、-1(識別器為初始化)或-2(識別不合格)。該函數(shù)的本質(zhì)是一個(gè)比較、判斷器,即將重新采集的語音標(biāo)準(zhǔn)特征矢量與訓(xùn)練產(chǎn)生的最佳標(biāo)準(zhǔn)特征矢量進(jìn)行比較,并根據(jù)比較結(jié)果輸出相應(yīng)的控制信號。
語音識別在人機(jī)通信中有著重要的意義,它能提高我們的生活質(zhì)量和工作效率,讓我們的生活和工作更人性化、和諧化,具有廣闊的應(yīng)用前景。本文應(yīng)用凌陽單片機(jī)語音技術(shù)及其相關(guān)算法,實(shí)現(xiàn)了門、電燈、電視、風(fēng)扇等常用辦公電器的語音控制。
[1]侯媛彬,袁益民,霍漢平.凌陽單片機(jī)原理及其畢業(yè)設(shè)計(jì)精選.北京:科學(xué)出版社,2006.
[2]姚文冰,姚天任.穩(wěn)健語音識別技術(shù)發(fā)展現(xiàn)狀及展望.信號處理,2001,17(6).
This article uses Lingyang Single-chip Computer SPCE061A Speech Recognition Technology and the relative arithmetic;and it is based upon the controlled objects such as door,lamps,T.V.set and electric fans to design a speech control system of smart housing;thus to spread the specific applications of Lingyang Single-chip Computer Speech Recognition Technology.
Lingyang Single-chip;Computer Smart Housing;Speech Recognition
(作者單位:廣東省電子信息技工學(xué)校)
(編輯 李艷華)