馬建富 譚科華 張劉愈
摘要:智能控制系統(tǒng)是建立起一種更便捷的控制為目的,而繁瑣的傳統(tǒng)鍵盤(pán)和按鈕操作已不能滿足要求,所以需要建立一個(gè)更方便、更智能、更加人性化的人機(jī)控制方式,由此一種擺脫雙手束縛的智能語(yǔ)音識(shí)別控制技術(shù)應(yīng)運(yùn)而生。本文設(shè)計(jì)的初衷為現(xiàn)代化智能便民家居實(shí)行語(yǔ)音控制。涉及技術(shù)有音頻采集、音頻濾波處理、音頻應(yīng)答數(shù)據(jù)庫(kù)的建立,以及基于STM32C8T6的實(shí)時(shí)嵌入式控制系統(tǒng),可以實(shí)現(xiàn)家居電器的集中監(jiān)測(cè)和語(yǔ)音智能控制。
關(guān)鍵詞:STM32C8T6;音頻采集;語(yǔ)音識(shí)別;智能控制
中圖分類號(hào):TN912.34?? 文獻(xiàn)標(biāo)識(shí)碼:A?? 文章編號(hào):1672-9129(2020)16-0093-01
1 引言
設(shè)計(jì)是基于聽(tīng)覺(jué)的新型人機(jī)交互方式,目前主流的語(yǔ)音控制技術(shù)是基于統(tǒng)計(jì)模式的數(shù)據(jù)庫(kù)對(duì)比方案,其運(yùn)算量大,預(yù)算復(fù)雜,對(duì)設(shè)備內(nèi)存和運(yùn)算速度提出了較高的要求;嵌入式語(yǔ)音識(shí)別系統(tǒng)相比于其他的語(yǔ)音識(shí)別系統(tǒng),雖然其運(yùn)算速度與內(nèi)存容量較小,但是它具有體積和成本投資小、功耗低、可靠性高、安裝靈活等優(yōu)點(diǎn),特別適用于智能家居、消費(fèi)電子產(chǎn)品等微控制領(lǐng)域。。
2 系統(tǒng)的硬件設(shè)計(jì)
本次設(shè)計(jì)的智能語(yǔ)音識(shí)別控制系統(tǒng)的主體硬件設(shè)計(jì)框圖如圖1所示。
如圖1所示,本設(shè)計(jì)由STM32F103C8T6主控器、LD3320語(yǔ)音識(shí)別/聲控模塊、JQ8400 語(yǔ)音硬解碼模塊、12V供電系統(tǒng)組成。
2.1主控制電路:主控電路采用的是ST公司的,基于ARM Cortex—M3 32位RISC內(nèi)核的STM32F103C8T6芯片。該芯片工作頻率最高可達(dá)72 MHz,內(nèi)置高速存儲(chǔ)器以及豐富的增強(qiáng)I/O端口,為該控制器控制外圍電路提供了可靠保障。
2.2語(yǔ)音識(shí)別模塊:采用LD3320芯片,是一款非特定人語(yǔ)音識(shí)別芯片,其提供的語(yǔ)音識(shí)別技術(shù),是基于“關(guān)鍵詞語(yǔ)列表”的識(shí)別技術(shù),識(shí)別語(yǔ)句內(nèi)容可以動(dòng)態(tài)編輯修改,只需要主控STM32把識(shí)別關(guān)鍵詞語(yǔ)的識(shí)別碼串通過(guò)設(shè)置寄存器的方式傳入芯片內(nèi)部。
2.3 JQ8400語(yǔ)音硬解碼模塊:我們采用的是一線串口控制,JQ8400與STM32串口2進(jìn)行連接,用于識(shí)別語(yǔ)音后喇叭發(fā)出聲音,由于JQ8400的驅(qū)動(dòng)能力較弱,因此我們常采用其附加的8002A進(jìn)行音頻放大。
2.4 12V供電系統(tǒng)組成:控制部分所涉及的電源是3.3V-5.0V之間弱電,它采用統(tǒng)一的5V1A標(biāo)準(zhǔn)電源適配器供電,3.3V電源采用AMS117 -3.3V降壓模塊得到。
3 系統(tǒng)的軟件設(shè)計(jì)
設(shè)計(jì)的程序設(shè)計(jì)主要分為三部分;STM32嵌入式中控系統(tǒng)、LD3320語(yǔ)音識(shí)別、JQ8400-FL音頻硬解碼輸出的設(shè)計(jì)。
3.1 STM32嵌入式中控系統(tǒng):我們?cè)O(shè)計(jì)是基于ARMCortexTM-M3 32位的RISC內(nèi)核的STM32F103C8T6芯片為中控的語(yǔ)音采集的實(shí)時(shí)控制系統(tǒng),為對(duì)信息的采集、處理、任務(wù)的分層化處理、系統(tǒng)的響應(yīng)速度提出較高的要求,它采用源碼公開(kāi)、可移植、占先式的μC/OS-II實(shí)時(shí)多任務(wù)操作系統(tǒng)。
3.2 LD3320語(yǔ)音識(shí)別:由于LD3320 芯片上集成了高精度的 A/D 和 D/A 接口,可以實(shí)現(xiàn)語(yǔ)音識(shí)別/聲控/人機(jī)對(duì)話功能。并且只需要把識(shí)別的關(guān)鍵詞語(yǔ)以字符串的形式傳送進(jìn)芯片,即可以在下次識(shí)別中立即生效。其編程流程為:初始化—STM32中編寫(xiě)識(shí)別列表并傳入LD3320—識(shí)別對(duì)比—響應(yīng)中斷。
3.3 JQ8400-FL音頻硬解碼輸出:JQ8400-FL語(yǔ)音芯片采用SOC方案,采用硬解碼的方式,更加保證了系統(tǒng)的穩(wěn)定性和音質(zhì)。在語(yǔ)音內(nèi)容更換上,只需要跟換 SPI-flash 內(nèi)的語(yǔ)音內(nèi)容,簡(jiǎn)化了傳統(tǒng)語(yǔ)音芯片需要安裝上位機(jī)才能更換語(yǔ)音的難題。在音頻輸出上,STM32與JQ8400-FL通過(guò)串口通信的模式將需要播放的音頻識(shí)別碼傳入,以達(dá)到音頻的輸出。
4 設(shè)計(jì)總結(jié)
我們?cè)O(shè)計(jì)的成果是一個(gè)基于STM32C8T6微控制器的智能語(yǔ)音識(shí)別控制器,可以通過(guò)語(yǔ)音控制一些常用的開(kāi)關(guān),或者控制一些智能設(shè)備,有語(yǔ)音播報(bào)提醒功能。設(shè)備采用離線的語(yǔ)音采集芯片LD3320,采用非特定人語(yǔ)音識(shí)別技術(shù),不需要用戶進(jìn)行錄音訓(xùn)練;可動(dòng)態(tài)編輯的識(shí)別關(guān)鍵詞語(yǔ)列表,只需要把識(shí)別的關(guān)鍵詞語(yǔ)以字符串的形式傳送進(jìn)芯片,即可以在下次識(shí)別中立即生效;支持用戶自由編輯 50 條關(guān)鍵詞語(yǔ)條,即在同一時(shí)刻,最多在 50 條關(guān)鍵詞語(yǔ)中進(jìn)行識(shí)別,終端用戶可以根據(jù)場(chǎng)景需要,隨時(shí)編輯和更新這 50 條關(guān)鍵詞語(yǔ)的內(nèi)容,可適用于各種環(huán)境和各種條件下的控制。設(shè)計(jì)的硬件電路原理圖如圖2所示。
智能語(yǔ)音識(shí)別控制器的設(shè)計(jì)建立了一個(gè)既可通過(guò)語(yǔ)音遠(yuǎn)程控制又可通過(guò)手動(dòng)控制來(lái)實(shí)現(xiàn)對(duì)外部設(shè)備進(jìn)行控制的系統(tǒng),設(shè)備的控制呈現(xiàn)多元化,可根據(jù)不同的場(chǎng)景選擇不同的控制方式,語(yǔ)音遠(yuǎn)程控制能建立一個(gè)更方便、更智能、更加人性化的人機(jī)控制方式,由此解放人們的雙手,有一定的應(yīng)用價(jià)值。
參考文獻(xiàn):
[1][美]Lawrence_R._Rabiner. .語(yǔ)音識(shí)別基本原理[M].清華大學(xué)出版社, 1999
[2]俞棟 鄧力. 解析深度學(xué)習(xí):語(yǔ)音識(shí)別實(shí)踐[M].電子工業(yè)出版社,2016
[3]劉火良,楊森.STM32庫(kù)開(kāi)發(fā)實(shí)戰(zhàn)指南[M].機(jī)械工業(yè)出版社,2020.
[4]楊少春.傳感器原理及應(yīng)用[M].電子工業(yè)出版社,2011.