孫啟
摘 要
語音識(shí)別研究即讓機(jī)器了解人的話語,懂得人的意圖,并執(zhí)行相關(guān)命令,當(dāng)前智能語音控制系統(tǒng)已被應(yīng)用到語言識(shí)別的多領(lǐng)域內(nèi)。而本文則重點(diǎn)闡述了基于DSP的智能語音控制系統(tǒng)設(shè)計(jì),該系統(tǒng)應(yīng)用領(lǐng)域廣泛,能為人機(jī)交互提供有力參考方案。
【關(guān)鍵詞】DSP 職能語音控制系統(tǒng) 設(shè)計(jì)
語音識(shí)別技術(shù)起源自20世紀(jì)50年代,通過將近幾十年的發(fā)展,技術(shù)已趨于成熟。我國語音識(shí)別技術(shù)研究起步晚,不過近年發(fā)展卻相當(dāng)快速,DSP的智能語音控制系統(tǒng)設(shè)計(jì)是當(dāng)前備受關(guān)注的研究領(lǐng)域,關(guān)注DSP智能語音控制系統(tǒng)硬件設(shè)計(jì)與軟件實(shí)現(xiàn)意義重大。
1 DSP的智能語音控制系統(tǒng)硬件設(shè)計(jì)
該系統(tǒng)硬件結(jié)構(gòu)框圖見圖1,其中核心處理芯片用的是T1公司的TMS320VC5509芯片,特有的高速率、低功耗優(yōu)勢,被應(yīng)用到便攜式設(shè)備終端信號(hào)處理、語音處理等多領(lǐng)域。語音編解碼芯片TLV320AIC23B用到了現(xiàn)代化Sigma-Delta采樣技術(shù),可在8-96kHz采樣率范圍中提供16位、20位、24位與32位采樣,ADC與DAC信噪比各自能達(dá)90dB與100dB,此芯片被廣泛應(yīng)用到不同音頻信號(hào)處理領(lǐng)域。無線部分則用到了基于nRF401無線通信芯片設(shè)計(jì)的PTR2000模塊,此模塊發(fā)射功耗低,靈敏性強(qiáng),為現(xiàn)今低功耗無線電傳輸最佳選擇。
系統(tǒng)上電后,首先測試者需利用麥克風(fēng)或線性輸入模式把語音信號(hào)成功傳至音頻編碼芯片TLV320AIC23B,再記住MCBSP串口傳送至系統(tǒng)核心處理芯片(DSP)。此后,DSP成功接收語音控制信號(hào)后通過對(duì)應(yīng)算法展開分析,分辨出其中的語音控制命令。最后,系統(tǒng)把辨別出的結(jié)果部分傳至LCD顯示模塊利于后期觀察,而另外的則被傳送至無線收發(fā)模塊,實(shí)現(xiàn)與智能化控制設(shè)備的遠(yuǎn)程交互。通過鍵盤可對(duì)顯示電路給予控制使其顯示,對(duì)監(jiān)控系統(tǒng)工作情況給予實(shí)時(shí)監(jiān)控。
2 DSP的智能語音控制系統(tǒng)軟件實(shí)現(xiàn)
整個(gè)系統(tǒng)軟件實(shí)現(xiàn)流程框圖見圖2。首先系統(tǒng)使用片上支持庫初始化語音編碼芯片、無線收發(fā)模塊、時(shí)鐘、存儲(chǔ)器等片上資源。后打開多通道緩沖串口實(shí)現(xiàn)語音信號(hào)的全面采集,并把所采集信號(hào)完成傳送至DSP芯片,執(zhí)行語音信號(hào)端點(diǎn)檢測、訓(xùn)練模塊生成等流程的操作。訓(xùn)練模板生成后,借助DSP的EMIF口把訓(xùn)練模板妥善保存至存儲(chǔ)器內(nèi),再借助MCBSP串口執(zhí)行語音信號(hào)特征提取、再次采樣等環(huán)節(jié)的操作。后把訓(xùn)練模塊里的特征分量及該次采樣結(jié)果展開對(duì)比,實(shí)現(xiàn)語音命令識(shí)別。
2.1 語音編解碼模塊
語音編解碼芯片TLV320AIC23芯片、DSP通過I2C實(shí)現(xiàn)總線互聯(lián),語音芯片被啟動(dòng)后,首先借助I2C總線實(shí)現(xiàn)對(duì)語音芯片控制寄存器的配置。如:進(jìn)行語音采樣速率的設(shè)置、增益倍數(shù)等。在程序的實(shí)現(xiàn)上DSP多是通過CSL片的支持庫實(shí)現(xiàn)對(duì)語音芯片的配置,并借助MCBSP串口實(shí)現(xiàn)對(duì)語音破解編碼芯片的讀寫操作。
2.2 存儲(chǔ)器與無線收發(fā)模塊
同步東塔器存儲(chǔ)器大小約4M×16bit,通過DSP的EMIF口語DSP完成雙向通信,可尋址范圍即0x40000~0x7ffff,完成對(duì)訓(xùn)練模板的存儲(chǔ)。擴(kuò)張存儲(chǔ)器接口配置方法與AIC相似。
無線收發(fā)模塊用的是PTR2000模塊,內(nèi)核芯片為Nrf401無線通信芯片。整體屬于封裝好的模塊結(jié)構(gòu),包括7個(gè)引腳:VCC電源引腳、PWR低功耗控制、CND電源地、DO/DI數(shù)據(jù)輸入輸出、TXEN收發(fā)模式切換、CND電源地、CS頻道選擇引腳。使用期間只要簡單借助DSP的IO口設(shè)置頻道與收發(fā)方式等相對(duì)簡單的配置引腳即能正常工作。
整個(gè)軟件設(shè)計(jì)流程片上外設(shè)均用到的是DSP片上支持庫進(jìn)行編寫,通過一組標(biāo)準(zhǔn)化方法來訪問與控制片上資源,整個(gè)系統(tǒng)可裁剪性相當(dāng)好,便于移植。軟件流程具體如圖2。
3 小結(jié)
智能人機(jī)交互系統(tǒng)可解決人們不能與設(shè)備直接接觸完成設(shè)備控制的問題,更符合復(fù)雜工業(yè)現(xiàn)場需求,因該系統(tǒng)核心處理芯片特有的片上資源與擴(kuò)展接口,更易與其它設(shè)備互聯(lián),便于系統(tǒng)升級(jí)。
參考文獻(xiàn)
[1]高海英.基于DSP的機(jī)器人語言識(shí)別及控制系統(tǒng)設(shè)計(jì)[D].重慶:重慶大學(xué),2006.
[2]陳濤.基于DSP的語音信號(hào)識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D].成都:成都理工大學(xué),2010.
作者單位
北方民族大學(xué) 寧夏回族自治區(qū)銀川市 750021