蘇 倩,杜 堃
(河北能源職業(yè)技術(shù)學(xué)院,河北 唐山 063000)
隨著農(nóng)業(yè)生產(chǎn)模式轉(zhuǎn)變,我國(guó)的農(nóng)田逐漸向大型生產(chǎn)主體集中,大規(guī)模專業(yè)化生產(chǎn)成為現(xiàn)代農(nóng)業(yè)的發(fā)展趨勢(shì)。在這種形勢(shì)下,以人力為主的生產(chǎn)方式已無(wú)法滿足生產(chǎn)的需求,提高農(nóng)業(yè)機(jī)械化水平是必然的選擇。農(nóng)業(yè)機(jī)械遠(yuǎn)高于人工的生產(chǎn)效率,可以在較短時(shí)間內(nèi)完成目標(biāo)作業(yè)。我國(guó)農(nóng)業(yè)機(jī)械的研制起步較晚,但是在近些年的普及應(yīng)用非常迅速。與國(guó)外相比,我國(guó)的部分農(nóng)業(yè)機(jī)械性能還需要改善,農(nóng)業(yè)生產(chǎn)的整體機(jī)械化率有提升的空間和潛力。
水稻是亞洲國(guó)家的主要糧食作物,我國(guó)北至黑龍江、西至新疆等有灌溉條件的地區(qū)都有水稻種植。我國(guó)的水稻種植面積僅次于印度,產(chǎn)量居世界第一。水稻在農(nóng)業(yè)中占有重要地位,其高產(chǎn)穩(wěn)產(chǎn)是國(guó)家糧食安全的保障。作為最主要的糧食作物,水稻生產(chǎn)的機(jī)械化率相對(duì)較高,在部分稻區(qū)已經(jīng)實(shí)現(xiàn)了全程機(jī)械化。在水稻生產(chǎn)環(huán)節(jié)中,收割是最后的步驟,對(duì)產(chǎn)量有著直接影響。水稻的收割時(shí)期較短,必須要把握最佳收割時(shí)機(jī),才能獲得最好的效益。水稻提前收割會(huì)損失日產(chǎn)量,推遲收割則會(huì)增加鳥(niǎo)鼠蟲(chóng)害、極端天氣和自然落粒造成的損失。另外,在雙季稻種植區(qū),早稻及時(shí)收割也有利于晚稻種植的順利開(kāi)展。因此,研制水稻收割機(jī)械具有重要的意義,是水稻生產(chǎn)機(jī)械發(fā)展的一個(gè)重點(diǎn)[1]。
在水稻收割機(jī)的各項(xiàng)性能中,行走速度對(duì)作業(yè)質(zhì)量的影響最大。合適的行走速度需要綜合考慮作業(yè)效率和質(zhì)量,速度太慢導(dǎo)致喂入量不足,作業(yè)效率相應(yīng)地降低;速度太快導(dǎo)致喂入量過(guò)大,谷稈分離效果差,清選損失增加,還會(huì)損壞收割機(jī)的零部件[2]。為此,國(guó)內(nèi)外學(xué)者開(kāi)展了許多相關(guān)研究,設(shè)計(jì)出多種收割機(jī)行走速度自動(dòng)控制方法,在一定程度上解決了上述問(wèn)題[3-4]。另外,人們對(duì)收割機(jī)的切割部件結(jié)構(gòu)進(jìn)行了分析優(yōu)化,并開(kāi)發(fā)出新型喂入密度檢測(cè)方法,為收割機(jī)性能改進(jìn)提供了依據(jù)[5-6]。
我國(guó)主要稻區(qū)的水稻收割都采用聯(lián)合收割機(jī)進(jìn)行,但收割機(jī)的自動(dòng)控制水平不高,限制了機(jī)械的適用性。精準(zhǔn)農(nóng)業(yè)是現(xiàn)代農(nóng)業(yè)的發(fā)展方向,推動(dòng)了農(nóng)業(yè)生產(chǎn)的規(guī)?;蛯I(yè)化,也對(duì)農(nóng)業(yè)機(jī)械提出了更高要求[7]。因此,利用現(xiàn)代技術(shù)設(shè)計(jì)新型水稻收割機(jī)控制系統(tǒng),具有重大的現(xiàn)實(shí)意義。
語(yǔ)音識(shí)別技術(shù)可以賦予機(jī)器識(shí)別和理解語(yǔ)音的能力,能將人類的語(yǔ)音信號(hào)轉(zhuǎn)變成相應(yīng)的文本或命令,其應(yīng)用領(lǐng)域包括信息處理、教育商務(wù)、電子消費(fèi)和機(jī)械控制等[8]。王登峰等和涂惠燕等分別設(shè)計(jì)了以汽車(chē)和手機(jī)為平臺(tái)的語(yǔ)音識(shí)別系統(tǒng),通過(guò)算法改進(jìn)獲得了較好的識(shí)別精度[9-10]。研究人員還根據(jù)語(yǔ)音識(shí)別設(shè)備的特點(diǎn),將其與嵌入式技術(shù)結(jié)合,在簡(jiǎn)化硬件設(shè)備的前提下,提高了語(yǔ)音識(shí)別的實(shí)時(shí)性和準(zhǔn)確性[11-13]。
在機(jī)械控制方面,趙海濱等和富鋼等將語(yǔ)音識(shí)別電路與電機(jī)控制電路整合在一起,分別實(shí)現(xiàn)了對(duì)機(jī)械手和機(jī)床的準(zhǔn)確控制[8,11]。上述的研究表明,語(yǔ)音識(shí)別在農(nóng)業(yè)機(jī)械控制上有廣闊的應(yīng)用前景,但目前用來(lái)對(duì)水稻收割機(jī)進(jìn)行控制的報(bào)導(dǎo)還較少。英語(yǔ)是世界上應(yīng)用最廣泛的語(yǔ)言,其語(yǔ)法簡(jiǎn)單、語(yǔ)感自然,這些特性使得英語(yǔ)在機(jī)械設(shè)計(jì)和控制方面具有優(yōu)勢(shì)。在農(nóng)業(yè)機(jī)械的控制過(guò)程中引入英語(yǔ)語(yǔ)音,既能利用國(guó)外技術(shù)改善農(nóng)業(yè)機(jī)械性能,又能增加我國(guó)成熟機(jī)械對(duì)國(guó)際市場(chǎng)的適應(yīng)能力。本文基于英語(yǔ)語(yǔ)音識(shí)別技術(shù)設(shè)計(jì)了一種水稻收割機(jī)的控制系統(tǒng),對(duì)機(jī)械的行駛速度、行駛方向和割臺(tái)高度進(jìn)行語(yǔ)音控制,并通過(guò)實(shí)例驗(yàn)證系統(tǒng)語(yǔ)音識(shí)別的準(zhǔn)確性和實(shí)時(shí)性,用以降低收割機(jī)的操作難度,提高智能化水平。
收割機(jī)控制系統(tǒng)主要由語(yǔ)音識(shí)別模塊和控制執(zhí)行模塊組成,語(yǔ)音識(shí)別模塊包括麥克風(fēng),用于語(yǔ)音信號(hào)的實(shí)時(shí)采集, TLC1543CN型模數(shù)轉(zhuǎn)換器將語(yǔ)音信號(hào)轉(zhuǎn)換為可供處理的數(shù)碼信號(hào)。語(yǔ)音解碼芯片為Infineon公司的Unispeech 80D51專用型,集成了8B的CMU主控制器和16B的協(xié)處理器,前后端分別帶有模擬和數(shù)字通道。語(yǔ)音識(shí)別模塊的核心是ST公司的S3C2440型嵌入式微處理芯片作為中央處理器,集成了優(yōu)化識(shí)別算法,進(jìn)行語(yǔ)音的處理和識(shí)別,并形成控制指令。芯片內(nèi)置64kB的高速存儲(chǔ)器和增強(qiáng)型I/O端口,能夠滿足語(yǔ)音實(shí)時(shí)識(shí)別的要求。微處理芯片上還連接顯示屏和存儲(chǔ)器,用于對(duì)系統(tǒng)運(yùn)行狀態(tài)、過(guò)程參數(shù)和語(yǔ)音識(shí)別結(jié)果的顯示和存儲(chǔ),如圖1所示。
圖1 收割機(jī)控制系統(tǒng)的組成部分Fig.1 Components of the rice combine control system
收割機(jī)控制執(zhí)行模塊接收語(yǔ)音識(shí)別模塊輸出的指令用于機(jī)械控制,包括行駛速度、行駛方向和割臺(tái)高度。收割機(jī)是久保田4LZ-4型半喂入履帶式聯(lián)合收割機(jī),采用無(wú)級(jí)變速,割幅為2m,蓄電池同時(shí)為語(yǔ)音識(shí)別模塊提供電源。行駛速度的控制裝置為步進(jìn)電機(jī)、油門(mén)和剎車(chē),步進(jìn)電機(jī)按相應(yīng)的方向和幅度轉(zhuǎn)動(dòng),調(diào)節(jié)油門(mén)和剎車(chē)的位置實(shí)現(xiàn)對(duì)機(jī)械速度的控制。行駛方向的控制通過(guò)方向盤(pán)控制器完成,控制器與收割機(jī)的方向盤(pán)連接,由馬達(dá)驅(qū)動(dòng)轉(zhuǎn)向。方向盤(pán)控制器安裝方便,對(duì)機(jī)械具有很好的適應(yīng)性。割臺(tái)高度由弱電信號(hào)控制的液壓閥進(jìn)行調(diào)整,能夠與S3C2440型嵌入式芯片兼容,接收其輸出的電信號(hào)。
收割機(jī)操作人員的英語(yǔ)語(yǔ)音指令通過(guò)麥克風(fēng)錄入,經(jīng)過(guò)預(yù)處理去除環(huán)境中的背景噪音,然后轉(zhuǎn)換為數(shù)字信號(hào)用于提取語(yǔ)音特征。鑒于嵌入式芯片的性能和運(yùn)算速度,在保證準(zhǔn)確識(shí)別的前提下,本文采用精簡(jiǎn)的特征維數(shù)減少計(jì)算量:第1識(shí)別階段為22維MFCC特征的初步識(shí)別,第2識(shí)別階段為26維MFCC特征的精確識(shí)別。首先按照訓(xùn)練模板進(jìn)行初步識(shí)別,得到多個(gè)候選詞條;然后輸出選項(xiàng),在新的模型框架中獲得精確識(shí)別的結(jié)果。另外,可以基于隱馬爾科夫(HMM)模型,直接進(jìn)行精確識(shí)別;識(shí)別得到的語(yǔ)義與參考模型庫(kù)做相似度比較,將相似性最高的特征矢量作為識(shí)別結(jié)果,以控制指令的形式輸出,如圖2所示。
圖2 語(yǔ)音識(shí)別的流程Fig.2 Flow of speech recognition
英語(yǔ)語(yǔ)言識(shí)別模塊中的軟件采用C語(yǔ)言進(jìn)行代碼編程,編寫(xiě)的代碼涉及語(yǔ)音輸入至指令輸出之間的各個(gè)環(huán)節(jié),以及聲音檢測(cè)失敗、重新訓(xùn)練、存在背景噪音和序號(hào)錯(cuò)誤等突發(fā)狀況下的處理程序。C語(yǔ)言編程的支持軟件為微軟語(yǔ)音應(yīng)用軟件開(kāi)發(fā)工具包SASDK1.1,用于加載xml描述方法,保存輸入的音頻和序列分析結(jié)果。當(dāng)出現(xiàn)錯(cuò)誤的異常識(shí)別結(jié)果時(shí),SASDK1.1工具包可以創(chuàng)建和部署糾錯(cuò)應(yīng)用程序,并重新調(diào)試識(shí)別程序。嵌入式芯片中帶有Sphinx語(yǔ)音識(shí)別引擎作為英語(yǔ)語(yǔ)音識(shí)別的基礎(chǔ),為連續(xù)語(yǔ)音識(shí)別、大詞匯量和高識(shí)別率識(shí)別提供支持。Sphinx語(yǔ)音識(shí)別引擎的源代碼為開(kāi)放型,方便與其它相關(guān)技術(shù)兼容和整合。
識(shí)別算法主要集中在特征提取和精確識(shí)別兩個(gè)環(huán)節(jié)。與理想環(huán)境相比,實(shí)際應(yīng)用環(huán)境中的語(yǔ)音特征質(zhì)量明顯降低,歸因于背景噪音、目標(biāo)通道畸變和人為因素的影響。本文通過(guò)MFCC的一階和二階差分來(lái)消除噪音干擾,提高目標(biāo)語(yǔ)音的可識(shí)別性。差分計(jì)算公式參考涂惠燕等(2011)的研究,采用22維的一階差分MFCC和26維的二階差分MFCC。
語(yǔ)音的精確識(shí)別基于HMM模型,利用馬爾科夫鏈模擬語(yǔ)音的特征量變化,然后通過(guò)三元函數(shù)建立馬爾科夫模型;計(jì)算得到初始狀態(tài)的矢量分布概率后進(jìn)行掃描,從而產(chǎn)生特征狀態(tài)的序列,最后對(duì)序列進(jìn)行預(yù)加重、分幀和FFT變換處理實(shí)現(xiàn)對(duì)語(yǔ)音的識(shí)別。在模板訓(xùn)練過(guò)程中,標(biāo)準(zhǔn)發(fā)音的特征值利用Baum-Welch算法計(jì)算獲得,識(shí)別過(guò)程中輸入的用戶語(yǔ)音特征則利用Viterbi算法解碼。
試驗(yàn)中,系統(tǒng)語(yǔ)音采集頻率為15kHz,語(yǔ)音的特征提取分為有重疊的幀,每幀提取1次語(yǔ)音特征,幀長(zhǎng)30ms,幀移15ms。將水稻收割機(jī)控制過(guò)程中使用的英語(yǔ)短語(yǔ)按照功能分類,組成短語(yǔ)的基本單詞如表1所示。
表1 不同控制功能的應(yīng)用單詞Table 1 Words applied in different controlling function
針對(duì)實(shí)際應(yīng)用需求,系統(tǒng)分別在20、40、60、80dB的4種噪音環(huán)境中進(jìn)行測(cè)試。在每種噪音環(huán)境下,由建立訓(xùn)練模板的收割機(jī)特定駕駛員向語(yǔ)音識(shí)別系統(tǒng)發(fā)出50條英語(yǔ)短語(yǔ)形式的指令,記錄系統(tǒng)準(zhǔn)確識(shí)別的英語(yǔ)單詞數(shù)、短語(yǔ)數(shù)和識(shí)別所用的平均時(shí)間,評(píng)價(jià)系統(tǒng)的準(zhǔn)確性和實(shí)時(shí)性。
系統(tǒng)測(cè)試的結(jié)果如表2所示。理想環(huán)境下,系統(tǒng)對(duì)英語(yǔ)單詞和短語(yǔ)的識(shí)別率分別達(dá)到98%和96%。隨著環(huán)境噪音的增加,識(shí)別率有所下降;在噪音最嚴(yán)重的環(huán)境下,對(duì)英語(yǔ)單詞和短語(yǔ)的識(shí)別率仍然達(dá)到91%和88%,具有較高的準(zhǔn)確性和適應(yīng)性。系統(tǒng)對(duì)英語(yǔ)指令的平均識(shí)別時(shí)間為43~47ms,沒(méi)有受到環(huán)境噪音的影響,可以滿足實(shí)時(shí)識(shí)別的要求。
表2 語(yǔ)音識(shí)別系統(tǒng)的準(zhǔn)確性和實(shí)時(shí)性Table 2 Accuracy and real time of speech recognition system
基于英語(yǔ)語(yǔ)音識(shí)別技術(shù)設(shè)計(jì)了一種水稻收割機(jī)的控制系統(tǒng),由語(yǔ)音識(shí)別模塊和控制執(zhí)行模塊組成。語(yǔ)音識(shí)別模塊的核心是嵌入式微處理芯片,基于HMM模型算法識(shí)別英語(yǔ)語(yǔ)音,識(shí)別結(jié)果以指令的形式輸出,對(duì)收割機(jī)的行駛速度、行駛方向和割臺(tái)高度進(jìn)行控制。試驗(yàn)表明:系統(tǒng)英語(yǔ)語(yǔ)音識(shí)別具有較好的準(zhǔn)確性和實(shí)時(shí)性,可以用來(lái)降低收割機(jī)的操作難度,提高智能化水平。