国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向戰(zhàn)術(shù)環(huán)境的語(yǔ)音指揮技術(shù)研究

2017-05-03 07:04蔡海興廖生權(quán)
火力與指揮控制 2017年4期
關(guān)鍵詞:話音信噪比電臺(tái)

蔡海興,廖生權(quán)

(中國(guó)電子科技集團(tuán)公司第二十八研究所,南京210007)

面向戰(zhàn)術(shù)環(huán)境的語(yǔ)音指揮技術(shù)研究

蔡海興,廖生權(quán)

(中國(guó)電子科技集團(tuán)公司第二十八研究所,南京210007)

與數(shù)據(jù)指揮相比,語(yǔ)音指揮在戰(zhàn)術(shù)環(huán)境中優(yōu)勢(shì)明顯。但因戰(zhàn)術(shù)條件下地理環(huán)境復(fù)雜、電磁環(huán)境惡劣、通信信道速率低等原因影響了其指揮效能的發(fā)揮。通過(guò)對(duì)語(yǔ)音指揮現(xiàn)狀分析,提出面向戰(zhàn)術(shù)環(huán)境特別是窄信道條件下語(yǔ)音指揮的總體設(shè)想,并給出提升戰(zhàn)術(shù)環(huán)境下語(yǔ)音指揮能力的關(guān)鍵技術(shù)及解決措施。最后通過(guò)試驗(yàn)驗(yàn)證了技術(shù)可行性。

戰(zhàn)術(shù)環(huán)境,語(yǔ)音指揮,語(yǔ)音識(shí)別,語(yǔ)音編碼

0 引言

指揮方式主要包括數(shù)據(jù)指揮、語(yǔ)音指揮、視頻指揮等,語(yǔ)音指揮因其信息承載量大、操作便捷、對(duì)雙手依賴性小等特點(diǎn),在指揮領(lǐng)域占據(jù)重要地位。特別在分隊(duì)、單兵等戰(zhàn)術(shù)單元,指戰(zhàn)人員高度復(fù)用,語(yǔ)音指揮的優(yōu)勢(shì)尤其明顯。

分隊(duì)及以下戰(zhàn)術(shù)單元因其作戰(zhàn)特點(diǎn),遠(yuǎn)離核心保障區(qū),通信保障力量薄弱,對(duì)外通信以無(wú)線窄帶信道為主,加上所處地理及電磁環(huán)境惡劣,導(dǎo)致其通信信道速率低、誤碼率高,影響其指揮效率和能力發(fā)揮。因此,有必要研究適用于戰(zhàn)術(shù)環(huán)境,特別是窄帶信道和惡劣電磁環(huán)境的語(yǔ)音獲取、編碼和傳輸?shù)燃夹g(shù),以期提升戰(zhàn)術(shù)單元的指揮能力。

超短波、短波通信因其使用方便、設(shè)備簡(jiǎn)單、機(jī)動(dòng)靈活等特點(diǎn),是戰(zhàn)術(shù)網(wǎng)絡(luò)的重要組成部分,也是戰(zhàn)術(shù)末端的主要通信手段,本文主要以此為對(duì)象展開(kāi)分析。

1 語(yǔ)音指揮現(xiàn)狀

1.1 語(yǔ)音通達(dá)率方面

語(yǔ)音通信信道分有線信道和無(wú)線信道兩種。有線信道及部分高速無(wú)線信道因帶寬高、信道穩(wěn)定,可承載VoIP、PSTN業(yè)務(wù),通話鏈路以撥號(hào)方式建立;低速無(wú)線信道,如短波、超短波等,因其帶寬窄、易受干擾,服務(wù)質(zhì)量QoS低,無(wú)法承載控制信號(hào),語(yǔ)音信息只能以廣播方式在同一子網(wǎng)內(nèi)一跳直達(dá),不能跨區(qū)域、跨網(wǎng)絡(luò)多跳路由。

雖然隨著技術(shù)的發(fā)展,在特定范圍實(shí)現(xiàn)了無(wú)線話音與有線話音的鉸鏈,初步具備全網(wǎng)系話音互通能力,但終究因條件限制,無(wú)法大規(guī)模推廣應(yīng)用。如戰(zhàn)術(shù)互聯(lián)網(wǎng)中,通過(guò)超短波電臺(tái)RAP模式,在電臺(tái)之間、電臺(tái)與固定電話之間通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)了點(diǎn)對(duì)點(diǎn)撥號(hào)通話,但因RAP通話需要基站節(jié)點(diǎn)伴隨保障等因素,限制了其使用范圍。又如,通過(guò)協(xié)議改進(jìn)實(shí)現(xiàn)了VoIP協(xié)議與電臺(tái)話音的鉸鏈,將電臺(tái)話音作為“最后一公里”話音覆蓋,但因戰(zhàn)術(shù)電臺(tái)無(wú)法承載撥號(hào)信令,該方案目前只能實(shí)現(xiàn)從有線到無(wú)線的單向通話,且電臺(tái)之間仍然是廣播通話??梢?jiàn)戰(zhàn)術(shù)末端的語(yǔ)音尚不能通過(guò)戰(zhàn)術(shù)網(wǎng)絡(luò)實(shí)現(xiàn)全網(wǎng)系點(diǎn)對(duì)點(diǎn)傳輸。

1.2 抗干擾能力方面

在戰(zhàn)術(shù)末端,電磁環(huán)境惡劣,地理環(huán)境復(fù)雜,加上敵方電磁干擾影響,信號(hào)信噪比較低。為了提升電臺(tái)抗干擾能力,采用了糾錯(cuò)編碼、交織、直列擴(kuò)頻等技術(shù),但這些技術(shù)的使用是以占用一定通信資源為前提,降低了帶寬資源,進(jìn)而影響電臺(tái)業(yè)務(wù)承載能力[1]。以短波電臺(tái)為例,當(dāng)信道數(shù)傳速率大于600b/s,信噪比大于3 dB時(shí),電臺(tái)送受話器才能正常輸出聲音。

1.3 與數(shù)據(jù)指揮鉸鏈方面

語(yǔ)音指揮與數(shù)據(jù)指揮系統(tǒng)之間互相隔離、互相獨(dú)立。一方面,語(yǔ)音指揮過(guò)程中從輸入、傳輸、接收、轉(zhuǎn)發(fā)、輸出、存儲(chǔ)均為語(yǔ)音信息,若要轉(zhuǎn)換為數(shù)據(jù)指揮系統(tǒng)能識(shí)別的信息需人工手動(dòng)錄入,既占用人工,且效率無(wú)法保障。以某任務(wù)中上級(jí)指揮所掌握下級(jí)部隊(duì)位置信息并在態(tài)勢(shì)圖顯示流程為例,流程如下:①下級(jí)部隊(duì)通過(guò)電臺(tái)語(yǔ)音上報(bào)位置信息;②上級(jí)指揮所值班員收到清晰的語(yǔ)音信息后手動(dòng)記錄該部隊(duì)位置數(shù)據(jù);③上級(jí)指揮所值班員通過(guò)手動(dòng)方式將下級(jí)部隊(duì)位置信息錄入數(shù)據(jù)庫(kù)并上圖顯示。另一方面,數(shù)據(jù)指揮系統(tǒng)具有類似于手機(jī)電話薄的通信名錄,提供給指揮員的是與編程相關(guān)的席位名稱等信息,而不是一串不便記憶的號(hào)碼;但語(yǔ)音指揮無(wú)法利用通信名錄做到一鍵撥號(hào),必須采用手動(dòng)輸入號(hào)碼、頻率等方式。

2 戰(zhàn)術(shù)環(huán)境下語(yǔ)音指揮設(shè)想

根據(jù)語(yǔ)音指揮現(xiàn)狀及存在問(wèn)題,語(yǔ)音指揮能力總體思路是根據(jù)語(yǔ)音指揮的特點(diǎn)將語(yǔ)音信息數(shù)字化,利用數(shù)據(jù)編碼壓縮技術(shù),壓縮語(yǔ)音信息空間,降低對(duì)通信信道的要求,以適應(yīng)戰(zhàn)術(shù)末端通信環(huán)境;打通數(shù)據(jù)指揮與語(yǔ)音指揮接口,實(shí)現(xiàn)數(shù)據(jù)層面的統(tǒng)一;利用數(shù)據(jù)指揮系統(tǒng)建設(shè)成果,通過(guò)其底層傳輸平臺(tái),在實(shí)現(xiàn)全網(wǎng)全要素之間語(yǔ)音互通??傮w示意如圖1所示,流程如圖2所示。

圖1 語(yǔ)音指揮設(shè)想示意圖(△語(yǔ)音承載的信息)

圖2 語(yǔ)音指揮流程圖

發(fā)送端按通信名錄發(fā)送撥號(hào)信令建立鏈接,話音通過(guò)語(yǔ)音識(shí)別技術(shù)實(shí)現(xiàn)模擬語(yǔ)音信號(hào)數(shù)字化,利用高效率語(yǔ)音編碼技術(shù)對(duì)語(yǔ)音信息進(jìn)行編碼壓縮,并按數(shù)據(jù)指揮系統(tǒng)傳輸協(xié)議封裝語(yǔ)音信息和控制信息后發(fā)送。接收端按傳輸協(xié)議解析獲取語(yǔ)音信息,通過(guò)解碼后將信息通過(guò)語(yǔ)音合成技術(shù)合成為語(yǔ)音信號(hào)播放或直接將信息提交給數(shù)據(jù)指揮系統(tǒng)處理。

通過(guò)以上分析,語(yǔ)音識(shí)別技術(shù)、語(yǔ)音編碼技術(shù)、語(yǔ)音指揮和數(shù)據(jù)指揮鉸鏈技術(shù)是實(shí)現(xiàn)窄帶條件語(yǔ)音指揮能力提升的關(guān)鍵技術(shù)。

3 語(yǔ)音指揮能力提升技術(shù)

3.1 語(yǔ)音編碼技術(shù)

3.1.1 背景

直接模擬語(yǔ)音數(shù)字化將占據(jù)電臺(tái)通信系統(tǒng)無(wú)法支持的空間,因此,必須依靠語(yǔ)音壓縮編碼技術(shù),將數(shù)字化語(yǔ)音壓縮到電臺(tái)可支持的帶寬范圍進(jìn)行傳輸[2]。傳統(tǒng)語(yǔ)音編碼有波形編碼、參數(shù)編碼和混合編碼3種方式。波形編碼是直接將時(shí)間域語(yǔ)音信息直接轉(zhuǎn)換為數(shù)字代碼進(jìn)行處理、傳輸,重建后能較好地還原語(yǔ)音波形。波形編碼以ITU-T G.711規(guī)范為代表,其編碼速率為64 kb/s。參數(shù)編碼是在語(yǔ)音信號(hào)頻率域或其他正交域提取音特征信息,并將其轉(zhuǎn)換為數(shù)字代碼進(jìn)行處理、傳輸,重建后能還原語(yǔ)音特征信息。參數(shù)編碼采用LPC標(biāo)準(zhǔn),最低編碼速率可以到2.4 kb/s以下,但其還原后語(yǔ)音保真度較低,MOS評(píng)分只有2.5,主要用于軍用保密通話?;旌暇幋a是由波形編碼和參數(shù)編碼相結(jié)合的編碼方式,在傳輸參數(shù)同時(shí),還傳輸了部分樣點(diǎn)?;旌暇幋a主要采用CELP編碼標(biāo)準(zhǔn),編碼速率最低可到4.8 kb/s[3-4]。

電臺(tái)具有模擬話和數(shù)字話兩種通話方式。模擬話直接將話音調(diào)制到載波信號(hào)上進(jìn)行傳輸,具有處理電路簡(jiǎn)單、占用信道頻帶窄、實(shí)時(shí)性高等特點(diǎn)。但模擬話對(duì)環(huán)境噪聲處理能力有限,極易受干擾。電臺(tái)數(shù)字話采用參數(shù)編碼方式,通過(guò)聲碼器提取話音的特征信息并將其轉(zhuǎn)換為數(shù)字信息進(jìn)行處理、傳輸,具有較強(qiáng)的信道適應(yīng)能力,通過(guò)該方式實(shí)現(xiàn)了在短波/超短波等低速信道上的數(shù)字語(yǔ)音通信,是現(xiàn)役電臺(tái)語(yǔ)音通信的主要手段,一般有2 400 b/s、1 200 b/s、600 b/s 3種速率可選[3]。

從以上分析可見(jiàn),電臺(tái)數(shù)字話正常通信的前提是數(shù)據(jù)通信速率在600 b/s以上。在惡劣電磁環(huán)境中,數(shù)據(jù)通信速率很難穩(wěn)定在600 b/s以上,語(yǔ)音通信便無(wú)法進(jìn)行。短波電臺(tái)數(shù)傳速率在600 b/s以下,還有300 b/s、150 b/s、75 b/s和極低速等幾檔。根據(jù)香濃定理,在信道帶寬一定情況下,信噪比與信道速率成反比,隨著信道速率降低,對(duì)信噪比的要求也隨之降低。因此,通過(guò)數(shù)據(jù)傳輸信道傳輸語(yǔ)音信息是提升語(yǔ)音通信抗干擾能力的有效途徑。

香濃定理為:

與信道速率之間函數(shù)關(guān)系簡(jiǎn)化為:

轉(zhuǎn)換為分貝后為:

根據(jù)短波電臺(tái)技術(shù)指標(biāo),x≈3,因此:

假設(shè)短波電臺(tái)信道帶寬固定,根據(jù)式(2)計(jì)算得短波電臺(tái)典型數(shù)傳速率對(duì)應(yīng)信噪比見(jiàn)表1。

由表1可見(jiàn)隨著數(shù)傳速率的降低,對(duì)信噪比的要求也隨之降低。在極低速模式下,信噪比可以降到-18 dB,是數(shù)字話的1/125。可見(jiàn)通過(guò)數(shù)據(jù)信道傳輸語(yǔ)音信息可大幅提升語(yǔ)音通信的抗干擾能力。

表1 短波電臺(tái)數(shù)傳速率與信噪比對(duì)應(yīng)關(guān)系

3.1.2 編碼方式

話音通信比數(shù)據(jù)通信實(shí)時(shí)性要求更高,實(shí)際生活中都有體會(huì)。例如雙方通過(guò)短消息通信,對(duì)傳輸延時(shí)感覺(jué)沒(méi)那么直觀,如果雙方是電話通信,傳輸過(guò)程中的延時(shí)、卡頓直接影響到通話體驗(yàn)度。

語(yǔ)音通信過(guò)程包括說(shuō)話、語(yǔ)音識(shí)別、傳輸和合成4部分[5],如圖3所示。接聽(tīng)者只要開(kāi)始收到對(duì)方語(yǔ)音即認(rèn)為已經(jīng)收到,不在意話音持續(xù)時(shí)間,因此,語(yǔ)音合成時(shí)間可以不考慮。語(yǔ)音識(shí)別的最小單位是斷句,識(shí)別裝置必須接收完一個(gè)斷句后才能開(kāi)始識(shí)別,因此,說(shuō)話速度是影響語(yǔ)音通信質(zhì)量的一個(gè)因素。根據(jù)以上分析,影響語(yǔ)音通信質(zhì)量有說(shuō)話延時(shí)、語(yǔ)音識(shí)別延時(shí)和傳輸延時(shí)3方面因素。播音員級(jí)說(shuō)話速度為305漢字/min[6],一個(gè)斷句識(shí)別速度約為300 ms,這些指標(biāo)在目前已是較高水平。在通信設(shè)備傳輸速率短時(shí)內(nèi)無(wú)法大幅度提升情況下,對(duì)語(yǔ)音信息進(jìn)行高效率壓縮編碼,減少傳輸數(shù)據(jù)量是提高語(yǔ)音通信質(zhì)量最有效的途徑。下面主要研究基于GBK庫(kù)的自由語(yǔ)音和基于自定義命令詞庫(kù)的命令詞兩種編碼方式。

圖3 語(yǔ)音通信各階段延時(shí)特性

自由語(yǔ)音編碼以GBK庫(kù)為基礎(chǔ),每個(gè)漢字用兩個(gè)字節(jié)的代碼表示,對(duì)字符的組合方式、字符數(shù)量均無(wú)要求,所能表示的內(nèi)容較為豐富,目前GBK庫(kù)共收納了21 003個(gè)漢字。命令詞是通過(guò)若干字節(jié)代碼對(duì)命令進(jìn)行編碼,2個(gè)字節(jié)代碼可編碼65 536條命令,3個(gè)字節(jié)代碼可編碼1 677萬(wàn)條命令。在軍事指揮領(lǐng)域,指揮用語(yǔ)主要以軍語(yǔ)為主,文獻(xiàn)[7]共收納了6 562條軍語(yǔ),因此,2字節(jié)代碼完全可滿足當(dāng)前軍語(yǔ)的編碼要求。

圖4 命令詞編碼方式的編碼速率

由圖4可見(jiàn)編碼速度隨著軍語(yǔ)漢字?jǐn)?shù)的增多而降低,最大為81 b/s,最小為5 b/s分別是數(shù)字話的1/7和1/120。無(wú)論是自由語(yǔ)音方式還是命令詞方式,與電臺(tái)數(shù)字話相比,編碼效率明顯提升,對(duì)通信信道的要求也相應(yīng)降低。

設(shè)語(yǔ)音通信從說(shuō)話到開(kāi)始接收話音的時(shí)延為:

實(shí)際應(yīng)用中為了與數(shù)據(jù)指揮系統(tǒng)鉸鏈,語(yǔ)音編碼后的信息傳輸主要依托短報(bào)文傳輸和分發(fā)體制,因此,信道上傳輸?shù)某苏Z(yǔ)音編碼還包括短報(bào)文控制信息。短報(bào)文傳輸報(bào)文頭為41字節(jié),假設(shè)信道數(shù)傳速率為V,則按自由語(yǔ)音編碼的傳輸延時(shí)為按命令詞編碼的延時(shí)為繪制當(dāng)n=1、2、5、8、15、20時(shí)數(shù)傳速率(V)與時(shí)延(t)關(guān)系如圖5所示。

由圖5可見(jiàn),軍語(yǔ)漢字?jǐn)?shù)越少,自由語(yǔ)音編碼和命令詞編碼之間時(shí)延差距越小。當(dāng)信道速率高于150 b/s時(shí),兩種編碼方式時(shí)延基本接近;當(dāng)信道速率低于150 b/s時(shí),命令詞編碼方式效率更高,且信道速率越低效果越明顯。

綜合分析表1、圖4、圖5可得,命令詞方式具有編碼效率高、對(duì)信道要求低,可用于信噪比低于-5 dB以下惡劣電磁環(huán)境下。但命令詞編碼方式信息量較少,所能表達(dá)的意思有限,靈活性不足,無(wú)法表示時(shí)間、地點(diǎn)、位置等變量信息。因此,設(shè)計(jì)基于帶變量槽位的語(yǔ)音模板,充分利用自由語(yǔ)音信息量大、靈活性高,命令詞編碼效率高等優(yōu)勢(shì),是今后語(yǔ)音編碼的方向。

圖5 數(shù)傳速率與時(shí)延關(guān)系圖

3.2 語(yǔ)音識(shí)別準(zhǔn)確率提高技術(shù)

語(yǔ)音識(shí)別是模擬話音數(shù)字化重要環(huán)節(jié),語(yǔ)音識(shí)別準(zhǔn)確率直接影響到通信成功率,語(yǔ)音識(shí)別流程如圖6所示。

圖6 語(yǔ)音識(shí)別流程圖

從語(yǔ)音識(shí)別流程可以看出,可以從4方面提升語(yǔ)音識(shí)別準(zhǔn)確率。

3.2.1 語(yǔ)音增強(qiáng)

戰(zhàn)場(chǎng)環(huán)境中,環(huán)境噪聲高,噪聲組成復(fù)雜,信噪比低,影響語(yǔ)音識(shí)別準(zhǔn)確率。提高語(yǔ)音信號(hào)信噪比,還原信號(hào)是提升語(yǔ)音識(shí)別準(zhǔn)確率的關(guān)鍵步驟。雙麥克增強(qiáng)技術(shù)是解決語(yǔ)音識(shí)別中噪聲問(wèn)題的有效方法[8],其原理是,一個(gè)信道用于采集背景噪聲,另一個(gè)信道采集背景噪聲與話音信息的混合信號(hào),將兩個(gè)信道信號(hào)融合處理后得到原始話音信號(hào),模型如圖7所示。圖8為在95 dB至105 dB的車(chē)載噪聲環(huán)境中實(shí)際測(cè)得降噪前后信噪比,經(jīng)過(guò)雙麥克語(yǔ)音增強(qiáng),信噪比增加了20 dB,可有效還原話音信號(hào),保存了語(yǔ)音信息完整性,為語(yǔ)音識(shí)別準(zhǔn)確率提升奠定了基礎(chǔ)。

圖7 雙麥克增強(qiáng)技術(shù)原理圖

圖8 降噪前后信號(hào)信噪比

3.2.2 聲學(xué)模型訓(xùn)練

語(yǔ)音識(shí)別受環(huán)境影響較大,在安靜的環(huán)境、野外環(huán)境、車(chē)載環(huán)境、機(jī)載環(huán)境等,其聲學(xué)模型都不一樣,如果用在辦公室環(huán)境下訓(xùn)練的模型在車(chē)載環(huán)境應(yīng)用,識(shí)別率會(huì)有一定影響。不同的人說(shuō)話、不同說(shuō)話風(fēng)格、不同口音,對(duì)識(shí)別率也存在較大影響。通過(guò)采集大量具有不同話音特征的話音錄音,特別是對(duì)特定用戶有針對(duì)性的采集話音錄音,用于聲學(xué)模型訓(xùn)練并擴(kuò)充聲學(xué)模型庫(kù),可提高識(shí)別準(zhǔn)確率。

3.2.3 語(yǔ)言模型訓(xùn)練

漢語(yǔ)中存在大量同音詞,相同語(yǔ)音針對(duì)不同的應(yīng)用語(yǔ)境,具有不同的語(yǔ)義,例如,“gōngjī”一音,在日常語(yǔ)言環(huán)境應(yīng)識(shí)別為“公雞”,而在戰(zhàn)場(chǎng)環(huán)境中應(yīng)識(shí)別為“攻擊”。因此,需要搜集大量實(shí)際應(yīng)用環(huán)境的語(yǔ)言語(yǔ)料,進(jìn)行一定時(shí)間的語(yǔ)言模型訓(xùn)練,從而提高識(shí)別準(zhǔn)確率。

3.2.4 基于關(guān)鍵詞的常用語(yǔ)詞庫(kù)

匯集作戰(zhàn)常用命令的軍語(yǔ)庫(kù)內(nèi)容及范圍相對(duì)固定,建立基于軍語(yǔ)關(guān)鍵詞的詞庫(kù),并為每條軍語(yǔ)按其組成漢字及軍語(yǔ)含義設(shè)定一組可以體現(xiàn)其唯一性的特征關(guān)鍵詞,只要識(shí)別到該關(guān)鍵詞即可準(zhǔn)確翻譯成完整的軍語(yǔ),可極大提升識(shí)別準(zhǔn)確率和識(shí)別速度。

3.3 語(yǔ)音指揮與數(shù)據(jù)指揮系統(tǒng)鉸鏈技術(shù)

語(yǔ)音指揮系統(tǒng)與數(shù)據(jù)指揮系統(tǒng)鉸鏈技術(shù)指的是打通兩套系統(tǒng)接口,利用對(duì)方系統(tǒng)已有成果,實(shí)現(xiàn)效能增倍,提升指揮能力。兩套系統(tǒng)鉸鏈技術(shù)主要包括:完善指揮通信名錄,擴(kuò)充語(yǔ)音指揮號(hào)碼參數(shù),實(shí)現(xiàn)席位與語(yǔ)音號(hào)碼綁定;定制與數(shù)據(jù)指揮數(shù)據(jù)格式兼容的語(yǔ)音數(shù)據(jù)格式,語(yǔ)音數(shù)據(jù)直接可作為指控軟件數(shù)據(jù)來(lái)源,實(shí)現(xiàn)兩類數(shù)據(jù)的同傳輸、同存儲(chǔ)、同處理、同顯示;增加語(yǔ)音網(wǎng)關(guān),實(shí)現(xiàn)基于傳統(tǒng)電路交換格式、VOIP協(xié)議的語(yǔ)音信息與基于數(shù)據(jù)傳輸報(bào)文的語(yǔ)音信息之間的交換,從而實(shí)現(xiàn)語(yǔ)音信息的一網(wǎng)通。

4 試驗(yàn)驗(yàn)證

試驗(yàn)驗(yàn)證環(huán)境如圖9所示,A、B兩組采用相同的設(shè)備,每組分別由信息終端(含耳麥)、短波電臺(tái)組成,電臺(tái)與信息終端之間通過(guò)RS232串口互連。因不同體制網(wǎng)絡(luò)的控制協(xié)議不同,協(xié)議開(kāi)銷也不同,反映到數(shù)據(jù)通信額外開(kāi)銷也不同。因此,本試驗(yàn)選用透明傳輸電臺(tái),降低不同網(wǎng)絡(luò)控制協(xié)議開(kāi)銷差異。兩組分別位于10層辦公樓的1樓房間和頂樓平臺(tái)。

圖9 試驗(yàn)驗(yàn)證環(huán)境

試驗(yàn)過(guò)程如下:

①在信息終端上安裝某指控軟件,并配置通信名錄等參數(shù);

②設(shè)置電臺(tái)數(shù)據(jù)通信速率分別為極低速、75b/s、150 b/s、300 b/s、600 b/s、1 200 b/s、2 400 b/s,確保通信雙方電臺(tái)通信正常;

③因自由語(yǔ)音識(shí)別準(zhǔn)確率與詞庫(kù)大小密切相關(guān),而短期內(nèi)生成單機(jī)版詞庫(kù)較困難,因此,試驗(yàn)采用命令詞編碼方式。先期生成包含1 000條常用命令詞的自定義詞庫(kù),命令詞長(zhǎng)度從4個(gè)至15個(gè)漢字不等,平均長(zhǎng)度為11個(gè)漢字。詞庫(kù)包含精確到分的坐標(biāo)庫(kù);

④A、B通過(guò)語(yǔ)音操作向?qū)Χ税l(fā)起50次語(yǔ)音對(duì)話,記錄每種速率下100次對(duì)話的語(yǔ)音識(shí)別一次成功率、平均接收成功率和平均時(shí)延見(jiàn)表2;

⑤在300 b/s速率下,A、B分別通過(guò)語(yǔ)音向?qū)Ψ綀?bào)送10個(gè)位置信息,記錄上圖成功率。

表2 試驗(yàn)數(shù)據(jù)

由表2可見(jiàn),采用命令詞編碼格式語(yǔ)音識(shí)別成功率接近100%,接收成功率保持在98%以上水平,不同語(yǔ)音通話延時(shí)濾除計(jì)時(shí)誤差和軟件處理延時(shí)基本與圖5一致。在接收成功情況下,上圖成功率為100%。

以上試驗(yàn)是在基于命令詞庫(kù)的有限范圍內(nèi)進(jìn)行的,但詞庫(kù)大小僅影響語(yǔ)音識(shí)別成功率。隨著自由語(yǔ)音詞庫(kù)不斷擴(kuò)展和完善,基于自由語(yǔ)音編碼方式,以及兩種編碼的混合方式也同樣具有以上試驗(yàn)效果。

5 結(jié)論

針對(duì)當(dāng)前語(yǔ)音指揮存在的不足,本文提出了通過(guò)語(yǔ)音識(shí)別準(zhǔn)確率提升技術(shù)、面向窄信道的語(yǔ)音編碼技術(shù)、與其他指揮控制系統(tǒng)鉸鏈技術(shù),利用電臺(tái)數(shù)據(jù)信道傳輸語(yǔ)音信息的解決方法,實(shí)現(xiàn)了戰(zhàn)術(shù)條件惡劣電磁環(huán)境下語(yǔ)音指揮的全網(wǎng)通,打通了語(yǔ)音指揮和數(shù)據(jù)指揮之間接口,實(shí)現(xiàn)了指揮能力倍增。最后對(duì)所提出的技術(shù)及解決措施進(jìn)行了試驗(yàn)驗(yàn)證,達(dá)到了預(yù)期目的。

[1]王劍鋒,周龍.淺談軍用無(wú)線通信的特點(diǎn)[J].通信技術(shù),2011,44(7):4-6.

[2]侯燦靖,達(dá)新宇.CVSD仿真及其在某地空電臺(tái)語(yǔ)音終端中的應(yīng)用[J].火力與指揮控制,2008,33(10):149-151.

[3]尤增錄.短波通信網(wǎng)[M].北京:解放軍出版社,2010.

[4]張剛,陳衍翊.通信中的話音編碼技術(shù)[J].計(jì)算機(jī)與網(wǎng)絡(luò),1995(1):43-49.

[5]趙海峰,毛文博.指揮員命令語(yǔ)音識(shí)別算法[J].指揮信息系統(tǒng)與技術(shù),2014,5(2):31-35.

[6]李明娟.淺談新聞播音速度的掌控[J].當(dāng)代電視,2008(6):63-65.

[7]中國(guó)人民解放軍軍事科學(xué)院.中國(guó)人民解放軍軍語(yǔ)[M].北京:軍事科學(xué)出版社,1997.

[8]潘麗杰.基于雙麥克風(fēng)降噪技術(shù)的語(yǔ)音識(shí)別系統(tǒng)[J].現(xiàn)代電子技術(shù),2016,39(2):137-139.

Research on Voice Command Technology for Tactical Environment

CAI Hai-xing,LIAO Sheng-quan
(The 28th Research Institute of China Electronics Technology Group Corporation,Nanjing 210007,China)

Although voice command has advantage of data command in tactical environment,it is preventingvoicecommandfromeffectingthatcomplicatedgeographicalenvironment,bad electromagnetic environment and low channel bandwidth etc.A general idea about voice command in tactical environment is raised based on situation analysis.Then,the paper puts the core technology and solution to enhance capability of voice command in actical environment,which are proved feasible by experiment.

tactical environment,voice command,speech recognition,speech coding

E141;TP399

A

1002-0640(2017)04-0122-06

2016-03-18

2016-04-03

國(guó)家自然科學(xué)基金資助項(xiàng)目(61379118)

蔡海興(1979-),男,浙江諸暨人,碩士研究生,高級(jí)工程師。研究方向:指揮信息系統(tǒng)總體設(shè)計(jì)。

猜你喜歡
話音信噪比電臺(tái)
親戚
兩種64排GE CT冠脈成像信噪比與劑量對(duì)比分析研究
基于經(jīng)驗(yàn)分布函數(shù)快速收斂的信噪比估計(jì)器
自跟蹤接收機(jī)互相關(guān)法性能分析
基于深度學(xué)習(xí)的無(wú)人機(jī)數(shù)據(jù)鏈信噪比估計(jì)算法
淺談模塊化短波電臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)
話音疊加中實(shí)時(shí)混音算法的FPGA實(shí)現(xiàn)
機(jī)載超短波電臺(tái)鄰道干擾減敏特性建模與評(píng)估
地空話音組網(wǎng)系統(tǒng)的應(yīng)用及前景分析研究
荔枝FM