国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語音命令轉(zhuǎn)換器實(shí)現(xiàn)設(shè)計(jì)

2018-09-10 14:39周瑞巖
關(guān)鍵詞:降噪語音識別數(shù)據(jù)庫

周瑞巖

摘要:隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,語音識別、語音翻譯等在生活中普遍應(yīng)用。以現(xiàn)有基于互聯(lián)網(wǎng)構(gòu)建的語音識別技術(shù)為基礎(chǔ),對其原理進(jìn)行分析,語音命令轉(zhuǎn)換器利用離線數(shù)據(jù)庫進(jìn)行語音降噪處理,識別采集的語音信息并轉(zhuǎn)換形成文本信息,與數(shù)據(jù)庫的特定數(shù)據(jù)指令進(jìn)行匹配,再按照指令格式輸出用于試驗(yàn)訓(xùn)練,以提高采集信息的時(shí)效性。

關(guān)鍵詞:降噪;音頻采集;語音識別;語義分析;命令翻譯;數(shù)據(jù)庫

中圖分類號:TP274文獻(xiàn)標(biāo)志碼:A文章編號:1008-1739(2018)23-60-2

0引言

近年來,隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,云技術(shù)和大數(shù)據(jù)技術(shù)構(gòu)建的智慧城市、智慧交通等已經(jīng)惠及生活,較前些年僅可以通過電話、短信方式進(jìn)行通信,現(xiàn)以互聯(lián)網(wǎng)技術(shù)構(gòu)建的微信語音、微信視頻等通信方式更方便,雖然語音識別、語音翻譯等應(yīng)用APP在生活中隨處可見,但該技術(shù)卻未曾在軍事應(yīng)用中實(shí)現(xiàn),隨著部隊(duì)深化改革的推進(jìn),以往通過輔助終端發(fā)送命令或裝備信息的方式很難在時(shí)域、頻域及可用性上滿足試驗(yàn)訓(xùn)練考核的需求,為此借助當(dāng)前市場上的語音識別、語音翻譯等技術(shù)及實(shí)現(xiàn)模式,以試驗(yàn)訓(xùn)練需求為根本,進(jìn)行語音命令轉(zhuǎn)換器的設(shè)計(jì)。

該設(shè)備實(shí)現(xiàn)中文自然語音命令的識別,并轉(zhuǎn)換成相應(yīng)的設(shè)備控制指定報(bào)文。輸入為中文語音命令,內(nèi)部進(jìn)行識別、語義翻譯及存儲結(jié)果,同時(shí)可以實(shí)現(xiàn)語音命令翻譯為設(shè)備控制報(bào)文。

1系統(tǒng)國內(nèi)外現(xiàn)狀

圍繞著語音識別翻譯,國內(nèi)外有很多圍繞互聯(lián)網(wǎng)開發(fā)的相應(yīng)軟硬件系統(tǒng)。

1.1國外現(xiàn)狀

在國外有Nuance、Google、Apple、MSRA語音等公司進(jìn)行語音識別的開發(fā),還有多款開源軟件,如HTK、Kaldi、Speech等。

①HTK[1]:一款語音識別工具包,源碼可免費(fèi)獲取。識別流程:語音文件---》HMM---》文件信息;訓(xùn)練流程:訓(xùn)練語音文件---》HTK---》HMM。

②Kaldi[2]:一款非常強(qiáng)大的語音識別工具庫,主要由Daniel Povey開發(fā)與維護(hù),目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多種語音識別模型的訓(xùn)練與預(yù)測。其中DNN-HMM中的神經(jīng)網(wǎng)絡(luò)還有配置文件自定義,DNN、CNN、TDNN、LSTM及Bidirectional-LSTM等神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)均可支持。

③Speech工具庫:使用Python3依賴Speech模塊,弊端是離線版開發(fā)難度大。

1.2國內(nèi)現(xiàn)狀

國內(nèi)開發(fā)類似軟件的公司有科大訊飛、云知聲及百度語音等,其中科大訊飛的多款產(chǎn)品應(yīng)用廣泛,如訊飛翻譯機(jī)2.0、訊飛輸入法、訊飛聽見、阿法爾蛋及叮咚音樂盒,還有支持開發(fā)的語音引擎。

2方案設(shè)計(jì)

2.1總體設(shè)計(jì)

語音命令轉(zhuǎn)換器采用獨(dú)立的系統(tǒng)設(shè)計(jì)[1-2],輸入接口為語音,輸出可以是串口、網(wǎng)口或者其他類型接口。為了保證語音采集的清晰可靠,采集設(shè)備可以采用高性能的降噪麥克風(fēng)或麥克風(fēng)陣列,通過音頻接口輸入計(jì)算機(jī)。命令的報(bào)文輸出可以根據(jù)具體的操作設(shè)備輸入不同而采用不同的接口,例如有UART、CAN及以太網(wǎng)等[3-4]。

為了提高識別準(zhǔn)確度,命令需要按照預(yù)定義的格式提前在系統(tǒng)中存儲。當(dāng)語音命令轉(zhuǎn)換器收到語音指令后,會根據(jù)在系統(tǒng)中預(yù)置的命令去匹配目標(biāo)設(shè)備和具體的操作指令[5]。

例如:系統(tǒng)提前預(yù)定義命令如下:

:(開機(jī))

猜你喜歡
降噪語音識別數(shù)據(jù)庫
數(shù)據(jù)庫
通話中的語音識別技術(shù)
語音信號的降噪研究
仿生耦合風(fēng)機(jī)葉片模型降噪與增效分析
空調(diào)噪音的來源、診斷和降噪研究
面向移動終端的語音簽到系統(tǒng)
水下結(jié)構(gòu)覆蓋粘彈性材料的降噪復(fù)矢徑法分析
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
正定县| 长沙县| 宝鸡市| 吴堡县| 平舆县| 西乌珠穆沁旗| 托克托县| 徐闻县| 额尔古纳市| 佛坪县| 厦门市| 越西县| 淳化县| 武强县| 界首市| 临清市| 铁岭市| 正定县| 五家渠市| 鄂托克旗| 闻喜县| 天气| 麻栗坡县| 南丰县| 沙河市| 绥江县| 桑植县| 满城县| 宾阳县| 抚远县| 临沧市| 呼玛县| 温宿县| 新干县| 巴青县| 抚松县| 桦川县| 修水县| 通河县| 河间市| 化隆|