国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

PSO-BP神經網絡在語音干擾效果評估中的應用

2019-04-04 03:17許亮趙松波高強莫家慶呂小毅郭翔
現代電子技術 2019年6期
關鍵詞:粒子群優(yōu)化算法干擾BP神經網絡

許亮 趙松波 高強 莫家慶 呂小毅 郭翔

關鍵詞: 干擾; BP神經網絡; 粒子群優(yōu)化算法; Mel倒譜; 特征參數; 主觀MOS

中圖分類號: TN912?34 ? ? ? ? ? ? ? ? ? ? 文獻標識碼: A ? ? ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2019)06?0043?04

Abstract: An objective speech interference effect evaluation method which uses the particle swarm optimization (PSO) algorithm to optimize the BP neural network is proposed, so as to overcome the shortcomings during the process of using the back propagation (BP) neural network to evaluate continuous speech data interference effects. In the method, the continuous speech data feature parameters obtained and extracted by using the Mel cepstrum technology are taken as the input of the model. The multi?point optimization is conducted for the initial weight coefficient of the BP neural network by means of the PSO, so as to construct the BP neural network model based on PSO algorithm optimization. The nonlinear mapping from the input values to the corresponding mean opinion scores of subjective evaluation is implemented by using the optimized BP neural network model. A verification for effectiveness of the method was conducted by using the selected representative speech data. The results show that, in comparison with the traditional BP neural network, the BP neural network model based on PSO algorithm optimization has a big improvement in the convergence speed, its convergence error can be effectively controlled within 4%, and the correlation coefficients and standard deviations of the model are closer to the ideal parameters.

Keywords: interference; BP neural network; PSO algorithm; Mel cepstrum; feature parameter; subjective MOS

伴隨著通信技術的發(fā)展及生活標準的提高,基于輸出的客觀語音干擾效果評估已經成為干擾效果評估研究中的重要內容,在實際的通信系統具有不可或缺的意義[1]。如現代軍事領域、遙感通信傳輸領域等在較難甚至不能獲取原始語音的狀況下,要實現語音質量的客觀評價,則必須采用基于輸出的客觀語音干擾效果評估系統進行評估操作[2]。同時對命令的傳遞和執(zhí)行、通信設備的研制,以及語音信號增強、語音信號自動快速識別、語音自動客觀評分等領域中都具有重要的應用前景[3]。

目前,國內外研究學者在語音干擾效果評估領域中提出眾多譜失真測度。其中,Mel倒譜失真測度充分且更真實地反映了人耳對語音重要特征參量的非線性感知特性,并形象地模擬了人耳聽到復雜聲音時所表現的頻率分析和譜合成特性[4]。同時,Mel倒譜失真測度作為一種彎折頻率譜失真測度,以計算量少、運行速度快的優(yōu)點受到了廣泛的關注,在語音干擾下效果客觀評價和語音識別等方面取得了大量的工程應用,并獲取了顯著的成績[5?6]。本文采用Mel倒譜對連續(xù)語音信號進行特征參數提取。

BP神經網具有強大的自組織性、協同性、容錯性和聯想記憶性的優(yōu)勢,是目前人工智能領域中研究最多、應用范圍最廣的一種神經網絡。該網絡依據大腦結構為原理,可以實現處理數據間的并行分析,進而組建成了一種新的信息處理系統。在實際工程中,BP神經網絡存在易陷入局部最優(yōu)、學習效率較低、搜索時間長、速度慢、網絡泛化及適應能力較差等問題。文獻[7?8]提出粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法,該算法以群體全局尋優(yōu)為基礎,對種群進行歷次迭代搜索,依據追蹤鳥群捕食的路徑,分析和研究后提出一種有效的尋優(yōu)算法,該算法具有易于實現、結構簡單、收斂速度快等特點。目前已廣泛應用于模式識別、函數優(yōu)化、數據挖掘及神經網絡等許多領域,具有良好的應用前景。本文利用PSO優(yōu)化的BP神經網絡模型,由一些簡單且高度互聯的處理元素來實現語音信號特征參數到主觀評價平均意見得分(MOS)的映射,完成基于輸出的客觀音質快速精準的評估。

1 ?基于Mel倒譜的特征參數提取

Mel倒譜失真測度基于語音信號頻域分析原理而建立,在一定程度上模擬了人耳的聽覺系統特征,從而實現了對語音干擾前后語音頻率及幅度的模擬評價。并依據感知實驗結果,通過非線性彎折,將信號頻率映射到新的頻率尺度空間,在新尺度空間下提取一系列典型的語音特征參數。Mel頻率尺度可以很精準地模擬聽覺系統對音量的敏感程度及與聲頻之間的關系。Mel倒譜系數表示法則是一種基于短時傅里葉變換的譜包絡參數表示方法。Mel倒譜與其他倒譜相比,運算量較小,易于實現,不依賴于全局點語音產生模型,在噪聲干擾條件下具有較強的穩(wěn)定性,使得其在語音信號分析中取得更加廣泛的應用[6]。對連續(xù)語音信號進行特征參數提取的步驟如下。

1) 預處理:由于聲門激勵和口鼻輻射的影響,且語音信號是非平穩(wěn)信號,因此需對語音信號s(n)進行預處理,預處理包括預加重、分幀和加窗兩部分操作。預加重前信號是s(n),預加重后信號為[sn]。本文選取8 000 Hz進行采樣,一幀為25 ms,故一幀的采樣點數為200個;采用Hamming窗作為窗函數進行窗截取。

2) FFT變換:FFT變換之前,對每一幀語音序列[P(n)]補56個0,然后進行256點FFT變換,再取模平方進行短時功率譜[P(f)]的計算。

3) 頻率彎折和濾波:頻率彎折過程中,利用線性頻率彎折的方法處理1 000 Hz以下的頻率,利用對數頻率彎折處理1 000 Hz以上的頻率。Mel頻率與線性頻率的非線性映射為:[mel=1 000 log2(1+f1 000)]。其中,[mel]表示Mel頻率;[f]表示線性頻率。彎折處理之后,使[P(f)]通過Mel測度三角帶通濾波器組,計算可得該序列通過每個數字濾波器的能量加權和[Ak]。

通過語音數據測試實驗結果可得,在同一個干擾效果客觀評估系統之中,對多組不同的語音文件進行客觀評價時,PSO?BP網絡模型誤差明顯低于BP網絡模型,且PSO?BP模型的各項性能指標也均優(yōu)于BP模型。由此可得,PSO?BP神經網絡評估模型在BP神經網絡評估模型的基礎上,對BP神經網絡的初始權系(權值和閾值)進行優(yōu)化,降低了模型的評估誤差,提高了模型的可靠性,并進一步提升了BP神經網絡評估模型的精確度。

5 ?結 ?語

本文利用Mel倒譜對不同失真條件下的語音文件進行MFCC特征參數提取,采用PSO算法對BP神經網絡的初始權值和閾值進行優(yōu)化,利用優(yōu)化后PSO?BP神經網絡模型對不同語音文件進行干擾效果客觀評估,形成一個新的語音干擾效果評估模型,也為語音干擾效果客觀評估確立了一個新的快速評估標準??陀^評估結果與主觀評估結果相關聯,與失真干擾的變化規(guī)律一致,能有較真實且精確地反映不同失真條件人的主觀感覺[13]。最終可以通過PSO?BP模型的客觀評估結果來快速精確預測或者代替主觀評估結果,對主觀判斷者起到較好的輔助作用,且減小了干擾環(huán)境下主觀評估的不確定性,具有較好的應用前景。

注:本文通訊作者為呂小毅。

參考文獻

[1] 張偉偉.通信系統中語音質量評價的研究[D].北京:北京郵電大學,2014.

ZHANG Weiwei. The research on speech quality assessment in communication system [D]. Beijing: Beijing University of Posts and Telecommunications, 2014.

[2] 譚曉衡,許可,秦基偉.基于聽覺感知特性的語音質量客觀評價方法[J].西南交通大學學報,2013,48(4):756?760.

TAN Xiaoheng, XU Ke, QIN Jiwei. Objective evaluation method of speech quality based on auditory perceptual properties [J]. Journal of Southwest Jiaotong University, 2013, 48(4): 756?760.

[3] 郝佳,彭沛沛.BP神經網絡在語音干擾評估系統中的應用研究[J].信息通信,2016(4):6?7.

HAO Jia, PENG Peipei. Application of BP neural network in speech interference assessment system [J]. Information & communications, 2016(4): 6?7.

[4] 袁飛,陳煒玲,李曄,等.水聲語音通信體驗質量的實時測量方法[J].數據采集與處理,2016,31(2):307?314.

YUAN Fei, CHEN Weiling, LI Ye, et al. Real?time measurement for experience quality of underwater acoustic voice communication [J]. Journal of data acquisition & processing, 2016, 31(2): 307?314.

[5] 尚永強,殷未來,姜雙雙,等.基于相位調制特征的語音活動檢測[J].吉林大學學報(信息科學版),2016,34(1):29?33.

SHANG Yongqiang, YIN Weilai, JIANG Shuangshuang, et al. Voice activity detection based on phase modulation feature [J]. Journal of Jilin University (Information science edition), 2016, 34(1): 29?33.

[6] 鄧瑞,肖純智,高勇.基于MFCC相似度和譜熵的端點檢測算法[J].現代電子技術,2013,36(21):67?69.

(上接第46頁)

DENG Rui, XIAO Chunzhi, GAO Yong. Endpoint detection algorithm based on MFCC similarity and spectrum entropy [J]. Modern electronics technique, 2013, 36(21): 67?69.

[7] EBERHART R C, KENNEDY J. A new optimizer using particle swarm theory [C]// Proceedings of the Sixth International Symposium on Micro Machine and Human Science. Nagoya: IEEE, 1995: 39?43.

[8] EBERHART R C, KENNEDY J. Particle swarm optimization [C]// Proceedings of IEEE International Conference on Neural Networks. Perth: IEEE, 1995: 1942?1948.

[9] KENNEDY J, EBERHART R C, SHI Y. Swarm intelligence [M]. San Francisco: Morgan Kaufman Publishers, 2001: 20?28.

[10] 楊遵,雷虎民.采用粒子群優(yōu)化算法規(guī)劃無人機偵察航路[J].電光與控制,2007,14(2):4?7.

YANG Zun, LEI Humin. Particle swarm optimization based path planning for reconnaissance of unmanned air vehicles [J]. Electronics optic & control, 2007, 14(2): 4?7.

[11] 中華人民共和國信息產業(yè)部.軍用通信系統音質的MOS評價法:SJ/T20771?2000[S].北京:中國標準出版社,2000.

Ministry of Industry and Information Technology of the People′s Republic of China. MOS method of speech quality assessment for military communication systems: SJ/T20771?2000 [S]. Beijing: Standards Press of China, 2000.

[12] 佚名.MOS測試語音材料表(配套應用標準):SJ6607?2000[S].北京:中國標準出版社,2000.

Anon. Speech material table of MOS test (matched application standard): SJ6607?2000 [S]. Beijing: Standards Press of China, 2000.

[13] 張毅,謝延義,羅元,等.一種語音特征提取中Mel倒譜系數的后處理算法[J].智能系統學報,2016,11(2):208?215.

ZHANG Yi, XIE Yanyi, LUO Yuan, et al. Postprocessing method of MFCC in speech feature extraction [J]. CAAI transactions on intelligent systems, 2016, 11(2): 208?215.

猜你喜歡
粒子群優(yōu)化算法干擾BP神經網絡
基于自適應線程束的GPU并行粒子群優(yōu)化算法
基于混合粒子群算法的供熱管網優(yōu)化設計
基于改進支持向量機的船舶縱搖預報模型
科學處置調頻廣播信號對民航通信干擾實例
復雜背景下的手勢識別方法
BP神經網絡在軟件質量評價中的應用研究 
BP神經網絡算法在數值預報產品釋用中的應用
隆安县| 富川| 乐陵市| 惠来县| 永定县| 星座| 陆丰市| 竹溪县| 澄城县| 奉贤区| 淮阳县| 佛教| 北票市| 宣城市| 东方市| 札达县| 永德县| 玉龙| 绥德县| 增城市| 阳谷县| 德州市| 扎兰屯市| 河曲县| 浮山县| 紫阳县| 淮北市| 皋兰县| 牡丹江市| 天水市| 三亚市| 家居| 海门市| 黔江区| 时尚| 涞源县| 七台河市| 林甸县| 横峰县| 哈尔滨市| 乌审旗|