錢(qián)甜
摘 要:主要對(duì)聲紋特征在音樂(lè)識(shí)別方法中的應(yīng)用進(jìn)行了研究,對(duì)音樂(lè)語(yǔ)音信號(hào)采用聲紋特征提取方法完成分析和識(shí)別過(guò)程。在完成原始音頻數(shù)據(jù)處理的基礎(chǔ)上,通過(guò)信號(hào)重組和特征分解進(jìn)一步處理提取出的音樂(lè)語(yǔ)音數(shù)據(jù),然后將音樂(lè)語(yǔ)音信號(hào)通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解方法的使用完成時(shí)頻轉(zhuǎn)換過(guò)程,再對(duì)語(yǔ)音信號(hào)經(jīng)過(guò)降噪分離實(shí)現(xiàn)信息提純和特征分解,將處理后的語(yǔ)音信號(hào)的聲紋特征提取出來(lái),并以提取結(jié)果為依據(jù)完成音樂(lè)的識(shí)別過(guò)程。仿真實(shí)驗(yàn)結(jié)果表明本文方法顯著提高了識(shí)別過(guò)程的分辨力和準(zhǔn)確性,具有一定的可行性。
關(guān)鍵詞: 聲紋特征; 音樂(lè)信號(hào)識(shí)別方法; 實(shí)現(xiàn)路徑
中圖分類(lèi)號(hào): G 642
文獻(xiàn)標(biāo)志碼: A
Abstract: This paper mainly studies the application of voiceprint features in music recognition methods, and uses voiceprint feature extraction method to complete the analysis and recognition process of music speech signals based on the completion of original audio data processing, through signal recombination and features. It decomposes and processes the extracted music voice data, and then completes the time-frequency conversion process by using the empirical voice decomposition method, andperforms noise purification and feature decomposition on the voice signal through noise reduction, and processes the processed voice signal. The voiceprint feature is extracted, and the music recognition process is completed based on the extraction result. The simulation results show that the proposed method significantly improves the resolution and accuracy of the recognition process and has certain feasibility.
Key words: voiceprint feature; music signal recognition method; implementation path
0 引言
快速發(fā)展的互聯(lián)網(wǎng)和計(jì)算機(jī)多媒體技術(shù)得以在各領(lǐng)域普遍應(yīng)用,不斷發(fā)展和完善的互聯(lián)網(wǎng)和數(shù)字音頻技術(shù)為傳播及獲取音樂(lè)拓寬了途徑,促使網(wǎng)絡(luò)上的音樂(lè)數(shù)量不斷增長(zhǎng),隨著使用網(wǎng)絡(luò)音樂(lè)應(yīng)用的用戶(hù)數(shù)量不斷增加,對(duì)音樂(lè)信息需求也呈多樣化發(fā)展。因此如何有效管理海量音樂(lè)數(shù)據(jù)已成為目前研究的重點(diǎn),音樂(lè)信息檢索在此背景下逐漸發(fā)展起來(lái),管理音樂(lè)數(shù)據(jù)的基礎(chǔ)和關(guān)鍵在于音樂(lè)信息檢索,即將各種不同信息從音樂(lè)中有效識(shí)別和提取出來(lái),
目前的研究方向主要集中在對(duì)音樂(lè)流派、樂(lè)器分類(lèi)等進(jìn)行有效的識(shí)別分類(lèi)上,研究中國(guó)傳統(tǒng)樂(lè)器具有較高的研究?jī)r(jià)值,目前在音樂(lè)信息檢索領(lǐng)域中,音樂(lè)識(shí)別方法中的識(shí)別分類(lèi)系統(tǒng)大多需先對(duì)音樂(lè)特征進(jìn)行人工提取,在此基礎(chǔ)上通過(guò)分類(lèi)器進(jìn)行訓(xùn)練建模后,以該模型為依據(jù)完成對(duì)音樂(lè)樣本的識(shí)別分類(lèi)過(guò)程。但由于識(shí)別分類(lèi)任務(wù)種類(lèi)會(huì)直接影響所需音樂(lè)特征,極大的增加了人工提取音樂(lè)特征的難度,導(dǎo)致人工提取音樂(lè)特征已經(jīng)難以滿足音樂(lè)數(shù)據(jù)的檢索和管理需求。
1 需求分析
為使音樂(lè)的鑒賞水平和制作質(zhì)量得以有效提高,在鑒賞和制作音樂(lè)的過(guò)程中,準(zhǔn)確的圖譜分析是處理音樂(lè)發(fā)音信號(hào)的重要環(huán)節(jié),在此基礎(chǔ)上實(shí)現(xiàn)音樂(lè)的準(zhǔn)確識(shí)別??焖侔l(fā)展的計(jì)算機(jī)信息處理技術(shù)促使數(shù)字信號(hào)處理方法不斷完善,在音樂(lè)識(shí)別中結(jié)合應(yīng)用數(shù)字信號(hào)處理及語(yǔ)音信號(hào)分析等方法有效彌補(bǔ)了人工提取音樂(lè)特征的不足,表現(xiàn)出了較佳的性能,需在完成音樂(lè)發(fā)音信號(hào)的聲樂(lè)圖譜特征提取的基礎(chǔ)上,完成音樂(lè)圖譜的分析和繪制(通過(guò)使用聲紋特征分析方法),然后對(duì)音樂(lè)信號(hào)的特征進(jìn)行分解(以圖譜分析結(jié)果為依據(jù))同時(shí)完成自適應(yīng)分離過(guò)程,從而有效提高識(shí)別音樂(lè)的準(zhǔn)確性和音樂(lè)鑒賞能力。隨著聲紋特征提取方法的發(fā)展和完善,為研究音樂(lè)語(yǔ)音信號(hào)的領(lǐng)域(包括優(yōu)化發(fā)音質(zhì)量及提高音樂(lè)鑒賞水平等)提供了有效支撐,在高效的音樂(lè)識(shí)別過(guò)程表現(xiàn)出了較大的優(yōu)勢(shì)。采用LORFA 譜、高階譜等特征提取方法是傳統(tǒng)提取音樂(lè)信號(hào)特征的主要方法,并在音樂(lè)識(shí)別過(guò)程中有效融合盲源濾波及信號(hào)分離(自適應(yīng))方法,雖已具備一定的識(shí)別水平,但已經(jīng)難以滿足識(shí)別合成成分不斷增多的音樂(lè)信號(hào)對(duì)準(zhǔn)確性的需求[1]。本文在分析和識(shí)別音樂(lè)語(yǔ)音信號(hào)上采用了基于聲紋特征提取的方法,完成原始音頻數(shù)據(jù)初步處理和提取后,重組音樂(lè)語(yǔ)音信號(hào)數(shù)據(jù),在此基礎(chǔ)上進(jìn)行特征分解和降噪分離(采用自適應(yīng)濾波方法),實(shí)現(xiàn)信息提純和特征分解過(guò)程,最后將處理后的信號(hào)聲紋特征提取出來(lái),據(jù)此完成音樂(lè)識(shí)別。
2 原始音頻數(shù)據(jù)處理
原始音頻數(shù)據(jù)處理流程,如圖1所示。
3 音樂(lè)發(fā)音信號(hào)采集及預(yù)處理
3.1 信號(hào)建模
針對(duì)音樂(lè)發(fā)音信號(hào)本文通過(guò)信號(hào)處理方法的使用完成提取特征及識(shí)別信息的過(guò)程,為實(shí)現(xiàn)識(shí)別過(guò)程的可視化構(gòu)建,需先完成音樂(lè)發(fā)音信號(hào)模型的構(gòu)建,在此基礎(chǔ)上對(duì)發(fā)音的聲紋圖譜進(jìn)行提取,語(yǔ)音識(shí)別和圖譜對(duì)比則采用MFCC(梅爾頻率倒譜系數(shù))感知方法完成。對(duì)音樂(lè)發(fā)音特征進(jìn)行分解時(shí)(包括時(shí)頻分解和聲紋特征分解)則通過(guò)使用雙層濾波檢測(cè)方法完成,本文所構(gòu)建的聲紋特征提取的總體架構(gòu)(包含采集音樂(lè)信號(hào)[2]),如圖2所示。
以 M 為信號(hào)頻率點(diǎn)數(shù)根據(jù)時(shí)間間隔 n完成特征采樣及聲紋特征(指對(duì)信號(hào)輸出頻譜端)的提取,最終實(shí)現(xiàn)音樂(lè)識(shí)別過(guò)程。
4 仿真實(shí)驗(yàn)與結(jié)果分析
為了檢測(cè)本文基于聲紋特征提取的音樂(lè)識(shí)別方法的可行性,在采用 Matlab中完成了仿真實(shí)驗(yàn)設(shè)計(jì),仿真參量設(shè)定為:采集音樂(lè)信號(hào)樣本的頻率為 12 kHz,小波分解的尺度系數(shù)為 0.12,初始采樣頻率(由f0 表示,針對(duì)載波頻率為 25 kHz的聲紋特征)為1.5 Hz,聲頻帶分布帶寬為 15 ms,據(jù)此獲取的原始信號(hào)建模結(jié)果見(jiàn)圖4 ,測(cè)試樣本為圖 4 的音樂(lè)語(yǔ)音信號(hào),通過(guò)降噪分離完成信息提純和特征分解過(guò)程,所獲取的聲紋特征提取結(jié)果能準(zhǔn)確反映出音樂(lè)相關(guān)信息(包括聲頻帶和聲調(diào)等),實(shí)現(xiàn)音樂(lè)的準(zhǔn)確辨識(shí),本文方法音樂(lè)識(shí)別效果同傳統(tǒng)模糊匹配濾波檢測(cè)方法間的對(duì)比結(jié)果,如圖5所示。
相比傳統(tǒng)方法本文方法具備更高的音樂(lè)識(shí)別準(zhǔn)確度及抗干擾能力,為提高音樂(lè)語(yǔ)音識(shí)別能力提供參考[9]。
5 總結(jié)
隨著音樂(lè)信息檢索重要性的日益凸顯,有效音樂(lè)識(shí)別方法的構(gòu)建逐漸成為研究重點(diǎn)之一,針對(duì)收集到的音樂(lè)發(fā)音信號(hào)將其聲樂(lè)圖譜特征提取出來(lái),根據(jù)特征分析結(jié)果(運(yùn)用聲紋特征分析法)完成音樂(lè)圖譜的繪制,在此基礎(chǔ)上完成音樂(lè)信號(hào)的自適應(yīng)分離和識(shí)別過(guò)程,欣賞和評(píng)價(jià)音樂(lè)水平的提高需以音樂(lè)識(shí)別為基礎(chǔ),為使識(shí)別和分辨音樂(lè)發(fā)音的能力得以有效提高,進(jìn)而提高識(shí)別音樂(lè)能力,本文采用聲紋特征提取方法完成分析和識(shí)別過(guò)程,以從經(jīng)提純處理后的語(yǔ)音信號(hào)提取出的聲紋特征結(jié)果為依據(jù)完成音樂(lè)識(shí)別過(guò)程。仿真實(shí)驗(yàn)結(jié)果表明使用基于聲紋特征的識(shí)別方法有效提升了提取語(yǔ)音特征的準(zhǔn)確性及降噪能力,顯著提高了音樂(lè)識(shí)別及分辨能力,具有較高的實(shí)際應(yīng)用價(jià)值。
參考文獻(xiàn)
[1]
陳雯雯,王亞林,周杰. 三維統(tǒng)計(jì)信道中的多普勒效應(yīng)及其信號(hào)分析[J]. 計(jì)算機(jī)科學(xué), 2017(3):84-88.
[2] 周婧范凌云.基于最小二乘支持向量機(jī)的電子音樂(lè)識(shí)別研究[J].現(xiàn)代電子技術(shù),2018(9):109-112.
[3] 李戰(zhàn)明,尚豐.一種基于語(yǔ)音端點(diǎn)檢測(cè)的維納濾波語(yǔ)音增強(qiáng)算法[J]. 電子設(shè)計(jì)工程,2016(2):42-45.
[4] Huiyan Hao. Multi component LFM signal detection and parameter estimation based on EEMD-FRFT[J] . Optik -?International Journal for Light and Elect., 2016 (23):6093-6096.
[5] You He, Cai-sheng Zhang, Xiao-ming Tang, et al. Coherent integration loss due to pulses loss and phase modulation in passive bistatic radar[J]. Digital Signal Processing, 2013 (4):1265-1276.
[6] Jian Dai,Li-Juan Xu, Guo-Dong Han, et al. Down-regulation of long non-coding RNA ITGB2-AS1 inhibits osteosarcoma proliferation and metastasis by repressing Wnt/β-catenin signalling and predicts favourable prognosis[J]. Artificial Cells, Nanomedicine, and Biotechnology, 2018(S3):783-790.
[7] 馬婷婷,佟首峰,南航,等. 信號(hào)光偏振特性對(duì)空間相干探測(cè)混頻效率的影響[J]. 激光與光電子學(xué)進(jìn)展, 2017(2):110-116.
[8] 田旺蘭.語(yǔ)音/音樂(lè)的深度置信網(wǎng)絡(luò)高準(zhǔn)確度識(shí)別方法[J].吉首大學(xué)學(xué)報(bào)(自然科學(xué)版),2017(1):36-39.
[9] 姚成玉,陳東寧,王斌. 基于T-S故障樹(shù)和貝葉斯網(wǎng)絡(luò)的模糊可靠性評(píng)估方法[J]. 機(jī)械工程學(xué)報(bào), 2018(2):193-201.
(收稿日期: 2019.08.29)