趙亮
摘 要: 針對傳統(tǒng)模型無法準(zhǔn)確實(shí)現(xiàn)電子音樂分類和識別的難題,提出改進(jìn)極限學(xué)習(xí)機(jī)的電子音樂分類模型。首先對電子音樂數(shù)據(jù)進(jìn)行采集,并提取其倒譜系數(shù)特征,并采用核主成分分析對特征進(jìn)行篩選;然后采用遺傳算法對極限學(xué)習(xí)機(jī)的參數(shù)進(jìn)行選擇,并用于構(gòu)建電子音樂的分類器;最后采用多種類型的電子音樂進(jìn)行仿真實(shí)驗(yàn),改進(jìn)極限學(xué)習(xí)機(jī)的電子音樂平均分類率達(dá)到了95%以上,電子音樂的錯分率要遠(yuǎn)遠(yuǎn)低于當(dāng)前其他電子音樂分類模型。實(shí)驗(yàn)結(jié)果驗(yàn)證了該電子音樂分類模型的可行性以及優(yōu)越性。
關(guān)鍵詞: 音樂分類; 核主成分分析; 極限學(xué)習(xí)機(jī); 音樂特征; 遺傳算法
中圖分類號: TN912.3?34; TP391 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)05?0155?04
Abstract: It is difficult to class and recognize the electronic music with the traditional model accurately, a new electronic music classification model based on improved extreme learning machine is proposed. The electronic music data is collected to extract the feature of the cepstrum coefficient. The kernel principal component analysis is used to screen the feature. The genetic algorithm is used to select the parameters of the extreme learning machine to construct the classifier of the electronic music. The polytype electronic music is adopted to carry out the simulation experiments. The average classification rate of the electronic music can reach up to 95% with the improved extreme learning machine, and the wrong classification rate of the electronic music is far lower than that of other electronic music classification models. The feasibility and superiority of the electronic music classification model were verified with the experimental results.
Keywords: music classification; kernel principal component analysis; extreme learning machine; music characteristic; genetic algorithm
0 引 言
隨著信息技術(shù)的不斷發(fā)展,與音樂的結(jié)合更加緊密,出現(xiàn)了許多種類的電子音樂,電子音樂可以減輕人們生活、工作上的壓力,然而每一個(gè)用戶喜歡的電子音樂類型不同,如何從海量的電子音樂庫準(zhǔn)確找到用戶喜歡的音樂十分重要[1]。電子音樂分類是提高電子音樂查詢效率的關(guān)鍵,成為人們關(guān)注的焦點(diǎn)[2]。
電子音樂分類研究可以劃分為兩個(gè)階段:傳統(tǒng)階段和現(xiàn)代階段,傳統(tǒng)階段是一種人工分類方式,通過一些專家和專業(yè)人員對電子音樂進(jìn)行分析,將它們劃分到相應(yīng)的類別中[3]。當(dāng)電子音樂的數(shù)據(jù)很小時(shí),傳統(tǒng)分類方法的分類準(zhǔn)確率高,可以很好地對分類結(jié)果進(jìn)行解釋。隨著音樂數(shù)據(jù)的不斷增加,傳統(tǒng)方法的缺陷逐漸體現(xiàn)出來,出現(xiàn)了誤分率高,分類效率低等不足[4]。現(xiàn)代階段主要通過計(jì)算機(jī)實(shí)現(xiàn)電子音樂的自動分類[5]。電子音樂自動分類屬于一種模式識別問題,它首先要提取反映電子音樂的特征信息,然而原始特征數(shù)量相當(dāng)龐大,直接根據(jù)原始特征信息進(jìn)行電子音樂自動分類的時(shí)間長、效率低,為此通常對電子音樂的原始特征進(jìn)行篩選,當(dāng)前采用主成分分析對特征進(jìn)行處理,降低特征的數(shù)量,加快電子音樂自動分類的速度[6]。主成分分析屬于線性處理方法,不能有效提取描述電子音樂標(biāo)簽的非線性信息[7]。核主成分分析是一種改進(jìn)的主成分分析方法,通過引入核函數(shù)提取非線性信息,獲得了比主成分分析更優(yōu)的特征[8]。電子音樂自動識別也需要設(shè)計(jì)電子音樂分類器,當(dāng)前主要有隱馬爾可夫模型、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)[9?11],然而這些方法均存在一些不足,如隱馬爾可夫模型只能進(jìn)行線性分類,電子音樂分類的結(jié)果不可靠;人工神經(jīng)網(wǎng)絡(luò)雖然能夠?qū)﹄娮右魳愤M(jìn)行非線性分類,但要求電子樣本數(shù)據(jù)充足,一旦不能滿足樣本充足這個(gè)條件,電子音樂分類效果急劇下降;支持向量機(jī)雖然沒有神經(jīng)網(wǎng)絡(luò)對樣本數(shù)據(jù)的要求,但學(xué)習(xí)過程繁鎖,時(shí)間復(fù)雜度高,不能滿足海量電子音樂分類的速度要求[12]。
針對傳統(tǒng)模型在電子音樂分類過程中存在的不足,提出了改進(jìn)極限學(xué)習(xí)機(jī)的電子音樂分類模型。首先提取電子音樂的倒譜系數(shù)特征,采用核主成分分析選擇電子音樂的特征,然后改進(jìn)極限學(xué)習(xí)機(jī)構(gòu)建電子音樂的分類器,最后仿真實(shí)驗(yàn)結(jié)果表明,改進(jìn)極限學(xué)習(xí)機(jī)提高了電子音樂的平均分類率,電子音樂分類性能優(yōu)于其他模型。
1 改進(jìn)極限學(xué)習(xí)機(jī)的電子音樂分類模型
1.1 提取電子音樂的特征
當(dāng)前電子音樂有很多種特征來描述其類型,而電子音樂實(shí)際是一種聲音,Mel倒譜系數(shù)可以描述聲音頻率的能量變化,提取特征速度很快,為此本文選擇Mel倒譜系數(shù)作為電子音樂分類的特征,具體步驟如下:
(1) 對采集的電子音樂數(shù)據(jù)進(jìn)行分幀處理,去除無效幀。
(2) 采用傅里葉變換對電子音樂的幀信號進(jìn)行處理,得到它們的幅度頻譜。
(3) 通過幅度頻譜的Mel尺度變換,并采用濾波器組對頻譜進(jìn)行濾波處理,得到第[j]個(gè)濾波器的能量值為:
1.3 改進(jìn)極限學(xué)習(xí)機(jī)
為了解決傳統(tǒng)神經(jīng)網(wǎng)絡(luò)收斂速度慢,易產(chǎn)生過擬合、網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜的缺陷,Huang等提出了極限學(xué)習(xí)機(jī),只要簡單的隨機(jī)設(shè)置權(quán)值和閾值,而且只要確定隱含層的節(jié)點(diǎn)數(shù),便可以順利完成訓(xùn)練過程,得到求解問題的最優(yōu)解[13]。設(shè)隱含層的節(jié)點(diǎn)數(shù)為[L,]那么極限學(xué)習(xí)機(jī)的輸出函數(shù)為:
在極限學(xué)習(xí)機(jī)的工作過程中,參數(shù)[ai,bi]直接影響其學(xué)習(xí)性能,為了解決該問題,本文采用遺傳算法確定極限學(xué)習(xí)機(jī)的參數(shù),具體如圖1所示。
1.4 改進(jìn)極限學(xué)習(xí)機(jī)的電子音樂分類步驟
(1) 收集電子音樂樣本數(shù)據(jù),組成電子音樂數(shù)據(jù)庫。
(2) 提取電子音樂數(shù)據(jù)庫的特征,它們組成特征向量庫。
(3) 對電子音樂數(shù)據(jù)庫中的特征進(jìn)行歸一化處理。
(4) 采用核主成分分析選擇電子音樂數(shù)據(jù)庫的特征,組成最優(yōu)特征子集。
(5) 根據(jù)最優(yōu)特征子集對訓(xùn)練樣本和測試樣本進(jìn)行降維處理,減少數(shù)據(jù)的規(guī)模。
(6) 將訓(xùn)練樣本輸入到極限學(xué)習(xí)機(jī)中進(jìn)行學(xué)習(xí),采用遺傳算法確定最優(yōu)極限學(xué)習(xí)機(jī)參數(shù)。
(7) 根據(jù)最優(yōu)參數(shù),極限學(xué)習(xí)建立電子音樂分類模型。
(8) 采用電子音樂的測試數(shù)據(jù)對電子音樂分類模型的性能進(jìn)行測試與分析。
2 電子音樂分類的性能測試
2.1 電子音樂數(shù)據(jù)的來源
為了分析改進(jìn)極限學(xué)習(xí)機(jī)的電子音樂分類效果,選擇大量數(shù)據(jù)進(jìn)行仿真測試,該數(shù)據(jù)可分為4種類型的電子音樂,它們分別為:古箏、琵琶、笛子、箜篌,它們的樣本數(shù)量分布如表1所示。為了使IELM的電子音樂分類效果具有可比性,設(shè)計(jì)了2種對比模型,具體描述如下:
(1) 主成分分析+ELM的電子音樂分類模型(PCA?ELM)。
(2) 核主成分分析+支持向量機(jī)的電子音樂分類模型(KPCA?SVM)。
2.2 結(jié)果與分析
每一種模型運(yùn)行10次,計(jì)算它們的平均值,KPCA?ELM與對比模型的電子音樂分類正確率、錯誤分類率與平均訓(xùn)練時(shí)間(單位:s)如圖2~圖4所示。
對圖2~圖4進(jìn)行分析可知:
(1) 相對于PCA?ELM,KPCA?ELM的電子音樂分類率得到了提高,而且錯誤分類率更小,這是因?yàn)镵PCA可以提取比PCA更好的非線性特征,使得特征可以更加準(zhǔn)確地反映電子音樂的類型。
(2) 相對于KPCA?SVM,KPCA?ELM的電子音樂分類率同樣得到了改善,有效降低了電子音樂的錯誤分類率,這是因?yàn)镋LM集成了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的優(yōu)點(diǎn),建立了性能更優(yōu)的電子音樂分類模型。
(3) 在所有電子音樂分類模型中,KPCA?ELM的電子音樂分類訓(xùn)練最少,這是因?yàn)镵PCA可以有效減少特征維數(shù),而且ELM可以獲得比支持向量機(jī)更快的學(xué)習(xí)速度,加快了電子音樂分類的訓(xùn)練速度,提高了電子音樂的分類效率,更加適合于海量電子音樂分類的要求。
3 結(jié) 語
電子音樂分類可以拓寬多媒體的應(yīng)用范圍,具有十分重要的應(yīng)用價(jià)值。為了解決當(dāng)前電子音樂分類模型存在的不足,本文提出了改進(jìn)極限學(xué)習(xí)機(jī)的電子音樂自動分類模型,該模型集成了核主成分分析和極限學(xué)習(xí)機(jī)的優(yōu)點(diǎn),同時(shí)采用遺傳算法對極限學(xué)習(xí)機(jī)參數(shù)進(jìn)行選擇,提高了電子音樂分類的準(zhǔn)確性,具有廣泛的應(yīng)用前景。
參考文獻(xiàn)
[1] TZANETAKIS G, COOK E. Musical genre classification of audio signals [J]. IEEE transactions on speech & audio proces?sing, 2001, 10(5): 293?302.
[2] COSTA Y M G, OLIVEIRA L S, KOEFICH A L, et a1. Music genre classification using LBP textural features [J]. Signal processing, 2012, 92(11): 2723?273.
[3] 鄒昊.基于概率神經(jīng)網(wǎng)絡(luò)的流行音樂分類研究[J].北方音樂,2015,35(16):44.
[4] 張寶印,于俊清,唐九飛,等.面向情感的電影背景音樂分類方法[J].計(jì)算機(jī)科學(xué),2013,40(12):37?41.
[5] 韓浩,王寅瀟,王博,等.基于概率神經(jīng)網(wǎng)絡(luò)的流行音樂分類研究[J].數(shù)字技術(shù)與應(yīng)用,2013(8):64?65.
[6] 高林杰,張 明.基于熵和支持向量機(jī)的音樂分類方法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2014,23(5):83?67.
[7] 張燕,唐振民,李燕萍,等.基于MFCC和 HMM的音樂分類方法研究[J].南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版),2008(4):112?114.
[8] 胡景凱,吳磊,高陽.基于學(xué)習(xí)分類器(LCS)的MP3音樂分類方法[J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2007(4):417?421.
[9] 張家發(fā),胡景凱,高陽,等.基于MDCT域特征的MP3音樂分類[J].江南大學(xué)學(xué)報(bào)(自然科學(xué)版),2007(6):769?773.
[10] 李劍.神經(jīng)網(wǎng)絡(luò)在音樂分類中的應(yīng)用研究[J].江南大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,27(11):168?170.
[11] 孟永輝,蔣冬梅,付中華,等.一種新穎的語言/音樂分割與分類方法[J].計(jì)算機(jī)工程與科學(xué),2009,31(4):106?109.
[12] 劉建輝,曾麗輝,許金鳳,等.基于最小二乘支持向量機(jī)的樂器音樂分類[J].華東交通大學(xué)學(xué)報(bào),2009,26(6):60?64.
[13] HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications [J]. Neurocomputing, 2006, 70(1): 489?501.