張棲銘 袁瑞臨 范凡 王峰
摘要:為了實(shí)現(xiàn)豬只不同狀態(tài)下的自動(dòng)檢測,試驗(yàn)采用聲音識(shí)別技術(shù),設(shè)計(jì)了基于支持向量機(jī)算法(SVM)的聲音識(shí)別方法,首先通過短時(shí)過零率和短時(shí)能量的端點(diǎn)檢測,確定豬只不同狀態(tài)的聲音信號(hào)的起始點(diǎn)和終止點(diǎn),然后提取聲音信息的梅爾頻率倒譜系數(shù)作為特征參數(shù),使用SVM算法進(jìn)行訓(xùn)練,建立聲音的分類模型,最后對(duì)豬只不同狀態(tài)進(jìn)行識(shí)別。結(jié)果表明:豬只狀態(tài)識(shí)別精度較高,達(dá)到了預(yù)期效果。
關(guān)鍵詞:聲音識(shí)別;SVM;MFCC;端點(diǎn)檢測
中圖分類號(hào):TP391
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2017)10-0162-03
動(dòng)物發(fā)聲是動(dòng)物行為的一種方式,可以通過叫聲與其他成員進(jìn)行有效交流,它能反映動(dòng)物的生理狀況如饑餓、疼痛、情緒狀態(tài)等,因而基于動(dòng)物聲音的狀態(tài)識(shí)別是有一定事實(shí)基礎(chǔ)的。并且,隨著計(jì)算機(jī)技術(shù)和數(shù)字信號(hào)處理技術(shù)的發(fā)展,聲音識(shí)別技術(shù)已經(jīng)取得了顯著進(jìn)步,動(dòng)物的聲音識(shí)別技術(shù)也得到了一定的發(fā)展。
因?yàn)樨i只的聲音信息可以很好的反饋豬只的狀態(tài),因此,本試驗(yàn)采用梅爾倒譜系數(shù)(MFCC)作為豬只聲音的特征參數(shù),然后將提取的特征參數(shù),用來建立支持向量機(jī)(SVM)的分類模型,最后對(duì)不同狀態(tài)的豬只聲音進(jìn)行識(shí)別,為規(guī)?;酿B(yǎng)豬業(yè)提供客觀的豬只狀態(tài)監(jiān)測。
1.算法介紹
1.1聲音信號(hào)的端點(diǎn)檢測
端點(diǎn)檢測,聲音處理中的一個(gè)重要方面,其作用是從包含聲音的一段信號(hào)中確定出聲音的起始點(diǎn)及終止點(diǎn),區(qū)分聲音和非聲音信號(hào)。有效的端點(diǎn)檢測不僅可以減少數(shù)據(jù)處理量,節(jié)約時(shí)間,而且能抑制無聲段或噪聲段的干擾,提高聲音信號(hào)質(zhì)量。利用短時(shí)能量和短時(shí)過零率進(jìn)行雙門限的端點(diǎn)檢測。
短時(shí)能量是聲音的一個(gè)重要的特性,對(duì)聲音的能量分析主要集中在短時(shí)能量上。短時(shí)能量的定義如下:
1.2聲音識(shí)別特征參數(shù)的提?。∕FCC)
聲音信號(hào)特征的梅爾倒譜系數(shù)(MFCC)法,是基于聽覺特性的特征參數(shù):不同頻率的聲音,在人耳內(nèi)基礎(chǔ)膜的不同位置振動(dòng)。所以人耳就可以很容易辨別出各種狀態(tài)的聲音,此參數(shù)作為豬聲音的識(shí)別參數(shù)能更好地反應(yīng)各種聲音信號(hào)的特性,從而極大地提高整個(gè)系統(tǒng)魯棒性和系統(tǒng)的識(shí)別率。
MFCC參數(shù)主要描述了聲音信號(hào)在頻域的能量分布,Mel頻率的大小與實(shí)際頻率呈對(duì)數(shù)分布。下式即為Mel頻率與聲音頻(Hz)的關(guān)系式:
以兩種豬只狀態(tài)的聲音為例,得到MFCC參數(shù)如圖1,可以從圖中看出,不同狀態(tài)的豬只聲音的特征參數(shù)有明顯的區(qū)別,用此參數(shù)可以區(qū)別不同豬只狀態(tài)。
1.3SVM算法
支持向量機(jī)(Support Vector Machine,SVM)是Vapnikm等人提出的一類新型機(jī)器學(xué)習(xí)方法。由于支持向量機(jī)在解決小樣本問題、非線性問題及高維空間內(nèi)的模式識(shí)別問題的時(shí)候有很多優(yōu)點(diǎn),所以其被廣泛使用。
目前實(shí)行支持向量機(jī)的軟件方法有Libsvm、Liblinear、mvs-VM、SVMlight等方法。中國臺(tái)灣大學(xué)的林智仁(Chih-Jen Lin)教授等人設(shè)計(jì)了Libsvm軟件,已經(jīng)在多個(gè)操作系統(tǒng)平臺(tái)上實(shí)現(xiàn)了支持向量機(jī)。該軟件整合了交叉驗(yàn)證(Cross-Validation)的功能,能夠方便地優(yōu)化參數(shù)。利用Libsvm可以解決C支持向量分類機(jī)、v支持向量分類機(jī)、s支持向量回歸機(jī)和v支持向量回歸機(jī)等問題,以及基于1-v-1算法的多分類問題。
本試驗(yàn)中支持向量機(jī)采用的是Libsvm算法。Libsvm算法中的訓(xùn)練分類函數(shù)可以選擇支持向量機(jī)的不同訓(xùn)練模式,其中,Option參數(shù)為訓(xùn)練分類模型的參數(shù)??捎眠x項(xiàng)即表示涵義如下:
2.實(shí)現(xiàn)豬只狀態(tài)的識(shí)別
豬只的患病、爭斗以及食欲情況都反映其生理健康狀況。試驗(yàn)根據(jù)畜牧養(yǎng)殖從業(yè)人員的實(shí)際經(jīng)驗(yàn),選取了5種可以體現(xiàn)上述行為狀態(tài)的豬只聲音信息:小豬被壓、豬打架、豬饑餓、豬吃料、豬咳嗽,作為本次試驗(yàn)的聲音樣本。
2.1豬聲音識(shí)別流程
將采集到的五種豬只聲音,一部分作為訓(xùn)練集,首先對(duì)聲音信息進(jìn)行預(yù)處理,即預(yù)加重、分幀、加窗;然后對(duì)聲音進(jìn)行雙門限的端點(diǎn)檢測,確定聲音的起始點(diǎn);將處理后的聲音通過mel倒譜系數(shù)法提取聲音特征值。將提取到的特征值通過SVM算法訓(xùn)練得到分類模型(model)。將其中一種豬只聲音作為測試集,通過MFCC特征提取后,使用SVM算法分類預(yù)測出豬只狀態(tài)。
圖2是豬聲音識(shí)別流程。
2.2程序分析結(jié)果
Option選項(xiàng)中,-c和-g決定了分類效果,通過交叉驗(yàn)證選擇最佳參數(shù)-c和-g。我們得到的最佳參數(shù)是:
-c=0.125;-g=0.0078125。
采用參數(shù)-c與-g對(duì)整個(gè)訓(xùn)練集進(jìn)行訓(xùn)練獲取支持向量機(jī)模型;訓(xùn)練得到的model參數(shù):
分類模型(model)中主要參數(shù)說明:
(1)model.Parameters參數(shù)分別表示為:-s參數(shù)為0,為C-SVC函數(shù);一t參數(shù)為2,采用RBF函數(shù);-d參數(shù)為3;-gr(gama)為0.0078(優(yōu)化得到的參數(shù));-r coefO參數(shù)為0.
(2)model.Label表示訓(xùn)練數(shù)據(jù)的分類標(biāo)簽,本試驗(yàn)采用的是l,2,3,4,5。
(3)model.nr_class表示訓(xùn)練數(shù)據(jù)的分類個(gè)數(shù),本試驗(yàn)是五分類。
(4)model.totalSV表示訓(xùn)練樣本共有的支持向量數(shù)目,試驗(yàn)結(jié)果表明,共有1476個(gè)支持向量。
(5)model.nSV表示每類訓(xùn)練樣本的支持向量的數(shù)目,分別是:標(biāo)簽為1的訓(xùn)練樣本的支持向量數(shù)目有313個(gè),標(biāo)簽為2的訓(xùn)練樣本的支持向量數(shù)目有299個(gè),標(biāo)簽為3的訓(xùn)練樣本的支持向量數(shù)目有372個(gè),標(biāo)簽為4的訓(xùn)練樣本的支持向量數(shù)目有364個(gè),標(biāo)簽為5的訓(xùn)練樣本的支持向量數(shù)目有128個(gè)。
通過svmpredict函數(shù)對(duì)測試集進(jìn)行識(shí)別預(yù)測。得表2識(shí)別結(jié)果,包含待識(shí)別豬只狀態(tài)和識(shí)別準(zhǔn)確率。
3.結(jié)論
試驗(yàn)設(shè)計(jì)了一種基于聲音的豬只狀態(tài)識(shí)別方法,通過短時(shí)能量和短時(shí)過零率的端點(diǎn)檢測,選擇梅爾倒譜系數(shù)作為聲音特征參數(shù),以SVM算法作為分類器識(shí)別預(yù)測5種狀態(tài)下的豬只異常聲音,識(shí)別準(zhǔn)確率較高。但本試驗(yàn)訓(xùn)練數(shù)據(jù)不足,且預(yù)測環(huán)境較為理想,因此有很多地方需要改進(jìn)。一方面需要增加訓(xùn)練數(shù)據(jù)量,另一方面,進(jìn)一步研究現(xiàn)場環(huán)境中混雜在一起的各種豬聲音以及噪音的問題,通過以上方法來提高系統(tǒng)的準(zhǔn)確率及實(shí)用性。