米月琴 王新懷 徐茵
摘要:提出了一種基于梅爾頻率倒譜系數(shù)(Mel frequency cepstrum coefficients,MFCC)的聲音檢測(cè)裝置及 算法實(shí)現(xiàn)。通過(guò)采集聲音的波形,結(jié)合特征提取和分類算法,實(shí)現(xiàn)對(duì)不同聲音的智能判斷。從嵌入式系統(tǒng) 硬件設(shè)計(jì)、聲音波形特征提取、聲音分類算法等方面進(jìn)行了詳細(xì)的研究,并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了分析。結(jié)果 表明,該設(shè)計(jì)方案在聲音檢測(cè)方面具有較高的準(zhǔn)確性和可行性。
關(guān)鍵詞:MFCC;特征提取;嵌入式系統(tǒng);檢測(cè)裝置
中圖分類號(hào):TN912.3;TP277文獻(xiàn)標(biāo)識(shí)碼:A
0 引言
近年來(lái),信號(hào)處理技術(shù)和語(yǔ)音識(shí)別技術(shù)都取得 了飛速的發(fā)展。研究人員越來(lái)越多地采用信號(hào)處理 和語(yǔ)音識(shí)別方法來(lái)分析聲音。數(shù)字信號(hào)處理技術(shù)的 進(jìn)步,使得研究人員能夠借助計(jì)算機(jī)高效分析聲 音,時(shí)域分析、頻域分析和頻譜分析等信號(hào)處理手 段為研究人員提供了豐富的工具。在語(yǔ)音識(shí)別領(lǐng) 域,信號(hào)經(jīng)過(guò)預(yù)處理后,再經(jīng)過(guò)模式識(shí)別技術(shù)進(jìn)行 分類判斷,這些分類判斷后的信號(hào)對(duì)于聲音的分析 至關(guān)重要。
嬰兒啼哭聲中包含豐富的信息,如饑餓、疼 痛、不適或疾病等。基于嵌入式系統(tǒng)的嬰兒啼哭智 能檢測(cè)設(shè)計(jì)可以實(shí)時(shí)分析和識(shí)別啼哭聲,及時(shí)發(fā)現(xiàn) 嬰兒的健康問(wèn)題,為醫(yī)護(hù)人員提供重要參考,從而 采取相應(yīng)的護(hù)理和治療措施。嬰兒啼哭聲識(shí)別可以 作為一種輔助工具,幫助父母或照顧者更好地了解 嬰兒的需求 [1]。嬰兒啼哭檢測(cè)裝置通過(guò)分析啼哭聲 的特征和模式,可以快速判斷嬰兒的狀態(tài),是否饑 餓、是否需要換尿布、是否感到不適等 [2]。
基于嵌入式系統(tǒng)的智能嬰兒啼哭檢測(cè)設(shè)計(jì)是一 項(xiàng)前沿研究,旨在利用先進(jìn)的硬件和軟件技術(shù),實(shí) 現(xiàn)對(duì)嬰兒啼哭聲的實(shí)時(shí)分析和識(shí)別。本文通過(guò)探討 該設(shè)計(jì)方案的主要內(nèi)容,包括系統(tǒng)設(shè)計(jì)、軟件設(shè) 計(jì)、算法設(shè)計(jì)和測(cè)試結(jié)果,以期為智能嬰兒護(hù)理和 健康監(jiān)測(cè)領(lǐng)域提供有益的參考和指導(dǎo)。
1 系統(tǒng)設(shè)計(jì)
本裝置基于嵌入式系統(tǒng),通過(guò)各種傳感器來(lái)檢 測(cè)嬰兒是否啼哭、是否發(fā)燒、是否尿床,從而及時(shí) 安撫嬰兒。系統(tǒng)采用了高性能的嵌入式處理器作為主控單元,用于控制和管理整個(gè)系統(tǒng)的運(yùn)行 [3]。聲 音傳感器負(fù)責(zé)實(shí)時(shí)采集嬰兒的啼哭聲信號(hào),并將 其轉(zhuǎn)化為數(shù)字信號(hào)用于后續(xù)處理。濕度傳感器可 檢測(cè)嬰兒尿床情況,及時(shí)發(fā)現(xiàn)濕度變化并進(jìn)行記 錄。溫度傳感器用于監(jiān)測(cè)嬰兒的體溫,確保嬰兒的 身體狀態(tài)得到及時(shí)關(guān)注。這些傳感器與嵌入式處 理器通過(guò)適當(dāng)?shù)慕涌诤屯ㄐ欧绞竭M(jìn)行連接和數(shù)據(jù)傳 輸。系統(tǒng)由硬件和軟件兩個(gè)部分組成,通過(guò)精心設(shè) 計(jì)的算法和可靠的報(bào)警機(jī)制,使得系統(tǒng)能夠高效 工作并提供準(zhǔn)確的嬰兒護(hù)理服務(wù)。系統(tǒng)組成如圖 1 所示。
2 軟件設(shè)計(jì)
系統(tǒng)采用了梅爾頻率倒譜系數(shù)(Mel frequency cepstrum coefficients,MFCC)算法和軟件設(shè)計(jì),實(shí) 現(xiàn)對(duì)傳感器數(shù)據(jù)的處理、分析和報(bào)警。通過(guò)聲音信 號(hào)處理算法,系統(tǒng)能夠提取嬰兒啼哭聲的特征和模 式,以判斷嬰兒的情緒狀態(tài)和需求。濕度數(shù)據(jù)和溫 度數(shù)據(jù)經(jīng)過(guò)處理和分析,用于檢測(cè)尿床和體溫異常 情況。基于這些數(shù)據(jù)和算法,系統(tǒng)能夠及時(shí)發(fā)出警 報(bào)信號(hào),通過(guò)聲音提示、LED 指示燈等方式提醒看 護(hù)者嬰兒的情況,以便及時(shí)采取相應(yīng)的護(hù)理和照顧 措施。軟件流程如圖 2 所示。
3 算法設(shè)計(jì)
算法設(shè)計(jì)主要包括聲音信號(hào)預(yù)處理、特征提取 算法。聲音信號(hào)預(yù)處理主要負(fù)責(zé)對(duì)采集到的信號(hào)降 噪,并進(jìn)行濾波、歸一化等處理,以便于后續(xù)特征 提取 [4]。特征提取算法需要將聲音信號(hào)轉(zhuǎn)化為可以 用于分類的特征向量,本文采用上述提到的基于時(shí) 域、頻域和小波變換的特征提取方法,算法設(shè)計(jì)內(nèi) 容如下。
(1)嬰兒啼哭聲音信號(hào)的采集與預(yù)處理。首先 需要通過(guò)麥克風(fēng)等設(shè)備采集嬰兒啼哭聲音信號(hào)。為 了確保信號(hào)質(zhì)量,可對(duì)采集到的聲音信號(hào)進(jìn)行預(yù)處 理,包括去除背景噪聲、預(yù)加重濾波以補(bǔ)償信號(hào)中 高頻部分的能量損失等。預(yù)處理后的信號(hào)是后續(xù) MFCC 算法提取特征的基礎(chǔ)。
(2)特征提取算法。MFCC 算法通過(guò)應(yīng)用離 散余弦變換的方式將梅爾頻譜轉(zhuǎn)換為頻率系數(shù)。然 后,選擇一部分系數(shù)作為特征向量,將高維度的頻 譜數(shù)據(jù)降低為較低維度的特征向量。該方式有助于 減少特征向量的冗余性,提高分類器模型的效率和 準(zhǔn)確性。
(3)特征表示和分類。通過(guò)將選定的一部分系 數(shù)組合成一個(gè)特征向量,可以將嬰兒啼哭聲表示為 一個(gè)數(shù)值向量。該向量包含了聲學(xué)特征,可作為輸 入向量提供給分類器模型。分類器模型根據(jù)訓(xùn)練數(shù) 據(jù)中不同類型的啼哭聲模式進(jìn)行學(xué)習(xí),對(duì)輸入的特 征向量進(jìn)行分類預(yù)測(cè),判斷啼哭聲是否屬于特定類 型。圖 3 和圖 4 分別為嬰兒哭聲 MFCC 提取結(jié)果、 嬰兒哭聲維數(shù)與幅值的關(guān)系;圖 5 和圖 6 分別為成 人聲音 MFCC 提取結(jié)果、成人聲音維數(shù)與幅值的 關(guān)系。
由此可見(jiàn),嬰兒哭聲在各方面都與成人聲音有 所區(qū)別。在頻率特征上,嬰兒哭聲通常具有較高的 頻率,主要集中在高頻段;常見(jiàn)噪聲則在頻率上均 勻分布,包含各種頻率。在時(shí)域特征上,嬰兒哭聲 的時(shí)域特征通常表現(xiàn)為連續(xù)且有規(guī)律的振蕩,具有 一定的周期性;常見(jiàn)噪聲則在時(shí)域上表現(xiàn)為隨機(jī)的 波動(dòng),缺乏明顯的周期性。在動(dòng)態(tài)特性上,嬰兒哭 聲具有較明顯的動(dòng)態(tài)變化,包括音高、音量和音 色的變化,且隨著嬰兒情緒的變化而變化;常見(jiàn) 噪聲通常是固定的、穩(wěn)定的,不具備明顯的動(dòng)態(tài) 變化 [5]。
4 測(cè)試結(jié)果
4.1 數(shù)據(jù)收集
為了訓(xùn)練一個(gè)有效的模型,需要收集大量的正 類(嬰兒哭聲)和負(fù)類(其他背景聲音)樣本。針 對(duì)已有的嬰兒哭聲音頻,可以將其切分成多個(gè)較短 的片段以增加樣本數(shù)量。然而,僅依靠這一個(gè)音頻 是不夠的,還需要收集更多音頻文件。 本文的測(cè)試收集了 50 個(gè)正類和 50 個(gè)負(fù)類音頻文 件,每個(gè)文件時(shí)長(zhǎng)為 2 s??倶颖玖繛?100 個(gè)。
4.2 數(shù)據(jù)預(yù)處理
確保所有音頻文件具有相同的采樣率、比特率 和聲道數(shù),保證特征提取過(guò)程具有一致性。因此, 所有轉(zhuǎn)換后的音頻文件采樣率為 44 100 Hz、比特 率為 16 bit/s 且為單聲道。
4.3 MFCC 算法處理
為了測(cè)試該裝置對(duì)信號(hào)的降噪作用,將各種 不同程度噪聲信號(hào)與嬰兒哭聲音頻疊加后參與識(shí) 別,測(cè)試結(jié)果可反映出本產(chǎn)品中采用的算法是否完備且有效。對(duì)嬰兒哭聲樣本分別疊加 5 dB、10 dB、 15 dB 的噪聲,基于 MFCC 算法提取的特征參數(shù), 最后統(tǒng)計(jì)識(shí)別數(shù)量,并與之前未加噪聲時(shí)的樣本數(shù) 量比較,得到疊加噪聲后識(shí)別率比較(表 1)。
由此可見(jiàn),系統(tǒng)在不同噪聲環(huán)境下都能保持識(shí) 別率不會(huì)低于 83%,具有較強(qiáng)的抗干擾能力。這意 味著在現(xiàn)實(shí)生活中,如家庭、醫(yī)院等各種環(huán)境中, 系統(tǒng)都能有效地識(shí)別嬰兒哭聲。
5 結(jié)論
本文通過(guò)嵌入式系統(tǒng)設(shè)計(jì)和各個(gè)傳感器采集 數(shù)據(jù)實(shí)現(xiàn)了硬件系統(tǒng)的設(shè)計(jì),采用 MFCC 算法進(jìn) 行特征提取并在微控制單元(microcontroller unit, MCU)上編程實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果表明,本文提出的 嵌入式系統(tǒng)檢測(cè)嬰兒哭聲的設(shè)計(jì)具有較高的準(zhǔn)確率 和抗干擾能力。本設(shè)計(jì)在實(shí)際應(yīng)用中具有重要意 義,有助于家長(zhǎng)及時(shí)了解嬰兒的需求和狀況,為醫(yī) 護(hù)人員提供有力的輔助手段。
參考文獻(xiàn)
[1] 羅聰,李輝,彭旺,等 . 基于 STM32 的智能安全監(jiān) 護(hù)系統(tǒng)設(shè)計(jì) [J]. 儀表技術(shù),2022(5):18-20.
[2] 楊振雷 . 智能嬰兒監(jiān)護(hù)系統(tǒng)設(shè)計(jì) [J]. 電子世界,2012 (22):127-128.
[3] 王赫楠,燕燕,王甜宇,等 . DTW 算法在嵌入式語(yǔ) 音識(shí)別系統(tǒng)中的應(yīng)用研究 [J]. 科技創(chuàng)新導(dǎo)報(bào),2014, 11(8):71.
[4] 許愛(ài)功 . 基于 ARM 和 FPGA 的語(yǔ)音識(shí)別系統(tǒng)的研究 [D]. 北京:北方工業(yè)大學(xué),2014.
[5] 崔戰(zhàn)士 . 復(fù)雜背景噪聲中的嬰兒啼哭聲檢測(cè)研究 [D]. 哈爾濱:哈爾濱工業(yè)大學(xué),2019.