音頻帶寬擴(kuò)展技術(shù)分析與展望?

2011-04-02 18:04鮑楓劉鑫賈懋王申鮑長(zhǎng)春

電訊技術(shù) 2011年2期

鮑楓，劉鑫，賈懋王申，鮑長(zhǎng)春

鮑楓，劉鑫，賈懋王申，鮑長(zhǎng)春

（北京工業(yè)大學(xué)電子信息與控制工程學(xué)院語(yǔ)音與音頻信號(hào)處理研究室，北京100124）

對(duì)音頻帶寬擴(kuò)展中的非盲目式和盲目式高頻重建技術(shù)進(jìn)行了分析、對(duì)比，給出了非盲目式高頻重建中的6種技術(shù)及盲目式高頻重建中的4種技術(shù)的基本原理，并對(duì)它們各自的優(yōu)劣性進(jìn)行了評(píng)價(jià)，指出盲目式高頻重建法將是未來(lái)頻帶擴(kuò)展技術(shù)發(fā)展中關(guān)注和研究的熱點(diǎn)。

音頻信號(hào)處理；音頻編碼；帶寬擴(kuò)展；高頻重建

1 引言

相對(duì)于音頻信號(hào)的高頻信息，人耳對(duì)音頻信號(hào)的低頻信息更敏感，所以，在很多低比特率音頻編碼方法中，為了提高編碼效率，高頻信息幾乎被截去，而只對(duì)低頻信息編碼，如MP3［1］、MPEG－2 AAC［2］等編碼方法，這使得重建音頻信號(hào)的明亮度與自然度喪失許多，導(dǎo)致整體音頻質(zhì)量下降。

為了還原音頻信號(hào)的帶寬，提高音頻解碼質(zhì)量，人們通常將帶寬擴(kuò)展技術(shù)，即高頻重建技術(shù)引入到音頻解碼器中來(lái)恢復(fù)截去的高頻信息。高頻重建是指碼流中不包含高頻編碼信息時(shí)，通過(guò)低頻解碼信息來(lái)恢復(fù)高頻信息的一種技術(shù)，其主要目的是拓寬原始編碼信號(hào)的有效頻帶，提高解碼音頻信號(hào)的質(zhì)量。帶寬擴(kuò)展方法［3－15］可分為非盲目式高頻重建法［3－11］和盲目式高頻重建法［12－15］。在非盲目式高頻重建法中，編碼器除對(duì)低頻信息編碼外，還需對(duì)高、低頻相關(guān)參數(shù)、高頻子帶諧波／噪聲屬性和高頻能量包絡(luò)等邊信息進(jìn)行編碼，解碼器則根據(jù)低頻信息和隱含高頻信息的邊信息來(lái)恢復(fù)高頻信息；而在盲目式高頻重建法中，編碼器不提取任何隱含高頻信息的參數(shù)，解碼器直接用低頻信息來(lái)恢復(fù)高頻信息。

本文將分別介紹音頻帶寬擴(kuò)展的非盲目式和盲目式高頻重建方法的基本原理，對(duì)相關(guān)技術(shù)進(jìn)行分析，最后得出結(jié)論。

2 非盲目式高頻重建方法

目前，非盲目式高頻重建法主要包括頻帶復(fù)制（Spectral Band Replication，SBR）法［3－6］、簡(jiǎn)化參數(shù)的帶寬擴(kuò)展（Simplified Parameters Bandwidth Extension，SPBE）法［7］、PlusV高頻重建法［8］、Bark帶頻譜建模（Bark Band Spectrum Modeling，BBSM）［9］、基于BBSM的簡(jiǎn)化參數(shù)高頻重建［10］和基于最小熵的音頻信號(hào)高頻重建法［11］。

2.1 頻帶復(fù)制（SBR）法［3－6］

在編碼端，SBR方法首先借助正交鏡像濾波器（Quadrature Mirror Filter，QMF）將輸入信號(hào)劃分為64個(gè)子帶，并定義前32個(gè)子帶包含低頻信息，后32個(gè)子帶包含高頻信息。其次，對(duì)各高頻子帶進(jìn)行諧波和噪聲屬性分析，最后將高頻各子帶的諧波和噪聲屬性及能量包絡(luò)參數(shù)隨同低頻信息參數(shù)一同寫入碼流。

在解碼端，首先借助QMF，將解碼后的低頻時(shí)域信號(hào)分為32個(gè)子帶；其次，將各低頻子帶信息復(fù)制到各高頻子帶；最后，根據(jù)解碼后高頻各子帶的諧波和噪聲屬性及能量包絡(luò)恢復(fù)高頻各子帶信息，即若某一高頻子帶為諧波屬性，則用正弦發(fā)生器生成該頻帶的時(shí)域信號(hào)；若該頻帶為噪聲屬性，則由白噪聲生成器生成該頻帶的時(shí)域信號(hào)。

通過(guò)上述原理介紹我們可以看出，SBR方法的主要優(yōu)點(diǎn)是直接將低頻子帶的信息復(fù)制到高頻子帶，并借助高頻子帶的諧波和噪聲屬性及能量包絡(luò)重建高頻信息。但其缺點(diǎn)是需對(duì)原始音頻信號(hào)進(jìn)行分帶處理，并提取高頻子帶的諸多參數(shù)，這使得復(fù)雜度和加入比特流的參數(shù)信息量很大。為此，文獻(xiàn)［7］提出了一種簡(jiǎn)化SBR參數(shù)的方法，下面對(duì)其原理進(jìn)行概要介紹。

2.2 簡(jiǎn)化參數(shù)的帶寬擴(kuò)展（SPBE）法［7］

在編碼端，SPBE方法首先對(duì)輸入音頻信號(hào)進(jìn)行修正的離散余弦變換（Modified Discrete Cosine Transform，MDCT），將得到的一組MDCT系數(shù)等分到N個(gè)子帶中，并定義前N／2個(gè)子帶包含低頻信息，后N／2個(gè)子帶包含高頻信息；其次，利用各子帶中的MDCT系數(shù)計(jì)算各低頻子帶與各高頻子帶的相關(guān)系數(shù)及各高頻子帶能量；最后，將各高頻子帶的能量參數(shù)、高低頻子帶相關(guān)系數(shù)隨同低頻MDCT系數(shù)一同寫入碼流。

在解碼端，首先將解碼后的低頻時(shí)域信號(hào)分為N／2個(gè)子帶；其次，根據(jù)高低頻子帶相關(guān)系數(shù)，判斷是否存在與高頻子帶相關(guān)的低頻子帶，如果有，則將對(duì)應(yīng)的低頻子帶信息復(fù)制到對(duì)應(yīng)的高頻子帶；如果沒(méi)有，則將對(duì)應(yīng)的高頻子帶填充隨機(jī)白噪聲；最后，利用高頻子帶能量信息調(diào)整時(shí)域幅度，完成高頻重建。

通過(guò)上述的原理介紹我們可以看出，SPBE方法與SBR相比，避免了分帶處理，而是利用MDCT建立起的高低頻子帶相關(guān)性及高頻子帶能量進(jìn)行低頻子帶信息復(fù)制或噪聲填充來(lái)實(shí)現(xiàn)高頻信息重建，該方法具有復(fù)雜度低和邊信息少的優(yōu)勢(shì)。

2.3 PlusV高頻重建法［8］

在編碼端，首先將輸入音頻信號(hào)的有效帶寬一分為二，并將高頻帶等分為N個(gè)子帶。然后依次檢測(cè)各高頻子帶是否存在類正弦峰值，如果存在，則記錄該峰值的能量及對(duì)應(yīng)頻率。接下來(lái)則去除各高頻子帶的類正弦峰值，使各高頻帶只剩下類噪聲成分，并分別計(jì)算每個(gè)高頻子帶的類噪聲能量。最后，將類正弦峰值的能量與其對(duì)應(yīng)的頻率及高頻各子帶類噪聲能量參數(shù)隨同低頻信息參數(shù)一同寫入碼流。

在解碼端，首先將高頻帶等分為N個(gè)子帶，然后用白噪聲填充各高頻子帶，并用解碼的高頻各子帶類噪聲能量調(diào)整各子帶能量。最后，利用解碼的類正弦峰值的能量及其所對(duì)應(yīng)的頻率，在各高頻子帶加入正弦峰值，完成最終的高頻信息重建。

通過(guò)上述原理分析可以看出，PlusV方法利用了音頻信號(hào)的高頻信息由噪聲和類正弦信號(hào)混合組成的特點(diǎn)。該方法主要以噪聲來(lái)填充高頻帶，這對(duì)于高頻帶以噪聲為主要成分的信號(hào)而言，高頻重建效果較好，人耳很難聽出解碼信號(hào)與輸入信號(hào)的差別。但是由于其重建所得的高頻頻譜并不精細(xì)，對(duì)于諧波成分多、噪聲成分少的音頻信號(hào)而言，難免會(huì)引入人工噪聲，人耳對(duì)此噪聲會(huì)有所感知，造成音頻質(zhì)量下降。

2.4 Bark帶頻譜建模（BBSM）法［9］

在編碼端，首先對(duì)輸入音頻信號(hào)進(jìn)行FFT變換，并計(jì)算高頻帶與本地解碼的低頻帶信息之間的相關(guān)系數(shù)；其次，將輸入信號(hào)的高頻幅度譜與本地解碼的低頻幅度譜分別按Bark尺度進(jìn)行子帶劃分，并將高頻Bark子帶分為N個(gè)組，低頻前M個(gè)Bark子帶歸為一個(gè)組，這里N應(yīng)是M的倍數(shù)。最后，計(jì)算各高頻子帶組與低頻子帶組的能量比隨同低頻信息參數(shù)一同寫入碼流。

在解碼端，首先對(duì)低頻解碼信息進(jìn)行采樣，并利用Bark尺度進(jìn)行子帶劃分；其次，根據(jù)解碼的相關(guān)系數(shù)進(jìn)行高低頻相關(guān)性判斷，當(dāng)相關(guān)系數(shù)小于給定閾值時(shí)，用隨機(jī)白噪聲填充高頻各Bark子帶；反之，將解碼的前M個(gè)低頻Bark子帶信息復(fù)制到各高頻子帶組；最后，根據(jù)解碼的高頻子帶組與低頻子帶組的能量比，對(duì)高頻Bark子帶的能量進(jìn)行調(diào)整，完成最終的高頻重建。

通過(guò)上述原理分析可以看出，BBSM方法借助Bark尺度進(jìn)行非均勻分帶［16］，使得子帶寬度呈指數(shù)增長(zhǎng)，避免了前面3種方法對(duì)頻帶進(jìn)行均勻劃分的缺陷，有效減少了分帶數(shù)目及表示高頻信息的參數(shù)。但是，由于該方法使用一組相同的Bark帶低頻信息去重建各組Bark帶高頻信息，并沒(méi)有使用與高頻子帶相關(guān)性最大的低頻子帶去重建高頻信息，因此得到的不是最佳的重構(gòu)信息。

2.5 基于BBSM的簡(jiǎn)化參數(shù)高頻重建方法［10］

在編碼端，首先將輸入信號(hào)等分為N個(gè)子帶；其次，根據(jù)子帶能量差異和過(guò)零率，對(duì)相鄰兩幀信號(hào)相同低頻子帶進(jìn)行相關(guān)性判斷，并提取相關(guān)性最強(qiáng)的M個(gè)低頻子帶，作為高頻重建單元；接著，比較相鄰兩幀高頻各子帶的能量差異，只有當(dāng)差異值大于給定門限時(shí)，才傳遞高、低頻子帶能量比；最終將提取的M個(gè)低頻子帶的索引值、高頻子帶的能量差異與高、低頻子帶能量比參數(shù)隨同低頻信息參數(shù)一同寫入碼流。

在解碼端，首先，將解碼的低頻信號(hào)等分為N／2個(gè)子帶；其次，利用相鄰兩幀高頻各子帶的能量差異進(jìn)行頻帶復(fù)制判斷，當(dāng)差異值大于給定門限時(shí)，則將M個(gè)低頻子帶復(fù)制到高頻帶，并利用高、低頻子帶能量比對(duì)其進(jìn)行能量調(diào)整得到高頻信息；反之，則填充隨機(jī)白噪聲得到高頻信息。

通過(guò)上述原理分析可以看出，此方法避免了BBSM中使用固定的低頻信息重建高頻信息的缺陷，通過(guò)選擇相關(guān)性最好的低頻子帶對(duì)高頻帶進(jìn)行重建，進(jìn)一步減少了表示高頻的參數(shù)，有利于提升重建質(zhì)量。

2.6 基于最小熵的音頻信號(hào)高頻重建法［11］

在編碼端，輸入音頻信號(hào)經(jīng)FFT變換后被等分為N個(gè)子帶，將提取的高頻各子帶的包絡(luò)能量信息隨同低頻信息參數(shù)一同寫入碼流。

在解碼端，將信號(hào)等分為N個(gè)子帶，低頻解碼信息填入對(duì)應(yīng)的低頻子帶，高頻子帶均賦為零值，同時(shí)加入直流信息，構(gòu)成一個(gè)全頻帶信號(hào)。經(jīng)IFFT變換后，得到時(shí)域信號(hào)。將此時(shí)域信號(hào)作為初始全頻帶信號(hào)，結(jié)合高頻包絡(luò)能量信息，用最小熵算法［11，17］循環(huán)迭代不斷得到新的全頻帶信號(hào)。每次恢復(fù)出全頻帶信號(hào)后，都將其與初始全頻帶信號(hào)做相關(guān)性檢測(cè)，當(dāng)相關(guān)系數(shù)小于某個(gè)門限值時(shí)，迭代停止，此時(shí)恢復(fù)的全頻帶信號(hào)即為解碼信號(hào)。

通過(guò)上述原理分析可以看出，該方法利用了最小熵準(zhǔn)則來(lái)對(duì)低頻信息進(jìn)行譜外推得到高頻信息，其核心思想是利用信息熵來(lái)度量信號(hào)的頻譜分辨率，通過(guò)求取最小信息熵來(lái)提高信號(hào)的頻譜分辨率，使得外推得到的高頻譜信息更加準(zhǔn)確。其重建音頻信號(hào)的高頻譜信息更加豐富，從而使得重建信號(hào)更加飽滿自然。但是，由于本方法沒(méi)有對(duì)高頻細(xì)節(jié)譜進(jìn)行精確恢復(fù)，當(dāng)處理高頻能量較強(qiáng)的信號(hào)時(shí)，難免會(huì)引入輕微的噪聲。

3 盲目式高頻重建方法

目前，盲目式高頻重建法主要包括線性外推（Linear Extrapolation，LE）［12］、有效高頻帶寬擴(kuò)展（Efficient High-frequency Bandwidth Extension，EHBE）［13，14］、混合信號(hào)外推（Hybrid Signal Extrapolation，HSE）［15］和非線性預(yù)測(cè)［18］等。

3.1 線性外推（LE）法［12］

LE法利用音頻信號(hào)的對(duì)數(shù)幅度譜包絡(luò)呈近似線性遞減關(guān)系來(lái)進(jìn)行高頻重建。

在解碼端的高頻重建中，需要恢復(fù)的高頻信息包括兩部分內(nèi)容，即高頻譜包絡(luò)和高頻譜細(xì)節(jié)。高頻譜包絡(luò)借助幅度譜的線性關(guān)系獲得，高頻譜細(xì)節(jié)通過(guò)復(fù)制低頻帶的諧波結(jié)構(gòu)獲得。具體步驟如下：

首先，對(duì)低頻解碼信號(hào)進(jìn)行時(shí)頻變換得到其譜包絡(luò)；其次，采用線性最小二乘法將該包絡(luò)在對(duì)數(shù)域擬合成一條直線，得到該直線的最佳斜率和截距；最后，將低頻譜信息進(jìn)行復(fù)制得到高頻譜細(xì)節(jié)，并利用擬合直線的斜率對(duì)高頻譜細(xì)節(jié)進(jìn)行包絡(luò)衰減，完成最后的高頻重建。

通過(guò)上述原理分析可以看出，LE方法利用了強(qiáng)制譜包絡(luò)遞減的方法來(lái)保證重構(gòu)的高頻信息不會(huì)淹沒(méi)低頻信息，但當(dāng)實(shí)際的音頻頻譜包絡(luò)在對(duì)數(shù)域不呈下降趨勢(shì)時(shí)，重構(gòu)高頻信息將與原始譜有較大差別。

3.2 有效高頻帶寬擴(kuò)展（EHBE）法［13，14，19］

在解碼端的高頻重建中，EHBE法首先將低頻解碼的信號(hào)（截止頻率為fcut）進(jìn)行帶通濾波，得到此低頻解碼信號(hào)的最高八度音信號(hào)（截止頻率為起始頻率兩倍的帶限音頻信號(hào)［19］），將其定義為基波B1（fcut／2～fcut）。然后經(jīng)非線性手段產(chǎn)生基波B1的二次諧波B2（fcut～2fcut）、三次諧波B3（2fcut～3fcut）等一系列諧波，將包含這些諧波的信號(hào)記為S。接著將信號(hào)S經(jīng)另一個(gè)帶通濾波器處理，得到所需的諧波集合BS（fcut～fhigh），并將其作為重建高頻信息。這里，fhigh為頻帶展寬后信號(hào)的截止頻率。最后調(diào)整此高頻信息的增益，并與低頻解碼信號(hào)結(jié)合，得到全頻帶音頻信號(hào)。

通過(guò)上述原理分析可以看出，EHBE法是一種基于八度音信號(hào)的高頻重建方法，其優(yōu)點(diǎn)是計(jì)算復(fù)雜度低，針對(duì)不同帶寬的信號(hào)，只需更改濾波器系數(shù)和諧波增益就可進(jìn)行高頻重建。其缺點(diǎn)是，帶通濾波器的過(guò)渡帶會(huì)使八度音信號(hào)的截止頻率不精準(zhǔn)，從而導(dǎo)致重建高頻信息的準(zhǔn)確性下降。

3.3 混合信號(hào)外推（HSE）法［15］

在解碼端的高頻重建中，HSE法首先對(duì)每幀低頻解碼信號(hào)進(jìn)行線性預(yù)測(cè)，并利用預(yù)測(cè)系數(shù)將每幀信號(hào)進(jìn)行前向和后向外推，以增加時(shí)域信號(hào)的長(zhǎng)度。這樣做的目的是為了提高每幀信號(hào)的頻域分辨率，保證頻域外推的準(zhǔn)確性。其次，將增長(zhǎng)的時(shí)域信號(hào)加窗，經(jīng)FFT變換得到頻域系數(shù)，并對(duì)這些系數(shù)進(jìn)行動(dòng)態(tài)估計(jì)，得出截止頻率。在處理截止頻率未知或變化的音頻信號(hào)時(shí)，此操作避免了信號(hào)低頻譜與重建高頻譜之間產(chǎn)生譜間隙。最后，將FFT系數(shù)轉(zhuǎn)換到對(duì)數(shù)域進(jìn)行線性預(yù)測(cè)，并利用預(yù)測(cè)系數(shù)外推得到高頻譜信息，完成最終的高頻重建。

通過(guò)上述原理分析可以看出，HSE法是一種時(shí)域外推和頻域外推相結(jié)合的高頻重建方法。由于截止頻率檢測(cè)模塊的存在，使得此方法適用于未知截止頻率或可變截止頻率音頻信號(hào)的高頻重建，從而擴(kuò)大了應(yīng)用范圍。但是，如果此方法處理的是瞬態(tài)信號(hào)，如鼓聲等，增加樣點(diǎn)數(shù)的時(shí)域外推步驟將導(dǎo)致信號(hào)動(dòng)態(tài)特性的丟失，從而在反變換后將無(wú)法精確恢復(fù)出瞬態(tài)信息。

3.4 非線性預(yù)測(cè)法［18］

在解碼端的高頻重建中，非線性預(yù)測(cè)法首先將截去高頻信息的時(shí)域信號(hào)進(jìn)行分幀處理，并對(duì)相鄰兩幀的信號(hào)進(jìn)行MDCT變換，得到低頻MDCT系數(shù)；其次，求取此低頻MDCT系數(shù)的嵌入維和延遲量來(lái)重構(gòu)音頻非線性動(dòng)力系統(tǒng)的相空間；接著在重構(gòu)相空間中，利用Lyapunov指數(shù)對(duì)MDCT系數(shù)序列的混沌特性進(jìn)行檢測(cè)，一旦MDCT系數(shù)具有混沌特性后，則利用局部自適應(yīng)非線性預(yù)測(cè)結(jié)合低頻MDCT系數(shù)預(yù)測(cè)得到高頻MDCT系數(shù)；而后再根據(jù)人耳的聽覺(jué)特性與高、低頻MDCT系數(shù)間的相關(guān)性，對(duì)高頻MDCT系數(shù)譜信息的諧波成分進(jìn)行調(diào)整；最后，將原有的低頻MDCT系數(shù)與重建所得高頻MDCT系數(shù)結(jié)合，利用逆MDCT變換將其變換到時(shí)域，得到經(jīng)過(guò)頻帶擴(kuò)展后的全頻帶時(shí)域信號(hào)。

通過(guò)上述原理分析可以看出，該非線性預(yù)測(cè)法是一種利用音頻信號(hào)的非線性動(dòng)力學(xué)特性及人耳的聽覺(jué)特性的盲目式頻帶擴(kuò)展方法，更符合音頻變化的一般規(guī)律，一但找到了理想的相空間，則會(huì)產(chǎn)生高質(zhì)量的高頻信息。這是一項(xiàng)暫新的課題，有待進(jìn)一步研究。

4 結(jié)論

通過(guò)分析上述兩類音頻高頻重建方法可以看出，利用頻帶擴(kuò)展技術(shù)能夠在較低的碼率下實(shí)現(xiàn)對(duì)高質(zhì)量音頻的良好重建，對(duì)降低高帶寬音頻處理、存儲(chǔ)和傳輸成本具有重要的意義。

本文描述了目前主流的音頻頻帶擴(kuò)展技術(shù)，分別針對(duì)盲目式和非盲目式兩類高頻重建法的關(guān)鍵技術(shù)進(jìn)行了詳細(xì)闡述。非盲目式高頻重建法需要編碼端提取額外的邊信息，邊信息越豐富，重建高頻的質(zhì)量越好，但這些邊信息會(huì)增加編碼的比特?cái)?shù)，降低整個(gè)編碼器的編碼效率。而盲目式高頻重建法則不需要編碼端提供任何邊信息，解碼端只根據(jù)低頻信息就可得到高頻信息。因缺少相應(yīng)的高頻邊信息，盲目式高頻重建法的性能通常要遜色于非盲目式高頻重建法，但盲目式高頻重建法可大大節(jié)省編碼比特?cái)?shù)，有效提高編碼效率。因此，在未來(lái)頻帶擴(kuò)展技術(shù)發(fā)展的過(guò)程中，盲目式高頻重建法會(huì)同時(shí)受到客戶和制造企業(yè)的青睞，其研究工作也將日益成為人們關(guān)注的熱點(diǎn)。

參考文獻(xiàn)：

［1］ISO／IEC 11172－3，Coding of moving pictures and associated audio for digital storage media at up to about 1.5Mbit／s——Part 3 Audio［S］.

［2］ISO／IEC 13818－7，Information technology－Generic coding of moving pictures and associated audio information－Part 7：Advanced Audio Coding（AAC）［S］.

［3］ISO／IEC，WD Text for Backward Compatible Bandwidth Extension for General Audio Coding［S］.

［4］Per Ekstrand，Andreas Ehret，Manfred Lutzky，et al.Enhancing mp3 with SBR：Features and Capabilities of the new mp3PRO Algorithm［C］／／Proceedings of the 112th AES Convention.Munich，Germany：AES，2002：1－7.

［5］Martin Dietz，Lars Liljeryd，Kristofer Kj?rling，et al.Spectral Band Replication，a novel approach in audio coding［C］／／Proceedings of the 112th AES Convention.Munich，Germany：AES，2002：1－8.

［6］Per Ekstrand.Bandwidth extension of audio signals by spectral band replication［C］／／Proceedings of the 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio.Leuven，Belgium：IEEE，2002：53－58.

［7］黃遠(yuǎn)軍，胡劍凌.一種簡(jiǎn)化參數(shù)的音頻信號(hào)譜擴(kuò)展技術(shù)［J］.電聲技術(shù)，2007，31（4）：45－48.

HUANG Yuan-jun，HU Jian-ling.Research on the Bandwidth Extension Algorithm for the Audio Signal Using the Simplified Parameters［J］.Audio Engineering，2007，31（4）：45－48.（in Chinese）

［8］VLSI Solution Oy.PlusV Specification：VLSI Solution PlusV［R］.Finland：VLSI，2001.

［9］Jeongil Seo，Daeyoung Jang，Jinwoo Hong，et al.A Simple Method for Reproducing High Frequency Components at Low－Bit Rate Audio Coding［C］／／Proceedings of the 113th AES Convention.Los Angeles，California：AES，2002：1－7.

［10］潘政彥.節(jié)省參數(shù)并提升音質(zhì)之改良式高頻重建方法［D］.臺(tái)灣：大葉大學(xué)，2005. PAN Jeng－yan.A Solution of High Frequency Reconstruction for Saving more Parameters and Improving Quality［D］. Taiwan：Da－Yeh University，2005.（in Chinese）

［11］白曉亮，胡劍凌，徐盛.基于最小熵的音頻信號(hào)高頻重建［J］.電聲技術(shù)，2006，30（2）：37－40.

BAI Xiao-liang，HU Jian-ling，XU Sheng.Minimum Entropy Based High Frequency Reconstruction of Audio Signal［J］. Audio Engineering，2006，30（4）：37－40.（in Chinese）

［12］Chi－Min Liu，Wen－Chieh Lee，Han－Wen Hsu.High frequency reconstruction for band－limited audio signals［C］／／Proceedings of the 6th International Conference on Digital Audio Effects.London，UK：IEEE，2003：1－6.

［13］Erik Larsen，Ronald M Aarts，Michael Danessis.Efficient high－frequency bandwidth extension of music and speech［C］／／Proceedings of the 112th AES Convention.Munich，Germany：AES，2002：1－5.

［14］Ronald M Aarts，Erik Larsen，Dani?l Schobben.Improving perceived bass and reconstruction of high frequencies for band limited signals［C］／／Proceedings of the 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio.Leuven，Belgium：IEEE，2002：59－71.

［15］Chatree Budsabathon，Akinori Nishihara.Bandwidth Extension with Hybrid Signal Extrapolation for Audio Coding［J］. IEICE Transactions on Fundamentals，2007，E90－A（8）：1564－1569.

［16］Julius O Smith，Jonathan S Abel.Bark and ERB Bilinear Transforms［J］.IEEE Transactions on Speech and Audio Processing，1999，7（6）：697－708.

［17］Mauricio D Sacchi，Danilo R Velis，Alberto H Cominguez. Minimum entropy deconvolution with frequency－domain constraints［J］.Geophysics，1994，59（6）：938－945.

［18］Yong－tao Sha，Chang－chun Bao，Mao－shen Jia，et al. High frequency reconstruction of audio signal based on chaotic prediction theory［C］／／Proceedings of IEEE International conference on Acoustics speech and signal processing. Dallas，Texas，USA：IEEE，2010：381－384.

［19］沙永濤，鮑長(zhǎng)春，賈懋王申.一種基于重構(gòu)八度音的音頻信號(hào)高頻重建方法［C］／／第十四屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)（CCSP－2009）論文集.長(zhǎng)沙：［s.n.］，2009：139－142.

SHA Yong－tao，BAO Chang－chun，JIA Mao－shen.A Method of High Frequencies Reconstruction of Audio signal based on Reconstructed Octave［C］／／Proceeding of the 14th Annually Academic Conference on Signal Processing.Changsha，China：［s.n.］，2009：139－142.（in Chinese）

BAO Feng was born in Changchun，Jilin Province，in 1990.He is now a principal investigator of National Innovation Research and Training Program for Beijing University of Technology.His research concerns audio information processing.He holds an excellent award for course study and a top award for Embedded System Design Competition of Yu－xing Cup.

劉鑫（1986－），男，北京人，北京工業(yè)大學(xué)碩士研究生，主要研究方向?yàn)橐纛l信號(hào)處理；

LIU Xin was born in Beijing，in 1986.He is now a graduate student.His research direction is audio signal processing.

賈懋王申（1982－），男，河北張家口人，2010年獲北京工業(yè)大學(xué)博士學(xué)位，現(xiàn)為講師，主要研究方向?yàn)檎Z(yǔ)音與音頻編碼；

JIA Mao－shen was born in Zhangjiakou，Hebei Province，in 1982.He received the Ph.D.degree in Electrical Engineering from Beijing University of Technology in 2010.He is now a lecturer.His research direction is speech and audio coding.

鮑長(zhǎng)春（1965－），男，內(nèi)蒙古赤峰人，北京工業(yè)大學(xué)教授、博士生導(dǎo)師，主要研究方向?yàn)檎Z(yǔ)音與音頻信號(hào)處理。

BAO Chang－chun was born in Chifeng，Neimonggol Autonomous Region，in 1965.He is now a professor and also the Ph.D.supervisor. His research direction is speech and audio signal processing.

Email：chchbao＠bjut.edu.cn

Analysis and Forecast of Audio Bandwidth Extending Techniques

BAO Feng，LIU Xin，JIA Mao-shen，BAO Chang-chun
（Speech and Audio Signal Processing Lab，School of Electronic Information and Control Engineering，Beijing University of Technology，Beijing 100124，China）

The non-blind and blind high frequency reconstruction methods for extending audio bandwidth are introduced and compared in this paper.The basic principles of six specific methods related to the non-blind one and four specific methods related to the blind one are given，respectively.Their advantages and disadvantages of these methods are evaluated as well.Finally，it is pointed out that the blind high frequency reconstruction will be the research focus in the development of bandwidth extending.

audio signal processing；audio coding；bandwidth extension；high frequency reconstruction

The National Natural Science Foundation of China（No.60872027，61072089）；The Natural Science Foundation of Beijing（No.4082006）；The Funding Project for Academic Human Resources Development in Institutions of Higher Learning Under the Jurisdiction of Beijing Municipality；National Innovation Research and Training Program for Beijing University of Technology（No.101000506）

TN912.3

10.3969／j.issn.1001－893x.2011.02.025

鮑楓（1990－），男，吉林長(zhǎng)春人，北京工業(yè)大學(xué)國(guó)家大學(xué)生創(chuàng)新性實(shí)驗(yàn)項(xiàng)目負(fù)責(zé)人，主要研究興趣為音頻信息處理，曾獲北京工業(yè)大學(xué)學(xué)習(xí)優(yōu)秀獎(jiǎng)和北京工業(yè)大學(xué)“裕興杯”嵌入式系統(tǒng)設(shè)計(jì)競(jìng)賽一等獎(jiǎng)；

1001－893X（2011）02－0122－05

2010－11－08；

2011－01－17

國(guó)家自然科學(xué)基金資助項(xiàng)目（60872027，61072089）；北京市自然科學(xué)基金資助項(xiàng)目（4082006）；北京市屬高等學(xué)校人才強(qiáng)教計(jì)劃；北京工業(yè)大學(xué)國(guó)家大學(xué)生創(chuàng)新性實(shí)驗(yàn)項(xiàng)目（101000506）

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

音頻帶寬擴(kuò)展技術(shù)分析與展望?

1 引言

2 非盲目式高頻重建方法

3 盲目式高頻重建方法

4 結(jié)論