曹軍梅
摘 要: 在詳細分析MP3音頻數(shù)據(jù)流結(jié)構(gòu)的基礎(chǔ)上,利用數(shù)字水印技術(shù),提出一種版權(quán)保護的魯棒音頻水印算法。首先,選擇MP3編碼長窗中的中頻對應(yīng)的比例因子作為嵌入位置,保證了水印的不可感知性;其次,將二值圖像水印進行混沌加密,提高了水印信息的安全性;并且實現(xiàn)了版權(quán)水印的盲提取。仿真實驗證明,該算法不僅具有較好的透明性,而且對諸如噪聲、濾波、采樣、回聲、剪切、壓縮等攻擊均具有較好的魯棒性。
關(guān)鍵詞: MP3; 比例因子; 數(shù)字水?。?版權(quán)保護
中圖分類號: TN915?34 文獻標識碼: A 文章編號: 1004?373X(2016)04?0006?03
Abstract: The MP3 audio data stream structure is analyzed. A new robust audio watermarking algorithm for copyright protection is proposed in combination with the digital watermarking technology. The scale factor corresponding to intermediate frequency in the long window of MP3 encoding is selected as the embedded location to ensure the watermarking imperceptibility. The chaotic encryption of binary image watermarking is conducted to improve the security of watermarking information. The blind extraction of copyright watermarking was realized with the algorithm. The simulation experimental results show that the algorithm not only has better transparency, but also possess good robust against the attacks of white noise, low?pass filtering, resampling, echo, shearing, compression, etc.
Keywords: MP3; scale factor; digital watermarking; copyright protection
0 引 言
隨著互聯(lián)網(wǎng)的普及和信息的數(shù)字化,MP3已成為當下Internet應(yīng)用最為廣泛的音頻文件格式。通過網(wǎng)絡(luò)發(fā)表和傳播MP3文件給創(chuàng)作者和發(fā)行商帶來了極大的便利,但同時非法拷貝、篡改、盜版等現(xiàn)象嚴重影響著MP3作品的版權(quán)和安全性。由此可見,MP3音樂作品的版權(quán)保護已顯得十分重要。數(shù)字水印作為版權(quán)保護的一種新型的技術(shù),彌補了加密技術(shù)不能對解密后的數(shù)據(jù)提供保護的不足,因此也成為人們研究的熱點。
由于人類的聽覺系統(tǒng)比視覺系統(tǒng)更加敏感[1],所以在音頻中嵌入水印信息難度更大。文獻[2?4]提出將水印直接嵌入到MPEG音頻流比例因子和MPEG編碼的樣本數(shù)據(jù)中,但這些算法都沒有考慮自適應(yīng)和同步,魯棒性也不理想。本文在研究分析MP3文件音頻數(shù)據(jù)的基礎(chǔ)上,利用比例因子在MP3文件中存在冗余的特性,選擇長窗中的中頻對應(yīng)的比例因子進行水印的嵌入,同時考慮了同步和實時性。
1 MP3數(shù)據(jù)流分析
MP3幀的數(shù)據(jù)分為邊信息和主數(shù)據(jù)[5]。邊信息包括解碼必須的主數(shù)據(jù)開始位置、比例因子長度、與Huffman解碼相關(guān)的信息、與逆量化相關(guān)的信息等。主數(shù)據(jù)的每幀中包含粒度0和粒度1兩個粒度組,每個粒度組包含各聲道數(shù)據(jù),聲道數(shù)據(jù)是MP3解碼所需的比例因子和Huffman編碼數(shù)據(jù),當粒度組1共用粒度組0的比例因子時,粒度組1中的比例因子不傳輸。
編碼器進行MP3編碼時,在MDCT(Modified Discrete Cosine Transform)變換過程中,采用不同的窗來劃分成數(shù)個比例因子帶,長窗時576條頻譜線被劃分為21個比例因子帶,短窗時576條頻譜線被劃分為12個比例因子帶。長窗比短窗的敏感度更低[6]。對子帶進行量化時,每個子帶使用一個比例因子,音頻的頻率能量譜分布是非均勻的,它隨頻率的增大而減小,低頻集中了大部分能量,是人耳比較敏感的區(qū)域,對音頻重建有較大影響,在量化時采用精細的量化,而隨著頻率的增加量化精度下降[7]。
2 水印算法
2.1 嵌入位置的選擇
為了滿足水印的不可感知性、魯棒性等特征,通過對MP3音頻數(shù)據(jù)流分析可知,首先選擇主數(shù)據(jù)中粒度組0,其次選擇長窗中的中頻對應(yīng)的比例因子進行嵌入水印;在本算法中選擇11~15共5個比例因子嵌入水印。
2.2 水印預(yù)處理
2.2.1 混沌加密
2.2.2 降維處理
由于MP3音頻文件是一維的,為了將水印圖像嵌入MP3音頻中,需要對水印圖像進行降維處理。將混沌加密后的水印Wl按公式(4)轉(zhuǎn)化為一維水印,用一維數(shù)組存儲:
2.3 水印嵌入步驟
(1) 對二值字符水印圖像進行混沌加密和降維,具體方法見第2.2節(jié)。
(2) 讀取MP3幀邊信息,根據(jù)第2.1節(jié)原則選取比例因子。
(3) 根據(jù)水印W′[i]的值,按式(5)修改所選擇的比例因子。
2.4 水印提取步驟
該算法是盲水印算法,即提取水印時不需要原MP3音頻文件的參與。水印提取過程與嵌入過程相反:
(1) 讀取 MP3 文件,獲取比例因子信息,使用和嵌入水印時相同的原則,確定水印嵌入點,得到含水印信息的比例因子。
(2) 根據(jù)式(6),提取比例因子中的水印信息。
[Ws′k=SFW′ and 111] (6)
(3) 將最終得到的一維數(shù)組[Ws′k]恢復(fù)成N×N的二維矩陣[Ws′i,j],然后根據(jù)密鑰Key生成的混沌序列,對[Ws′i,j]進行解密得[W′x,y],即提取的最終水印圖像[W′]。
3 實驗驗證
仿真實驗環(huán)境為VS 2010+Matlab 2010,MP3原始音頻載體為采樣頻率44.1 kHz,雙聲道音頻信號,水印選用了[64×64]的二值文本圖像。由于采用的水印在感覺上是可視的,所以提取的水印信息很容易辨別。
3.1 不可感知性測試
不可感知性可能會隨著測試人的不同而出現(xiàn)一定的差異,為了更加精確地評價水印的不可感知性,通常采用信噪比SNR(Signal Noise Ratio)對其進行評價,其值越高,不可感知性越好。
3.2 魯棒性測試
4 結(jié) 語
本文在對MP3數(shù)據(jù)流分析的基礎(chǔ)上,通過有選擇地修改比例因子,設(shè)計出一種實用的 MP3版權(quán)保護音頻數(shù)字水印算法。該算法具有計算簡單、易于實時操作、水印盲提取等特點。實驗證明,該算法具有較強的不可感知性和魯棒性,可以有效地保護MP3 音樂作品的版權(quán)。
參考文獻
[1] 張力光,王讓定.心理聲學(xué)模型及其在MP3編碼中的應(yīng)用[J].寧波大學(xué)學(xué)報(理工版),2010,23(3):27?31.
[2] QIAO L, NAHRSTEDT K. Non?invertible watermarking methods for MPEG encoded audio [C]// SPIE Proceedings on Security and Watermarking of Multimedia Contents. USA: SPIE, 1999: 194?202.
[3] KOUKOPOULOS D, STAMATIOU Y. An dffient watermarking method for MP3audio files [J]. Computer technology, 2005, 7: 154?159.
[4] TAKAGI K, SAKAZAWA S. Light weight MP3 watermarking method for mobile terminals [C]// Proceedings of the 13th Annual ACM International Conference on Multimedia. [S.l.]: ACM, 2005: 107?128.
[5] 常遼豫,余小青,萬旺根,等.MP3壓縮域中語音分割的研究與實現(xiàn)[J].計算機應(yīng)用,2009,29(4):1189?1192.
[6] WANG C T, CHEN T S. A new audio watermarking based on modified discrete cosine transform of MPEG/audio layer [C]// Proceedings of IEEE International Conference on Networking, Sensing &Control. [S.l.]: IEEE, 2012: 984?989.
[7] 栗明嗚.MP3音頻數(shù)字水印技術(shù)研究[D].成都:西南交通大學(xué),2010:38?50.
[8] 許紅山.置亂技術(shù)在信息隱藏中的應(yīng)用[J].廣州大學(xué)學(xué)報(自然科學(xué)版),2004(2):134?136.