劉玲媛
[摘 要]多媒體技術(shù)的發(fā)展使圖像信息逐漸成為交互的主要內(nèi)容之一。解決圖像存儲(chǔ)與傳輸問題的壓縮編碼技術(shù)一直以來是國內(nèi)外研究的熱點(diǎn),從數(shù)據(jù)各種編碼方法的發(fā)展方向反映圖像壓縮編碼技術(shù)的飛速發(fā)展。主要介紹各種壓縮編碼技術(shù)的必要性、可能性、壓縮的過程,分類及各自的優(yōu)缺點(diǎn)。
[關(guān)鍵詞]數(shù)據(jù)壓縮 圖像壓縮 編碼方法
中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-7597(2009)0720041-02
一、多媒體數(shù)據(jù)壓縮的必要性
進(jìn)入信息時(shí)代,人們將越來越依靠計(jì)算機(jī)獲取和利用信息。多媒體計(jì)算機(jī)系統(tǒng)是現(xiàn)代計(jì)算機(jī)發(fā)展一個(gè)主流方向。數(shù)字化后的視頻和音頻等媒體信息具有數(shù)據(jù)海量性,與當(dāng)前硬件技術(shù)所能提供的計(jì)算機(jī)存儲(chǔ)資源和網(wǎng)絡(luò)帶寬之間有很大差距。這樣,就對(duì)多媒體信息的存儲(chǔ)和輿造成了很大的困難,成為阻礙人們有效獲取和利用信息的一個(gè)瓶頸。以一個(gè)陸地衛(wèi)星的為例:其水平、垂直分辨率分別為2340和3240,四波段、采樣精度7位,它的一幅圖像的數(shù)據(jù)量為2340*3240*7*4=212Mbit,按每天30幅計(jì),每天數(shù)據(jù)量為212*30=6.6Gbit,每年的數(shù)據(jù)量高達(dá)2300Gbit。
二、多媒體數(shù)據(jù)壓縮的可能性
圖像壓縮的目的是為了減少需要保存或傳輸?shù)臄?shù)據(jù)量,但這應(yīng)以不破壞原有圖像的信息為根本原則,否則,這種壓縮就失去了數(shù)據(jù)壓縮的意義。研究發(fā)現(xiàn),圖像數(shù)據(jù)表示中存在著大量的冗余。通過去除這些冗余數(shù)據(jù)可以使原始圖像數(shù)據(jù)極大地減少,而不會(huì)對(duì)圖像品質(zhì)產(chǎn)生很大影響,從而解決圖像數(shù)據(jù)量巨大的問題。而圖像數(shù)據(jù)冗余情況常見的有以下幾種:空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、知識(shí)冗余、視覺冗余、圖像區(qū)域的相同性冗余、紋理的統(tǒng)計(jì)冗余。圖像數(shù)據(jù)壓縮技術(shù)就是采取一定的策略從原始信息中找出并去掉這些冗余中的一種或幾種,以達(dá)到壓縮的目的。
三、圖像壓縮的一般過程
圖像壓縮處理一般是由兩個(gè)過程組成的:一是編碼過程,即將原始數(shù)據(jù)經(jīng)過編碼進(jìn)行壓縮,以便于存儲(chǔ)與傳輸;二是解碼過程,此過程對(duì)編碼數(shù)據(jù)進(jìn)行解碼,還原為可用的數(shù)據(jù)。
四、壓縮的分類
多媒體數(shù)據(jù)壓縮方法根據(jù)不同的依據(jù)可產(chǎn)生不同的分類。第一種,根據(jù)質(zhì)量有無損失可分為有損編碼和無損編碼。第二種,按照其作用域在空間域或頻率域上分為:空間方法、變換方法和混合方法。第三種:根據(jù)是否自適應(yīng)分為自適應(yīng)性編碼和非適應(yīng)性編碼。
五、多媒體數(shù)據(jù)編碼分類
六、常用的圖像壓縮技術(shù)編碼方法簡介
(一)脈沖代碼調(diào)制(PCM)
它實(shí)際上是連續(xù)模擬信號(hào)的數(shù)字采樣表示。PCM編碼器和解碼器位于一個(gè)圖像編碼系統(tǒng)的起點(diǎn)和終點(diǎn)。它們實(shí)際上分別是A/D轉(zhuǎn)換器和D/A轉(zhuǎn)換器。其它的編碼方法都是在多媒體數(shù)據(jù)模擬信號(hào)經(jīng)過PCM編碼后再進(jìn)行的壓縮編碼方法。
(二)預(yù)測編碼
編碼器記錄與傳輸?shù)牟皇菢颖镜恼鎸?shí)值,而是它與預(yù)測值的差。這一方法稱為DPCM方法。預(yù)測編碼方法原理,是從相鄰像素之間有強(qiáng)的相關(guān)性特點(diǎn)考慮的。比如當(dāng)前像素的灰度或顏色信號(hào),數(shù)值上與其相鄰像素總是比較接近,除非處于邊界狀態(tài)。那么,當(dāng)前像素的灰度或顏色信號(hào)的數(shù)值,可用前面已出現(xiàn)的像素的值,進(jìn)行預(yù)測(估計(jì)),得到一切預(yù)測值I估計(jì)值)將實(shí)際值與預(yù)測值求差,對(duì)這個(gè)差值信號(hào)進(jìn)行編碼、傳送。預(yù)測編碼主要是減少了數(shù)據(jù)在時(shí)間和空間上的相關(guān)性,因而對(duì)于時(shí)間序列數(shù)據(jù)有著廣泛的應(yīng)用價(jià)值。在數(shù)字通信系統(tǒng)中,例如語音的分析與合成,圖像的編碼與解碼,預(yù)測編碼已得到了廣泛的實(shí)際應(yīng)用。
預(yù)測編碼方法分線性預(yù)測和非線性預(yù)測編碼方法。線性預(yù)測是預(yù)測器中預(yù)測系數(shù)是固定不變的常數(shù)?;陬A(yù)測技術(shù)的幀間預(yù)測編碼技術(shù)處理的對(duì)象是序列圖像(運(yùn)動(dòng)圖像)。利用幀間的時(shí)間相關(guān)性進(jìn)一步消除圖像信號(hào)的冗余度,提高壓縮比。它也有兩種編碼方法是:條件補(bǔ)充法和運(yùn)動(dòng)補(bǔ)償技術(shù)。
(三)變換編碼
變換編碼不是直接對(duì)空域圖像信號(hào)編碼,而是首先將空域圖像信號(hào)映射變換到另一個(gè)正交矢量空間,產(chǎn)生一批變換系數(shù),然后對(duì)這些變換系數(shù),進(jìn)行編碼處理。變換編、解碼過程示意圖:
變換編碼技術(shù)已有近30年的歷史,廣泛應(yīng)用于各種圖像數(shù)據(jù)壓縮,諸如單色圖像、彩色圖像、靜止圖像、運(yùn)動(dòng)圖像,以及多媒體計(jì)算機(jī)技術(shù)中的電視幀內(nèi)圖像壓縮和幀間圖像壓縮等。
正交變換的種類很多,如傅里葉變換、沃爾什變換、哈爾變換、斜變換、余弦變換、正弦變換、K-L變換等。最佳的正交變換是K-L變換。次最優(yōu)的正交變換是DCT變換。變換編碼方案把N*N像素的圖像分割成n*n像素的子圖像,然后對(duì)每個(gè)子圖像的進(jìn)行單位變換。單位變換是一種可逆的線性變換。變換的目的是去除原始信號(hào)中像素間的相關(guān)性。這種去除相關(guān)的操作一般會(huì)亂信號(hào)能量僅在一小組傳輸系數(shù)上重新分布,利用這種方法,許多數(shù)可以在量化之后,可以借助于對(duì)比度敏感函數(shù)達(dá)到視覺上的無損壓縮。
在圖像壓縮中應(yīng)用變換,應(yīng)有如下的特性:
1.減少圖像相關(guān):理想的變換是將完全消除圖像塊中數(shù)據(jù)的相關(guān)。
2.基本函數(shù)與圖像無關(guān):由于圖像間的統(tǒng)計(jì)特征變化大,最佳的變換通常依賴于圖像本身,所以一般用于圖像無關(guān)的基本變換函數(shù)來替換最有性能變換。
3.快速實(shí)現(xiàn):n點(diǎn)的變換所需的操作一般是O(n2)。一些變換有快速實(shí)現(xiàn)的算法,其操作次數(shù)可以減少為O(nlogn)。
(四)統(tǒng)計(jì)編碼
如果要求在編碼過程中不丟失信息量,即要求保存信息熵,這種信息保持編碼又叫做熵保存編碼,或者叫熵編碼。熵編碼是無失真數(shù)據(jù)壓縮,用這種編碼結(jié)果經(jīng)解碼后可無失真地恢復(fù)原圖像。
信息量和信息熵。信息是不確定性的量度定義的。一個(gè)消息的可能性越小,其信息量越多;而消息的可能性越大,則其信息量越少。所謂信息量是指從N個(gè)相等可能事件中選出一個(gè)事件所需要的信息度量或含量,也就是在辨識(shí)N個(gè)事件中特定的一個(gè)事件的過程中所需要提問“是或否”的最少次數(shù)。例如:要從64個(gè)數(shù)中選定某一個(gè)數(shù),可以先提問“是否大于32”,不論回答是或否都消去了半數(shù)的可能事件,這樣繼續(xù)問下去,只要提問6次這類問題,就能從64個(gè)數(shù)中選定某一個(gè)數(shù)。這是因?yàn)槊刻釂栆淮味紩?huì)得到1bit的信息量。因此在64個(gè)數(shù)中選定某一個(gè)數(shù)所需要的信息量是:log264=6(bit)。如果將信源所有可能事件的信息量進(jìn)行平均,就得到信息的“熵”,熵就是平均信息量。
香農(nóng)信息論認(rèn)為,信源所含有的平均信息量(熵)就是進(jìn)行無失真編碼的理論極限。低于此極限的無失真編碼方法是找不到的,而只要不低于此極限,那就總能找到某種適宜的編碼任意地逼近熵。信源中或多或少的含有自然冗余度,這咱冗余既來自于信源本身的相關(guān)性,又來自于信源概率分布的不均勻性中。只要找到去除相關(guān)或改變概率分布不均勻的方法和手段,也就找到信息熵編碼的方法。因此,如何利用信息熵理論減少數(shù)據(jù)在傳輸和存儲(chǔ)時(shí)的冗余度,就是信息熵編碼所要解決的問題。
利用信息熵進(jìn)行編碼的方法有多種,有:哈夫曼編碼(利用概率分布特性);行程編碼方法(利用相關(guān)特性);算術(shù)編碼(利用概率分布)。前兩種方法廣泛用于數(shù)據(jù)編碼壓縮系統(tǒng)中,并被JPEG列入推薦算法的一部分。
哈夫曼編碼的理論依據(jù)是變字長編碼理論。在變字長編碼中,編碼器的編碼輸出漢字是字長不等的碼字,按編碼輸入信息符號(hào)出現(xiàn)的統(tǒng)計(jì)概率,給輸出碼字分配以不同的字長。對(duì)于編碼輸入中,出現(xiàn)大概率的信息符號(hào),賦以短字長的輸出碼字;對(duì)于編碼輸入中,出現(xiàn)小概率的信息符號(hào),賦以長字長的輸出碼字。
行程編碼是相對(duì)簡單的編碼技術(shù),主要思路是將一個(gè)相同值的邊疆串用一個(gè)代表值和串長。在進(jìn)行圖像編碼時(shí),可以定義特定方向上具有相同灰度值的相鄰元為一輪,其延續(xù)長度稱之為延續(xù)的行程,簡稱“游程”。游程的終點(diǎn)位置由前一游程的綹位置確定,這樣就可以由串來表示圖像數(shù)據(jù)。
算術(shù)編碼比哈夫曼編碼、行程長度等熵編碼方法都復(fù)雜,但是它不需要傳送像哈夫曼編碼的哈夫曼碼表,同時(shí)算術(shù)編碼還有自適應(yīng)能力的優(yōu)點(diǎn),所以算術(shù)編碼是實(shí)現(xiàn)高效壓縮數(shù)據(jù)中很有前途的編碼方法。它是將被編碼的信息表示成實(shí)數(shù)0和1之間的一個(gè)間隔。這種編碼方法的實(shí)現(xiàn)要比哈夫曼編碼能提高5%左右的效率。
七、結(jié)束語
壓縮技術(shù)的發(fā)展同社會(huì)的需求息息相關(guān),壓縮標(biāo)準(zhǔn)也是越來越多,基于知識(shí)的編碼和語義編碼將是壓縮編碼的發(fā)展方向,隨著數(shù)學(xué)理論、信息論以及計(jì)算機(jī)視覺理論等的發(fā)展,必然會(huì)有一些更新的、功能更全面的,效率更的高的壓縮編碼方法出現(xiàn)。