沈有成 武漢輕工大學 電氣與電子工程學院
數(shù)字圖像處理技術是電子計算機發(fā)展的產(chǎn)物,人們利用它處理圖形和圖像信息。早期該技術被用于提高圖像質(zhì)量,改善視覺效果,并在取得成就后獲得了迅速的發(fā)展,應用日漸廣泛。而目前通信工程把有關文字、圖像、聲音和數(shù)據(jù)相結合的多媒體通信作為主要的發(fā)展方向,其中因圖像的數(shù)據(jù)量巨大,在傳輸途中顯得尤為困難,數(shù)字圖像處理的圖像編碼壓縮等技術正好可以解決這個難題。本文主要針對數(shù)字圖像處理技術的內(nèi)容,以及該技術在通信工程領域的應用現(xiàn)狀和前景進行分析討論。
圖像是人們在日常生活中獲取信息的重要來源,據(jù)研究表明,這些信息有大約70%是人眼獲得的圖像信息,如何更好的處理這些圖像信號成為了關鍵。數(shù)字圖像處理技術,指的就是將圖像信號以一定形式轉(zhuǎn)換成數(shù)字信號,并由計算機進行處理的一種技術。它于上個世紀應運而生,幫助美國處理了航天探測器拍攝的大量月球圖像,又被一名英國工程師用于發(fā)明X射線計算機斷層攝影裝置,也就是我們俗稱的CT。在航空航天和醫(yī)學方面屢建奇功后,數(shù)字圖像處理技術受到了廣泛關注,并陸續(xù)在軍事工業(yè),文化藝術和通信工程等方面取得進展。
(1)信息源多為二維數(shù)據(jù),處理的信息量大,對硬件的運行速度和儲存空間要求較高。
(2)數(shù)字圖像中各像素之間相關性強,適宜于圖像數(shù)據(jù)的壓縮。
(3)處理的圖像是三維物體的映射,計算機只能對圖像采集時丟失掉的幾何信息進行模擬補充,處理結果具有不確定性。
(4)數(shù)字圖像處理技術綜合程度高,需要操作者具有較高的數(shù)學或?qū)I(yè)能力。
(1)圖像變換
圖像變換是研究數(shù)字圖像處理的一個重要內(nèi)容。由于是在空間域中直接處理,圖像陣列大,所以常見如下變換:傅里葉變換、正弦(余弦)變換、哈達碼變換、沃爾什變換、小波變換等,根據(jù)它們的性質(zhì)特點,將圖像轉(zhuǎn)換到變換域中然后間接處理, 比如傅里葉變換可以在頻域中進行數(shù)字濾波處理,或者由空間域的圖像轉(zhuǎn)換到頻域的變換處理都能夠有效改善圖像質(zhì)量,新興的小波變換在時域和頻域也有出色的表現(xiàn)。因為大部分變換都存在快速實現(xiàn)的手段(快速傅里葉變換FFT)從而提高了運算的速度。
(2)圖像壓縮
圖像壓縮編碼技術能在滿足一定圖像質(zhì)量要求(不失真,或能夠允許的失真范圍里)的前提下, 將圖像數(shù)據(jù)變換,編碼和壓縮,除去對人們需求的區(qū)域不相關的冗余信息,最大程度地減少圖像的數(shù)據(jù)量。促使圖像壓縮編碼技術產(chǎn)生的原因是數(shù)字圖像信號的數(shù)據(jù)量過大,例如我們常見的超清1920*1080靜態(tài)彩色圖片(RGB),每種顏色用8bit表示,則該圖片的數(shù)據(jù)量為:
1920*1 080*3 *8/8=6220800Byte
而像素的相關性給該技術的發(fā)展提供了空間。因此在圖像的存儲和傳輸中,圖像壓縮編碼發(fā)揮著重要的作用,為圖像的傳輸節(jié)省了帶寬。當前圖像壓縮編碼的方法有很多,從信息是否可逆方面來看分為有損編碼和無損編碼,由于不同的壓縮比和圖像質(zhì)量,這兩種方法一般應用于不同的方向。
(3)圖像增強
圖像增強主要是指利用各種數(shù)學方法和變換技術,對圖像進行失真處理,對圖像中的物體特征區(qū)別對待,針對特定場合提升人們需要部分的圖像視覺效果,也可以同時抑制其他部分的特征,起到加強識別,便于分析的作用。圖像處理技術由處理的空間不同可分為頻域算法和空域算法,前者采用高通濾波法增強邊緣高頻信號,低通濾波法去除圖像噪聲來提高圖像清晰度,后者采用均值、中值濾波法使圖像平滑消除噪音,灰度變換和直方圖修正使圖像均勻,增強對比度。
(4)圖像分割
圖像分割作為一個將圖像中的特征區(qū)域分離出來的過程,是圖像處理向圖像分析過渡的關鍵。圖像分割有基于閾值、區(qū)域、邊緣的分割方法和相關的特定理論,其中最常被用到的就是閾值分割法,只要確定一個合適的閾值T,然后將像素點的灰度值與其對比,就能快速得到分割后的圖像區(qū)域。輸入圖像f到輸出圖像g的轉(zhuǎn)換關系:
對于圖像分割技術,盡管人們提出了大量的分割算法,但目前還未能實現(xiàn)通用的算法,只有根據(jù)特定情況選取最優(yōu)算法,因此圖像分割還有待進一步的分析研究。
(5)圖像復原
在物體成像過程中,由于目標和設備相對運動、系統(tǒng)誤差、噪聲干擾、介質(zhì)散射等因素,產(chǎn)生成像后的圖像“退化”(質(zhì)量降低)。圖像復原就是失真的逆過程,把退化的圖像修復或重建成原來的景物圖像。圖像復原主要研究造成圖像質(zhì)量降低的因素和建立退化數(shù)學模型。因為圖像復原的基本任務是去除模糊,所以需要用到去模糊函數(shù),并選用相關濾波進行處理。
(6)圖像重建
由于在醫(yī)療方面,特別是CT成像技術的成功應用,圖像重建得到了更好的發(fā)展。它是一種通過對物體外部測量,獲得物體的三維信息的技術。一般過程是先應用超聲波、X射線等方法獲取物體內(nèi)部的結構數(shù)據(jù),再將此數(shù)據(jù)進行運算處理而構成內(nèi)部圖像。常見的投影重建就是利用特殊射線穿過不同組織時,被吸收的程度不同,使得最后成像的各區(qū)域投射強度不同,逆向演算得出結果。
通信工程研究的是通過電磁波,聲波等形式把信息由發(fā)送端傳遞到接收端。當前的通信發(fā)展方向主要是多媒體通信,其中的圖像通信由于數(shù)據(jù)量大,顯得最為困難。盡管由于硬件的更新優(yōu)化和相關理論的發(fā)展,人們可以在通信過程中提供越來越大的帶寬,增加在固定時間內(nèi)傳輸資料的數(shù)量,但現(xiàn)代社會對于多媒體資源的品質(zhì)要求也在逐年提高,如播放視頻的清晰度從標清、高清到超清,每一級都需要比之前更大的數(shù)據(jù)資源,如果不壓縮數(shù)據(jù)量,以目前的傳輸速率很難做到實時傳輸,因此可以說圖像壓縮編碼是圖像傳輸?shù)募夹g前提。
若干個用戶之間的交互式通信是通信工程建設的重點,如可視電話就是點對點的交互式圖像通信,兩個圖像終端通過雙向通信線路直接相連,借助公網(wǎng)線路或電路交換網(wǎng)絡,傳輸圖像信息給對方。這種通話方式使得人們在遠距離交流中可以看到對方的圖像,還能同時分享更多信息,豐富了通信內(nèi)容。在通話過程中,由于要借助的公共電話網(wǎng)絡隨時隨刻都在處理著大量的數(shù)據(jù),所以對于傳輸數(shù)據(jù)量有一定要求,另一方面,可視電話圖像內(nèi)容相對單一,主要觀察的是雙方的頭肩圖像,可以適當降低圖像質(zhì)量,因此需要數(shù)字圖像處理技術,既能通過壓縮編碼減少數(shù)據(jù)量,得到更流暢的傳輸速度,又能通過圖像復原排除部分噪聲干擾,使接收終端達到要求的圖像質(zhì)量。會議電視和可視電話類似,同屬視聽通信業(yè)務, 但不同于可視電話的點對點的圖像通信,它還可以用于多點間的圖像通信, 傳送的圖像內(nèi)容也發(fā)生了改變,一般為運動量較小的室內(nèi)景物, 如公司管理人員同時參加會議的圖像等, 適用于多地點、多對象的“面對面”的信息交流活動。在會議電視系統(tǒng)中數(shù)字圖像處理技術也得到了有效的應用,根據(jù)一般會議的需求,會議電視對終端設備的圖像編碼能力也有更高的要求。由于編碼中采用了 VLC 技術,經(jīng)過圖像處理后的數(shù)據(jù)成為不均勻的數(shù)據(jù)流, 為了能勻速穩(wěn)定進行傳輸, 需要用傳輸緩沖存儲器來處理圖像信號使數(shù)據(jù)更平滑。當圖像信號被傳輸?shù)浇邮斩?,則需要解碼器經(jīng)過解碼、格式轉(zhuǎn)換、D/A后,才能最后在監(jiān)示器上顯示數(shù)字圖像處理后的信息。
交通控制系統(tǒng)是通信工程在交通控制領域的重要體現(xiàn),早期的交通控制系統(tǒng)將一條道路上多個交叉口信號燈機械聯(lián)動,是一種內(nèi)聯(lián)式的線控制系統(tǒng),隨著城市的建設和汽車的普及,傳統(tǒng)系統(tǒng)無法滿足城市道路需求,面控制系統(tǒng)作為一種能與時刻變化的交通情況相適應的交通控制系統(tǒng)應運而生,它可以利用計算機控制各交叉路口的交通信號,那么如何采集道路占有率、車速、交通事故等交通參數(shù)便成為了關鍵,此時數(shù)字圖像處理技術便為提取交通參數(shù)提供了新的途徑。數(shù)字圖像處理技術是通過安裝在各路口的圖像傳感器獲取道路交通圖像,然后利用計算機對圖像進行處理和識別來獲取需要的信息。得到的圖像中會有部分因為距離太遠,天氣惡劣等原因,不能清晰的反映路況和車輛信息,這時就要用到圖像復原對圖像預處理,然后利用圖像分割進行灰度變換,如增加車牌號和車牌顏色的對比度,才能有效獲取目標特征,便于檢測和追蹤。
近年來,無線、移動通信的迅速發(fā)展給人們的生活方式帶來了巨大影響, 手機上常見的3G、WLAN、藍牙等都是無線通信技術的應用,在無線信道上傳輸實時圖像信息是其中一個重要發(fā)展方向。移動通信便捷實用的特點吸引了大量的用戶,使其成為世界上用戶最多的通信形式。移動通信從1G模擬移動系統(tǒng),發(fā)展到如今的4G高速移動通信系統(tǒng),4G相比較前代的的優(yōu)勢在于交互式的多媒體業(yè)務和高速優(yōu)質(zhì)的數(shù)據(jù)傳輸,在無線網(wǎng)絡環(huán)境中傳輸,由于傳輸途徑多,覆蓋范圍廣,會存在一定的誤碼率,我們可以利用數(shù)字圖像處理技術,采用糾錯編碼對誤碼進行掩蓋或直接重新傳輸,降低誤碼對圖像信息帶來的影響,保證圖像質(zhì)量。對于有媒體間同步需求的情況,如常見的音畫不同步,會直接影響人們的視頻觀看體驗,視頻圖像的分級編碼可以很好地解決此類問題。
在21世紀,隨著計算機技術的高速發(fā)展和人類社會的多樣化需求,數(shù)字圖像處理技術必將有更多人關注和深入的研究,不同學科間的相互融合也為其創(chuàng)造新的理論支持。數(shù)字圖像處理技術會在包括通信工程在內(nèi)的多個領域得到廣泛的應用實踐,為社會的發(fā)展做出貢獻。