張揚(yáng)
摘 要:流媒體是現(xiàn)代信息技術(shù)快速發(fā)展的產(chǎn)物。流媒體技術(shù)的應(yīng)用,對(duì)人們的工作和生活產(chǎn)生了巨大影響。本文基于流媒體的基本概念,具體闡述了流媒體系統(tǒng)中的關(guān)鍵技術(shù),以期為促進(jìn)流媒體技術(shù)的不斷進(jìn)步提供一定的指導(dǎo)意義。
關(guān)鍵詞:流媒體系統(tǒng);關(guān)鍵技術(shù);研究實(shí)現(xiàn)
現(xiàn)階段,網(wǎng)絡(luò)技術(shù)和流媒體技術(shù)的不斷發(fā)展,推動(dòng)了流媒體業(yè)務(wù)的興盛。其中,新聞出版、電子商務(wù)以及遠(yuǎn)程醫(yī)療等領(lǐng)域中流媒體業(yè)務(wù)的應(yīng)用,極大地豐富了互聯(lián)網(wǎng)的相關(guān)功能。從現(xiàn)有的媒體市場(chǎng)發(fā)展?fàn)顩r來(lái)看,流媒體行業(yè)已經(jīng)逐漸地出現(xiàn)了一個(gè)較為穩(wěn)定的轉(zhuǎn)變趨向,即從傳統(tǒng)的流媒體協(xié)議向回到純HTTP下載。加強(qiáng)對(duì)流媒體系統(tǒng)關(guān)鍵技術(shù)的研究,對(duì)促進(jìn)流媒體業(yè)務(wù)的良好發(fā)展具有重要意義。
1 流媒體的基本概念
流媒體主要是指在網(wǎng)絡(luò)運(yùn)行過(guò)程中,以流的形式傳輸各種音頻、視頻以及其它多媒體文件的一種形式(如下圖1所示)[1]。作為一種有效的媒體網(wǎng)絡(luò)傳輸技術(shù),其能夠?qū)⑦B續(xù)的音頻視頻信息經(jīng)過(guò)特定的壓縮,并上傳到相關(guān)的網(wǎng)站服務(wù)器,用戶可以在客戶端下載的過(guò)程中欣賞視頻,以相應(yīng)地減少了用戶的等候時(shí)間。不過(guò),安裝客戶端的計(jì)算機(jī)需要?jiǎng)?chuàng)造一個(gè)緩沖區(qū)才能夠支持流媒體技術(shù)的運(yùn)行。通常來(lái)說(shuō),在采用流式傳輸方式的系統(tǒng)當(dāng)中,用戶可以在短時(shí)間內(nèi)利用計(jì)算機(jī)系統(tǒng)中相應(yīng)的播放器對(duì)已經(jīng)完成壓縮的視頻或音頻等流式媒體文件進(jìn)行播放,其它剩余的部分可以繼續(xù)下載,并持續(xù)到播放結(jié)束。
在這樣的一個(gè)過(guò)程中包含著一系列相關(guān)的“包”,簡(jiǎn)稱為“流”。當(dāng)流媒體技術(shù)進(jìn)入人類的生產(chǎn)生活領(lǐng)域中,人們可以在網(wǎng)上交互聊天時(shí),可以直接地采用語(yǔ)音的形式進(jìn)行輸入。同時(shí),如果雙方想要看到彼此的相貌和表情,那么只需要彼此安裝一個(gè)攝像頭即可。用戶在對(duì)流媒體內(nèi)容進(jìn)行訪問(wèn)時(shí),往往不是直接地可以獲取相關(guān)音頻視頻媒體內(nèi)容,而是需要經(jīng)過(guò)特定的媒體發(fā)布指定文件。一般來(lái)說(shuō),這些文件主要包括三種形式,即媒體壓縮格式,媒體流格式以及媒體發(fā)布格式。
2 流媒體系統(tǒng)中的關(guān)鍵技術(shù)研究
一個(gè)完整的流媒體系統(tǒng)大致包括編碼工具、服務(wù)器以及播放器等部分[2]。其中,編碼工具主要負(fù)責(zé)將不同的多媒體文件進(jìn)行編碼壓縮,從而轉(zhuǎn)換成適合在網(wǎng)絡(luò)上進(jìn)行傳輸?shù)母袷健7?wù)器則主要用于多相關(guān)用戶發(fā)布的一些多媒體內(nèi)容進(jìn)行存儲(chǔ)和管理維護(hù)。播放器主要是指用戶在客戶端的計(jì)算機(jī)上呈現(xiàn)已經(jīng)被解碼的媒體內(nèi)容。筆者在此主要探討的是流媒體編碼解碼的有關(guān)技術(shù)。
流媒體的傳輸過(guò)程大致為:起初,用戶根據(jù)自身的需要,選擇一種符合要求的流媒體服務(wù),用Web瀏覽器根據(jù)HTTP協(xié)議,對(duì)不同的信息進(jìn)行交換控制,并在服務(wù)器中檢索出需要傳輸?shù)募磿r(shí)數(shù)據(jù)(如下圖2所示)。常見的流媒體編碼壓縮技術(shù)包括可伸縮性編碼技術(shù)、多媒體標(biāo)準(zhǔn)技術(shù)以及對(duì)等網(wǎng)絡(luò)技術(shù)等。MPEG是指運(yùn)動(dòng)圖像專家組,主要負(fù)責(zé)制定一些適用于數(shù)字存儲(chǔ)技術(shù)、廣播電視等應(yīng)用場(chǎng)合的音頻視頻數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn)。MPEG格式標(biāo)準(zhǔn)大致包括MEPG-1,MEPG-2,MEPG-4,MEPG-7和MEPG-21。其中,MEPG-1的標(biāo)準(zhǔn)主要包括五個(gè)部分,系統(tǒng)層、圖像層、聲音層、一致性測(cè)試層以及軟件仿真技術(shù)報(bào)告五個(gè)部分。系統(tǒng)層主要說(shuō)明了如何根據(jù)圖像層和聲音層的相關(guān)規(guī)定,對(duì)音頻和視頻進(jìn)行復(fù)合編碼。一致性測(cè)試層則主要說(shuō)明了對(duì)解碼器和編碼器的輸出比特流進(jìn)行檢驗(yàn),是否符合系統(tǒng)層、圖像層以及聲音層相關(guān)部分的規(guī)定。軟件仿真技術(shù)報(bào)告則是一個(gè)用較為完整的C語(yǔ)言完成的一個(gè)編碼解碼器。多媒體將已經(jīng)選定的所有元素,諸如文字、音頻、靜態(tài)圖像、圖形以及視頻等集成到單一的媒體對(duì)象當(dāng)中。流技術(shù)可以幫助用戶在媒體對(duì)象中被讀取、收聽或者觀看的過(guò)程中實(shí)現(xiàn)對(duì)象的傳輸。其中,視頻圖像數(shù)據(jù)之間具有較為密切的關(guān)系,因此在對(duì)其進(jìn)行編碼的過(guò)程中需要對(duì)大量的冗余信息進(jìn)行清除。幀間編碼技術(shù)是一種常見的清除時(shí)域冗余信息的方式,大致包括三個(gè)部分,第一個(gè)部分是運(yùn)動(dòng)補(bǔ)償部分,即通過(guò)對(duì)先前的局部圖像進(jìn)行分析和預(yù)測(cè)現(xiàn)有的局部圖像,以減少幀與幀之間陳列的冗余信息。第二個(gè)部分是運(yùn)動(dòng)表示,主要是對(duì)不同區(qū)域的圖像進(jìn)行分析,然后根據(jù)用戶需要選定不同的運(yùn)動(dòng)矢量對(duì)運(yùn)動(dòng)信息進(jìn)行描述,并通過(guò)熵編碼進(jìn)行壓縮。第三個(gè)部分是運(yùn)動(dòng)估計(jì),即指從視頻序列中抽取一部分有用的運(yùn)動(dòng)信息作為補(bǔ)償。對(duì)空域冗余信息進(jìn)行去除則主要使用的幀內(nèi)編碼技術(shù)和熵編碼技術(shù)。其中,熵編碼技術(shù)是一種無(wú)損編碼技術(shù),主要負(fù)責(zé)的是對(duì)變換和量化后所得到的系統(tǒng)和運(yùn)動(dòng)信息進(jìn)行更深入地壓縮。由于幀內(nèi)圖像和預(yù)測(cè)差分信號(hào)中都含有較多的空域冗余信息,此時(shí)需要充分地發(fā)揮變換編碼器的功能,將空域信號(hào)變換到另一個(gè)新的正交矢量空間當(dāng)中[3]。當(dāng)對(duì)不同的冗余信息進(jìn)行編碼之后,系統(tǒng)會(huì)自動(dòng)地產(chǎn)生一批變換的系數(shù),通過(guò)對(duì)這些系數(shù)進(jìn)行不同量化的對(duì)比,保證編碼器的輸出可以達(dá)到特定的位率。
互聯(lián)網(wǎng)的發(fā)展和普及,流媒體系統(tǒng)的相關(guān)技術(shù)也將不斷成熟,為流媒體業(yè)務(wù)的拓展提供了廣闊的發(fā)展前景。
[參考文獻(xiàn)]
[1]蘇靜,劉明,馬玉春.基于P2P的流媒體系統(tǒng)關(guān)鍵技術(shù)的研究[J].電腦知識(shí)與技術(shù).2010(05).
[2]凌燕,藍(lán)善禎,徐品,潘麗.流媒體系統(tǒng)關(guān)鍵技術(shù)概述[J].電視技術(shù).2012(02).
[3]楊戈,田慧瑾.云環(huán)境下流媒體傳輸關(guān)鍵技術(shù)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用.2013(12).