耿森
摘要:文章以多媒體在線會議的發(fā)展現(xiàn)狀為切入點(diǎn),詳細(xì)研究了在線會議系統(tǒng)中的SIP協(xié)議、RTP協(xié)議等關(guān)鍵技術(shù),并對基于多媒體終端的在線會議系統(tǒng)進(jìn)行了設(shè)計(jì)與實(shí)現(xiàn)。
關(guān)鍵詞:SIP協(xié)議;RTP協(xié)議;在線會議系統(tǒng);實(shí)現(xiàn)
0 引言
在信息時代,各種新技術(shù)不斷出現(xiàn)并應(yīng)用在日常生活和商務(wù)交流中,如遠(yuǎn)程監(jiān)控系統(tǒng)、遠(yuǎn)程視頻會議系統(tǒng)等,這些技術(shù)的出現(xiàn),極大地縮短TAG人之間的距離,方便、快捷地解決了人們的問題,提高了工作效率。在會議系統(tǒng)中,傳統(tǒng)的會議模式已經(jīng)不能滿足人們工作和生活的需要,流動性的會議越來越受到人們的關(guān)注,多媒體終端的普及為在線會議系統(tǒng)的發(fā)展指明了新的方向。
1 多媒體在線會議的發(fā)展現(xiàn)狀
自20世紀(jì)70年代開始,國外就展開了對視頻會議系統(tǒng)的研究,近些年來,視頻會議在國內(nèi)也取得了迅速的發(fā)展。隨著用戶的需求多樣化,多媒體視頻會議的發(fā)展也呈現(xiàn)多樣化趨勢,廣泛應(yīng)用于企業(yè)、監(jiān)控、教學(xué)、運(yùn)營等各個領(lǐng)域。但視頻會議仍存在美中不足之處,一是專業(yè)的視頻會議系統(tǒng)造價高,二是一般的會議系統(tǒng)不能滿足人們對于會議系統(tǒng)隨時隨地使用的要求。
最初的視頻會議均采用專業(yè)的硬件設(shè)備,成本較高,無法在社會上進(jìn)行普及。但隨著PC和手機(jī)3G業(yè)務(wù)的不斷發(fā)展,人們開始期待能夠依靠多媒體終端進(jìn)行視頻會議。所以,在智能手機(jī)上開展隨時隨地的在線視頻會議成為研發(fā)者研究的方向,促進(jìn)了基于多媒體終端的在線會議系統(tǒng)成為現(xiàn)實(shí)。
2 關(guān)鍵技術(shù)的研究
2.1 SIP協(xié)議的基本原理及工作流程
SIP(Session Initiation Protocol)是信令協(xié)議中的一種,它可以實(shí)現(xiàn)對多媒體對話和會議進(jìn)行創(chuàng)建、改變和結(jié)束的操作,被廣泛應(yīng)用于工作在IP網(wǎng)絡(luò)之上的多媒體通信的控制過程,包括視頻會議系統(tǒng)中。SIP協(xié)議可以同時在TCP協(xié)議和UDP協(xié)議之上進(jìn)行工作。
SIP協(xié)議是屬于文本類型的一種協(xié)議,借鑒了HTTP(Hypertext Transfer Protocol,超文本傳輸協(xié)議)和SMTP(Simple Mail TransferProtocol,簡單郵件轉(zhuǎn)發(fā)協(xié)議)協(xié)議的格式。SIP包含請求和應(yīng)答兩種消息,具體實(shí)現(xiàn)如下:當(dāng)一方發(fā)送請求消息時,另一方以狀態(tài)碼的形式對請求方作出響應(yīng),經(jīng)雙方協(xié)商可進(jìn)行語音、視頻等通信,等會話結(jié)束后再使用SIP進(jìn)行處理。
2.2 RTP協(xié)議及RTCP協(xié)議
實(shí)時傳輸協(xié)議RTP(Real time Transport Protocol)用于在IP網(wǎng)絡(luò)上傳輸標(biāo)準(zhǔn)的音頻和視頻數(shù)據(jù)包,它被廣泛應(yīng)用于包括流媒體在內(nèi)的數(shù)據(jù)通信與娛樂系統(tǒng)中,當(dāng)然,在線會議系統(tǒng)中也需要用到RTP協(xié)議。
RTP應(yīng)結(jié)合RTP控制協(xié)議RTCP(RTP Control Protocol)來使用。RTP攜帶的是媒體流,被用于傳輸多媒體數(shù)據(jù);RTCP則用于監(jiān)控數(shù)據(jù)信息,并通過監(jiān)控發(fā)送的QoS參數(shù)保證服務(wù)質(zhì)量。RTP主要通過用戶數(shù)據(jù)報協(xié)iXuDP(User DatagramProtocol)實(shí)現(xiàn)其功能,且被認(rèn)為是IP網(wǎng)絡(luò)中音視頻傳輸?shù)闹饕獦?biāo)準(zhǔn)。
2.3 VOIP的基本原理
VOIP(Voice over IP)將聲音這種模擬信號轉(zhuǎn)換為數(shù)字信號,并將數(shù)字信號組裝成數(shù)據(jù)包的形式在IP網(wǎng)絡(luò)上進(jìn)行實(shí)時傳輸。相對于傳統(tǒng)網(wǎng)絡(luò)電話的服務(wù),VoIP的服務(wù)更優(yōu)質(zhì),因?yàn)閂OIP利用了Internet全球化的優(yōu)勢。VOIP可以在IP網(wǎng)絡(luò)上傳送語音和視頻等數(shù)據(jù),比如視頻會議,而且成本比傳統(tǒng)業(yè)務(wù)低。其基本原理是:設(shè)備實(shí)時采集音頻數(shù)據(jù),先編碼后進(jìn)行壓縮,隨之將壓縮的語音封裝成數(shù)據(jù)包,通過IP網(wǎng)絡(luò)把數(shù)據(jù)包傳送到目的地,經(jīng)解壓縮與解碼還原音頻信號,實(shí)現(xiàn)由IP網(wǎng)絡(luò)傳送語音的目的。
2.4 其它相關(guān)技術(shù)
Ffmpeg是一個極其快速的視頻和音頻轉(zhuǎn)換器,可以跨平臺實(shí)現(xiàn)音視頻的錄制、轉(zhuǎn)換與播放等功能。它的優(yōu)勢還在于可以從直播中獲取音視頻來源,并且實(shí)現(xiàn)任意采樣率與任意大小視頻之間的相互轉(zhuǎn)換。Ffmpeg對于多輸入文件的處理流程如下:首先根據(jù)輸入流的最低時間戳將文件同步,然后將編碼后的數(shù)據(jù)包傳遞給解碼器,解碼器產(chǎn)生未壓縮的幀并進(jìn)行處理過濾,再次傳送到編碼器進(jìn)行編碼,隨后編碼的數(shù)據(jù)包傳遞給復(fù)用器,寫入到輸出文件中。
Android操作系統(tǒng)基于Linux內(nèi)核的自由及開源,多用于智能手機(jī)、平板電腦等便攜設(shè)備中。Android系統(tǒng)采用了分層架構(gòu)的思想,主要有系統(tǒng)內(nèi)核層、系統(tǒng)運(yùn)行庫層、應(yīng)用程序框架層和應(yīng)用程序?qū)?,這種內(nèi)核和應(yīng)用分開的設(shè)計(jì),符合Linux系統(tǒng)的設(shè)計(jì)風(fēng)格。Android平臺具有開放性和開發(fā)者不受任何限制的優(yōu)勢。
3 基于多媒體終端的在線會議系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
3.1 在線會議系統(tǒng)的需求及功能
根據(jù)用戶需求,我們需要為無法到場的與會人員建立一個可以通過PC或者智能手機(jī)加入到會議中的平臺。從用戶的角度來講,一般的接入用戶只需要會操作PC和手機(jī)就能正常使用會議終端的各種功能,而作為主持會議的用戶則對在線會議系統(tǒng)有更多的要求,需要控制會議的發(fā)起、進(jìn)行和結(jié)束以及人員的安排等。從功能上來看,會議系統(tǒng)需要向各個會場提供音頻和視頻服務(wù),保證信息的完整性。從系統(tǒng)結(jié)構(gòu)上講,系統(tǒng)的拓?fù)浣Y(jié)構(gòu)應(yīng)盡量簡單,以減少系統(tǒng)冗余資源和不必要的錯誤。會議的傳輸網(wǎng)絡(luò)以LAN、WLAN網(wǎng)絡(luò)為主,智能手機(jī)端由WLAN接入,通過對網(wǎng)絡(luò)優(yōu)化和系統(tǒng)優(yōu)化的方法,保證傳輸?shù)膶?shí)時性。
多媒體終端會議系統(tǒng)應(yīng)具備以下功能:人員安排與分配、會議控制(包括會議發(fā)起、查詢、結(jié)束及會議日志報告等)、媒體處理、多終端接入等。
3.2 在線會議系統(tǒng)的設(shè)計(jì)方案
視頻會議系統(tǒng)的設(shè)計(jì)必須滿足基本的會議功能要求,同時盡量使系統(tǒng)結(jié)構(gòu)模塊化,便于模塊的改進(jìn)和升級。該系統(tǒng)不需要專門的設(shè)備,只要為用戶提供多媒體終端的可視化會議,滿足大多數(shù)人在線會議的需要即可。
在線會議系統(tǒng)的拓?fù)浣Y(jié)構(gòu)可以從控制拓?fù)浜兔襟w拓?fù)鋬煞N結(jié)構(gòu)中選擇。控制拓?fù)渲械募惺娇刂品绞讲捎靡粋€集中控制單元,可實(shí)現(xiàn)對整個會議系統(tǒng)的發(fā)起與調(diào)度功能,該集中控制單元與每個與會者都有端對端的連接,保證與會者都參與到會議中。媒體拓?fù)渲械募惺酵負(fù)浣Y(jié)構(gòu)主要是通過媒體處理實(shí)體和與會人員進(jìn)行數(shù)據(jù)交互,該媒體處理實(shí)體負(fù)責(zé)數(shù)據(jù)的接收、編碼、發(fā)送、解碼等功能。從物理結(jié)構(gòu)上看,在線會議系統(tǒng)由服務(wù)器、主會場和分會場三部分組成。從邏輯上看,會議系統(tǒng)包括注冊服務(wù)器、代理服務(wù)器、會議控制器、媒體處理器和用戶終端等。在線會議系統(tǒng)中可采用Speex作為音頻解碼器,H.263作為視頻解碼器。
3.3 在線會議系統(tǒng)的實(shí)現(xiàn)
3.3.1 注冊服務(wù)器的實(shí)現(xiàn)
在SIP信令協(xié)議中,用戶代理要想發(fā)起和接受呼叫,都必須先在注冊服務(wù)器進(jìn)行信息注冊。注冊流程如下:注冊服務(wù)器首先對發(fā)送來的消息進(jìn)行分析,如果是注冊消息,則進(jìn)行用戶信息解析,同時判斷是注冊命令還是注銷命令;若為注冊命令,則在該用戶不存在的情況下將用戶加入到用戶庫中;若為注銷命令,則在用戶庫中將用戶信息刪除。
在注冊服務(wù)器注冊的實(shí)質(zhì)是指綁定注冊用戶的用戶名和物理地址的映射關(guān)系,代理服務(wù)器可以根據(jù)用戶名查找到對應(yīng)的位置并進(jìn)行命令操作。
3.3.2 會議控制器的實(shí)現(xiàn)
會議控制器是包括會議控制、代理服務(wù)器和媒體處理器三個模塊的統(tǒng)稱,是整個會議的核心控制系統(tǒng)。會議控制器的工作流程如下:會議主持人通過會議控制器中的會議控制模塊進(jìn)行會議發(fā)起和相關(guān)多媒體功能的使用;隨后代理服務(wù)器分析命令,進(jìn)行SIP消息的組裝,將消息發(fā)送到各個終端;媒體處理器進(jìn)行媒體數(shù)據(jù)的處理,負(fù)責(zé)主會場與各終端音視頻數(shù)據(jù)的接收和發(fā)送等。
3.3.3 多媒體終端的實(shí)現(xiàn)
普通用戶要想?yún)⑴c會議需使用多媒體終端,終端系統(tǒng)主要包含會議注冊、接受邀請、加入會議以及退出會議等多種功能。多媒體終端作為用戶與會議交互的媒介,不僅需要向用戶提供會議服務(wù),也需要將終端用戶的數(shù)據(jù)提供給服務(wù)器方。
多媒體終端最核心的功能是獲取流媒體數(shù)據(jù)的處理,因?yàn)榻K端系統(tǒng)需要捕獲用戶的圖像和聲音,并將這些信息進(jìn)行編碼后發(fā)給服務(wù)器,服務(wù)器進(jìn)行解碼還原到為圖像和聲音,在揚(yáng)聲器和顯示屏上進(jìn)行顯示,最終保證會議的順利進(jìn)行。
4 結(jié)語
隨著技術(shù)的發(fā)展和進(jìn)步,在線會議系統(tǒng)的研究和應(yīng)用也不斷取得新的進(jìn)展,滿足了人們隨時隨地進(jìn)行溝通和交流的需要,但仍然存在一些需要解決的問題。目前,隨著網(wǎng)絡(luò)技術(shù)以及多媒體技術(shù)的發(fā)展,在線會議系統(tǒng)已成為通信領(lǐng)域研究的熱點(diǎn),尤其是基于多媒體終端的在線會議系統(tǒng)。相信隨著科技的進(jìn)一步發(fā)展,基于多媒體終端的在線會議系統(tǒng)會越來越完善,逐漸滿足人們對于會議的更高要求。