韓建亭,張 夙
(中國電信股份有限公司上海研究院 上海200122)
隨著光網(wǎng)城市的建設和3G無線網(wǎng)絡的發(fā)展,通信網(wǎng)絡更高的數(shù)據(jù)傳輸速率和數(shù)據(jù)業(yè)務支撐能力,為通信業(yè)務從傳統(tǒng)的話音轉(zhuǎn)向多媒體應用,提供了基礎和條件。近幾年智能終端產(chǎn)業(yè)鏈的迅速發(fā)展壯大,使得用戶通過手機、平板電腦、智能IPTV機頂盒等,使用各類多媒體應用成為可能。典型的多媒體應用(如流媒體點播、視頻監(jiān)控、可視電話等)取得了迅猛發(fā)展,跨網(wǎng)絡、多終端的融合通信業(yè)務正逐漸成為移動互聯(lián)網(wǎng)的核心和熱點業(yè)務。
隨著新應用的層出不窮,用戶對業(yè)務端到端的服務質(zhì)量也越來越關注。運營商為了提升競爭力,需要提供更加優(yōu)質(zhì)且有質(zhì)量保障的端到端視頻通信業(yè)務。影響視頻通信業(yè)務質(zhì)量的關鍵因素有哪些,對視頻通信業(yè)務如何進行評價,如何測試,是目前運營商需要重點關注的課題。
而目前,業(yè)界對視頻通信服務質(zhì)量評價方法的研究較少,且無相關的標準指導,導致評測視頻通信業(yè)務多以主觀為主,缺乏科學性和規(guī)范性。本文結(jié)合視頻質(zhì)量的主觀和客觀評估方法,研究影響視頻通信服務質(zhì)量的關鍵指標,對幾種基于智能終端的視頻通信產(chǎn)品的視頻服務質(zhì)量進行了評測和技術驗證,并對測試條件、測試方法、評分準則、數(shù)據(jù)處理等進行了規(guī)定,建立了基于智能終端的視頻服務質(zhì)量評測模型,為規(guī)范視頻通信業(yè)務質(zhì)量的評測奠定基礎。
IPTV、互聯(lián)網(wǎng)視頻等流媒體視頻服務與面向用戶的端到端視頻通信服務,對音視頻的質(zhì)量要求不同。視頻通信(包括視頻會議、視頻電話等)業(yè)務必須支持實時的編碼和解碼,對時延和時延抖動的要求更為苛刻。從體驗的角度分析,差異主要體現(xiàn)在以下幾個方面。
(1)雙向性
參與通話的雙方或多方都要進行媒體流的發(fā)送和接收,需要進行實時的編碼和解碼;流媒體視頻服務基本上都是單向的,用戶側(cè)只需進行音視頻的接收和解碼,不需要編碼。
(2)業(yè)務具備強交互性
視頻通信的雙方在話音和視頻方面都要求具備實時的交互性和互動性,流媒體的交互主要體現(xiàn)在點播和播放控制方面。
(3)對視頻質(zhì)量的連續(xù)性要求不強
視頻通信的視頻主要是人體肢體語言動作,相比流媒體支持播放的球賽、飛行、車輛等視頻,在連續(xù)性方面要求較低。
(4)對音視頻質(zhì)量要求相對較弱
視頻通信主要用于通話雙方的實時音視頻交互,偶爾出現(xiàn)停頓或斷續(xù)是可以容忍的,對畫質(zhì)和音質(zhì)的要求相對流媒體播放的音視頻畫質(zhì),可以降低。
盡管隨著IPTV等視頻播放業(yè)務的興起,國內(nèi)外對流媒體視頻服務質(zhì)量的研究已經(jīng)比較廣泛,但視頻通信業(yè)務對服務質(zhì)量的差異性,決定了評價視頻通信服務業(yè)務的服務質(zhì)量模式,不能夠采用流媒體服務質(zhì)量的評測方法。
視頻通信的服務質(zhì)量包括音頻質(zhì)量和視頻質(zhì)量兩方面。對于音頻服務質(zhì)量,由于目前VoIP技術的發(fā)展較為成熟,已有非常成熟的評估模型,并且相較于視頻碼流,音頻碼流所需網(wǎng)絡帶寬較小,目前各類視頻通信終端在網(wǎng)絡條件極其惡劣的條件下,都會采取優(yōu)先保障音頻服務質(zhì)量的策略,因此本文的研究范圍僅限于視頻服務質(zhì)量。
視頻通信的服務質(zhì)量,主要由視頻通信的終端能力和網(wǎng)絡服務質(zhì)量兩個方面所決定。
(1)終端處理能力
實現(xiàn)實時視頻通信特別是高清格式,需要對原始視頻信號進行較大的壓縮,而算法壓縮比越高,復雜度就會相應提高,對終端處理芯片的計算能力要求也就越高。因此終端視頻處理能力的提升,是實現(xiàn)高效壓縮算法的硬件保障。對于PC以及平板電腦而言,處理能力很強,終端性能不會成為影響視頻質(zhì)量的瓶頸;對于手機而言,主頻在500~800 MHz的智能手機都可承載視頻通信業(yè)務;對于機頂盒而言,需要具備支持實時視頻編解碼能力的處理芯片。
(2)攝像頭性能
攝像頭作為一種視頻輸入設備,其品質(zhì)決定了原始視頻的質(zhì)量,也就直接影響了接收端的視頻輸出。像素值是判斷攝像頭性能優(yōu)劣的重要指標。目前市場上常見的攝像頭都是采用USB接口的數(shù)字攝像頭,像素值最低為30萬左右。像素越高,圖像質(zhì)量越清晰,意味著同一幅圖像所包含的數(shù)據(jù)量越大,在編解碼器性能相同的前提下,對網(wǎng)絡帶寬的要求就越高。此外,攝像頭的視頻捕獲能力是另外一個重要指標,通常需要依靠硬件與軟件的結(jié)合達到滿足標準速率要求的捕獲指標。
(3)編解碼器性能
視頻編解碼器的性能是影響視頻質(zhì)量的關鍵因素。最優(yōu)的編碼器設計必須權(quán)衡壓縮效率及可用的計算能力,即在計算能力有限的情況下,獲得最佳壓縮效率。目前,圖像壓縮編碼方式主要有H.263、H.264、MPEG系列、AVS等標準,其中,H.264能夠在低帶寬下實現(xiàn)高清晰的動態(tài)圖像效果,而且編碼時延小,作為新一代視頻編解碼標準,其優(yōu)勢非常明顯。
視頻通信的服務質(zhì)量與網(wǎng)絡的性能有直接的關系,影響較大的因素包括分組丟失、端到端時延、時延抖動和帶寬4個方面。
(1)分組丟失
分組丟失是影響視頻質(zhì)量的關鍵因素。發(fā)送端和接收端之間數(shù)據(jù)分組數(shù)目的差值即網(wǎng)絡傳輸丟失的分組數(shù)目。分組丟失直接對視頻數(shù)據(jù)分組所在幀的解碼產(chǎn)生影響,進而對相關幀的解碼產(chǎn)生影響,形成傳播損傷,因此分組丟失對視頻服務質(zhì)量的影響是非常大的,如圖像會出現(xiàn)馬賽克、拖尾、停頓等。
(2)端到端時延
端到端時延分為固定時延和可變時延,前者包括編解碼器引入的時延和打包時延,后者包括承載網(wǎng)上的傳輸時延、服務處理時延、去抖動時延。根據(jù)不同的網(wǎng)絡負載狀況,端到端時延會發(fā)生變化。時延只能使視頻數(shù)據(jù)分組整體到達接收端的時間推遲,并不會影響數(shù)據(jù)分組之間的相對時間,因此時延對視頻服務質(zhì)量沒有太大的影響,即在保證音視頻同步并且時延在一個合理值范圍內(nèi)的前提下,時延對視頻通信服務質(zhì)量的影響可以忽略。
(3)時延抖動
抖動一般指視頻流中兩個連續(xù)數(shù)據(jù)分組的端到端時延的差值,使得視頻流到達接收端的時間不恒定,如果抖動時間超出一定的范圍,解碼器通常會丟棄此數(shù)據(jù)分組,這將直接影響解碼。因此抖動對需要規(guī)則化傳輸數(shù)據(jù)分組的視頻通信服務質(zhì)量有著顯著的影響,具體表現(xiàn)為圖像出現(xiàn)凝固或者快進。
(4)帶寬
視頻數(shù)據(jù)量比較大,而IP網(wǎng)絡本身無法提供帶寬保證,因此在特定分辨率下,媒體帶寬需求存在最小值,低于這個最小值,就會由于網(wǎng)絡擁塞而導致分組丟失、時延、抖動,影響視頻服務質(zhì)量,因此為了保證客戶端的可用性,視頻碼流不可以過高;另一方面,為了保障圖像質(zhì)量,碼流亦不可以過低,因此視頻碼流必須在可用性和視頻服務質(zhì)量之間進行折中考慮。
視頻質(zhì)量評價可分為兩大類:視頻主觀質(zhì)量評價(subjective quality assessment)和視頻客觀質(zhì)量評價(objective quality assessment)。視頻主觀質(zhì)量評價就是直接利用人對視頻的主觀感受給出視頻質(zhì)量的度量,視頻客觀質(zhì)量評價則是利用評估模型給出的量化指標自動計算視頻質(zhì)量。
主觀質(zhì)量評價方法得到的結(jié)果是視頻質(zhì)量主觀感受的最直接反映,符合視頻通信服務的最終目的,因此,ITU制定了多個針對視頻主觀測試的標準,如ITU-R BT.500-10規(guī)定了電視圖像質(zhì)量的主觀評測方法,ITU-T P.910、P.911規(guī)定了多媒體應用中的視頻主觀測試方法,ITU BT.1129和BT.1788規(guī)定了部分主觀視頻測試方法。
P.910中描述的4種多媒體應用的測試方法包括:絕對種類評分(absolute category rating,ACR)、帶隱藏參考的絕對種類評分 (absolute category rating with hidden reference,ACR-HR)、損傷種類評分 (degradation category rating,DCR)、成對比較法(pair comparison method,PC)。
主觀評價的評分標準常常采用五分制,分別與5個等級相對應,見表1。
表1 MOS評分等級
主觀質(zhì)量評價雖然能夠準確反映視頻質(zhì)量,但也有以下不足之處:
·主觀質(zhì)量評價必須在嚴格的測試環(huán)境中進行,實現(xiàn)起來步驟復雜,成本較高,并且具備較強的個體差異性;
·主觀質(zhì)量評價耗時長,實時性不高,不利于實時視頻通信中視頻服務質(zhì)量的評價。
在本文實驗中,主觀測試中使用ACR方法,受測者觀看通話視頻,使用滑動設備進行評分,在無參考視頻的情況下該方法比較合適。
由于視頻主觀質(zhì)量評價存在諸多不足,因此在實際應用中常采用視頻客觀質(zhì)量評價方法。根據(jù)評估過程中是否需要將源視頻文件作為參考,可以把視頻客觀質(zhì)量評價方法分為全參考(full reference,F(xiàn)R)、部分參考(reduced reference,RR)、無參考(no reference,NR)視頻客觀質(zhì)量評估方法3種。其中,無參考方法不需要將源視頻文件作為參考,通過提取并分析失真視頻中的失真特征信息(如模糊效應、分塊效應、噪聲效應等)對視頻質(zhì)量給出評分。由于這種方法不需要源視頻,因此非常適用于實時視頻通信業(yè)務視頻服務質(zhì)量的評價,但無參考方法對某些失真的敏感程度較低,無法檢測設計時沒有考慮到的失真類型。
由于人類視覺系統(tǒng)(human visual system,HVS)對不同類型失真的敏感程度不同,因此客觀評價的結(jié)果往往與視頻的主觀質(zhì)量不完全一致,不能很好地反映視頻通信業(yè)務的服務質(zhì)量。
綜合上述分析,本文在構(gòu)建視頻通信服務質(zhì)量模型時,采取主、客觀評估方法相結(jié)合的方式,即先由客觀評估方法獲取大量實驗數(shù)據(jù)構(gòu)建模型,再由主觀評估方法對模型進行驗證和修正。
現(xiàn)有的視頻主客觀評價標準大多基于傳統(tǒng)電視圖像,對新興的多媒體通信應用考慮不足,相關評價指標和方法都還不完善,需要進一步加以研究。ITU-T G.1070及Amendment(2009年修正案)建立了對于小格式(VGA及以下分辨率)音視頻點對點通信的QoE模型。G.1070標準利用多個音視頻編碼參數(shù)和網(wǎng)絡參數(shù)預測視頻電話的質(zhì)量,從統(tǒng)計的角度回歸相關參數(shù),利用這些參數(shù)預測視頻電話的質(zhì)量。關于HD分辨率的QoE模型G.OMVAS,目前正在研究中,SG12(Study Group 12)計劃在2014年通過最終版本。G.1070以及G.OMVAS的基本模型結(jié)構(gòu)如圖1所示。
G.1070提出的建議模型表示,符合一定的假設條件時,通過輸入一組音視頻通話過程中提取的關鍵參數(shù),如編解碼、碼率、分組丟失率、時延等,查找模型數(shù)據(jù)庫中對應該類型通話的系數(shù)值,根據(jù)這組系數(shù)值以及模型公式,估算本次音視頻的通話質(zhì)量。
模型數(shù)據(jù)庫由網(wǎng)絡側(cè)參數(shù)(分組丟失率、抖動等)以及視頻類參數(shù)(編解碼類型、碼率、幀率、視頻格式等)組成,當對特定視頻通信終端進行評測時,視頻類參數(shù)已經(jīng)確定,因此可以對模型進行簡化,得到視頻服務質(zhì)量與網(wǎng)絡參數(shù)之間的關系,如下所示:
其中,MOSVideo為視頻MOS值,采用五分制;PLR為分組丟失率,Jitter為抖動,Delay為時延,需要注意的是,由于分辨率會對MOS值造成影響,因此應針對客戶端提供的不同分辨率格式(如CIF、VGA、720P等)分別建模。
基于上述分析,需要在實驗室搭建如圖2所示的實驗環(huán)境,模擬不同網(wǎng)絡條件(包括分組丟失、抖動等)下,通過視頻質(zhì)量的主觀及客觀評價方法,評估各類智能終端的視頻通信客戶端產(chǎn)品的能力。通過實驗,采樣網(wǎng)絡參數(shù)與視頻質(zhì)量的關系數(shù)據(jù),分析模型原型、擬合系數(shù),進一步建立視頻通信產(chǎn)品的服務質(zhì)量評估模型。
實驗采用的主要測試工具見表2。其中,G5和Dex是Hammer測試儀表,可以在局域網(wǎng)環(huán)境內(nèi)分別模擬IMS核心網(wǎng)網(wǎng)元設備和視頻通信終端,與被測視頻通信客戶端互通,并對視頻質(zhì)量進行客觀評分,G5集成的客觀評估算法是一種無參考的視頻客觀質(zhì)量評估算法(VQmon);網(wǎng)絡損傷儀用來模擬不同的網(wǎng)絡條件,包括分組丟失率、抖動、帶寬等。采用G5測試儀表,與H.264終端互通,對視頻質(zhì)量做出評價。
表2 測試工具描述
實驗時,改變網(wǎng)絡損傷儀的設置,分別針對分組丟失、抖動等,控制網(wǎng)絡損傷,將測試儀表G5仿真視頻通信終端,與被評測的視頻通信客戶端通信,以獲取客觀MOS評分;為了減少誤差,同樣的網(wǎng)絡條件下,進行10次通話,每次通話時長為3 min,對10個MOS值取平均作為最終MOS值。改變網(wǎng)絡參數(shù),得到多組數(shù)據(jù)后,通過觀察數(shù)據(jù)關系估計模型原型并得到系數(shù)。
基于大量測試數(shù)據(jù),研究關鍵指標和視頻服務質(zhì)量的關系,通過對多個客戶端的評測,不斷修正評測方法和評測指標,最終為不同的分辨率提出視頻質(zhì)量評測模型。
考察分組丟失率和視頻質(zhì)量的關系時,時延、抖動均設置為0,不限帶寬,改變分組丟失率取值。實驗時,主要針對PC客戶端(分辨率為720P、CIF)和機頂盒客戶端(分辨率為VGA)進行測試,結(jié)果如圖3所示。
從圖3中可以看出,隨著分組丟失率的增大,MOS值不斷減小,即視頻質(zhì)量隨之下降;當分組丟失率大于1%時,MOS值已降至3.0甚至2.0以下,并且基本不再變化,視頻質(zhì)量已經(jīng)遠遠不可接受,繼續(xù)增大分組丟失率,不再有意義。同時,主觀觀測的結(jié)果表示,分組丟失一旦出現(xiàn),圖像就會出現(xiàn)馬賽克,在MOS值高于4.0時,視頻質(zhì)量基本不受影響;在MOS值低于4.0但高于3.5時;視頻質(zhì)量受到的影響較小,MOS值低于3.5時,視頻質(zhì)量受到的影響較大。
建模時,模型應在滿足準確性的前提下盡量保持簡單易用。從圖3可見,分組丟失率對視頻質(zhì)量的影響呈非線性形態(tài),因此可采用多階非線性回歸方程對模型進行分析,回歸方程形式如下:
其中,x代表分組丟失率,y代表MOS值,y0、A、R0為待定系數(shù)。模型的準確度可以由擬合優(yōu)度(R2)檢驗,R2越接近1,則表示模型的擬合程度越高。
所得的不同視頻分辨率對應的回歸方程系數(shù)見表3。
表3 擬合得到的回歸方程系數(shù)
由擬合優(yōu)度可見,3種模型的擬合優(yōu)度均大于0.90,都能比較好地擬合實驗中所得的數(shù)據(jù)。擬合效果如圖4~圖6所示。
考察時延和視頻質(zhì)量的關系時,分組丟失率、抖動均設置為0,不限帶寬,改變時延的設置。實驗結(jié)果顯示,時延設置為100 ms、200 ms、500 ms甚至1 s,MOS值均無變化,主觀感受除了視頻出現(xiàn)幾秒時延之外,圖像質(zhì)量沒有變化,而根據(jù)中華人民共和國通信行業(yè)標準《IP網(wǎng)絡技術要求——網(wǎng)絡性能參數(shù)與指標》的規(guī)定,進行多媒體傳輸(視訊業(yè)務),網(wǎng)絡時延上限不可超過400 ms。實際網(wǎng)絡情況的時延基本不會超過這個范圍,可以驗證時延對視頻質(zhì)量沒有太大的影響。
在實驗室,通過對1 000多次視頻通話的信息分析,提取分組丟失、抖動、有效碼流、客觀MOS評分等關鍵信息,建立視頻通信服務質(zhì)量數(shù)據(jù)倉庫,得出評測模型。
為了驗證模型的準確性,組織專家團隊對視頻服務質(zhì)量進行主觀評測,修正實驗結(jié)果。評測時,采用ITU-T P.910中推薦的視頻主觀質(zhì)量評估方法ACR作為研究和評價模型的基準,找到8名觀測者為視頻通信客戶端的服務質(zhì)量進行評分統(tǒng)計。
此外,對相同分辨率下的不同視頻通信客戶端進行測評,720P分辨率下,兩款視頻通信客戶端的MOS值隨分組丟失率變化的曲線如圖7所示。通過對比評估并結(jié)合視頻通信的業(yè)務需求,可見客戶端Ju更符合業(yè)務需求,客戶端Cai需要按照評測模型進行優(yōu)化和改進。隨著視頻通信客戶端的版本更新和性能提升,可以持續(xù)積累實驗數(shù)據(jù),對評測模型進行不斷修正。同時,評測模型也可以作為評價新入網(wǎng)視頻通信客戶端的標準。
本文圍繞基于智能終端的視頻通信業(yè)務視頻服務質(zhì)量,通過分析網(wǎng)絡服務質(zhì)量對視頻服務質(zhì)量的影響以及目前已有的視頻主客觀質(zhì)量評估方法,制定了適合視頻通信業(yè)務的測試標準,包括測試條件、測試方法、評分準則、數(shù)據(jù)處理等,建立了視頻服務質(zhì)量的評測模型并進行實驗室優(yōu)化驗證,為運營商有針對性地提升視頻通信業(yè)務的服務質(zhì)量提供了測試依據(jù)和方法。由于目前測試儀表和測試手段的限制,抖動對視頻質(zhì)量的影響暫未有有效的測試結(jié)論,下一步將對該結(jié)論進行補充。
1 ITU-T Recommendation P.910.Subjective Video Quality Assessment Methods for Multimedia Applications,1996
2 ITU-R Recommendation BT.500-11.Methodology for the Subjective Assessment of the Quality of Television Pictures,2002
3 ITU-T Recommendation G.1070.Opinion Model for Video-Telephony Applications,2007
4 Study Group 12.Proposal on Opinion Model for Audio and Video Streaming Applications(G.OMVAS),2011
5 Hyun Jong Kim.A study on a QoS/QoE correlation model for QoE evaluation on IPTV service.Advanced Communication Technology(ICACT),the 12th International Conference,South Korea,2010
6 IP網(wǎng)絡技術要求——網(wǎng)絡性能參數(shù)與指標標準.YD/T 1171-2001,2011
7 張大陸,張起強,胡治國等.IP網(wǎng)絡中視頻流QoE評價模型.計算機工程與應用,2012(3)