国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

構建智能實時網絡,使能5G視頻業(yè)務繁榮

2021-11-28 08:54呂達鄭清芳
中興通訊技術 2021年1期

呂達 鄭清芳

摘要:5G將促進視頻業(yè)務的大繁榮,包括極大地改善現有的視頻業(yè)務體驗和催生新型的視頻服務形態(tài)。為應對5G視頻業(yè)務所面臨的超低時延、高可靠及高體驗質量等方面的挑戰(zhàn),中興通訊提出構建智能實時視頻網絡(SmartRTN)的理念,并圍繞這一理念,創(chuàng)新性地研發(fā)出一系列技術和方案,包括基于內容智能分析的低碼高清視頻編碼技術、超低時延的網絡傳輸、基于深度學習的內容處理與增強、結合邊緣計算以及網絡切片的組網方案和智能調度策略等。這些技術和方案被應用于視頻業(yè)務端到端各個環(huán)節(jié),有效地解決了困擾5G視頻業(yè)務發(fā)展的技術瓶頸問題。

關鍵詞:低碼高清;實時通信;超分辨率;智能調度;體驗質量

Abstract: 5G is expected to bring prosperity of video applications, including significantly improving existing applications and bringing forth new exciting applications. To meet the challenges of 5G video applications, such as ultra low latency, high reliability and high quality of experience, ZTE proposes the concept of constructing smart real time video network (SmartRTN). Based on this concept, ZTE innovatively develops a series of technologies and solutions, including low bitrate high quality video compression based on content intelligent analysis, ultra low latency video transportation, smart video processing and enhancement based on deep learning, networking solutions and intelligent scheduling strategies combining edge computing and network slicing. These technologies and solutions have been applied in all end-to-end video service processes, effectively solving the technical bottlenecks that beset 5G video service development.

Keywords: low bitrate high quality; real time communication; super resolution; smart scheduling; quality of experience

1 5G視頻業(yè)務概述

1.1 5G促進視頻業(yè)務持續(xù)發(fā)展

5G具有大寬帶、低時延的特點,它解決了視頻業(yè)務發(fā)展的關鍵瓶頸問題,大大促進了視頻業(yè)務的發(fā)展。5G不僅使傳統(tǒng)視頻業(yè)務,如安防、視頻會議、點播、直播等,獲得了迅速發(fā)展,還使由視頻業(yè)務衍生的遠程教育、遠程醫(yī)療等遠程交互業(yè)務也獲得了巨大發(fā)展。更進一步地,面向家庭和娛樂場景的超高清視頻、沉浸式視頻、全景視頻、3D視頻也獲得了高速發(fā)展的機會。

根據Cisco可視化網絡指數(VNI)預測,到2022年,全球互聯網協(xié)議(IP)視頻流量將占總流量的82%,如圖1(a)所示。所有形式的IP視頻(包括互聯網視頻、IP視頻點播、視頻流游戲、視頻會議和基于文件共享的視頻文件)的總和將繼續(xù)保持在總IP流量的80%~90%。2017—2022年,全球視頻流量的復合年增長率為26%。 隨著網絡的廣泛部署以及市場競爭的發(fā)展,移動視頻業(yè)務發(fā)展迅猛,2022年移動視頻流量將占據總移動數據業(yè)務的79%,并保持46%的年復合增量率,如圖1(b)所示。

1.2 新型視頻業(yè)務下的端到端技術指標

視頻業(yè)務的形態(tài)不斷增加,對端到端的技術指標提出差異化要求:準實時直播時延的可接受范圍為1~3 s;實時互動直播的時延要控制在500 ms以內;視頻會議要求端到端時延需要在200 ms以內、編碼時延需在100 ms以內、操作指令時延在30 ms以內;而對于實時性要求較強的增強現實(AR)/虛擬現實(VR)業(yè)務及云游戲業(yè)務,端到端時延一般需要控制在100 ms以內、編碼時延需要在控制在10 ms以內。

1.3 5G視頻業(yè)務端到端的質量仍需提升

5G給網絡狀況帶來的提升只是視頻業(yè)務繁榮的必要非充分條件,我們還必須從視頻業(yè)務端到端全流程的角度來設計完整的技術體系。5G只是為視頻的高效傳輸提供底層網絡支撐。如何協(xié)同利用人工智能(AI)、云計算、邊緣計算等新技術,來構建端到端的視頻技術體系,以及如何從智能實時網絡、智能化處理、端云邊協(xié)同高性能計算及存儲、智能部署等多個角度、業(yè)務全流程,來提升視頻業(yè)務采集、預處理、編碼、傳輸、解碼、后處理、渲染各個環(huán)節(jié)的處理效率和業(yè)務質量,以給用戶提供高清晰度、高流暢度、低時延、強交互感的極致用戶體驗,是中興通訊正在努力的方向。

2 中興通訊打造下一代智能實時網絡(SmartRTN)

中興通訊基于多年技術積累和產品研發(fā)工作,從信源、信道、用戶體驗、業(yè)務部署及運維等多方面綜合考慮,提出通過構建智能實時視頻網絡來使能視頻業(yè)務繁榮的理念。圍繞這一理念,中興通訊創(chuàng)新性地研發(fā)出一系列技術,并將這些技術成功應用于視頻業(yè)務端到端各環(huán)節(jié),例如:

(1)在信源方面,中興通訊結合業(yè)界最新視頻編碼標準的進展,通過對視頻內容的智能分析,合理地分配碼率,盡可能在保證較高畫質體驗的前提下提升數據壓縮比;進一步地引入基于AI的圖像生成技術,使特定場景內容(如人臉等)取得了極致的壓縮比。

(2)在信道方面,中興通訊自主研發(fā)傳輸協(xié)議,通過控制視頻編碼與傳輸之間的協(xié)同機制,有效降低了傳輸時延。精巧設計的抗丟包策略,實現了弱網環(huán)境下的可靠傳輸。

(3)在用戶體驗方面,中興通訊研發(fā)了一系列技術,以對不同環(huán)節(jié)予以改善。例如,在成像環(huán)節(jié),增強在不同光照條件下的畫面清晰度;在顯示環(huán)節(jié),通過虛擬背景技術保護用戶隱私;在會議場景中,通過對人臉以及人物動作的識別,使會場管理更加便利。

(4)在業(yè)務部署和運維方面,中興通訊借助5G的網絡切片,實現了用戶服務質量(QoS)差異化保障;使用邊緣計算,實現業(yè)務的就近接入和媒體的下沉處理;通過智能路由,實現最優(yōu)路徑的選擇;通過智能用戶體驗質量(QoE)檢測,及時發(fā)現故障并無感修復。

2.1低碼高清

視頻低碼高清是指在保證視頻畫面質量的前提下,盡可能提升壓縮比、降低視頻碼率,它可以從視頻編碼、視頻前后處理等多個維度進行提升。視頻編碼主要分為基于現有成熟編碼的優(yōu)化和新一代編碼技術的引入。

2.1.1挖掘現有視頻編解碼標準的最大

潛力

基于目前產品廣泛使用的H.264/ H.265編碼,我們實現針對不同場景的內容感知編碼(CAE)優(yōu)化:

(1)基于感興趣區(qū)域(RoI)編碼優(yōu)化

在典型的視頻通信場景中,人們的主要關注點在于人臉及周邊區(qū)域,而非背景區(qū)域。如圖2所示,在視頻通信發(fā)送端引入實時人臉檢測和基于RoI的編碼算法,并對不同區(qū)域設置不同的碼率,可使最終實現的RoI編碼在保持畫面主觀質量不下降的前提下,實現20%的碼率節(jié)省。

(2)基于屏幕內容特性的壓縮編碼優(yōu)化

無論是視頻通信還是云電腦的應用,視頻的內容來源主要包括兩類:屏幕內容分享和攝像頭視頻。屏幕內容和攝像頭采集生成的視頻內容有本質差別,H.265已有專門針對屏幕內容的高效視頻壓縮編碼(HEVC)-屏幕圖像編碼(SCC)[3]壓縮標準。如圖3所示,考慮到現有大規(guī)模部署的H.264系統(tǒng),針對視頻會議的輔流文檔共享、云電腦的屏幕內容分享場景,中興通訊對屏幕內容進行分類壓縮,采用調色板、文字特征提取等壓縮方式,在確保文字區(qū)域無損清晰的前提下,使圖像傳輸帶寬降低10%以上。

(3)基于動態(tài)幀率的編碼優(yōu)化

在視頻通信或云電腦的實際使用場景中,經常會出現階段性畫面無變化的情形,比如,在視頻交互通信中播放幻燈片(PPT)文檔內容、云電腦用戶操作不太頻繁。動態(tài)幀率的編碼優(yōu)化能夠根據場景的運動劇烈程度來動態(tài)實時調整幀率,比如在PPT分享或屏幕應用靜止時,可以通過自動降低幀率實現至少10%的綜合帶寬降低效果。

2.1.2 研發(fā)新一代編碼技術

除了前述基于現有H.264/H.265進行碼率、幀率等方面的編碼優(yōu)化外,中興通訊還積極參與研發(fā)新一代視頻編解碼技術。目前,全球最新視頻Codec標準主要以多功能視頻編碼(VVC,也稱H.266)[4]、開放媒體聯盟視頻標準(AV1)[5]和第3代數字音視頻編解碼技術標準(AVS3)[6]為主流,同時基本視頻編碼(EVC)[7]和低復雜度增強視頻編碼(LCEVC)[8]針對特定場景(如降低編碼復雜度、充分利用現有硬件等)也有一定的應用空間。部分最新視頻編碼碼率降低效果對比結果具體如圖4所示。

中興通訊持續(xù)參與 HEVC、VVC標準的制定工作,并在當前動態(tài)圖像專家組(MPEG)的兩個特別工作組(AHG)中擔任領導職位。

2.1.3 AI進一步提升壓縮比

AI在各個領域中的應用得到了迅猛發(fā)展,并在特定的業(yè)務場景中,帶來了新的解決方法。關注用戶真正的場景需求有可能顛覆傳統(tǒng)的視頻編解碼技術,并帶來極致的壓縮比。例如,在SmartRTN網絡中,針對個人視頻通信這種場景,傳輸的視頻幀主要由變化很小的背景圖片和運動的人臉構成,用戶的關注點主要是表情的交流?;谏墒綄咕W絡(GAN)的人臉生成技術可以對攝像頭獲取的內容的關鍵信息進行重構,以形成新的解決方案,具體如圖5所示。與傳統(tǒng)的基于像素域的信號處理技術相比,中興通訊提出基于感興趣目標和稀疏關鍵點檢測的方法,對視頻信息進行編碼?;谶\動驅動感興趣目標,并結合該場景下背景信息重構壓縮后的視頻幀,該方法使碼率得到了更加有效的壓縮——可以達到傳統(tǒng)算法碼率的1/10。同時,重構后的視頻可以任意切換光照模式和視角,在虛擬會場中可以實現統(tǒng)一的光照模式及物體的任意視角,為個人視頻通信業(yè)務提供更具沉浸式的臨場感和更加真實的眼神交流體驗。

2.2 超低時延傳輸

2.2.1 不同視頻傳輸協(xié)議

針對不同的視頻業(yè)務場景,常見的視頻傳輸協(xié)議有實時消息傳輸協(xié)議(RTMP)、通用媒體應用格式(CMAF)、低時延HTTP實時流媒體(LHLS)、Web實時通信(WebRTC)等,其技術特性對比如表1所示。

為了滿足實時音視頻通信對低時延傳輸的需求,中興通訊研發(fā)了超低時延傳輸協(xié)議,在傳輸層參考快速用戶數據報網絡連接(QUIC)[11]協(xié)議的基礎上做了大量的重新設計,例如加密機制、多路徑、前向糾錯(FEC)支持、優(yōu)先級管理、可配置的擁塞控制算法等,以滿足實時流傳輸場景的需求。在媒體傳輸的應用層上,中興通訊研發(fā)的協(xié)議與WebRTC、RTMP等協(xié)議兼容,可適配各種不同的實時音視頻應用場景的需求。

2.2.2 融合編碼和傳輸技術

實時通信系統(tǒng)需要考慮視頻編碼器和傳輸協(xié)議的協(xié)同控制。傳輸協(xié)議和編解碼器不同步或網絡條件不穩(wěn)定,容易引發(fā)延遲現象或故障。

(1)有兩份視頻編碼時,選擇最合適的一份以避免擁塞。

斯坦福的Salsify項目[10]創(chuàng)新性地體現了新的組合方式——編解碼器速率控制和傳輸擁塞控制。Salsify的編解碼器可保證發(fā)送者不會在網絡擁塞時發(fā)送幀(必要時會丟棄已經編碼的幀),且不固定幀的發(fā)送速率。同時,編解碼器還可被允許生成更接近可用網絡容量的幀,且生成每個幀的兩個版本:一個質量略高于先前的成功案例,另一個則質量略低。應用程序在查看每個選項的實際壓縮大小后,從這些選項中進行選擇(或不選)。官方的測試結果表明[11], Salsify比現有的商用系統(tǒng)(如Skype、FaceTime和WebRTC)在時延控制和視頻質量上更為優(yōu)秀。

(2)采用編碼與傳輸的管道機制,邊編碼邊傳輸

音視頻采集、編碼、傳輸、解碼、渲染等流程是相互聯動和影響的。采集、編碼與傳輸形成管道,可以有效降低時延。例如,視頻編碼編完一個切片后,在編下一個切片的同時,可傳輸剛編完的切片數據;若采用SVC或LCEVC編碼,則可以編完一個層,且在編下一個層的同時,立刻傳輸已編完的層數據。

2.2.3 擁塞控制技術

實際的網絡狀態(tài)是復雜多變的,丟包、延時和網絡帶寬都在時刻變化,這就對網絡擁塞控制算法提出了很高的要求。網絡擁塞是指發(fā)送的數據超過了網絡所能承載的傳輸能力。盡管基礎通信設施在不斷地完善,網絡擁塞的情況在5G時代還是會有可能出現。

針對實時音視頻傳輸的擁塞控制,中興通訊提出適應多場景的擁塞控制模塊,包括傳統(tǒng)的基于傳輸控制協(xié)議(TCP)的瓶頸帶寬和往返時延(BBR)[12]、基于用戶數據報協(xié)議(UDP)的谷歌擁塞控制(GCC)[13]和基于機器學習的擁塞控制功能。這些擁塞控制模塊可以被選擇部署在云端或者集成在發(fā)送端。

(1)針對視頻專網等高可靠環(huán)境,通信雙方可以采用TCP方式傳輸實時音視頻數據。此時發(fā)送端自動采用基于TCP的控制模塊。目前主要采用的擁塞控制算法是BBR系列。

(2)對于弱網不可靠環(huán)境,通信雙方采用UDP方式傳輸實時音視頻數據,發(fā)送端則自動采用UDP系列的控制算法,如GCC。

(3)另外,中興通訊提出的擁塞控制模塊還包括支持基于大數據驅動的智能擁塞控制決策模塊。該模塊通過收集發(fā)送端、傳輸網絡、接收端等多方的信息,形成對網絡擁塞程度的預測,從而推動發(fā)送端選擇不同的編碼參數、不同的傳輸協(xié)議、擁塞控制參數(詳細技術原理可參考本文2.4.3節(jié))。

2.2.4 FEC、自動重傳請求(ARQ)等

弱網對抗技術

FEC也叫前向糾錯碼,是視頻業(yè)務系統(tǒng)網絡保證可靠傳輸質量的重要方法。FEC可以對n份原始數據增加m份數據,并能通過n+m份中的任意n份數據,還原原始數據,即如果有任意小于等于m份的數據失效,仍然能通過剩下的數據還原出來。當前的FEC算法使用范特蒙矩陣或者柯西矩陣,來實現糾錯碼的功能。通過在傳統(tǒng)FEC算法上做自適應改進,中興通訊的視頻FEC方案可根據網絡條件,實現延時自調整、網絡自適應、冗余自增減等功能。

ARQ也是抵抗網絡丟包的一種重要手段。中興通訊視頻系統(tǒng)使用的是基于否定確認包(NACK)的丟包重傳技術。NACK是一種通知技術,其觸發(fā)通知的條件剛好與確認包(ACK)相反。在未收到消息時,NACK通知發(fā)送方“我未收到消息”,即通知未達。NACK在接收端檢測到數據丟包后,發(fā)送NACK報文到發(fā)送端。發(fā)送端根據NACK報文中的序列號,在發(fā)送緩沖區(qū)找到對應的數據包,并將其重新發(fā)送到接收端。ARQ和FEC配合使用,可以在不大幅增加網絡冗余的條件下,實現較好的抗丟包效果。在實際應用中,中興通訊視頻系統(tǒng)能抵抗80%的網絡丟包,滿足95%以上的使用場景。

2.3 視頻智能分析

2.3.1 暗景增強實現低光照下的視頻畫質提升

在視頻通信場景中,由于場地變換、光照攝像頭角度變化等因素,通常會出現由關鍵人臉部分光照不均勻導致的暗影現象,這影響了用戶體驗。中興通訊通過對大量3D人臉在不同光照模式下的數據進行模擬訓練,實現了基于2D圖像對光照條件的預測,并通過光照條件的映射實現了自然光照場景下人臉圖像的非線性變換模擬,使之達到了光照均勻的效果,提升了暗光場景下的人臉畫質。

2.3.2 人像分割及背景虛化

視頻通信可以隨時隨地通過移動終端接入。雖然這極大地方便了客戶使用,但同時也導致客戶個人私密信息出現在視頻中。因此,基于語義分割的背景和背景虛化功能就成為了視頻通信產品不可或缺的功能。

中興通訊基于神經網絡架構搜索技術構建了輕量級模型,在自收集的 Portrait數據集上進行訓練,實現了端側的語義分割算法,并通過網絡模塊輕量化設計、模型剪枝及模型蒸餾等提速方案,得到了300 kB大小的輕量級語義分割模型。通過端側的部署加速和前后端處理的項目流程優(yōu)化,我們在驍龍845手機芯片上實現了高達33 幀/秒的實時推理過程。

背景替換和虛化技術是基于實時人像分割技術的應用。在使用輕量化深度神經網絡對輸入圖完成人像分割任務之后,所得的人像分割網絡輸出背景為0、人像為1的圖像,并與輸入圖進行相乘可保留人像信息。背景替換的圖片可以首先將網絡輸出的圖像取反,然后進行相乘生成替換的背景圖像,最后將人像信息和背景圖像合成為一張圖片,即可得到所需的背景替換,具體如圖6所示。

2.3.3人臉識別

中興通訊基于大規(guī)模私有人臉數據集、深度卷積神經網絡的人臉特征編碼模型以及度量學習方法,在人臉識別領域有著長期的技術積累。特別地,在視頻人臉識別處理中,中興通訊提出綜合視頻空域信息的代表幀融合和特征增強方法,相應的處理流程如圖7所示。表2給出了中興通訊視頻人臉識別方案在標準測試集YouTube Faces上的準確率比較。該方法大大提高了人臉特征的泛化性,同時提高了對運動/失焦模糊、低分辨、視頻編解碼噪聲的耐受力,并在多個開源測試集上達到了較高的準確率。

2.4 智能部署

2.4.1融合移動邊緣計算(MEC)和網絡切片

基于5G端到端網絡切片技術,對專用網絡進行優(yōu)化,可實現視頻服務加速、視頻服務網絡與其他網絡業(yè)務隔離服務,解決網絡擁塞和時延問題。支持5G接入側的MEC視頻服務下沉,不僅可實現媒體就近接入、就近處理,為用戶帶來更低時延的視頻體驗,還可同時降低對骨干網帶寬占用。更進一步地,融合5G網絡切片和MEC可對基站、頻率專享等組成5G虛擬專網,可以滿足高端客戶的高安全、高可控、高性能要求,如圖8所示。

2.4.2 智能路由調度

由于RTN網絡服務用戶的網絡條件和質量各異,基于強大的大數據分析和AI預判能力的支持,中興通訊實現了實時的智能路由調度,具體如圖9所示。針對統(tǒng)一接入調度模塊,用戶側接入調度除了選擇就近邊緣接入外,核心的網絡路由可以選擇進行如下操作:

(1)基于大數據提取多維度網絡路由質量評價指標,生成當前路由優(yōu)劣評分;

(2)基于現有的評價模型,實現了未來5~10 min內網絡質量的預判;

(3)實時統(tǒng)計網絡各個節(jié)點、不同粒度的質量參數(如帶寬、往返時延等),并綜合前兩者的評分結果,實現當前路由表的實時動態(tài)調整。

另外,為了保證低時延,網絡架構設計與傳統(tǒng)的內容分發(fā)網絡(CDN)分層設計稍有差異。其中,核心中繼服務器采用扁平Mesh組網架構,內部鏈路更短、更靈活,可支持采用動態(tài)選路的方式來調整構建的網狀結構。中繼服務器之間采用優(yōu)化過的QUIC協(xié)議實現數據傳輸,使內部鏈路延遲達到30 ms左右。

2.4.3 智能QoE監(jiān)測

實時視頻服務的QoE受到實時音視頻采集、前處理、編碼、傳輸、解碼、后處理、渲染各個環(huán)節(jié)的影響。一旦某一個環(huán)節(jié)出現問題,如傳輸過程中的網絡丟包、采集環(huán)節(jié)中的系統(tǒng)不兼容,都會直接導致實時音視頻服務出現質量問題,影響用戶體驗。因此,我們需要建立端到端的實時音視頻服務智能QoE監(jiān)測和優(yōu)化系統(tǒng)。

如圖10所示,實時音視頻服務智能QoE監(jiān)測和優(yōu)化系統(tǒng)分為數據收集、健康度評估和智能優(yōu)化3個部分。

(1)數據收集。該部分主要收集端到端的全鏈路實時音視頻通信數據,包括終端設備數據、網絡環(huán)境數據等。

終端設備數據:設備機型、用戶IP、視頻流的分辨率、幀率,在前處理、編碼、解碼、后處理、渲染等過程中的CPU使用率,圖形處理器(GPU)使用率以及內存使用率等;

網絡環(huán)境數據:上下行網絡丟包、抖動、時延等。

(2)健康度評估。該部分的核心思想是對收集到的監(jiān)控數據進行過濾、匯聚、實時計算,并進行實時音視頻通信質量評估,快速識別和感知實時音視頻通信中的問題。中興通訊通過構建/更新一組機器學習模型,判斷當前全鏈路服務狀態(tài)的健康程度,并將其作為后續(xù)智能優(yōu)化階段的觸發(fā)條件。具體來說,該部分包括:首先,基于“異常狀態(tài)監(jiān)控指標與正常狀態(tài)監(jiān)控指標處于不同分布”的假設,選用QoS指標(時延、碼率、CPU等)[20]和無參考視頻質量評估得分,構造樣本特征空間;然后,在此基礎上構造多個異構自動編碼器[21],并利用它們在訓練集上的預測殘差值進行正則化模型篩選;最后,通過模型篩選的多個自動編碼器的投票結果,將被作為當前狀態(tài)健康度的評估值。

(3)智能優(yōu)化。當前狀態(tài)的健康度低于閾值時,就需要進行智能優(yōu)化。這里我們將智能優(yōu)化過程視為馬爾科夫決策過程,利用強化學習求解當前狀態(tài)下的最優(yōu)策略。具體來說,我們將健康度的前后提升比率定義為獎勵,將網絡狀態(tài)的可觀測信息(時延、丟包、阻塞情況)定義為狀態(tài)空間,將網絡參數組合的可調選項(糾錯策略、重傳策略、緩沖器的緩沖值和緩沖區(qū)大?。┒x為動作空間,利用動作探索的獎勵反饋實時更新深度策略網絡[22],并逐步實現當前狀態(tài)下的最佳網絡配置組合。

3 結束語

隨著5G商用落地以及相關設施的完善,視頻的使用體驗將不斷升級,視頻的業(yè)務形態(tài)將不斷創(chuàng)新,視頻的應用場景也將不斷延展?!叭f物視頻化”的趨勢對底層技術支撐體系提出了新的、更高的要求。為了使能視頻業(yè)務繁榮,中興通訊提出了構建智能實時視頻網絡的理念,基于自身長期在網絡通信、視頻多媒體、AI等領域的持續(xù)耕耘和積累沉淀,創(chuàng)新性地研發(fā)了一系列技術和產品,并使之應用于視頻業(yè)務端到端流程的各環(huán)節(jié)。中興通訊構筑SmartRTN綜合技術體系,著眼于改善最終用戶的體驗,有效解決了內容增強、高效壓縮、可靠傳輸以及智能運維等問題,為5G視頻業(yè)務的不斷演化和縱深拓展提供了牢固的基礎。

參考文獻

[1] Cisco. Cisco visual networking index (VNI) complete forecast update, 2017—2022 [EB/ OL]. (2018-12)[2020-12-05]. https://www. cisco.com/c/dam/m/en_us/network-intelligence/service-provider/digital-transformation/ knowledge-network-webinars/pdfs/1213-business-services-ckn.pdf

[2] Cisco. Cisco visual networking index (VNI) global and americas/EMEAR mobile data traffic forecast, 2017-2022 [EB/OL]. (2019-03)[2020-12-05]. https://www.cisco.com/c/dam/ m/en_us/network-intelligence/service-provider/digital-transformation/knowledge-network-webinars/pdfs/190320-mobility-ckn.pdf

[3] ITU. HEVC-SCC [EB/OL]. [2020-12-05]. http:// www.itu.int/rec/T-REC-H.265

[4] MPEG. VVC [EB/OL]. [2020-12-05]. https:// mpeg.chiariglione.org/standards/mpeg-i/versatile-video-coding

[5] Alliance for Open Media. AV1 [EB/OL]. [2020-12-05]. http://aomedia.org/

[6] AVS Work Group. AVS3 [EB/OL]. [2020-12-05]. http://www.avs.org.cn/

[7] MPEG. MPEG5-EVC [EB/OL]. [2020-12-05]. https://mpeg.chiariglione.org/standards/mpeg-5/essential-video-coding

[8] MPEG. MPEG5-LCEVC [EB/OL]. [2020-12-05]. https://mpeg.chiariglione.org/standards/ mpeg-5/low-complexity-enhancement-video-coding

[9] 視頻傳輸延遲分析及解決方案:CMAF,LHLS [EB/ OL]. (2018-09-21)[2020-12-05]. https://cloud. tencent.com/developer/article/1346159

[10] WebRTC 1.0: Real-Time Communication Between Browsers [EB/OL]. https://www. w3.org/TR/webrtc/

[11] QUIC, a multiplexed stream transport over UDP [EB/OL]. https://www.chromium.org/quic

[12] Salsify. Video is better when the codec and transport work together [EB/OL]. [2020-12-05]. https://snr.stanford.edu/salsify/

[13] Salsify. Salsify測試結果 [EB/OL]. [2020-12-05]. http://web.mit.edu/6.829/www/currentsemester/materials/slides-salsify-lecture.pdf

[14] DING Z Z, ZHENG Q F, HOU C H, et al. Improving face recognition in surveillance video with judicious selection and fusion of representative frames [C]//ACM Multimedia Asia(MMAsia20). NY, USA: ACM, 2021. DOI:10.1145/3444685.3446259

[15] SCHROFF F, KALENICHENKO D, PHILBIN J. FaceNet: a unified embedding for face recognition and clustering [C]//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Boston, MA, USA. IEEE, 2015: 815-823. DOI:10.1109/cvpr.2015.7298682

[16] RAO Y M, LU J W, ZHOU J. Learning discriminative aggregation network for video-based face recognition [C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA: IEEE, 2017: 3781-3790

[17] TAIGMAN Y, YANG M, RANZATO M, et al. DeepFace: closing the gap to human-level performance in face verification [C]//2014 IEEE Conference on Computer Vision and Pattern Recognition. Columbus, OH, USA: IEEE, 2014: 1701-1708. DOI:10.1109/cvpr.2014.220

[18] YANG J L, REN P R, ZHANG D Q, et al. Neural aggregation network for video face recognition [C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA: IEEE, 2017: 4362-4371. DOI:10.1109/cvpr.2017.554

[19] GONG S X, SHI Y C, KALKA N D, et al. Video face recognition: component-wise feature aggregation network (C-FAN) [C]//2019 International Conference on Biometrics (ICB). Crete, Greece: IEEE, 2019: 1-8. DOI:10.1109/ icb45273.2019.8987385

[20] InfoQ. 音視頻質量評估綠皮書 [EB/OL]. (2019-08-26)[2021-12-05]. https://www.infoq.cn/ article/xt9vNLcC6dlkSvu9I6M2

[21] HINTON G, OSINDERO S, YW T. A fast learning algorithm for deep belief nets [J]. Neural computation, 2006, 18(7): 1527-1554. DOI: 10.1162/neco.2006.18.7.1527

[22] 桑頓, 巴圖. 強化學習: 第2版 [M]. 俞凱, 譯.北京: 電子工業(yè)出版社, 2019

作者簡介

呂達,中興通訊股份有限公司云視頻與能源研究院院長、高級工程師;研究方向為通信技術和協(xié)議、互聯網技術、云計算技術、視頻技術、數字家庭網絡及業(yè)務等;先后從事數字程控交換機、固網軟交換、IPTV、視頻會議、通信網絡供電等產品架構設計與研發(fā)管理工作,曾主持完成數字程控交換機、多媒體視訊、視頻會議等重大產品項目;發(fā)表論文多篇,申請專利8項。

鄭清芳,中興通訊股份有限公司云視頻首席科學家;研究方向為人工智能、計算機視覺、視頻編解碼、視頻通信、人機交互、多媒體芯片與系統(tǒng)等;先后從事視頻智能編目系統(tǒng)、視頻搜索系統(tǒng)、手機3D成像系統(tǒng)及應用、車載成像與識別系統(tǒng)、人臉識別、3D立體視覺芯片、視頻會議等系統(tǒng)及產品的架構設計與核心技術研發(fā);發(fā)表論文多篇,申請專利2項。

漠河县| 武城县| 永仁县| 修文县| 周至县| 利辛县| 阿克陶县| 南充市| 新泰市| 尼勒克县| 昭平县| 康马县| 宜兰县| 新巴尔虎右旗| 沾益县| 泽普县| 湟中县| 福贡县| 渭南市| 永胜县| 钟祥市| 鹰潭市| 岢岚县| 灵武市| 镇康县| 沂水县| 鸡东县| 扎鲁特旗| 杭锦后旗| 宁河县| 武汉市| 长子县| 京山县| 腾冲县| 化德县| 山东省| 龙门县| 虞城县| 开封县| 芜湖县| 吉首市|