呂 昊,郭江宇*,靳文兵,張 賓,王宇新
(1.北方自動(dòng)控制技術(shù)研究所,太原 030006;2.駐太原地區(qū)第二軍代室,太原 030006)
隨著時(shí)代的進(jìn)步和科學(xué)技術(shù)的發(fā)展,現(xiàn)代武器裝備的信息化程度越來(lái)越高。大數(shù)據(jù)時(shí)代的到來(lái),使得數(shù)據(jù)的及時(shí)傳遞和分析起到更大的作用,同時(shí)也使數(shù)據(jù)發(fā)掘應(yīng)用,支撐“智能化作戰(zhàn)”成為可能,圖像信息的獲取、壓縮、傳輸和存儲(chǔ)對(duì)于數(shù)據(jù)的分析處理具有重要意義。目前主流的視頻編碼方案大多采用混合視頻編碼框架,即由多個(gè)編碼模塊組成,它們采取的技術(shù)以及在率失真優(yōu)化技術(shù)指導(dǎo)下的模式選擇過(guò)程都會(huì)影響最終的編碼性能。
針對(duì)視頻編碼的優(yōu)化算法進(jìn)行國(guó)產(chǎn)化的設(shè)計(jì)與實(shí)現(xiàn)也具有重要意義,尤其是在國(guó)防科技工業(yè)領(lǐng)域,武器裝備的自主可控關(guān)系到我國(guó)的國(guó)防安全,發(fā)展自主可控裝備是我國(guó)國(guó)防工業(yè)的重要組成。針對(duì)重要技術(shù)實(shí)現(xiàn)自主可控,發(fā)展自主可控裝備,有利于消除可能存在的安全隱患,避免國(guó)外的軟件算法以及硬件平臺(tái)中可能存在的“后門(mén)”造成不利影響,對(duì)于實(shí)現(xiàn)裝備的自我保障,保證持續(xù)發(fā)展,具有重要的現(xiàn)實(shí)意義。
判斷視頻壓縮編碼效果的指標(biāo)有:壓縮失真、編碼碼率以及計(jì)算復(fù)雜度,而視頻編碼的根本任務(wù)是協(xié)調(diào)這3 個(gè)指標(biāo)之間的關(guān)系,并不斷優(yōu)化。率失真優(yōu)化是針對(duì)碼率和失真度之間的優(yōu)化。針對(duì)獨(dú)立率失真的優(yōu)化,人們紛紛展開(kāi)研究。郭紅偉等人提出一種內(nèi)容自適應(yīng)的拉格朗日乘子計(jì)算方法,其對(duì)于具有快速運(yùn)動(dòng)內(nèi)容的視頻,編碼性能改善較大。ZHANG J等則提出一種改進(jìn)的拉格朗日乘子運(yùn)動(dòng)估計(jì)算法,對(duì)于幀間劃分塊通過(guò)測(cè)試最小化失真和最小化碼率兩種極值,避免了較大的運(yùn)動(dòng)估計(jì)誤差;張世彥采用基于主成分分析的噪聲估計(jì)算法實(shí)現(xiàn)LCU 級(jí)的噪聲估計(jì),實(shí)現(xiàn)自適應(yīng)優(yōu)化量化步長(zhǎng)并消除噪聲影響,能適用于較寬泛的碼率范圍。
當(dāng)視頻在復(fù)雜網(wǎng)絡(luò)環(huán)境下進(jìn)行傳輸時(shí),它的工作容易受到在同一局域網(wǎng)環(huán)境下其他通信設(shè)備的干擾。而其他設(shè)備在使用過(guò)程中占用絕大部分的帶寬,會(huì)造成網(wǎng)絡(luò)擁塞,可能致使視頻編碼系統(tǒng)產(chǎn)生傳輸延遲以及丟包等情況。因此,在復(fù)雜網(wǎng)絡(luò)情況下,針對(duì)可使用帶寬較低的情況,可以提高視頻壓縮率來(lái)保持視頻傳輸?shù)姆€(wěn)定性。但是提高視頻壓縮比會(huì)導(dǎo)致失真度較高,為了解決在降低帶寬的前提下,提高視頻壓縮率造成的失真度,本文針對(duì)HEVC(high efficiency video coding)視頻編碼算法進(jìn)行優(yōu)化,并實(shí)現(xiàn)優(yōu)化算法在全國(guó)產(chǎn)平臺(tái)上的適配。主要是通過(guò)對(duì)編碼單元(coding unit,CU)的分割算法進(jìn)行優(yōu)化,在保證視頻目標(biāo)區(qū)域圖像質(zhì)量的前提下,提高壓縮速率,提高整體壓縮率。
為了實(shí)現(xiàn)重要技術(shù)的自主可控,本文主要采用全國(guó)產(chǎn)化的硬件平臺(tái),國(guó)產(chǎn)操作系統(tǒng)以及國(guó)產(chǎn)的深度學(xué)習(xí)框架展開(kāi)。主要選用以FT-2000/4 為CPU 的硬件平臺(tái),主頻為2.2 GHz,支持單精度、雙精度浮點(diǎn)運(yùn)算指令和ASIMD 處理指令。在操作系統(tǒng)上,本文選用銀河麒麟操作系統(tǒng),具有高安全、高可靠、高可用、跨平臺(tái)、中文化的特點(diǎn),并已經(jīng)廣泛應(yīng)用于多個(gè)行業(yè)或領(lǐng)域。在深度學(xué)習(xí)的框架上,選用百度的PaddlePaddle 深度學(xué)習(xí)框架進(jìn)行深度學(xué)習(xí)的訓(xùn)練以及推理工作。PaddlePaddle 是百度自主研發(fā)的性能優(yōu)先、靈活易用的深度學(xué)習(xí)平臺(tái),是主流深度學(xué)習(xí)框架中唯一完全國(guó)產(chǎn)化的產(chǎn)品。
本文通過(guò)在基于FT-2000/4 為CPU 的硬件平臺(tái)上搭載銀河麒麟操作系統(tǒng),搭建適配paddlepaddle運(yùn)行的軟件環(huán)境,完成HEVC 編碼算法運(yùn)行的國(guó)產(chǎn)化平臺(tái)。
感興趣區(qū)域(region of interest,ROI)是指在圖像中人眼主觀感興趣的區(qū)域。在本文中,我們認(rèn)為ROI是在常見(jiàn)環(huán)境背景下的目標(biāo)對(duì)象。提取ROI 的目的是針對(duì)感興趣區(qū)域以及非感興趣區(qū)域采用不同的編碼策略。由于人眼對(duì)于視頻中的不同區(qū)域位置會(huì)賦予不同的關(guān)注程度,同時(shí)也對(duì)失真度擁有不同的敏感性,采取不同編碼策略可以提高視頻圖像整體的主觀視覺(jué)效果。傳統(tǒng)ROI 的提取,主要是根據(jù)圖像顏色紋理特征、運(yùn)動(dòng)檢測(cè)以及通過(guò)視覺(jué)注意模型等方法,目標(biāo)檢測(cè)的方法大多是利用時(shí)間域或者空間信息進(jìn)行處理,采用背景差分法、光流法、幀差法等對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行檢測(cè)。本文則采用基于深度學(xué)習(xí)的目標(biāo)識(shí)別方法提取ROI。
在具體ROI 的提取過(guò)程中,通過(guò)使用PaddlePa ddle深度學(xué)習(xí)框架,利用公開(kāi)數(shù)據(jù)集VOC2012,在百度推出的AI studio 云平臺(tái)上使用平臺(tái)提供的算力,針對(duì)Mobilenet-SSD 算法進(jìn)行訓(xùn)練。MobileNet-SSD將輕量級(jí)深度網(wǎng)絡(luò)模型MobileNet 和目標(biāo)檢測(cè)算法SSD 結(jié)合起來(lái),很好地繼承了MobileNet 預(yù)測(cè)速度快,易于部署的特點(diǎn)。MobileNet 為了降低整體的計(jì)算量,主要使用了深度可分離卷積將標(biāo)準(zhǔn)卷積核進(jìn)行分解計(jì)算,以及通過(guò)引入兩個(gè)超參數(shù)來(lái)減少參數(shù)量和計(jì)算量。
深度可分離卷積將標(biāo)準(zhǔn)卷積核分為深度卷積核和大小為1*1 的點(diǎn)卷積核,當(dāng)輸入為M 個(gè)通道,輸入feature map 大小為D*D,卷積核大小為D*D,輸出通道為N 時(shí),標(biāo)準(zhǔn)卷積核和深度可分離卷積的計(jì)算量比率為:
除此外,當(dāng)引入超參數(shù)寬度乘數(shù)α 以及分辨率乘數(shù)ρ,輸入層通道個(gè)數(shù)M 變?yōu)棣粒敵鰧油ǖ纻€(gè)數(shù)N 變?yōu)棣粒傆?jì)算量為:
可以降低原來(lái)模型的計(jì)算量。
通過(guò)訓(xùn)練,獲取相關(guān)訓(xùn)練模型,并將訓(xùn)練好的模型移植到上一節(jié)中所述的搭載paddlepaddle 深度學(xué)習(xí)框架的國(guó)產(chǎn)化運(yùn)行平臺(tái)上。通過(guò)輸入測(cè)試視頻文件,來(lái)展開(kāi)推理工作,對(duì)視頻中的目標(biāo)對(duì)象進(jìn)行識(shí)別。
圖1 感興趣區(qū)域提取
在一幀視頻識(shí)別完成后,首先檢測(cè)該圖像中是否存在目標(biāo)區(qū)域,如果存在則輸出幀序號(hào)、目標(biāo)標(biāo)簽以及錨框等信息,如果不存在,則設(shè)定目標(biāo)標(biāo)簽為None,錨框坐標(biāo)為(-1,-1),由于在視頻編碼過(guò)程中,編碼單元最大為64*64,因此,將錨框起始坐標(biāo)及長(zhǎng)寬尺寸預(yù)處理為64 的倍數(shù),可以方便后續(xù)視頻編碼處理,并將算法中檢測(cè)出的關(guān)于背景的background 標(biāo)簽的目標(biāo)信息去除,避免影響感興趣區(qū)域的提取工作。在完成最感興趣區(qū)域的預(yù)處理后,將感興趣區(qū)域信息存儲(chǔ)以便后續(xù)處理。
在ROI 的提取工作中,通過(guò)利用基于深度學(xué)習(xí)的目標(biāo)識(shí)別算法將每一幀數(shù)據(jù)中有用的目標(biāo)信息,如目標(biāo)標(biāo)簽、錨框坐標(biāo)及尺寸等信息輸出,并及時(shí)傳遞給編碼算法對(duì)相應(yīng)幀進(jìn)行處理。實(shí)現(xiàn)視頻圖像ROI 的提取。
視頻壓縮編碼是一類(lèi)特殊的數(shù)據(jù)壓縮方法。各種視頻應(yīng)用催生了多種視頻編碼方法。HEVC 是2013 年發(fā)布的較新一代視頻編碼標(biāo)準(zhǔn),包括變換、量化、熵編碼、幀內(nèi)預(yù)測(cè)、幀間預(yù)測(cè)以及環(huán)路濾波等模塊。并在之前編碼方法的基礎(chǔ)上,加入了基于四叉樹(shù)的塊分割結(jié)構(gòu)。本文主要針對(duì)基于四叉樹(shù)的塊分割結(jié)構(gòu)進(jìn)行優(yōu)化處理。在之前的編碼算法中,CU 的大小是固定的,在HEVC 中,一幀圖像可以被劃分若干互不重疊的編碼樹(shù)單元(coding tree unit,CTU),之后依據(jù)四叉樹(shù)原則,CTU 可以被分割為多層不同大小的CU,CU 是否被繼續(xù)分割取決于算法中的分割標(biāo)志位。圖2 是CU 分割的示意圖,對(duì)于一個(gè)CU,最大為64*64,最小為8*8,即一個(gè)CTU 內(nèi)可以包含最少1 個(gè),最多64 個(gè)編碼單元。根據(jù)圖像中不同區(qū)域的圖像內(nèi)容以及應(yīng)用需求等,可以合理分配編碼單元大小和最大分割深度,使得編碼效果獲得較好的優(yōu)化,例如在平臺(tái)區(qū)域,采用較大的編碼單元進(jìn)行編碼可以減少所用的比特?cái)?shù),提高編碼效率。在HEVC 編碼過(guò)程中,視頻圖像首先根據(jù)I、P、B 幀,分為多個(gè)圖像組(group of pictures,GOP),在GOP 中每幀圖像為1 個(gè)圖片順序計(jì)數(shù)(picture order count,POC),之后逐層分解到對(duì)編碼單元的四叉樹(shù)劃分上。主要針對(duì)這部分的實(shí)現(xiàn)進(jìn)行一個(gè)修改和優(yōu)化。
圖2 編碼單元分割示意圖
HM(hevc test model)作為HEVC 的參考軟件,在HEVC 協(xié)議制定和修改的會(huì)議中,每次新的方案和技術(shù)提出后,都是利用HM 作為評(píng)價(jià)和驗(yàn)證優(yōu)化效率的工具。并且隨著方案技術(shù)的優(yōu)化,HM 也會(huì)公開(kāi)相應(yīng)的代碼實(shí)現(xiàn)。本文中,針對(duì)HEVC 算法的優(yōu)化,主要利用HM 的代碼進(jìn)行實(shí)現(xiàn)。
在HM 中,對(duì)編碼單元大小和分割深度的判定主要通過(guò)TEncCu::xCompressCU 函數(shù)實(shí)現(xiàn)。xCompressCU 函數(shù)主要是通過(guò)遍歷每種編碼大小的編碼單元,對(duì)比獲取最優(yōu)解。在函數(shù)的具體實(shí)現(xiàn)過(guò)程中,通過(guò)依次獲取較大的編碼單元,遍歷該編碼單元的所有預(yù)測(cè)模式,并對(duì)比確認(rèn)最佳率失真代價(jià),之后通過(guò)調(diào)用自身,對(duì)該編碼單元內(nèi)所包含的下一深度的編碼單元進(jìn)行計(jì)算,并逐漸計(jì)算到最小的8*8 的編碼單元,最后對(duì)比該深度的4 個(gè)編碼單元率失真代價(jià)之和與上一深度率失真代價(jià),依次進(jìn)行對(duì)比,并最后確認(rèn)該位置編碼單元的大小和分割深度。由上述過(guò)程可以知道,對(duì)于一個(gè)CTU,完成全部四叉樹(shù)的遍歷,需要進(jìn)行1+4+4*4+4*4*4,共85 次率失真代價(jià)的計(jì)算,并針對(duì)每個(gè)編碼單元進(jìn)行預(yù)測(cè)單元和變換單元的計(jì)算。編碼器在運(yùn)行過(guò)程中,計(jì)算復(fù)雜度很高。
在視頻編碼實(shí)際使用的過(guò)程中,實(shí)際上并不是視頻中所有區(qū)域的內(nèi)容都受到人們的關(guān)注。目前HEVC 算法中,編碼單元的劃分與視頻內(nèi)容的復(fù)雜度相關(guān),背景內(nèi)容較多,紋理復(fù)雜的區(qū)域,編碼單元相對(duì)較小,這樣可以更好地反映出復(fù)雜紋理區(qū)域的信息,而背景相對(duì)單一,紋理簡(jiǎn)單的區(qū)域,采用較大的編碼單元就可以反映該區(qū)域的信息,而不會(huì)顯著增加比特率。在此針對(duì)這種情況,提出利用感興趣區(qū)域的方法對(duì)這一過(guò)程進(jìn)行優(yōu)化。利用上一小節(jié)獲取的目標(biāo)信息,對(duì)視頻中不同區(qū)域分配不同的深度值,對(duì)于非目標(biāo)區(qū)域提前終止對(duì)編碼單元的劃分,進(jìn)而降低編碼的復(fù)雜度。
本文對(duì)非感興趣區(qū)域采取默認(rèn)最大的編碼單元時(shí),僅對(duì)感興趣區(qū)域進(jìn)行率失真代價(jià)的計(jì)算時(shí),可以很大程度降低編碼計(jì)算的復(fù)雜度,提高編碼速率,并且保證了感興趣區(qū)域的編碼質(zhì)量。
本文所述的HEVC 分割算法優(yōu)化在國(guó)產(chǎn)化平臺(tái)的具體實(shí)現(xiàn)如圖3 所示。在視頻輸入后,可以分為感興趣區(qū)域的提取和視頻編碼兩部分進(jìn)行。在感興趣區(qū)域的提取部分,首先利用FFMPEG 軟件,將視頻格式轉(zhuǎn)為.mp4,之后利用opencv 對(duì)視頻中每幀進(jìn)行處理,之后調(diào)用paddlepaddle 深度學(xué)習(xí)框架中MobileNet 的函數(shù),使用2.1 中所述在云端訓(xùn)練得到的模型,針對(duì)每幀圖像進(jìn)行目標(biāo)識(shí)別的推理工作。只要針對(duì)圖像中是否存在目標(biāo)區(qū)域進(jìn)行判斷,如果存在,則將視頻幀序號(hào)、目標(biāo)標(biāo)簽以及錨框相關(guān)信息按照一定格式進(jìn)行輸出,如果不存在,則標(biāo)定目標(biāo)標(biāo)簽為“None”,目標(biāo)坐標(biāo)為(-1,-1)。在此之后,針對(duì)提取到的感興趣區(qū)域信息進(jìn)行預(yù)處理,為了后期的視頻編碼方便進(jìn)行,在這里將錨框相關(guān)坐標(biāo)及長(zhǎng)寬信息轉(zhuǎn)化為以64 為單位長(zhǎng)度的整數(shù),即一個(gè)CU 的長(zhǎng)度作為單位長(zhǎng)度,方便視頻編碼工作的進(jìn)行。在處理完成后,將感興趣區(qū)域信息保存至datafile.txt 文件中,并判斷當(dāng)前處理幀是否為最后一幀,若不是則繼續(xù)處理,若是最后一幀,則結(jié)束對(duì)該視頻的感興趣區(qū)域提取工作。在視頻編碼部分,首先利用FFMPEG 軟件將視頻格式轉(zhuǎn)為.yuv,之后將視頻傳入HM 軟件后,對(duì)視頻進(jìn)行逐幀處理。在對(duì)一幀圖像進(jìn)行處理前,首先本文通過(guò)讀取保存在datafile.txt 中的感興趣區(qū)域信息,如果讀取不到對(duì)應(yīng)幀的感興趣區(qū)域信息,則延時(shí)后再次讀取,直到對(duì)應(yīng)幀的感興趣區(qū)域信息。之后本文對(duì)提取到的感興趣區(qū)域的信息進(jìn)行處理,提取錨框坐標(biāo)及尺寸信息,之后將數(shù)據(jù)送入xCompressCU 函數(shù)。在該函數(shù)中,首先對(duì)輸入的CU 進(jìn)行率失真代價(jià)的計(jì)算,之后判斷目前處理的CU 是否在坐標(biāo)范圍內(nèi),如果在則繼續(xù)進(jìn)行下一步分割,直到分割到最小CU,如果不在則停止分割,直接進(jìn)入下一個(gè)CU 進(jìn)行試驗(yàn),直到所有CU 遍歷完成。之后對(duì)下一幀進(jìn)行以上操作,直到視頻結(jié)束,完成視頻編碼。
圖3 視頻編碼算法優(yōu)化整體流程圖
在本文中,由于目標(biāo)識(shí)別是針對(duì)每一幀圖像進(jìn)行目標(biāo)識(shí)別,不涉及幀與幀之間目標(biāo)物的坐標(biāo)關(guān)系,并且編碼過(guò)程全部采用I 幀,不涉及P、B幀,即不涉及幀與幀之間的預(yù)測(cè),因此,不涉及時(shí)間相關(guān)性。
本文主要利用HEVC 參考源碼HM 中,目前最新版的HM16.20 進(jìn)行實(shí)驗(yàn)和測(cè)試,在實(shí)驗(yàn)過(guò)程中統(tǒng)一采用encoder_intra_main.cfg 標(biāo)準(zhǔn)配置文件,即全部采用I 幀,不涉及幀間預(yù)測(cè),針對(duì)不同分辨率的測(cè)試視頻文件進(jìn)行處理。
在實(shí)驗(yàn)中,本文通過(guò)對(duì)比同一視頻文件在采用HM16.20 原版軟件,以及在采用ROI 的方法后的視頻編碼軟件的運(yùn)行效果,對(duì)最后編碼后數(shù)據(jù)文件的大小,以及運(yùn)行時(shí)間等信息進(jìn)行對(duì)比,并且利用Python,matlab 等對(duì)數(shù)據(jù)進(jìn)行處理,通過(guò)在視頻文件中選取特定幀,在圖像中畫(huà)出編碼單元的分割情況,直觀確認(rèn)感興趣區(qū)域算法對(duì)視頻編碼算法的影響。由于HM 和深度學(xué)習(xí)算法所需要的視頻格式不同,因此,本文在進(jìn)行運(yùn)算處理之前,首先利用FFMPEG,將測(cè)試視頻分別轉(zhuǎn)為.yuv 以及.mp4 格式的文件。將.yuv 格式文件傳入HM 軟件,并利用Python 將.mp4 文件傳入感興趣區(qū)域提取的算法中,展開(kāi)實(shí)驗(yàn)。并及時(shí)記錄編碼過(guò)程中的測(cè)試結(jié)果,以及在編碼過(guò)程中傳輸回來(lái)的編碼單元深度信息的數(shù)據(jù)。
通過(guò)輸出編碼單元的分割深度信息等,本文可以有效得知每一個(gè)位置的編碼單元具體分割情況。通過(guò)將輸出的數(shù)據(jù)利用Python 進(jìn)行預(yù)處理以及重新排列,將每一幀的深度信息分開(kāi),并將深度信息數(shù)據(jù)與圖像坐標(biāo)位置進(jìn)行對(duì)應(yīng)。之后利用Python 調(diào)用OpenCV 隨機(jī)取出測(cè)試視頻中的某一幀圖像,以及對(duì)應(yīng)的編碼單元分割深度數(shù)據(jù),之后根據(jù)圖像及數(shù)據(jù),在matlab 內(nèi)繪制出編碼單元在實(shí)際圖像中的分割效果圖。
HEVC 視頻編碼的編碼單元分割算法優(yōu)化前后對(duì)比圖如圖4 所示,可以直觀地看出,針對(duì)分割算法進(jìn)行優(yōu)化后,目前圖像主要只針對(duì)感興趣區(qū)域內(nèi)的編碼單元進(jìn)行分割,而對(duì)于感興趣區(qū)域外,則采用64*64 的最大編碼單元。相比較算法未優(yōu)化之前,在保證感興趣區(qū)域內(nèi)的分割效果的基礎(chǔ)上,忽略非感興趣區(qū)域編碼單元的分割效果。通過(guò)整個(gè)系統(tǒng)良好的運(yùn)行效率,證明在全國(guó)產(chǎn)化平臺(tái)上,實(shí)現(xiàn)整個(gè)系統(tǒng)是可行的。
圖4 分割算法運(yùn)行對(duì)比圖
表1 多分辨率視頻實(shí)驗(yàn)記錄參數(shù)對(duì)比
在2.2 中,本文提到,在HEVC 協(xié)議制定和修改的會(huì)議中,每次新的方案和技術(shù)提出后,都是利用HM 作為評(píng)價(jià)和驗(yàn)證優(yōu)化效率的工具。因此,利用HM 作為編碼算法優(yōu)化的對(duì)比,具有客觀價(jià)值。在實(shí)驗(yàn)中主要記錄的參數(shù)有:測(cè)試視頻分辨率、幀率、感興趣區(qū)域占原圖像比例、原軟件處理時(shí)間、優(yōu)化后軟件處理時(shí)間、原軟件壓縮率、優(yōu)化后軟件壓縮率。通過(guò)比對(duì)優(yōu)化前后的處理時(shí)間以及壓縮率,可以發(fā)現(xiàn),通過(guò)對(duì)算法進(jìn)行優(yōu)化,可以有效降低軟件處理時(shí)間,并提高軟件壓縮率。
傳統(tǒng)獲取ROI 的方法針對(duì)視頻特征較少的視頻流或許可以獲得比本文更好的效果,但傳統(tǒng)方法無(wú)法針對(duì)我們所需要的特定對(duì)象為目標(biāo)進(jìn)行視頻編碼,僅保證特定對(duì)象的圖像質(zhì)量,因此,在本文不進(jìn)行對(duì)比。
為了優(yōu)化視頻信號(hào)在復(fù)雜網(wǎng)絡(luò)環(huán)境下由于網(wǎng)絡(luò)擁塞出現(xiàn)的數(shù)據(jù)丟包等情況,本文針對(duì)HEVC 編碼中的編碼單元分割算法進(jìn)行優(yōu)化,在保證目標(biāo)區(qū)域編碼效果的情況下,降低非感興趣區(qū)域編碼效果。本文算法通過(guò)在全國(guó)產(chǎn)化硬件及軟件平臺(tái)上,通過(guò)利用基于國(guó)產(chǎn)深度學(xué)習(xí)框架paddlepaddle 的MobileNet 模型算法進(jìn)行目標(biāo)識(shí)別,獲取感興趣區(qū)域,并在視頻編碼算法中通過(guò)限制非感興趣區(qū)域編碼單元的分割,來(lái)降低算法運(yùn)行的復(fù)雜度,優(yōu)化算法執(zhí)行效率。實(shí)現(xiàn)結(jié)果表明,優(yōu)化后的算法可以有效提高視頻整體壓縮率,縮短軟件處理時(shí)間,并且從主觀視覺(jué)上也可以判斷出,經(jīng)過(guò)優(yōu)化的算法可以準(zhǔn)確地針對(duì)感興趣區(qū)域保證較好的編碼精度。