姜龍 駱勇
摘? 要: 傳統(tǒng)的運動教學(xué)視頻壓縮算法壓縮幀數(shù)少,信噪比低。為了解決上述問題,提出基于人工智能技術(shù)的運動教學(xué)視頻壓縮算法,利用多線性子空間KL變換技術(shù)進行運動教學(xué)視頻編碼,引用人工智能技術(shù)中的鉆石搜索法構(gòu)建視頻壓縮算法,分析視頻圖像運動中矢量的基本規(guī)律來檢測算法的有效性,確定多個子空間的數(shù)據(jù),將視頻幀數(shù)進行分辯,分辨出新的變量進行XL變換處理來完成教學(xué)視頻編碼,編碼后采用鉆石搜索法的兩種模式進行互補,從而確定出最小誤差點,利用SAD算法算出最佳匹配矢量,完成運動教學(xué)視頻的壓縮。與傳統(tǒng)算法進行實驗對比,結(jié)果表明,基于人工智能技術(shù)的運動教學(xué)視頻壓縮算法壓縮幀數(shù)多、信噪比高、清晰度高,具有很好的壓縮效果。
關(guān)鍵詞: 人工智能技術(shù); 運動教學(xué)視頻; 視頻壓縮; 壓縮算法; 視頻編碼; 最小誤差點確定
中圖分類號: TN911.73?34; TP18? ? ? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)21?0055?04
Sports teaching video compression algorithm based on artificial intelligence technology
JIANG Long1, 2, LUO Yong2
(1. Jiangsu Normal University, Xuzhou 221116, China; 2. Lianyungang Technical College, Lianyungang 222000, China)
Abstract: As the traditional sports teaching video compression algorithm has fewer compressed frames and lower signal?to?noise ratio, a new sports teaching video compression algorithm based on artificial intelligence technology is proposed. The multi?line subspace KL transform technology is used for sports teaching video coding. The diamond search method in artificial intelligence technology is used to construct video compression algorithm. The basic law of vector in video image motion is analyzed. In order to check the validity of the algorithm, the data of several subspaces is determined, and then the number of video frames is discriminated to get new variables and perform XL transform processing, so as to complete the teaching video encoding. The two modes of diamond search method are adopted for complementary after encoding, so as to determine the minimum error point. The SAD algorithm is used to calculate the best matching vector to complete the compression of the sports teaching video. The results of comparison experiment show that, in comparison with the traditional algorithm, the sports teaching video compression algorithm based on artificial intelligence technology can get many frames compressed, and has high signal?to?noise ratio, high definition and good compression effect.
Keywords: artificial intelligence technology; sports teaching video; video compression; compression algorithm; video coding; minimum error point determination
0? 引? 言
現(xiàn)在的教育不僅僅是知識的教育,而是全面發(fā)展的教育,讓學(xué)生在運動、智力、意志力、情感等方面得到全面和諧的發(fā)展,各個大學(xué)都開展了運動教學(xué),它引導(dǎo)學(xué)生開展各種活動,通過學(xué)生在學(xué)習(xí)和掌握運動技能的反復(fù)練習(xí)中鍛煉學(xué)生的身體,達到增強體質(zhì)的目的。體育課也傳授個人衛(wèi)生方法的知識,使學(xué)生養(yǎng)成講究衛(wèi)生的好習(xí)慣,提高學(xué)生的健康水平[1]。某些高校為了提高學(xué)生的自主學(xué)習(xí)能力,用人工智能技術(shù)的運動教學(xué)視頻來傳授知識。因此本文基于人工智能技術(shù)研究了一種新的運動教學(xué)視頻壓縮算法[2]。
人工智能技術(shù)的運動教學(xué)視頻壓縮算法是一種有效的算法,其中最重要的環(huán)節(jié)就是視頻壓縮處理和編碼變換處理。當前,有學(xué)者提出壓縮方法主要利用關(guān)鍵幀檢測和指示符運動建模的智能教學(xué)視頻的壓縮算法[2],還有學(xué)者提出基于運動矢量細化的幀率上變換與HEVC結(jié)合的視頻壓縮算法[3]。但是這兩種方法運行復(fù)雜,運算時間長,所以本文采取簡便高效的鉆石搜索法。為了提高壓縮率,本文結(jié)合了多媒體擴展指令集(MMX)技術(shù),在進行編碼處理變換時,采取KL變換,降低局限性[3]。為了提高編碼處理的全面性,本文提出基于多線性子空間KL變換的壓縮視頻方法,通過廣義主成分分析法(GPCA)將視頻圖像信號映射到多個線性子空間,讓每個子空間的變換系數(shù)都靠近,可以使編碼獲得更好的結(jié)果。
1? 基于多線性子空間KL變換的運動教學(xué)編碼視頻
本文將GPCA方法和KL變換結(jié)合應(yīng)用于運動教學(xué)視頻編碼,即提出了基于多線性子空間KL變換的運動教學(xué)視頻編碼[4]。GPCA是把多個線性子空間中的數(shù)據(jù)集分割出來,估計線性子空間的維數(shù)和基向量。本文用這一方法進行圖像和視頻編碼,單一的輸入樣本不能保證是在分割出的各個小方塊中,所以本文需要足夠多的樣本證明實驗的準確性[5]。雖然GPCA方法的計算復(fù)雜度很高會消耗大量的計算時間,但是通過降低子空間的維數(shù)和減少子空間分割出的個數(shù),讓GPCA方法在一般情況下是可行的[6]。
處理后的GPCA可以進行運動教學(xué)視頻的壓縮,這種視頻壓縮方法比DCT方法消耗時間少、更加便捷[7]。GPCA法主要是利用圖像幀數(shù)進行KL變換處理,通過離散小波變換得到圖像的第一個幀數(shù)的一個多尺度分解,分解出圖像中的低頻信號和高頻信號,然后利用GPCA方法分割各個線性子空間的數(shù)據(jù),最后對分割的有效數(shù)據(jù)進行KL變換編碼,從而對運動教學(xué)視頻更好的進行壓縮。解碼時需要截取低頻信號和高頻信號,這樣才能得到完整的視頻編碼。
單一尺度圖像變換編碼時,視頻幀會劃分成一個個大小相等的子塊,因為圖像的紋理特點不同,很難在同一個線性空間中進行平均分割,所以直接對視頻幀分割處理是有局限性的[8]。為了解決這一局限性,本文先對圖像幀數(shù)進行訪問,根據(jù)訪問結(jié)果進行運動預(yù)測,根據(jù)預(yù)測結(jié)果進行視頻編碼。通過預(yù)測結(jié)果更好地了解圖像的高頻和低頻區(qū)域,準確地分割[9]。如果分割的都是低頻子帶會導(dǎo)致只得到基本層的解碼;如果分割的是高頻子帶也會導(dǎo)致解碼不全面,只有低頻子帶和高頻子帶都分割才能得到比較完整的視頻編碼。通過合理的方法將視頻幀分割成大小相等的子塊,接下來利用小波的多分辨、多分析過程將圖像的高頻分量和低頻分量進行分層,具體編碼流程如圖1所示。
1) 輸入視頻幀并對輸入的幀進行小波分析分辨;
2) 對分析出的高頻和低頻進行分組形成新的向量;
3) 對組成的新向量進行KL變換處理;
4) 對變換處理得到的系數(shù)進行量化,最后輸出視頻編碼。
輸入一個圖像幀,經(jīng)過小波分析分辨形成了三層波層、一個低頻分量和三個高頻分量,圖片左上角為低頻分量,將子帶中三個高頻分量系數(shù)組成一個新的向量,低頻分量進行KL變換處理與新的向量分開,向量進行GPCA運算和KL變換,得到運動教學(xué)視頻的編碼如圖2所示。
2? 基于人工智能技術(shù)的視頻壓縮算法
應(yīng)用人工智能技術(shù)中的鉆石搜索法構(gòu)建視頻壓縮算法,分析視頻圖像運動中矢量的基本規(guī)律[10]。鉆石搜索法是把要搜索的范圍放在一個大的圓形區(qū)域內(nèi),在圓形區(qū)域內(nèi)分布好正方形小格子,圓形與每個小格子的交點代表待搜索點的位置,在搜索點搜索圖像的頻譜如圖3所示。
因為視頻圖像的頻譜大多數(shù)是菱形的,與鉆石的形狀非常相像,所以鉆石分割法非常適合視頻壓縮。鉆石搜索法包括大鉆石搜索模式和小鉆石搜索模式[11]。如圖4和圖5所示。
雖然兩種搜索模式很相似,但選擇時不能隨意選擇。搜索模式的大小和形狀會影響到搜索的速度和精確度,所以在選擇時要十分的謹慎,選擇最合適的鉆石搜索模式[12]。鉆石搜索法的基本操作為:先用大鉆石搜索模式進行搜索,確定出小鉆石搜索模式的邊界點進行運算,發(fā)現(xiàn)最小誤差點,如果最小誤差點在各個小格子的交點上則直接進入最后搜索階段,進行小鉆石搜索模式,判斷出最佳匹配塊的運動矢量。如果發(fā)現(xiàn)最小誤差點不在各個小格子的交點處,則以上一次找到的最小誤差點為中心點,對局部沒有匹配的點進行SAD運算,最后取平均值,提供最佳匹配矢量點。
雖然操作是循環(huán)操作,但在執(zhí)行時只需要進行條件判定,符合條件則執(zhí)行相應(yīng)的操作,這種方法大大提高了CPU的利用效率,節(jié)約時間。通過舍棄部分運算結(jié)果進行編碼可以更好的進行視頻壓縮,鉆石搜索法為人工智能技術(shù)的視頻壓縮節(jié)省了空間,提高了壓縮率。
運動教學(xué)視頻壓縮算法計算式為:
[SAD(m,n)=m=1Mn=1Nbk(m,n)-bk-1(m+j,n+j)] (1)
式中:[bk(m,n)]和[bk-1(m+j,n+j)]分別代表第[k]幀和第[k-1]幀像素點[(m,n)]的亮度值;[M]和[N]為水平和垂直像素數(shù);[j]為最大可能平移的水平和垂直像素數(shù)[13]。
雖然鉆石搜索法提高了視頻壓縮率,但鉆石搜索模式在進行SAD最小誤差點運算時包含大量的循環(huán)運算,這種頻繁的循環(huán)運算非常適合MMX技術(shù)。MMX技術(shù)為鉆石搜索法釋放了額外的處理器周期[14]。
MMX和鉆石搜索法互相補充,大大地提高了視頻的壓縮率。結(jié)合后可以準確地計算出SAD值并且運算時間大大減少,與單獨運用鉆石搜索法相比速度提高了3倍,使用MMX指令計算絕對值不需要計算中間結(jié)果和分支,直接計算運動矢量估計絕對值。這樣用8位精度計算了絕對值不需要利用16位精度,也無需條件分支語句,使人工智能技術(shù)的視頻壓縮變得更加簡單[15]。
3? 仿真測試結(jié)果與分析
為檢測本文研究的算法效果,設(shè)計對比實驗,通過兩種不同的方法對視頻進行壓縮,實驗對比量為:壓縮完成的時間和相應(yīng)的壓縮所需要的幀數(shù)即運動教學(xué)視頻的壓縮率。選取的運動教學(xué)視頻文件是運動預(yù)備知識的視頻,視頻中男子有輕微的手部和腿部動作,用鉆石搜索法和傳統(tǒng)壓縮法對該視頻進行壓縮。首先對視頻圖像幀數(shù)進行分割,然后根據(jù)各自的方法進行視頻壓縮,因為實驗會受到電壓、計算機的影響出現(xiàn)誤差,所以本文最后的壓縮時間和壓縮率都取多次實驗的平均值。通過三種方法對運動教學(xué)視頻壓縮得出結(jié)果,對比圖如圖6所示。
由圖6可知,鉆石搜索法對運動教學(xué)視頻的壓縮率比傳統(tǒng)方法的壓縮率高。在相同的時間內(nèi),鉆石搜索法壓縮的幀數(shù)比傳統(tǒng)方法多,且鉆石搜索法的穩(wěn)定性強,不受視頻中人物動作的難易程度影響。所以鉆石搜索法對人工智能技術(shù)的運動教學(xué)視頻壓縮比傳統(tǒng)方法更加完善。
本文將GPCA方法和多線性子空間KL變換法相結(jié)合應(yīng)用于運動教學(xué)視頻的編碼,即提出基于多線性子空間KL變換的運動教學(xué)視頻的編碼。針對一個女生說話的視頻進行編碼,用KL變換和三維空間等級樹集的編碼方法同時編碼,對比最后編碼成功的視頻的清晰度和信噪比。
在KL變換編碼過程中選取32幀圖像序列進行離散小波變換處理,得到高頻和低頻信號并用GPCA方法分割出有效分量,最后進行編碼處理,三維空間等級樹集的編碼主要利用小波系數(shù)變換分解出高頻子帶和低頻子帶,不同的是它是從低頻向高頻不斷的分割,得到實驗需要的子帶。將子帶中像素坐標[(i,j,k)]寫入不重要像素表中和不重要集合中,代入式(1)得出編碼處理,在編碼過程中是以樹為單位的。開始編碼時需要對[i,j,k]三個向量進行分量初始化,得到初始化后的分量由公式算出平均值,從而完成整個編碼過程。得到的編碼結(jié)果如表1所示。
分析表1可知,本文算法編碼的視頻信噪比高、壓縮比高、更加清晰、穩(wěn)定。對于幀數(shù)變化不大的視頻序列,采用本文的變換處理法可以收集到更多的邊緣信息,編碼出更清晰的視頻。
對比分析本文算法、文獻[2?3]算法對8種運動教學(xué)視頻的壓縮情況,結(jié)果如表2所示。
分析表2可得,本文算法對8種類型運動教學(xué)視頻進行壓縮過程中的壓縮效率始終處于96%~99%之間,而傳統(tǒng)算法壓縮8種類型運動教學(xué)視頻的壓縮效率都低于本文算法。同時對比分析可得,相比其他兩種算法,本文算法的平均壓縮比高、信噪比高,說明本文算法壓縮不同類型運動教學(xué)視頻的壓縮性能更佳。
實驗為了分析本文算法的應(yīng)用性能,在某高校中隨機選擇100名運動視頻分析人員,采用問卷調(diào)查的手段得到這些人員對于本文算法的滿意度,結(jié)果如圖7所示。
全面分析圖7可得,這些運動視頻分析人員采用本文算法壓縮運動教學(xué)視頻過程,對于本文算法壓縮運動視頻的壓縮便利性、壓縮清晰度、壓縮效果以及壓縮信噪比的滿意度都占據(jù)較大比例,說明本文算法的實際應(yīng)用效果較佳,可大量推廣使用。
4? 結(jié)? 語
本文運用GPCA方法和多線性子空間KL變換方法對視頻進行編碼,設(shè)計了一種有效的視頻壓縮算法。通過實驗證明,鉆石搜索法比H.263方法更適合視頻編碼。本文研究的基于人工智能技術(shù)的運動教學(xué)視頻壓縮已經(jīng)應(yīng)用到一些高校中,并得到了滿意的結(jié)果。相信在今后基于人工智能技術(shù)的運動教學(xué)視頻壓縮中會發(fā)展的更好。
參考文獻
[1] 馮佳.基于數(shù)據(jù)人工智能技術(shù)的體育網(wǎng)站開發(fā)編程[J].自動化與儀器儀表,2018(1):144?146.
[2] 孟春寧,陳梓銘,馮明奎,等.基于關(guān)鍵幀和指示符運動模型的教學(xué)視頻壓縮算法[J].激光與光電子學(xué)進展,2018,55(10):118?129.
[3] 蔡于涵,熊淑華,孫偉恒,等.基于運動矢量細化的幀率上變換與HEVC結(jié)合的視頻壓縮算法[J].計算機科學(xué),2020,47(2):76?82.
[4] 馬琳,張傳新.體育人工智能的探討[J].泰山鄉(xiāng)鎮(zhèn)企業(yè)職工大學(xué)學(xué)報,2006(4):40?41.
[5] 艾強,劉業(yè)飛.基于五人制足球網(wǎng)上體育教學(xué)系統(tǒng)的研究[J].電子測試,2018(13):179?180.
[6] 劉健,吳飛,姚蕾,等.基于多線性子空間KL變換的可伸縮視頻壓縮方法[J].電子與信息學(xué)報,2010,32(5):1188?1192.
[7] 楊春玲,余英林.基于三維小波變換嵌入式視頻壓縮算法的研究[J].電子學(xué)報,2019,29(10):1381?1383.
[8] 徐麗琨,黃登山.基于H.263標準的視頻壓縮算法的優(yōu)化及研發(fā)[J].電力系統(tǒng)通信,2005,26(7):31?34.
[9] 祝世平,王再闊.一種基于對象的分形視頻壓縮算法研究[J].光電子·激光,2018,21(5):725?730.
[10] 須明,王博,何亦征,等.兩種實時視頻壓縮算法DSP嵌入式框架方案比較[J].航空電子技術(shù),2016,37(1):33?37.
[11] 李曉萌,王建軍.低比特率下視頻壓縮算法的研究[J].計算機應(yīng)用,2018,23(10):24?26.
[12] 陳秋華.一種內(nèi)存讀寫數(shù)據(jù)壓縮算法[J].中國集成電路,2018,27(7):42?47.
[13] 徐夏剛,葉正麟,張定華.分形視頻壓縮的一種快速算法[J].西北工業(yè)大學(xué)學(xué)報,2017,22(2):196?199.
[14] 王曉利.基于數(shù)學(xué)形態(tài)學(xué)的視頻幀間壓縮算法研究與實現(xiàn)[J].微計算機信息,2018,27(8):223?224.
[15] 鐘代笛,張琦.壓縮域內(nèi)的視頻圖像處理算法[J].電視技術(shù),2017,25(12):21?22.
作者簡介:姜? 龍(1987—),男,江蘇東海人,碩士,講師,主要研究方向為運動教學(xué)。