韓美林
(商洛學(xué)院 電子信息與電氣工程學(xué)院,陜西商洛 726000)
隨著視頻技術(shù)的不斷進(jìn)步,體育視頻數(shù)據(jù)急劇增加,但無(wú)論對(duì)觀眾還是運(yùn)動(dòng)員或教練都重點(diǎn)關(guān)注視頻中的一小部分,所以對(duì)于體育視頻中關(guān)鍵幀或運(yùn)動(dòng)員關(guān)鍵姿態(tài)的檢測(cè)非常重要[1]。目前對(duì)于體育運(yùn)動(dòng)員在比賽中的表現(xiàn)大多都是通過(guò)觀看體育視頻來(lái)實(shí)現(xiàn),這無(wú)疑耗時(shí)又耗力。而目標(biāo)檢測(cè)技術(shù)和深度學(xué)習(xí)技術(shù)為解決這一問(wèn)題提供了新的思路,將其應(yīng)用到舉重運(yùn)動(dòng)員關(guān)鍵姿態(tài)檢測(cè),高效的提取體育視頻中舉重運(yùn)動(dòng)員關(guān)鍵姿態(tài)檢測(cè),不僅可以帶來(lái)更好的體育視頻觀賞效果,還可以更好地輔助運(yùn)動(dòng)員的訓(xùn)練[2]。
目標(biāo)檢測(cè)法中基于像素點(diǎn)背景建模與更新的背景減除法具有計(jì)算簡(jiǎn)單、實(shí)時(shí)性好的特點(diǎn)被廣泛使用,但由于學(xué)習(xí)時(shí)間長(zhǎng)、運(yùn)算速度慢、并且當(dāng)攝像機(jī)抖動(dòng)時(shí)目標(biāo)檢測(cè)效果差等缺點(diǎn)[3],本文對(duì)檢測(cè)算法進(jìn)行改進(jìn)。主要針對(duì)原算法容易受到復(fù)雜背景干擾的問(wèn)題,如舉重視頻中可能出現(xiàn)其他工作人員或設(shè)備,所以需要利用空間相關(guān)性對(duì)背景進(jìn)行初始化和背景更新以提高檢測(cè)的準(zhǔn)確率。整個(gè)目標(biāo)檢測(cè)可以分為運(yùn)動(dòng)前景檢測(cè)和運(yùn)動(dòng)行人檢測(cè)兩部分,算法組成框圖如圖1 所示。
圖1 基于視頻監(jiān)控中行為人目標(biāo)檢測(cè)算法
采用基于像素塊的最小差分和算法對(duì)背景初始化,利用基于像素塊的信息熵估算法對(duì)背景模型選擇性更新,通過(guò)最小類(lèi)間方差法求自適應(yīng)閾值,并將該閾值應(yīng)用于背景減除法求出二值圖像,即為運(yùn)動(dòng)前景的檢測(cè)結(jié)果[4];然后通過(guò)對(duì)運(yùn)動(dòng)前景圖像采用掃描連通域標(biāo)記算法提取其運(yùn)動(dòng)區(qū)域游程信息和特征信息進(jìn)行運(yùn)動(dòng)行人檢測(cè)[5]。
在圖像的智能監(jiān)控領(lǐng)域,人體檢測(cè)只是處理的第一步,第二步是人體目標(biāo)的特征提取,第三步是人體目標(biāo)識(shí)別與驗(yàn)證。其中人體目標(biāo)特征提取是最關(guān)鍵的一步,它主要通過(guò)邊緣檢測(cè)技術(shù)來(lái)分離人體目標(biāo),進(jìn)而根據(jù)邊緣特征來(lái)完成目標(biāo)的特征提取,最終完成人體姿態(tài)的識(shí)別和分類(lèi)[6]。
本文通過(guò)分析舉重運(yùn)動(dòng)員申膝、引膝、發(fā)力、最高點(diǎn)四種人體姿態(tài)特征,提取了8 種特征量,建立了人體姿態(tài)特征模型,模型各特征量具體如表1 所示。
表1 人體姿態(tài)特征模型
BP 算法雖然預(yù)測(cè)的通用性較好、精度高,但在應(yīng)用中仍存在不少缺陷,比如隱含層數(shù)和隱含層節(jié)點(diǎn)數(shù)難以確定,收斂速度太慢等。因此,BP 算法被不斷地改進(jìn)應(yīng)用。針對(duì)體育視頻圖像中關(guān)鍵姿態(tài)研究,本文中神經(jīng)網(wǎng)絡(luò)的訓(xùn)練函數(shù)采用L-M 學(xué)習(xí)規(guī)則,動(dòng)量法作為參數(shù)[7]。
3.2.1 BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練策略
1)BP 網(wǎng)絡(luò)結(jié)構(gòu)的確定
多數(shù)情況下,在不確定隱層數(shù)及節(jié)點(diǎn)的情況下,訓(xùn)練從單隱層的BP 網(wǎng)絡(luò)即可。本文傳遞函數(shù)使用tansig,輸出層使用purelin 函數(shù)。隱含層節(jié)點(diǎn)數(shù)數(shù)量過(guò)多,會(huì)導(dǎo)致訓(xùn)練時(shí)間過(guò)長(zhǎng)、收斂速度慢、測(cè)試誤差增加等問(wèn)題,而數(shù)量過(guò)少,訓(xùn)練結(jié)果的正確性無(wú)法保證[8]。因此本文使用單隱層,逐漸增加節(jié)點(diǎn)數(shù),最終達(dá)到學(xué)習(xí)誤差小于給定閾值的目的。
2)誤差的選取
為了克服傳統(tǒng)BP 算法中迭代誤差的缺陷本文選取均方誤差MSE[9]。
3.2.2 BP 神經(jīng)網(wǎng)絡(luò)分類(lèi)器的訓(xùn)練過(guò)程
BP 神經(jīng)網(wǎng)絡(luò)分類(lèi)器的訓(xùn)練流程圖如圖2 所示[10]。
圖2 BP 神經(jīng)網(wǎng)絡(luò)分類(lèi)器的訓(xùn)練流程圖
圖3 BP 神經(jīng)網(wǎng)絡(luò)分類(lèi)器測(cè)試過(guò)程
1)確定BP 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)以及初始化。本文的姿態(tài)識(shí)別算法屬于分類(lèi)問(wèn)題,所以需要一個(gè)隱含層,人體姿態(tài)數(shù)據(jù)經(jīng)過(guò)特征提取之后為8維,本文中需要識(shí)別的姿態(tài)共有4 種,因此BP 神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為8-10-4;然后完成對(duì)權(quán)值的初始化,最后給定學(xué)習(xí)速率和神經(jīng)元激勵(lì)函數(shù)。2)隱含層輸出計(jì)算、輸出層輸出計(jì)算。3)誤差計(jì)算和權(quán)值更新。4)判斷訓(xùn)練是否結(jié)束:如果將所有輸入樣本訓(xùn)練,則算法結(jié)束;否,返回到步驟2。
3.2.3 BP 神經(jīng)網(wǎng)絡(luò)分類(lèi)器測(cè)試過(guò)程
BP 神經(jīng)網(wǎng)絡(luò)分類(lèi)器測(cè)試流程如圖3 所示[11]。
1)輸入測(cè)試樣本:將測(cè)試樣本庫(kù)里面的姿態(tài)數(shù)據(jù)輸入網(wǎng)絡(luò)。2)隱含層輸出計(jì)算、輸出層輸出計(jì)算。3)判斷測(cè)試是否結(jié)束:如果將所有輸入測(cè)試訓(xùn)練,則測(cè)試結(jié)束;否則返回到步驟1。4)給出姿態(tài)識(shí)別整體結(jié)果和識(shí)別的正確率。
為了驗(yàn)證算法的魯棒性采集不同姿態(tài),分別是申膝、引膝、發(fā)力、最高點(diǎn)各100 個(gè)樣本,BP 神經(jīng)網(wǎng)絡(luò)模型建立完成后,分別對(duì)四種姿態(tài)進(jìn)行識(shí)別與分類(lèi)。仿真結(jié)果如圖4、圖5、圖6、圖7 所示。
圖4 舉重運(yùn)動(dòng)員申膝姿態(tài)檢測(cè)
圖5 舉重運(yùn)動(dòng)員引膝姿態(tài)檢測(cè)
圖6 舉重運(yùn)動(dòng)員發(fā)力姿態(tài)檢測(cè)
圖7 舉重運(yùn)動(dòng)員最高點(diǎn)姿態(tài)檢測(cè)
最后,針對(duì)四種人體姿態(tài)利用攝像頭分別采集200 幀測(cè)試圖片,用于BP 網(wǎng)絡(luò)模型的人體姿態(tài)識(shí)別的統(tǒng)計(jì)分析,結(jié)果如表2所示。
表2 人體姿態(tài)識(shí)別結(jié)果
從表2 可以看出,申膝、引膝和發(fā)力的人體姿態(tài)識(shí)別率稍低,分別是95%、95.5%、96.5%。主要原因在于識(shí)別過(guò)程中有外界的干擾,比如鏡頭內(nèi)突然有運(yùn)動(dòng)員之外的人員出現(xiàn),或者申膝和引膝是非常相似的連續(xù)動(dòng)作所引起的誤判。最高點(diǎn)姿態(tài)識(shí)別率較高,達(dá)98.50%,檢測(cè)效果相對(duì)比較準(zhǔn)確。
本文面向舉重運(yùn)動(dòng)視頻,完成了基于BP 神經(jīng)網(wǎng)絡(luò)的體育視頻關(guān)鍵姿態(tài)檢測(cè),姿態(tài)識(shí)別部分采用了BP 神經(jīng)網(wǎng)絡(luò),通過(guò)深度學(xué)習(xí)的方法建立能夠表達(dá)圖像信息的特征參數(shù),本文對(duì)舉重運(yùn)動(dòng)中四個(gè)關(guān)鍵姿態(tài)進(jìn)行了識(shí)別,經(jīng)仿真表明,人體姿態(tài)識(shí)別率較高。在今后的學(xué)習(xí)和工作中,還需要不斷優(yōu)化算法,研究出高效且適應(yīng)范圍更廣的人體姿態(tài)研究算法。