張偉
(安徽機電職業(yè)技術學院,安徽 蕪湖 241002)
為提升個人身體健康,人們逐步將更多的時間與精力投入到體育鍛煉之中[1]。運行模式也逐步由單一的、無目的的向多元化以及科學化的形式轉變。網(wǎng)球作為一項非常大眾化的運動模式,對抗性與趣味性均較強,對技術要求較高,因此需要專業(yè)的指導和訓練,但是這部分費用超出了一部分人的承受能力,還需要專門預約時間,導致市民從事這項運動項目的可行性下降[2]。為解決這一問題,現(xiàn)今市場上涌現(xiàn)了許多運動軟件,人們可以利用該軟件觀看教學視頻,受到很多運動員和業(yè)余愛好者的歡迎。然而,這些軟件只能機械地顯示人體運動行為,交互性差,且不能對網(wǎng)球錯誤動作進行及時糾正,導致學習效果下降[3]。
到目前為止,錯誤動作識別領域的研究已經(jīng)取得了一定的進展,例如林水強等[4]提出了姿勢序列有限狀態(tài)法來提高用戶對自然行為的識別的通用性和效率,從而建立肢體節(jié)點坐標系統(tǒng)并且以用戶作為出發(fā)點,在對用戶的行為肢體節(jié)點數(shù)作描述的時候,不再是設備空間,而變成了用戶的空間。經(jīng)試驗證明,這種方法能夠很好地進行擴展,而且適用性也強,能滿足體感交互應用的需要,但是識別精準率卻很低;石祥濱等[5]在人體運動視頻序列聚類中采用了K均值聚類算法,以此提高運動識別的實用性和準確性,降低計算機在計算過程中的復雜程度,通過從聚類數(shù)據(jù)中提取人體動作視頻序列的關鍵幀,及其具有的兩個特征:關鍵幀中關節(jié)點位置和人體各部位間的骨架夾角,通過SVM分類器來對動作序列實現(xiàn)分類等,經(jīng)實驗結果證明,其識別精準率不是很高。
基于以上研究背景,本文將機器視覺技術應用到了體育網(wǎng)球錯誤技術動作識別中,以期提高體育網(wǎng)球錯誤技術動作識別能力。
根據(jù)對人體結構的認識,人體可分為五個部分,也就是軀干、左臂、右臂、左腿、右腿,軀干為支撐人體的重要部分[6]。人體有些腰部的關節(jié)點能夠體現(xiàn)其運動特征的信息,而手腳的運動信息特征是由該部位的四肢關節(jié)點表現(xiàn)出來的。人體五大部分的劃分結果如圖1所示。
圖1 人體五大部分的劃分結果
通過人體結構的劃分,可以用這五個部分的組合來代表人體的一些基本動作,所以在分類方面采用分層策略[7]。第一個層次:要把五個相關組合模式的動作歸納為一大類。例如,只有兩個手臂的動作是第二部分和第三部分的結合,這是粗略動作分類后的結果。第二層次:對同一組合方式的動作進行重新分類,確定動作的詳細分類。從人體的17個關節(jié)角來驗證二維平面上的投影所形成的關節(jié)角特征向量,并以此作為人體運動的第一個粗分類特征。按照運動學的原理來對人體相同組合方式的特征進行提取[8]。一個網(wǎng)球運動員完整的行動可以分為主要行動和輔助行動。主動作反映運動模式的整體狀態(tài),輔助動作反映運動模式的局部狀態(tài)。只有結合主輔動作的特點,才能更準確地表達這個動作。對于人體的軀干、左臂、右臂、左腿、右腿等五大部分,分別建立了其在三維空間坐標內的肢體向量,表示為
人體的運動序列是連續(xù)的,并隨時間而變化。節(jié)角發(fā)生改變后會就產(chǎn)生角速度值。主動關節(jié)角的肢體向量和角速度則是人體軀干和肢體的整體協(xié)同運動的表現(xiàn),通過人體肢體和軀干的彎曲來表現(xiàn)關節(jié)點間距離的變化。人體也從左視圖方向來進行YOZ側平面的投影。其網(wǎng)球運動員的五個部分到關節(jié)點的距離為
其中,dAB表示人體肩膀的寬度;表示人體五大部分中關節(jié)間歐式距離的均值。
根據(jù)人體五大部分的劃分結果,建立了人體的軀干、左臂、右臂、左腿、右腿在三維空間坐標內的肢體向量,進而利用人體五部分骨骼關節(jié)之間的距離,提取了體育網(wǎng)球錯誤技術動作特征。
在體育網(wǎng)球教學視頻或是比賽的實況錄像中,攝像機的位置是動態(tài)的。所以,在體育網(wǎng)球比賽錄像中非靜止畫面較多,由于攝影機時刻是移動的,所以不能很好地反映運動員的信息。因此需要利用機器視覺技術跟蹤運動目標來獲取運動員所活動的領域,并在這個范圍內來調整運動員的圖像,來抵消外部因素的影響[10]。
經(jīng)過如此處理,能夠實現(xiàn)對于目標跟蹤圖像序列的調整。調整后的圖像序列只包括了運動員的四肢運動和因球拍所產(chǎn)生的動作,而且不能反映原始圖像中攝影機運動情況[12]。
通過跟蹤體育網(wǎng)球運動目標,獲取網(wǎng)球運動員的活動區(qū)域,通過計算體育網(wǎng)球錯誤技術動作識別區(qū)域的質心坐標,生成體育網(wǎng)球錯誤技術動作跟蹤圖像,實現(xiàn)體育網(wǎng)球錯誤技術動作的跟蹤與調整。
在體育網(wǎng)球錯誤技術動作的基礎上,通過計算體育網(wǎng)球錯誤技術動作描述符,來設計體育網(wǎng)球錯誤技術動作識別流程。
機器視覺技術是以光流特征為基礎的,通過每個像素的時間位移來建立光流信息集,這就要求光流具有很高的精確度[13]。為了很好地將運動視頻的光流矢量變成矢量場,繼而形成可移動的空間分布關系,特別是需要對光流場進行分析。因為光流在跟蹤圖像的時候只能反映網(wǎng)球運動員前景圖像中的運動信息,所以跟蹤圖像中的背景則會對光流的計算產(chǎn)生影響。所以勢必先要清理好背景[14]。不但要考慮背景顏色的均勻性,而且還要在高斯混合模型的基礎上,對區(qū)域的生長算法進行處理后,得到網(wǎng)球運動員全局前景圖像。以運動員為中心的背景色消除如圖2所示。
圖2 以運動員為中心的背景色消除
根據(jù)攝像機的清晰度,用戶可以手動調整體育網(wǎng)球錯誤技術動作圖像序列,繼而估計光場的長度。首先,根據(jù)攝像機的閃光燈和強度的改變程度,來對體育網(wǎng)球錯誤技術動作圖像的亮度進行實時跟蹤,這會使得光流計算結果出現(xiàn)錯誤。所以要采用圖像差來區(qū)分亮度,消除因亮度變化而產(chǎn)生的影響。其次分析生物視覺系統(tǒng)的理論可知,機器視覺細胞對物體的邊緣運動很是敏感,在方向上和速度中,對于因圖像的不同而形成的不同光流,以此來反映出人類的視覺系統(tǒng)是如何影響物流運動的。在差分圖像的基礎上,通過Horn-Schunck算法來估算網(wǎng)球運動員是如何跟蹤Horn-Schunck光流場的,具體如下:
在調整體育網(wǎng)球錯誤技術動作圖像中的運動員位置與身體的相對位移具有相關性,這種位移存在于相應的圖像區(qū)域中[15]。對于網(wǎng)球運動員不同的姿態(tài),光流場的空間分布是不同的。
綜上所述,在機器視覺技術的基礎上,提取了體育網(wǎng)球錯誤技術動作特征,通過跟蹤和調整體育網(wǎng)球錯誤技術動作,計算了體育網(wǎng)球錯誤技術動作描述符,實現(xiàn)了體育網(wǎng)球錯誤技術動作的識別。
為了驗證基于機器視覺技術的體育網(wǎng)球錯誤技術動作識別方法的性能,采用了2016年奧運會網(wǎng)球比賽、2017年中國大師賽、蘇迪曼杯以及中國公開賽中采集的運動員錯誤技術動作數(shù)據(jù)。體育網(wǎng)球錯誤技術動作視頻采用MPEG-1的壓縮格式進行存儲,每一段視頻幀的大小為352*288。以上4場比賽中網(wǎng)球錯誤技術動作的類型都是在手動模式下進行標記的。實驗數(shù)據(jù)如表1所示。
表1 實驗數(shù)據(jù)
為了對基于機器視覺技術的體育網(wǎng)球錯誤技術動作識別方法進行定量評價,引入召回率指標和精確率指標來確定體育網(wǎng)球錯誤技術動作中每一個揮拍動作的識別能力。召回率指標和精準率指標的計算方法為
針對表1中的實驗數(shù)據(jù),采用3次交叉驗證策略組成實驗的訓練集和測試集,以體育網(wǎng)球錯誤技術動作次數(shù)為自變量,分別引入文獻[4]方法和文獻[5]體方法作為對比,經(jīng)過3次迭代之后,測試了3種動作識別方法的召回率,結果如圖3所示。從圖3的結果可以看出,3種動作識別方法在體育網(wǎng)球錯誤技術動作次數(shù)低于250時,動作識別的召回率基本相同,當動作超過250次時,本文方法在識別體育網(wǎng)球錯誤技術動作時,體育網(wǎng)球錯誤技術動作識別的召回率越來越高;文獻[4]方法由于識別到的體育網(wǎng)球錯誤技術動作視頻質量低,導致在動作次數(shù)為300時召回率出現(xiàn)了轉折點,開始逐漸降低;而文獻[5]方法由于受到攝像機移動的影響,雖然召回率呈現(xiàn)上升趨勢,但是上升的趨勢比較緩慢。因此可以得出,基于機器視覺技術的體育網(wǎng)球錯誤技術動作識別方法在體育網(wǎng)球錯誤技術動作識別的召回率測試中具有較好的性能。
圖3 召回率測試結果
體育網(wǎng)球錯誤技術動作識別的精準率測試結果如圖4所示。
圖4 精準率測試結果
從圖4的結果可以看出,隨著體育網(wǎng)球錯誤技術動作次數(shù)的增加,文獻[4]方法和文獻[5]方法當網(wǎng)球運動員的運動方向發(fā)生變化時,無法進行有效區(qū)分,導致體育網(wǎng)球錯誤技術動作識別的精準率逐漸降低;而本文方法在識別體育網(wǎng)球錯誤技術動作時,識別精準率降低的趨勢比較緩慢,當體育網(wǎng)球錯誤技術動作次數(shù)達到500時,動作識別的精準率也高達77%。
為及時校正體育網(wǎng)球錯誤技術動作,本文提出了基于機器視覺技術的體育網(wǎng)球錯誤技術動作識別方法,采用機器視覺技術提取體育網(wǎng)球錯誤技術動作的具體特征,通過跟蹤和調整體育網(wǎng)球錯誤技術動作,設計體育網(wǎng)球錯誤技術動作識別流程,實現(xiàn)了體育網(wǎng)球錯誤技術動作的識別。實驗結果顯示,與其他方法相比,本文方法的識別性能更好,精準率更高。