林 彬,劉 群,王 群,聶燕柳
(重慶郵電大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,重慶400065)
視頻語(yǔ)義分析一直是視頻處理領(lǐng)域的研究熱點(diǎn)。然而由于語(yǔ)義鴻溝的存在,限于當(dāng)前的技術(shù)水平,還難以建立底層特征與高層語(yǔ)義之間的通用模型進(jìn)行視頻分析。足球等體育項(xiàng)目由于深受人們所喜愛(ài),具有廣泛的群眾基礎(chǔ),因而對(duì)足球視頻語(yǔ)義內(nèi)容的研究具有廣闊的應(yīng)用前景。在一場(chǎng)90分鐘的足球比賽中,觀眾真正感興趣并可能反復(fù)觀看的往往是那些精彩鏡頭,如射門、角球、任意球、惡意犯規(guī)等。由于場(chǎng)地和攝像機(jī)數(shù)量的限制,足球視頻具有相對(duì)的結(jié)構(gòu)性和固定的鏡頭類型,且會(huì)以慢鏡頭的形式重放重要的語(yǔ)義事件。通過(guò)鏡頭的檢測(cè)與鏡頭類型的識(shí)別,結(jié)合領(lǐng)域知識(shí),是可能建立起底層特征到高層語(yǔ)義的映射關(guān)系的。一些研究者已經(jīng)在這方面做了有益的探索。彭利民[1]基于隱馬爾科夫模型識(shí)別足球語(yǔ)義事件。全國(guó)英等[2]在分割鏡頭后生成鏡頭線索,再基于分層隱馬爾科夫模型進(jìn)行事件推理。Tong等[3]結(jié)合貝葉斯網(wǎng)絡(luò)模型,根據(jù)鏡頭語(yǔ)義單元完成事件檢測(cè)。Ekin等[4]根據(jù)草色比率實(shí)現(xiàn)了足球視頻鏡頭分類、事件檢測(cè)并生成了視頻摘要。趙丕錫等[5]以慢動(dòng)作回放鏡頭為標(biāo)志,通過(guò)分析鏡頭間的關(guān)聯(lián)規(guī)則實(shí)現(xiàn)摘要的生成。Ouazzani等[6]基于有效的鏡頭分類,結(jié)合隱馬爾科夫模型和貝葉斯理論識(shí)別精彩片斷。Eldib等[7]改進(jìn)了基于logo檢測(cè)識(shí)別慢鏡頭的算法,通過(guò)分析慢鏡頭持續(xù)時(shí)間生成摘要。
視頻數(shù)據(jù)是一種非結(jié)構(gòu)化數(shù)據(jù),將其轉(zhuǎn)換成為以鏡頭類型為關(guān)鍵屬性的一連串標(biāo)示序列,是事件檢測(cè)、摘要生成的基礎(chǔ)。通常的做法是首先對(duì)視頻進(jìn)行預(yù)處理,以鏡頭為單位自動(dòng)切分視頻將其結(jié)構(gòu)化;在此基礎(chǔ)之上,再通過(guò)模式識(shí)別方法自動(dòng)識(shí)別出鏡頭所屬類型。在綜合分析了已有工作之后,本文提出了一種基于logo模板匹配和場(chǎng)地像素比率的鏡頭分類方法,將視頻鏡頭分為慢鏡頭、遠(yuǎn)鏡頭、中鏡頭、球員特寫或場(chǎng)外鏡頭四類。經(jīng)過(guò)實(shí)驗(yàn)證明,方法適應(yīng)性好,準(zhǔn)確性高,且實(shí)用高效。
鏡頭之間的時(shí)序關(guān)系對(duì)于視頻的語(yǔ)義分析具有重要的作用。如射門事件發(fā)生前會(huì)出現(xiàn)球門區(qū)域的遠(yuǎn)鏡頭,在射門發(fā)生之后通常會(huì)有一個(gè)射門球員的特寫鏡頭,緊跟著會(huì)有回放整個(gè)射門過(guò)程的慢鏡頭,如果射門成功,還會(huì)出現(xiàn)教練歡呼的鏡頭和觀眾鏡頭。因此,如何有效地檢測(cè)并識(shí)別足球視頻中各種類型的鏡頭,受到了眾多研究者的廣泛關(guān)注。
鏡頭分類首先要進(jìn)行視頻切分,準(zhǔn)確檢測(cè)鏡頭邊界以完成視頻切分,是有效劃分鏡頭類型的保障性前提。鏡頭邊界檢測(cè)最常采用的方法是比較相鄰兩幀顏色直方圖,如其距離大于某一指定閾值即認(rèn)為這兩幀為鏡頭邊界。該方法對(duì)于突變鏡頭邊界的檢測(cè)非常有效,但對(duì)于漸變鏡頭,由于漸變過(guò)程中相鄰幀間差異并不明顯,原始的直方圖比較法很容易失效。然而,當(dāng)鏡頭漸變發(fā)生時(shí),相鄰幀間的差異雖小于突變時(shí)的差異,卻大于同一鏡頭中相鄰幀間的差異?;诖耍琙hang等[8]提出的雙閾值比較法能夠比較有效地解決漸變鏡頭檢測(cè)的問(wèn)題。足球視頻中,大部分鏡頭邊界屬于突變類型,少部分屬于漸變。在已有的相關(guān)工作[9-12]中,分割鏡頭普遍采用雙閾值比較法或其改進(jìn)算法,雖能取得一定效果,但仍然容易產(chǎn)生誤檢,尤其是對(duì)漸變鏡頭的檢測(cè)。原因主要是足球視頻中存在大量的運(yùn)動(dòng),以及慢鏡回放部分開始和結(jié)束時(shí)的logo掃換在不同的視頻中差異較大,這些都會(huì)導(dǎo)致算法出現(xiàn)錯(cuò)誤的判斷。而基于漸變區(qū)域獲取logo模板而后進(jìn)行l(wèi)ogo模板匹配的慢鏡頭檢測(cè)算法[7,13-14],由于漸變檢測(cè)的效果不穩(wěn)定,其慢鏡頭定位的準(zhǔn)確性也會(huì)相應(yīng)地受到影響,這對(duì)于后續(xù)的研究工作是不利的。
根據(jù)拍攝角度與距離的不同,足球視頻中的鏡頭可分為遠(yuǎn)鏡頭、中鏡頭、特寫鏡頭、場(chǎng)外鏡頭等幾種類型。遠(yuǎn)鏡頭以鳥瞰的角度清晰地顯示出球場(chǎng)內(nèi)各球員的站位和比賽的進(jìn)行情況,通常遠(yuǎn)鏡頭的出現(xiàn)即意味著比賽的進(jìn)行;中鏡頭往往穿插于遠(yuǎn)鏡頭之間,聚焦于一名或幾名球員,并且顯示出球員的整個(gè)身體部分,而連續(xù)的中鏡頭通常在比賽中斷時(shí)出現(xiàn);特寫鏡頭所捕捉的對(duì)象往往是某一名球員,且只顯示球員的上半身部分,一般情況下,球員特寫鏡頭即意味著比賽的中斷;場(chǎng)外鏡頭顯示的是教練、替補(bǔ)席、觀眾席或其他情況,同樣意味著比賽的中斷。基于在不同類型的鏡頭中,球場(chǎng)區(qū)域在整幅圖像幀中的比率有較大差異,Xu等[9]提出利用草地顏色比率為特征,設(shè)定閾值以劃分足球視頻鏡頭類型,將其分為遠(yuǎn)鏡頭、中鏡頭和其他鏡頭。由于存在場(chǎng)內(nèi)中鏡頭與遠(yuǎn)鏡頭草色比例相似的情況,對(duì)閾值的選取造成了一定困難,因此分類效果并不理想。Ekin等[4]應(yīng)用黃金分塊的思想,根據(jù)圖像幀中不同區(qū)域草色比率的差值為特征,利用貝葉斯分類器對(duì)遠(yuǎn)、中、特寫鏡頭進(jìn)行分類,取得了較為理想的分類效果,但是文中并沒(méi)有說(shuō)明如何選幀以確定初始草地顏色值,而是直接對(duì)幀中主色進(jìn)行了計(jì)算。
Eldib等[7]通過(guò)實(shí)驗(yàn)確定場(chǎng)地像素的RGB范圍區(qū)間,凡是各分量均落在這個(gè)區(qū)間內(nèi)的像素即認(rèn)為是場(chǎng)地顏色像素,再根據(jù)場(chǎng)地像素比例設(shè)定閾值以區(qū)分各類鏡頭,由于場(chǎng)地顏色會(huì)隨著場(chǎng)館、天氣、光線等因素而不斷變化,且RGB顏色空間與人眼視覺(jué)存在差異性,算法魯棒性不佳。于俊清等[15]則利用視頻幀中子窗口區(qū)域的場(chǎng)地顏色比例來(lái)反映鏡頭的類型,也取得了一定效果,但在統(tǒng)計(jì)球場(chǎng)色像素時(shí)同樣是只判斷場(chǎng)地像素色度分量H值是否落在事先設(shè)定好的的取值范圍內(nèi),且算法依賴于子窗口大小與位置的選取。
綜上所述,當(dāng)前鏡頭分類方法的主要問(wèn)題是鏡頭邊界定位的準(zhǔn)確度不夠,算法的通用性不強(qiáng),各類型鏡頭的識(shí)別準(zhǔn)確率也有待進(jìn)一步提高。
通過(guò)觀察與分析得知,足球視頻中的鏡頭漸變?yōu)閘ogo掃換和疊化兩種。Logo掃換效果如圖1所示,出現(xiàn)于慢鏡回放部分的起始和結(jié)尾處;疊化效果如圖2所示,一般只出現(xiàn)于回放段內(nèi)的鏡頭切換處。而正常比賽部分的鏡頭切換通常為鏡頭突變。
一段慢鏡回放是通過(guò)一個(gè)或一組鏡頭對(duì)稍早前的精彩內(nèi)容的回放。考慮到一個(gè)回放段內(nèi)各鏡頭的語(yǔ)義相關(guān)性,本文的思路是將整個(gè)回放段視為一個(gè)慢鏡頭,首先通過(guò)logo模板匹配定位出視頻中所有的慢鏡頭,然后在其余的正常比賽部分做突變鏡頭檢測(cè)即可,從而有效解決足球視頻中漸變鏡頭檢測(cè)易產(chǎn)生誤檢的問(wèn)題。緊接著,本文提出了一種改進(jìn)的自適應(yīng)的場(chǎng)地色H值提取算法用于場(chǎng)地顏色區(qū)間取值范圍的確定,H值落在這個(gè)區(qū)間內(nèi)的像素即為場(chǎng)地像素,再結(jié)合黃金分塊的思想計(jì)算各塊的場(chǎng)地像素比率,并以此為特征,利用更適合視頻處理的SVM分類器將正常比賽部分鏡頭分為遠(yuǎn)鏡頭、中鏡頭、球員特寫或場(chǎng)外鏡頭三類 (鑒于球員特寫鏡頭與場(chǎng)外鏡頭在語(yǔ)義上具有相似性,本文將這兩類鏡頭歸為同一類型鏡頭)。
足球視頻中,當(dāng)進(jìn)球、射門、精彩過(guò)人、惡意犯規(guī)等觀眾最感興趣的語(yǔ)義事件發(fā)生時(shí),編導(dǎo)通常會(huì)以慢動(dòng)作回放的方式重播之前的內(nèi)容,甚至?xí)啻沃胤?、不同角度重放,供觀眾仔細(xì)觀看。因此,對(duì)慢鏡頭的準(zhǔn)確定位不僅能夠標(biāo)定比賽中精彩片斷在視頻流中所處位置,進(jìn)而生成比賽的精彩集錦,同時(shí)也是本文視頻切分方法的首要工作。
慢鏡回放通常會(huì)以一個(gè)特定的logo掃換引入,再以相同或類似的變化結(jié)束。對(duì)于同一類型的賽事,往往有其固定的logo掃換效果。因此,可以通過(guò)用戶交互的方式,讓用戶選擇比賽類型來(lái)獲取logo模板,如圖3所示;之后在視頻序列中通過(guò)對(duì)logo模板的檢測(cè)與匹配,逐一定位出慢鏡頭的開始和結(jié)束。
圖3 logo模板的選取
本文采用文獻(xiàn) [10]中的方法計(jì)算每一幀與logo模板的距離。計(jì)算公式為
式中:d1(s,t)——模板t中l(wèi)ogo所在區(qū)域與幀s對(duì)應(yīng)區(qū)域兩者基于顏色直方圖的距離,d2(s,t)——他們基于對(duì)應(yīng)像素顏色值的距離,0<β<1為權(quán)重。當(dāng)前幀與與logo模板的距離小于給定閾值時(shí),即記為一次logo匹配。
另外,由于logo掃換本身屬于鏡頭漸變,為了避免重復(fù)匹配,文獻(xiàn) [10]中還約定:若相鄰的兩次匹配發(fā)生在最小間隔幀數(shù)以內(nèi),則只記為一次匹配??紤]到一次慢鏡回放從開始到結(jié)束的時(shí)間,或兩次回放之間的間隔時(shí)間通常不會(huì)低于一秒,故而對(duì)于25幀/秒的視頻,取其最小間隔幀數(shù)為25。
定位出所有的慢鏡頭后,在其余的正常比賽部分通過(guò)直方圖比較法檢測(cè)鏡頭突變,完成視頻的切分。
2.2.1 確定場(chǎng)地色H值范圍區(qū)間
HSV顏色空間是一種面向視覺(jué)感知的顏色模型,其中H分量 (色度,Hue)是決定顏色本質(zhì)的基本特性,因此本文采用H分量的值來(lái)度量場(chǎng)地顏色,提出了一種自適應(yīng)的確定場(chǎng)地色H值范圍區(qū)間的算法,算法步驟如下:
步驟1 得到一個(gè)場(chǎng)地色H值的初始范圍區(qū)間[low,high](實(shí)驗(yàn)中l(wèi)ow取70,high取100);
步驟2 從視頻序列中均勻選取n幀圖像;
步驟3 計(jì)算第一幀H分量直方圖的峰值ipeak;
步驟4 如果ipeak∈[low,high],轉(zhuǎn)步驟6,否則轉(zhuǎn)步驟5;
步驟5 計(jì)算下一幀H分量直方圖的峰值ipeak,轉(zhuǎn)步驟4;
步驟6 按式 (2)~ (7)計(jì)算場(chǎng)地顏色均值,設(shè)定場(chǎng)地色H值取值范圍為[m-r,m+r],r為顏色半徑 (實(shí)驗(yàn)中r取5),算法結(jié)束。
式中:顏色區(qū)間的上下界imin,imax由式 (2)~ (6)確定,實(shí)驗(yàn)中K取0.2,m為場(chǎng)地顏色均值,將其定義為峰值ipeak左右顏色直方圖下降到K倍H[ipeak]區(qū)間內(nèi)所有顏色的均值[4]。
2.2.2 特征提取及關(guān)鍵幀選擇
黃金分塊的思想將圖像幀在每個(gè)方向按照3:5:3的比例劃分為9個(gè)分塊,如圖4所示,遠(yuǎn)鏡頭幀的第一行的三塊區(qū)域多為廣告牌區(qū)域,二、三行6塊區(qū)域中場(chǎng)地像素比率較大;中鏡頭幀往往在正中一塊區(qū)域場(chǎng)地像素比例較小;球員特寫鏡頭幀的非場(chǎng)地區(qū)域主要集中在第二列的三塊區(qū)域。分別計(jì)算圖像幀中九塊區(qū)域的場(chǎng)地像素比率值作為特征,繼而通過(guò)訓(xùn)練好的SVM分類器能夠完成對(duì)該幀的類型識(shí)別。
本文對(duì)每個(gè)比賽鏡頭選取等間隔的三幀圖像作為關(guān)鍵幀,對(duì)這3個(gè)關(guān)鍵幀進(jìn)行識(shí)別,得到三幀圖像的分類結(jié)果并以此判定鏡頭的類型。具體規(guī)則如下:若三幀的分類結(jié)果一致,則將該類型作為當(dāng)前鏡頭的類型;若有兩幀的分類結(jié)果一致,一幀為不同類型,則將相同結(jié)果的兩幀的類型作為當(dāng)前鏡頭的類型;若三幀的分類結(jié)果均不一致,則將鏡頭中間一幀的類型作為當(dāng)前鏡頭類型。
圖4 黃金分塊效果
2.2.3 SVM 分類器
支持向量機(jī) (SVM)已在圖像識(shí)別、信號(hào)處理等諸多應(yīng)用中取得了良好的效果。由于在解決小樣本領(lǐng)域分類問(wèn)題有其特有的優(yōu)勢(shì),SVM同樣適合于應(yīng)用在視頻處理領(lǐng)域,因此本文選用SVM作為分類器。SVM的核心思想是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,構(gòu)造最優(yōu)分類超平面以最大間隔將兩類數(shù)據(jù)分開。其優(yōu)化方程為
式中:w——矢量系數(shù),b——常量,ξi——松弛變量,C——錯(cuò)誤懲罰參數(shù),φ(x)——x的非線 性映射,xi、yi——第i個(gè)特征矢量及其所屬類別。SVM通過(guò)函數(shù)φ(·)將輸入矢量映射到高維空間,通過(guò)最優(yōu)計(jì)算得到最優(yōu)分類,保證得到的解為全局最優(yōu)解。
決定SVM性能的是核函數(shù)的選取,式 (9)為核函數(shù)公式
本文的SVM分類器采用高斯核函數(shù),即
為檢驗(yàn)本文方法的效果,采用MFC和DirectShow開發(fā)實(shí)驗(yàn)平臺(tái),實(shí)驗(yàn)視頻為CCTV轉(zhuǎn)播的多場(chǎng)足球比賽視頻片斷,在經(jīng)過(guò)慢鏡頭檢測(cè)、突變鏡頭檢測(cè)及鏡頭類型識(shí)別這三步處理后,對(duì)總長(zhǎng)54分36秒的視頻 (82 009幀,237個(gè)鏡頭)的鏡頭分類結(jié)果如表1所示。
將本文方法與文獻(xiàn) [14]中慢鏡頭檢測(cè)方法和文獻(xiàn)[15]中鏡頭分類方法作查全率與查準(zhǔn)率的比較,比較結(jié)果如表2所示。
其中查全率與查準(zhǔn)率的計(jì)算公式如下
表1 鏡頭分類實(shí)驗(yàn)結(jié)果
表2 查全率、查準(zhǔn)率對(duì)比結(jié)果
實(shí)驗(yàn)結(jié)果表明,本文方法對(duì)于慢鏡頭、遠(yuǎn)鏡頭、中鏡頭、球員特寫或場(chǎng)外鏡頭的檢測(cè)與識(shí)別均取得了較好的效果,相對(duì)于較為有代表性的文獻(xiàn) [14]、 [15]中方法,在查全率和查準(zhǔn)率方面均有所提高。產(chǎn)生誤檢和漏檢的主要原因一方面是鏡頭邊界檢測(cè)時(shí)由于鏡頭或球員運(yùn)動(dòng)產(chǎn)生誤檢和鏡頭間差別極小而產(chǎn)生漏檢,這類情況是較為難以避免的;另一方面是SVM分類產(chǎn)生的誤差,可以通過(guò)完善訓(xùn)練樣本和優(yōu)化分類器設(shè)計(jì)進(jìn)一步提高分類效果。中鏡頭由于情況多變且相對(duì)不規(guī)則,較容易被誤檢為遠(yuǎn)鏡頭或特寫鏡頭,因而查全率相對(duì)較低。而由于logo模板的獲取基于用戶交互,因而對(duì)實(shí)驗(yàn)視頻中所有慢鏡頭的檢測(cè)與定位達(dá)到了準(zhǔn)確無(wú)誤的效果。
已有的相關(guān)工作中,視頻的切分往往只專注于鏡頭突變、漸變的檢測(cè),本文不拘泥于這種常規(guī)思想,提出了一種切分足球視頻的新思路,即首先通過(guò)用戶交互獲取logo模板以精確定位視頻中的慢鏡頭,然后再通過(guò)突變鏡頭檢測(cè)進(jìn)一步切分正常比賽部分,避免了漸變檢測(cè)產(chǎn)生的較大誤差。另外,本文還提出了一種改進(jìn)的自適應(yīng)場(chǎng)地色提取算法,結(jié)合黃金分塊法并利用SVM分類器將正常比賽鏡頭進(jìn)一步的劃分。至此,本文方法將整個(gè)視頻流表示為結(jié)構(gòu)化的四類鏡頭類型標(biāo)示序列 (即慢鏡頭、遠(yuǎn)鏡頭、中鏡頭、球員特寫或場(chǎng)外鏡頭),為后續(xù)的語(yǔ)義事件檢測(cè)及摘要生成奠定了很好的結(jié)構(gòu)化基礎(chǔ)。
[1]PENG Limin.Research on semantic events of analyzing soccer video based on hidden Markov model[J].Computer Engineering and Design,2008,29 (19):5002-5005 (in Chinese).[彭利民.基于HMM的足球視頻語(yǔ)義分析研究 [J].計(jì)算機(jī)工程與設(shè)計(jì),2008,29 (19):5002-5005.]
[2]QUAN Guoying,TAO Linmi,XU Guangyou,et al.Cue fusion and event inference based on HHMM [J].Journal of Tsinghua University (Natural Science),2007,47 (1):112-115(in Chinese).[全國(guó)英,陶霖密,徐光祐,等.基于HHMM的多線索融合和事件推理方法 [J].清華大學(xué)學(xué)報(bào) (自然科學(xué)版),2007,47 (1):112-115.]
[3]TONG X F,LIU Q S,LU H Q,et al.Semantic units based event detection in soccer video [J].Acta Automatica Sinica,2005,31 (4):523-529.
[4]Ekin A,Tekalp A,Mehrotra R.Automatic soccer video analysis and summarization [J].IEEE Transactions on Image Processing,2003,12 (7):796-807.
[5]ZHAO Peixi,HU Bin,WANG Xiukun,et al.Analysis and summarization for soccer video [J].Computer Engineering and Applications,2005,41 (30):166-168 (in Chinese). [趙丕錫,胡濱,王秀坤,等.足球視頻的結(jié)構(gòu)分析與摘要 [J].計(jì)算機(jī)工程與應(yīng)用,2005,41 (30):166-168.]
[6]Ouazzani R E,Thami R O H.Highlights’recognition and learning in soccer video by using hidden Markov models and the Bayesian theorem [C].Proc of the IEEE International Conf on Multimedia Computing and Systems,2009:304-308.
[7]Eldib M Y,Zaid B,Zawbaa H M,et al.Soccer video summarization using enhanced logo detection[C].Proceedings of the IEEE International Conference on Image Processing,2009:4345-4348.
[8]ZHANG H J,Kankanhalli A,Smoliar S W.Automatic partitioning of full-motion video [J].Multimedia Systems,1993,1(1):10-28.
[9]XU P,XIE L,CHANG S F,et al.Algorithms and system for segmentation and structure analysis in soccer video[C].Proceedings of the IEEE International Conference on Multimedia and Expo,2001:721-724.
[10]WANG Fei.Research on sports video content analysis technology [D].Beijing:Graduate University of Chinese Academy of Sciences,2005(in Chinese).[王扉.體育視頻的內(nèi)容分析技術(shù)研究 [D].北京:中國(guó)科學(xué)院研究生院,2005.]
[11]ZHANG Yuzhen,WANG Jianyu,DAI Yuewei.Soccer video shot segmentation based on self-adapting dual threshold and dominant color percentage [J].Journal of Nanjing University of Science and Technology(Natural Science),2009,33 (4):432-437(in Chinese).[張玉珍,王建宇,戴躍偉.基于自適應(yīng)雙閾值和主色率的足球視頻鏡頭的分割 [J].南京理工大學(xué)學(xué)報(bào) (自然科學(xué)版),2009,33 (4):432-437.]
[12]ZHANG J.Robust shot boundary detection and video summarization based on motion information[J].Journal of Computer-Aided Design & Computer Graphics,2010,22 (6):1023-1032(in Chinese).[張劍.魯棒的鏡頭邊界檢測(cè)與基于運(yùn)動(dòng)信息的視頻摘要生成 [J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2010,22 (6):1023-1032.]
[13]PAN H,LI B,Sezan M.Automatic detection of replay segments in broadcast sports programs by detection of logos in scene transition [C].Proceedings of the IEEE International Conference on Acoustics Speech and Signal Processing,2002:3385-3388.
[14]HUANG Q,HU J,HU W,et al.A reliable logo and replay detector for sports video [C].Proceedings of the IEEE International Conference on Multimedia and Expo, 2007:1695-1698.
[15]YU Junqing,WANG Ning.Shot classification for soccer video based on sub-window region [J].Journal of Image and Graphics,2008,13 (7):1347-1352 (in Chinese).[于俊清,王寧.基于子窗口區(qū)域的足球視頻鏡頭分類 [J].中國(guó)圖象圖形學(xué)報(bào),2008,13 (7):1347-1352.]