陳雙全
(武漢船舶職業(yè)技術(shù)學(xué)院電氣學(xué)院,湖北 武漢 430050)
面對(duì)海量視頻上傳請(qǐng)求,有限的審核員配備條件,不可能讓審核員將視頻認(rèn)真從頭看到尾,這就為不良人員提供了在正規(guī)視頻中插播非正規(guī)內(nèi)容的機(jī)會(huì)。而機(jī)械識(shí)別效率和準(zhǔn)確率仍然不能滿足工程應(yīng)用的要求。因此本系統(tǒng)提出了針對(duì)視頻興趣度排列組合的K-MEANS改進(jìn)聚類算法識(shí)別違規(guī)視頻,保證互聯(lián)網(wǎng)視頻內(nèi)容的健康性。
從視頻數(shù)據(jù)形成的角度來看,按照形成過程首先視頻內(nèi)容包含了多個(gè)視頻的圖像幀,由一連串圖像幀構(gòu)成了一個(gè)鏡頭,再由多組鏡頭構(gòu)成了一個(gè)場(chǎng)景,最后由多個(gè)場(chǎng)景片段組成視頻。在進(jìn)行視頻結(jié)構(gòu)化處理時(shí),視頻流、場(chǎng)景分割、關(guān)鍵幀提取等都可以作為視頻內(nèi)容數(shù)據(jù)分析的組成部分。由此可見,視頻內(nèi)容識(shí)別有別于一般數(shù)據(jù)結(jié)構(gòu)性的關(guān)聯(lián)關(guān)系,視頻內(nèi)容非結(jié)構(gòu)化特征更為明顯。
對(duì)于一段視頻的內(nèi)容識(shí)別要首先對(duì)其按照視頻拍攝時(shí)的鏡頭進(jìn)行分割,無論是影片還是短視頻,都是由多個(gè)鏡頭組合而成,即使采用長(zhǎng)鏡頭進(jìn)行拍攝通常也不會(huì)大于10分鐘。所以,在對(duì)鏡頭進(jìn)行分割時(shí)要從鏡頭切換點(diǎn)進(jìn)行分割,將視頻劃分出若干個(gè)鏡頭的組成。鏡頭與鏡頭之間存在濾鏡的過渡,在分割時(shí)要準(zhǔn)確把握濾鏡的切入點(diǎn)與切出點(diǎn),由此進(jìn)行平均分割以達(dá)到鏡頭分割的準(zhǔn)確性。
鏡頭分割完成后,每一個(gè)鏡頭都包含一連串的圖像幀,圖像幀以圖像片段的形式存在,通過幀的滾動(dòng)實(shí)現(xiàn)圖像的連貫性播放。圖像幀作為視頻內(nèi)容的基本組成單元,進(jìn)行鏡頭圖像內(nèi)容的聚類可采用有幀平均法和直方圖平均法進(jìn)行關(guān)鍵幀的提取。有幀平均法是對(duì)一組連貫的圖像幀以圖像內(nèi)容相似度聚類的平均值所屬關(guān)鍵幀圖像作為圖像內(nèi)容進(jìn)行識(shí)別,直方圖平均法是對(duì)鏡頭中圖像坐標(biāo)像素?cái)?shù)的平均值作為圖像內(nèi)容進(jìn)行識(shí)別進(jìn)而得到關(guān)鍵幀的圖像。
對(duì)提取出來的關(guān)鍵幀圖像按照?qǐng)D像特征數(shù)據(jù)庫(kù)進(jìn)行比對(duì)分析和聚類計(jì)算,圖像特征數(shù)據(jù)庫(kù)作為圖像內(nèi)容識(shí)別的基礎(chǔ),其包含了大量的非結(jié)構(gòu)化圖像特征,可通過對(duì)圖像特征的累計(jì)不斷豐富圖像特征數(shù)據(jù)庫(kù)的內(nèi)容,由此提高視頻內(nèi)容識(shí)別的準(zhǔn)確度。
現(xiàn)有視頻內(nèi)容識(shí)別算法主要包括:K均值模糊聚類算法和C均值模糊聚類算法?;贙均值聚類的視頻內(nèi)容識(shí)別均值算法模型如下:(1)選取K個(gè)聚類中心作為視頻內(nèi)容樣本的K均值聚類
(3)計(jì)算視頻內(nèi)容樣本各聚類中心的新向量值:
式中nj為Sj所包含的樣本數(shù)。
K均值偽代碼如下:
設(shè)定聚類數(shù)目K,最大執(zhí)行步驟tmax,一個(gè)很小的容忍誤差ε>0決定聚類中心起始位置Cj(0),0 實(shí)現(xiàn)原理是:設(shè)有視頻內(nèi)容像素點(diǎn)X={x1,x2,…,xn} ,將它分為c類,uik為xk對(duì)第i類的隸屬度,用一個(gè)模糊隸屬度矩陣U={uik}∈Rcn表示分類結(jié)果,必須滿足: 通過最小化關(guān)于隸屬度矩陣U和聚類中心V的目函數(shù)Jm(U,V)來實(shí)現(xiàn): 其中,U={uik}為滿足條件(1)的隸屬度矩陣,為c個(gè)聚類中心點(diǎn)集,m∈(1,+∞)為加權(quán)指數(shù),當(dāng)m=1時(shí),模糊聚類就退化為硬C均值聚類。 第k個(gè)樣本到第i類中心的距離定義為: (1)初始化視頻內(nèi)容樣本的聚類中心V={v1,v2,…,vc} ; (2)用隨機(jī)數(shù)的方式初始化視頻內(nèi)容樣本的屬性度量矩陣; (3)計(jì)算C均值聚類算法的視頻內(nèi)容樣本的隸屬度矩陣: 其中,A為p×p的正定矩陣,當(dāng)A=I時(shí),即為歐氏距離。 C均值聚類算法的聚類模型描述如下: (5)重復(fù)步驟三和四直至公式6的結(jié)果處于收斂狀態(tài)。 C均值聚類偽代碼如下: 輸入:總數(shù)K,尺度tmax,誤差ε>0,起始位置Cj(0),0 針對(duì)現(xiàn)有的K-MEANS算法在流媒體視頻中的聚類結(jié)果往往趨于孤立點(diǎn)的問題以及時(shí)間復(fù)雜度為O(n2)不利于對(duì)流媒體系統(tǒng)中大數(shù)據(jù)量的挖掘的問題,本文采用的是基于排列組合思想的K-MEANS聚類改進(jìn)算法。 K-MEANS聚類改進(jìn)算法的設(shè)計(jì)流程:For i=0;i if(e∈E){//如果待測(cè)元素e屬于極大聚類集合 本文對(duì)現(xiàn)有視頻內(nèi)容識(shí)別算法進(jìn)行分析,包括:K均值模糊聚類算法和C均值模糊聚類算法,提出了基于改進(jìn)的K-均值聚類算法的視頻內(nèi)容識(shí)別設(shè)計(jì)思想,并通過算法的設(shè)計(jì)流程完成對(duì)K-MEANS聚類改進(jìn)解決流媒體視頻中的聚類結(jié)果趨于孤立點(diǎn)的問題以及時(shí)間復(fù)雜度為O(n2)不利于對(duì)流媒體系統(tǒng)中大數(shù)據(jù)量的挖掘的問題,該方法基于排列組合的K-MEANS聚類算法深層次挖掘策略的內(nèi)在規(guī)則,對(duì)于更好地識(shí)別視頻內(nèi)容有著較好的實(shí)現(xiàn)效果。 [1]徐勇.基于聚類算法的內(nèi)容識(shí)別研究[J].電腦與電信,2016(11):39-41. [2]孟彩霞.大數(shù)據(jù)環(huán)境下不良網(wǎng)絡(luò)內(nèi)容識(shí)別技術(shù)研究[J].軟件導(dǎo)刊,2015,14(11):19-21. [3]岳曉峰,龔青池.視頻流圖像字符識(shí)別算法的研究和實(shí)現(xiàn)[J].機(jī)械工程與自動(dòng)化,2015(4):73-75.4.2 K-MEANS聚類改進(jìn)算法設(shè)計(jì)
5 結(jié)語(yǔ)