基于聚類算法的視頻內(nèi)容識(shí)別研究

2018-01-22 01:48:35陳雙全

電腦與電信 2017年11期

陳雙全

(武漢船舶職業(yè)技術(shù)學(xué)院電氣學(xué)院，湖北武漢 430050)

1 引言

面對(duì)海量視頻上傳請(qǐng)求，有限的審核員配備條件，不可能讓審核員將視頻認(rèn)真從頭看到尾，這就為不良人員提供了在正規(guī)視頻中插播非正規(guī)內(nèi)容的機(jī)會(huì)。而機(jī)械識(shí)別效率和準(zhǔn)確率仍然不能滿足工程應(yīng)用的要求。因此本系統(tǒng)提出了針對(duì)視頻興趣度排列組合的K-MEANS改進(jìn)聚類算法識(shí)別違規(guī)視頻，保證互聯(lián)網(wǎng)視頻內(nèi)容的健康性。

2 視頻結(jié)構(gòu)分析

從視頻數(shù)據(jù)形成的角度來看，按照形成過程首先視頻內(nèi)容包含了多個(gè)視頻的圖像幀，由一連串圖像幀構(gòu)成了一個(gè)鏡頭，再由多組鏡頭構(gòu)成了一個(gè)場(chǎng)景，最后由多個(gè)場(chǎng)景片段組成視頻。在進(jìn)行視頻結(jié)構(gòu)化處理時(shí)，視頻流、場(chǎng)景分割、關(guān)鍵幀提取等都可以作為視頻內(nèi)容數(shù)據(jù)分析的組成部分。由此可見，視頻內(nèi)容識(shí)別有別于一般數(shù)據(jù)結(jié)構(gòu)性的關(guān)聯(lián)關(guān)系，視頻內(nèi)容非結(jié)構(gòu)化特征更為明顯。

3 視頻內(nèi)容檢索技術(shù)

3.1 鏡頭分割

對(duì)于一段視頻的內(nèi)容識(shí)別要首先對(duì)其按照視頻拍攝時(shí)的鏡頭進(jìn)行分割，無論是影片還是短視頻，都是由多個(gè)鏡頭組合而成，即使采用長(zhǎng)鏡頭進(jìn)行拍攝通常也不會(huì)大于10分鐘。所以，在對(duì)鏡頭進(jìn)行分割時(shí)要從鏡頭切換點(diǎn)進(jìn)行分割，將視頻劃分出若干個(gè)鏡頭的組成。鏡頭與鏡頭之間存在濾鏡的過渡，在分割時(shí)要準(zhǔn)確把握濾鏡的切入點(diǎn)與切出點(diǎn)，由此進(jìn)行平均分割以達(dá)到鏡頭分割的準(zhǔn)確性。

3.2 關(guān)鍵幀提取

鏡頭分割完成后，每一個(gè)鏡頭都包含一連串的圖像幀，圖像幀以圖像片段的形式存在，通過幀的滾動(dòng)實(shí)現(xiàn)圖像的連貫性播放。圖像幀作為視頻內(nèi)容的基本組成單元，進(jìn)行鏡頭圖像內(nèi)容的聚類可采用有幀平均法和直方圖平均法進(jìn)行關(guān)鍵幀的提取。有幀平均法是對(duì)一組連貫的圖像幀以圖像內(nèi)容相似度聚類的平均值所屬關(guān)鍵幀圖像作為圖像內(nèi)容進(jìn)行識(shí)別，直方圖平均法是對(duì)鏡頭中圖像坐標(biāo)像素?cái)?shù)的平均值作為圖像內(nèi)容進(jìn)行識(shí)別進(jìn)而得到關(guān)鍵幀的圖像。

3.3 視頻內(nèi)容聚類

對(duì)提取出來的關(guān)鍵幀圖像按照?qǐng)D像特征數(shù)據(jù)庫(kù)進(jìn)行比對(duì)分析和聚類計(jì)算，圖像特征數(shù)據(jù)庫(kù)作為圖像內(nèi)容識(shí)別的基礎(chǔ)，其包含了大量的非結(jié)構(gòu)化圖像特征，可通過對(duì)圖像特征的累計(jì)不斷豐富圖像特征數(shù)據(jù)庫(kù)的內(nèi)容，由此提高視頻內(nèi)容識(shí)別的準(zhǔn)確度。

4K-MEANS聚類改進(jìn)算法

4.1 視頻內(nèi)容識(shí)別算法

現(xiàn)有視頻內(nèi)容識(shí)別算法主要包括：K均值模糊聚類算法和C均值模糊聚類算法?；贙均值聚類的視頻內(nèi)容識(shí)別均值算法模型如下：（1）選取K個(gè)聚類中心作為視頻內(nèi)容樣本的K均值聚類

（3）計(jì)算視頻內(nèi)容樣本各聚類中心的新向量值:

式中nj為Sj所包含的樣本數(shù)。

K均值偽代碼如下：

設(shè)定聚類數(shù)目K，最大執(zhí)行步驟tmax，一個(gè)很小的容忍誤差ε>0決定聚類中心起始位置Cj（0），00，起始位置Cj（0），0

實(shí)現(xiàn)原理是：設(shè)有視頻內(nèi)容像素點(diǎn)X={x1,x2,…,xn} ，將它分為c類，uik為xk對(duì)第i類的隸屬度，用一個(gè)模糊隸屬度矩陣U={uik}∈Rcn表示分類結(jié)果，必須滿足：

通過最小化關(guān)于隸屬度矩陣U和聚類中心V的目函數(shù)Jm(U，V)來實(shí)現(xiàn)：

其中，U={uik}為滿足條件（1）的隸屬度矩陣，為c個(gè)聚類中心點(diǎn)集，m∈(1,+∞)為加權(quán)指數(shù)，當(dāng)m=1時(shí)，模糊聚類就退化為硬C均值聚類。

第k個(gè)樣本到第i類中心的距離定義為：

（1）初始化視頻內(nèi)容樣本的聚類中心V={v1,v2,…,vc} ；

（2）用隨機(jī)數(shù)的方式初始化視頻內(nèi)容樣本的屬性度量矩陣；

（3）計(jì)算C均值聚類算法的視頻內(nèi)容樣本的隸屬度矩陣：

其中，A為p×p的正定矩陣，當(dāng)A=I時(shí)，即為歐氏距離。

C均值聚類算法的聚類模型描述如下：

（5）重復(fù)步驟三和四直至公式6的結(jié)果處于收斂狀態(tài)。

C均值聚類偽代碼如下：

輸入：總數(shù)K，尺度tmax，誤差ε>0，起始位置Cj（0），0

4.2 K-MEANS聚類改進(jìn)算法設(shè)計(jì)

針對(duì)現(xiàn)有的K-MEANS算法在流媒體視頻中的聚類結(jié)果往往趨于孤立點(diǎn)的問題以及時(shí)間復(fù)雜度為O(n2)不利于對(duì)流媒體系統(tǒng)中大數(shù)據(jù)量的挖掘的問題，本文采用的是基于排列組合思想的K-MEANS聚類改進(jìn)算法。

K-MEANS聚類改進(jìn)算法的設(shè)計(jì)流程：For i=0；i

if（e∈E）{//如果待測(cè)元素e屬于極大聚類集合

5 結(jié)語(yǔ)

本文對(duì)現(xiàn)有視頻內(nèi)容識(shí)別算法進(jìn)行分析，包括：K均值模糊聚類算法和C均值模糊聚類算法，提出了基于改進(jìn)的K-均值聚類算法的視頻內(nèi)容識(shí)別設(shè)計(jì)思想，并通過算法的設(shè)計(jì)流程完成對(duì)K-MEANS聚類改進(jìn)解決流媒體視頻中的聚類結(jié)果趨于孤立點(diǎn)的問題以及時(shí)間復(fù)雜度為O(n2)不利于對(duì)流媒體系統(tǒng)中大數(shù)據(jù)量的挖掘的問題，該方法基于排列組合的K-MEANS聚類算法深層次挖掘策略的內(nèi)在規(guī)則，對(duì)于更好地識(shí)別視頻內(nèi)容有著較好的實(shí)現(xiàn)效果。

[1]徐勇．基于聚類算法的內(nèi)容識(shí)別研究[J]．電腦與電信，2016(11)：39-41．

[2]孟彩霞．大數(shù)據(jù)環(huán)境下不良網(wǎng)絡(luò)內(nèi)容識(shí)別技術(shù)研究[J]．軟件導(dǎo)刊，2015，14(11)：19-21．

[3]岳曉峰，龔青池．視頻流圖像字符識(shí)別算法的研究和實(shí)現(xiàn)[J]．機(jī)械工程與自動(dòng)化，2015(4)：73-75．

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡