国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聚類算法的視頻內(nèi)容識(shí)別研究

2018-01-22 01:48:35陳雙全
電腦與電信 2017年11期
關(guān)鍵詞:關(guān)鍵幀均值聚類

陳雙全

(武漢船舶職業(yè)技術(shù)學(xué)院電氣學(xué)院,湖北 武漢 430050)

1 引言

面對(duì)海量視頻上傳請(qǐng)求,有限的審核員配備條件,不可能讓審核員將視頻認(rèn)真從頭看到尾,這就為不良人員提供了在正規(guī)視頻中插播非正規(guī)內(nèi)容的機(jī)會(huì)。而機(jī)械識(shí)別效率和準(zhǔn)確率仍然不能滿足工程應(yīng)用的要求。因此本系統(tǒng)提出了針對(duì)視頻興趣度排列組合的K-MEANS改進(jìn)聚類算法識(shí)別違規(guī)視頻,保證互聯(lián)網(wǎng)視頻內(nèi)容的健康性。

2 視頻結(jié)構(gòu)分析

從視頻數(shù)據(jù)形成的角度來看,按照形成過程首先視頻內(nèi)容包含了多個(gè)視頻的圖像幀,由一連串圖像幀構(gòu)成了一個(gè)鏡頭,再由多組鏡頭構(gòu)成了一個(gè)場(chǎng)景,最后由多個(gè)場(chǎng)景片段組成視頻。在進(jìn)行視頻結(jié)構(gòu)化處理時(shí),視頻流、場(chǎng)景分割、關(guān)鍵幀提取等都可以作為視頻內(nèi)容數(shù)據(jù)分析的組成部分。由此可見,視頻內(nèi)容識(shí)別有別于一般數(shù)據(jù)結(jié)構(gòu)性的關(guān)聯(lián)關(guān)系,視頻內(nèi)容非結(jié)構(gòu)化特征更為明顯。

3 視頻內(nèi)容檢索技術(shù)

3.1 鏡頭分割

對(duì)于一段視頻的內(nèi)容識(shí)別要首先對(duì)其按照視頻拍攝時(shí)的鏡頭進(jìn)行分割,無論是影片還是短視頻,都是由多個(gè)鏡頭組合而成,即使采用長(zhǎng)鏡頭進(jìn)行拍攝通常也不會(huì)大于10分鐘。所以,在對(duì)鏡頭進(jìn)行分割時(shí)要從鏡頭切換點(diǎn)進(jìn)行分割,將視頻劃分出若干個(gè)鏡頭的組成。鏡頭與鏡頭之間存在濾鏡的過渡,在分割時(shí)要準(zhǔn)確把握濾鏡的切入點(diǎn)與切出點(diǎn),由此進(jìn)行平均分割以達(dá)到鏡頭分割的準(zhǔn)確性。

3.2 關(guān)鍵幀提取

鏡頭分割完成后,每一個(gè)鏡頭都包含一連串的圖像幀,圖像幀以圖像片段的形式存在,通過幀的滾動(dòng)實(shí)現(xiàn)圖像的連貫性播放。圖像幀作為視頻內(nèi)容的基本組成單元,進(jìn)行鏡頭圖像內(nèi)容的聚類可采用有幀平均法和直方圖平均法進(jìn)行關(guān)鍵幀的提取。有幀平均法是對(duì)一組連貫的圖像幀以圖像內(nèi)容相似度聚類的平均值所屬關(guān)鍵幀圖像作為圖像內(nèi)容進(jìn)行識(shí)別,直方圖平均法是對(duì)鏡頭中圖像坐標(biāo)像素?cái)?shù)的平均值作為圖像內(nèi)容進(jìn)行識(shí)別進(jìn)而得到關(guān)鍵幀的圖像。

3.3 視頻內(nèi)容聚類

對(duì)提取出來的關(guān)鍵幀圖像按照?qǐng)D像特征數(shù)據(jù)庫(kù)進(jìn)行比對(duì)分析和聚類計(jì)算,圖像特征數(shù)據(jù)庫(kù)作為圖像內(nèi)容識(shí)別的基礎(chǔ),其包含了大量的非結(jié)構(gòu)化圖像特征,可通過對(duì)圖像特征的累計(jì)不斷豐富圖像特征數(shù)據(jù)庫(kù)的內(nèi)容,由此提高視頻內(nèi)容識(shí)別的準(zhǔn)確度。

4K-MEANS聚類改進(jìn)算法

4.1 視頻內(nèi)容識(shí)別算法

現(xiàn)有視頻內(nèi)容識(shí)別算法主要包括:K均值模糊聚類算法和C均值模糊聚類算法?;贙均值聚類的視頻內(nèi)容識(shí)別均值算法模型如下:(1)選取K個(gè)聚類中心作為視頻內(nèi)容樣本的K均值聚類

(3)計(jì)算視頻內(nèi)容樣本各聚類中心的新向量值:

式中nj為Sj所包含的樣本數(shù)。

K均值偽代碼如下:

設(shè)定聚類數(shù)目K,最大執(zhí)行步驟tmax,一個(gè)很小的容忍誤差ε>0決定聚類中心起始位置Cj(0),00,起始位置Cj(0),0

實(shí)現(xiàn)原理是:設(shè)有視頻內(nèi)容像素點(diǎn)X={x1,x2,…,xn} ,將它分為c類,uik為xk對(duì)第i類的隸屬度,用一個(gè)模糊隸屬度矩陣U={uik}∈Rcn表示分類結(jié)果,必須滿足:

通過最小化關(guān)于隸屬度矩陣U和聚類中心V的目函數(shù)Jm(U,V)來實(shí)現(xiàn):

其中,U={uik}為滿足條件(1)的隸屬度矩陣,為c個(gè)聚類中心點(diǎn)集,m∈(1,+∞)為加權(quán)指數(shù),當(dāng)m=1時(shí),模糊聚類就退化為硬C均值聚類。

第k個(gè)樣本到第i類中心的距離定義為:

(1)初始化視頻內(nèi)容樣本的聚類中心V={v1,v2,…,vc} ;

(2)用隨機(jī)數(shù)的方式初始化視頻內(nèi)容樣本的屬性度量矩陣;

(3)計(jì)算C均值聚類算法的視頻內(nèi)容樣本的隸屬度矩陣:

其中,A為p×p的正定矩陣,當(dāng)A=I時(shí),即為歐氏距離。

C均值聚類算法的聚類模型描述如下:

(5)重復(fù)步驟三和四直至公式6的結(jié)果處于收斂狀態(tài)。

C均值聚類偽代碼如下:

輸入:總數(shù)K,尺度tmax,誤差ε>0,起始位置Cj(0),0

4.2 K-MEANS聚類改進(jìn)算法設(shè)計(jì)

針對(duì)現(xiàn)有的K-MEANS算法在流媒體視頻中的聚類結(jié)果往往趨于孤立點(diǎn)的問題以及時(shí)間復(fù)雜度為O(n2)不利于對(duì)流媒體系統(tǒng)中大數(shù)據(jù)量的挖掘的問題,本文采用的是基于排列組合思想的K-MEANS聚類改進(jìn)算法。

K-MEANS聚類改進(jìn)算法的設(shè)計(jì)流程:For i=0;i

if(e∈E){//如果待測(cè)元素e屬于極大聚類集合

5 結(jié)語(yǔ)

本文對(duì)現(xiàn)有視頻內(nèi)容識(shí)別算法進(jìn)行分析,包括:K均值模糊聚類算法和C均值模糊聚類算法,提出了基于改進(jìn)的K-均值聚類算法的視頻內(nèi)容識(shí)別設(shè)計(jì)思想,并通過算法的設(shè)計(jì)流程完成對(duì)K-MEANS聚類改進(jìn)解決流媒體視頻中的聚類結(jié)果趨于孤立點(diǎn)的問題以及時(shí)間復(fù)雜度為O(n2)不利于對(duì)流媒體系統(tǒng)中大數(shù)據(jù)量的挖掘的問題,該方法基于排列組合的K-MEANS聚類算法深層次挖掘策略的內(nèi)在規(guī)則,對(duì)于更好地識(shí)別視頻內(nèi)容有著較好的實(shí)現(xiàn)效果。

[1]徐勇.基于聚類算法的內(nèi)容識(shí)別研究[J].電腦與電信,2016(11):39-41.

[2]孟彩霞.大數(shù)據(jù)環(huán)境下不良網(wǎng)絡(luò)內(nèi)容識(shí)別技術(shù)研究[J].軟件導(dǎo)刊,2015,14(11):19-21.

[3]岳曉峰,龔青池.視頻流圖像字符識(shí)別算法的研究和實(shí)現(xiàn)[J].機(jī)械工程與自動(dòng)化,2015(4):73-75.

猜你喜歡
關(guān)鍵幀均值聚類
基于DBSACN聚類算法的XML文檔聚類
基于改進(jìn)關(guān)鍵幀選擇的RGB-D SLAM算法
均值不等式失效時(shí)的解決方法
基于相關(guān)系數(shù)的道路監(jiān)控視頻關(guān)鍵幀提取算法
均值與方差在生活中的應(yīng)用
基于改進(jìn)的遺傳算法的模糊聚類算法
基于聚散熵及運(yùn)動(dòng)目標(biāo)檢測(cè)的監(jiān)控視頻關(guān)鍵幀提取
關(guān)于均值有界變差函數(shù)的重要不等式
一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
論“關(guān)鍵幀”在動(dòng)畫制作中的作用
灵宝市| 合作市| 林西县| 宣城市| 高邮市| 岫岩| 双流县| 邢台县| 武陟县| 汾阳市| 洪泽县| 永丰县| 宣汉县| 普宁市| 措美县| 文化| 清徐县| 崇明县| 抚松县| 平邑县| 遂昌县| 唐山市| 隆子县| 婺源县| 新沂市| 平泉县| 康平县| 怀集县| 濉溪县| 涟水县| 屯门区| 肇东市| 宁乡县| 吴旗县| 濉溪县| 鄄城县| 县级市| 花莲县| 台湾省| 托克托县| 金坛市|