劉怡多(作者單位:國(guó)家廣播電影電視總局成都監(jiān)測(cè)臺(tái))
圖像識(shí)別在視頻監(jiān)管中的應(yīng)用
劉怡多
(作者單位:國(guó)家廣播電影電視總局成都監(jiān)測(cè)臺(tái))
摘 要:隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)已成為人們工作和生活中不可分割的一部分。但既有利,也有弊。本文通過(guò)圖像識(shí)別技術(shù)針對(duì)互聯(lián)網(wǎng)視頻中有害、敏感、色情、暴力等不良信息的監(jiān)管,對(duì)圖像識(shí)別技術(shù)的理念、結(jié)構(gòu)、檢測(cè)方法、步驟及應(yīng)用做簡(jiǎn)要分析,倡導(dǎo)創(chuàng)建健康、安全、清潔的網(wǎng)絡(luò)環(huán)境。
關(guān)鍵詞:圖像識(shí)別;網(wǎng)絡(luò);視頻監(jiān)管
隨著科學(xué)技術(shù)的進(jìn)步,尤其是計(jì)算機(jī)技術(shù)和信息技術(shù)的發(fā)展,互聯(lián)網(wǎng)已經(jīng)深入影響人們生活的方方面面。但也有許多不法之徒利用互聯(lián)網(wǎng)散播有害、敏感、暴力、色情等不良信息,網(wǎng)絡(luò)安全問(wèn)題日益突出。一種行之有效的技術(shù)手段——圖像識(shí)別技術(shù)應(yīng)運(yùn)而生。圖像識(shí)別技術(shù)產(chǎn)生于上世紀(jì)60年代,發(fā)展至今已有50多年歷史。
圖像識(shí)別是一個(gè)過(guò)程,即利用計(jì)算機(jī)網(wǎng)絡(luò)技術(shù),對(duì)某些事物或某些現(xiàn)象的各項(xiàng)特征信息進(jìn)行分析與處理,以達(dá)到對(duì)圖像進(jìn)行辨認(rèn)、分類和解釋的過(guò)程。
圖像識(shí)別是一項(xiàng)非常嚴(yán)謹(jǐn)、復(fù)雜的工程,一般要經(jīng)過(guò)五個(gè)步驟才能完成。第一步是將收集來(lái)的圖像信息統(tǒng)一輸入計(jì)算機(jī)圖像識(shí)別系統(tǒng)。第二步是對(duì)圖像的預(yù)處理,這一步又包括圖像分割、圖像增強(qiáng)、二值化、細(xì)化等四小步,其目的是提取圖片中的有效信息,提高圖像識(shí)別效率。第三步是特征提取,為了更精確地表示圖片的特征,將圖片信息轉(zhuǎn)化為可讀數(shù)字信息的形式表示出來(lái)。第四步是圖像分類,將圖片的數(shù)字信息分配到不同的數(shù)據(jù)庫(kù)中。第五步圖像匹配,將測(cè)試圖像特征與模板圖像特征進(jìn)行對(duì)比,從而達(dá)到辨認(rèn)、分類或解釋的目的。
視頻數(shù)據(jù)是由一連串的圖像序列組成,按其語(yǔ)義順序可劃分為四個(gè)結(jié)構(gòu)層次:幀、鏡頭、場(chǎng)景和視頻。其中幀是圖像序列的最小單元,代表每一個(gè)單一的圖像。鏡頭則是由一連串的連續(xù)幀組成,代表一個(gè)小的視頻數(shù)據(jù)。而場(chǎng)景又是由一連串的鏡頭組成,但不一定是連續(xù)的,中間可能會(huì)有其他鏡頭穿插。視頻則是按照一定方式連接起來(lái)的場(chǎng)景組成一個(gè)獨(dú)立的故事。就像平時(shí)我們看的電影一樣,無(wú)論是正敘、倒敘還是穿插,最后我們所看到的是一個(gè)完整的故事。
視頻檢測(cè)方法有許多種,這里只對(duì)鏡頭邊界檢測(cè)和皮膚檢測(cè)做簡(jiǎn)要分析。
鏡頭邊界檢測(cè)主要是針對(duì)視頻的輪廓、背景顏色及視頻精細(xì)程度展開(kāi)的,其中不包含視頻語(yǔ)義的轉(zhuǎn)化。視頻鏡頭轉(zhuǎn)換主要包含突變轉(zhuǎn)換和漸變轉(zhuǎn)換兩種方式。突變轉(zhuǎn)換指兩個(gè)鏡頭之間無(wú)時(shí)間間隔,視頻底層內(nèi)容直接發(fā)生顯著變化;漸變轉(zhuǎn)化則是在兩個(gè)不同鏡頭之間加入幾十幀,中間有了其他鏡頭的緩沖,使兩個(gè)鏡頭之間連貫起來(lái)。其目的是通過(guò)比較圖像之間幀的變化來(lái)探尋鏡頭邊界變化規(guī)律,是視頻數(shù)據(jù)處理的第一步,也是不良視頻檢測(cè)的基礎(chǔ)。
皮膚檢測(cè)技術(shù)是基于人體膚色區(qū)域?qū)σ曨l內(nèi)容檢測(cè)的一種手段,對(duì)于皮膚的計(jì)算方法主要包括三種模型,即高斯混合模型、顏色統(tǒng)計(jì)模型和色度空間模型。不同的人有不同的皮膚像素,即便是同一個(gè)人在不同外界條件反射下的像素也不相同,這是皮膚檢測(cè)技術(shù)的檢測(cè)基礎(chǔ)。通過(guò)建立不同條件下的膚色像素?cái)?shù)據(jù)庫(kù),將視頻信息與之進(jìn)行對(duì)比,從而找出不良視頻并予以剔除。
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,尤其是近些年來(lái)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)時(shí)代的到來(lái),人們的工作與生活都與網(wǎng)絡(luò)緊緊地相依在一起。但網(wǎng)絡(luò)在給我們帶來(lái)便利的同時(shí),也給我們的生活帶來(lái)困擾,尤其是對(duì)青少年產(chǎn)生較大的影響。
音視頻識(shí)別技術(shù)在視頻監(jiān)管里面具體應(yīng)用的流程為,首先系統(tǒng)通過(guò)搜索引擎自動(dòng)的獲得各種各樣的視頻資源;其次,將獲得視頻與資料庫(kù)里面的敏感有害圖像進(jìn)行對(duì)比,在系統(tǒng)預(yù)選的有害敏感視頻上傳到人工席位;再次,經(jīng)過(guò)人工確認(rèn)那些是否非法的視頻,對(duì)于這些視頻上報(bào)到指定的機(jī)構(gòu)里面,這個(gè)時(shí)候也是可以將這些非法視頻的敏感部分調(diào)到資料庫(kù)里面作為對(duì)比的資料;最后,進(jìn)行再次的視頻收集與下載,進(jìn)行下一次識(shí)別。
圖像識(shí)別技術(shù)是維護(hù)網(wǎng)絡(luò)清潔方式的具體應(yīng)用。通過(guò)圖像識(shí)別技術(shù),對(duì)網(wǎng)絡(luò)圖片、視頻進(jìn)行分析判斷,將載有不良信息的圖片與視頻予以濾除,從而維護(hù)網(wǎng)絡(luò)清潔健康。
在現(xiàn)今技術(shù)手段的應(yīng)用下,圖像識(shí)別技術(shù)還存在一定不足,這也是日后圖像識(shí)別需要發(fā)展與突破的方向。
網(wǎng)絡(luò)中的視頻、圖像等信息繁多冗雜,要保證一個(gè)健康的網(wǎng)絡(luò)環(huán)境不僅需要法律與道德的約束,還必須建立完整、系統(tǒng)的網(wǎng)絡(luò)監(jiān)管技術(shù)手段,在發(fā)現(xiàn)有害、敏感、暴力、色情等不良信息時(shí),能夠迅速、準(zhǔn)確地識(shí)別并剔除。在現(xiàn)今應(yīng)用的技術(shù)手段中,圖像識(shí)別技術(shù)是維護(hù)網(wǎng)絡(luò)安全的有效工具。但在實(shí)際應(yīng)用過(guò)程中還存在一定不足,需要人工及其他技術(shù)手段加以扶持。
參考文獻(xiàn):
[1]張毓晉.圖像處理和分析基礎(chǔ)[M].北京:高等教育出版社,2002.
[2]李建華,馬小妹.基于方向的動(dòng)態(tài)閾值圖像圖像二值化方法[J].大連理工大學(xué)學(xué)報(bào),2002,(5):626-628.
[3]崔屹.圖像處理與分析一數(shù)學(xué)形態(tài)學(xué)方法及應(yīng)用[M].北京:科學(xué)出版社,2000.