陳超
摘 要:在媒體行業(yè)不斷發(fā)展的今天,視頻作為重要的媒體表現(xiàn)形式發(fā)展迅猛。面對網(wǎng)絡上大量的視頻,如何能夠篩選有效的視頻已經(jīng)成為一大難題。視頻結(jié)構(gòu)化就是解決這個難題的重要途徑。本文闡述了視頻結(jié)構(gòu)化的定義,分析了視頻結(jié)構(gòu)化提出的原因,對于結(jié)構(gòu)化技術(shù)進行介紹,分析了視頻結(jié)構(gòu)化的難點。
關(guān)鍵詞:視頻結(jié)構(gòu)化內(nèi)容分析;鏡頭邊界檢測;場景檢測
1.視頻結(jié)構(gòu)化
很多人對于視頻結(jié)構(gòu)化是不甚了解的,視頻結(jié)構(gòu)化通俗講,就是對于視頻數(shù)據(jù)的結(jié)構(gòu)化處理,并且能夠?qū)τ谝曨l進行智能化處理,能夠在視頻中提取出關(guān)鍵的信息,并且能夠?qū)ζ溥M行語言文字敘述。在視頻中提取的關(guān)鍵信息主要有三大類:第一類,是對運動目標的識別,就是對視頻畫面中的運動對象進行識別,包括車輛和人;第二類,就是對于所提取目標對象進行特征提取,也就是對與視頻畫面中的車輛的外形、顏色、車牌號以及車型進行提取,還有就是對于人的身高、體型、衣服、性別等基本特征進行提?。坏谌?,便是對于目標對象運動軌跡進行分析,具體包括在哪里有所徘徊,在哪里拐彎,并且能夠?qū)τ谀繕藢ο笮雄欉M行大概判斷等等。
視頻結(jié)構(gòu)化主要包括以下4個步驟:(1)對背景建立模型,并且能夠?qū)⒛繕吮尘斑M行分離;(2)對于目標對象進行跟蹤,和對目標對象進行分類;(3)提取視頻畫面中目標對象的基本特征,包括人、車輛或者是物品的特征;(4)對于事件進行檢測,并且能夠進行大致的描述,這里描述的如果是人物,應當包括人臉、著裝、細節(jié)、身高、年齡范圍、性別等;如果是對于車輛的描述,應當包括車牌,車身顏色,車類型,品牌、子品牌,車貼,車飾物品等;視頻結(jié)構(gòu)化模型主要就包括以上幾個內(nèi)容,通過視頻結(jié)構(gòu)化,能夠快速的提取出有效信息。
2.視頻結(jié)構(gòu)化的必要性
視頻記錄的信息在內(nèi)容和形式上具有直觀、真實等自身特點,已經(jīng)成為了十分受關(guān)注的媒體。視頻主要包括圖像和音頻信號,圖像主要記錄的是視頻對象的形狀、顏色以及狀態(tài),還可以后期添加文字、圖片、字幕等等;音頻信號主要記錄了視頻對象所發(fā)出的聲音的音色、響度、語言以及背景,后期同樣也可添加音樂或是音效。這些都使視頻在數(shù)字化平臺上無結(jié)構(gòu)泛濫,無結(jié)構(gòu)就是指用戶難以查找到自己想要的視頻,人們最初的檢索方式就是,先找到文件源,然后逐條檢索,最后找到自己想要的文件;隨著時代的進步,人們用文字對視頻進行描述,然后檢索文字便可以檢索到視頻,然而這種方法耗費大量的人力去標記視頻,不再適用于現(xiàn)如今的大量視頻,因此視頻結(jié)構(gòu)化是十分必要的。
3.視頻結(jié)構(gòu)化研究現(xiàn)狀
1993年張宏江在ACM《多媒體系統(tǒng)雜志》期刊上發(fā)表關(guān)于視頻結(jié)構(gòu)化的第一篇文章,這篇文章為現(xiàn)代視頻檢索和內(nèi)容查詢建立了一個基本框架。下面簡述了相關(guān)技術(shù)的研究現(xiàn)狀。
3.1視頻鏡頭探測
我們把視頻按照時間的順序劃分成一個個結(jié)構(gòu)單元,這個結(jié)構(gòu)單元就是幀。鏡頭探測最初就是分析相連結(jié)構(gòu)單元的顏色變化來探測鏡頭。人們把視頻幀分成一個一個小塊,計算各個分塊之間的距離來探測鏡頭,這樣能夠提高對噪聲和對象運動的魯棒性。目前,視頻鏡頭探測已經(jīng)有很大進步,尤其是在對于突變鏡頭已經(jīng)有很高的準確性。但是在漸變等方面的探測準確性有待提高。
3.2語義標注
在之前的視頻檢索,傳統(tǒng)的檢索方法就是對圖像顏色、形狀、等特征進行檢索,但是這種方法已經(jīng)不能夠滿足現(xiàn)代人對于視頻搜索的需求。因此,出現(xiàn)了將視頻和音頻中的方法引入到視頻結(jié)構(gòu)化中,這樣便能在更高的水平實現(xiàn)視頻搜索。還有,隨著科學技術(shù)的進步,由于在視頻中穿插了大量字幕,因此,也隨之出現(xiàn)了字幕探測等方法。
3.3視頻音軌分析
音軌是視頻重要的組成之一,有了音頻,對于是視頻的理解更容易。在不同的情境下,會有不同的音軌,根據(jù)這些音頻的停頓、音樂、音響可以判斷視頻情境。因而,人們可以將視頻的音頻進行分段和標注,以此完成視頻結(jié)構(gòu)化。
4.視頻結(jié)構(gòu)化技術(shù)應用范圍
4.1視頻結(jié)構(gòu)化應用于公安行業(yè),能夠在眾多海量視頻信息中為公安部門提供有效的信息。在視頻內(nèi)容信息處理上,公安機關(guān)能夠用視頻結(jié)構(gòu)化,全方面實現(xiàn)實時視頻監(jiān)控,并且與互聯(lián)網(wǎng)相互作用,能夠?qū)⒖梢孕畔⑦M行探測,并且做到及時反饋和儲存,將這些獲取的信息轉(zhuǎn)化為公安工作中的有用情報。通過結(jié)構(gòu)化視頻能夠?qū)崿F(xiàn)自動監(jiān)控、自動聯(lián)網(wǎng)、自動報警等網(wǎng)絡功能,能夠?qū)崿F(xiàn)民警隨時隨地靈活、簡單、多樣進行治安管理,隨時探測到違法亂紀行為。
4.2視頻結(jié)構(gòu)化技術(shù)的應用于交通行業(yè)。在各個電警卡口圖偵上的應用需求和頻率早就超越了交警的工作范圍,因為大多數(shù)的案件都與交通有著必不可少的聯(lián)系,車輛是主要的交通作案工具。因此,對于各個路口對于特別車輛進行辨別顯得尤為重要,而此時,最好的獲取信息途徑便是對于監(jiān)控視頻的探測。這種卡口電警對于道路的安全有著重要作用。目前,在我國一些廠家加大對于這方面的投入,能夠精準抓拍特征車輛或者人的特征信息,能夠更好的保障人民生活。
5.對視頻結(jié)構(gòu)化提出幾點建議
5.1研究關(guān)鍵技術(shù),突破應用難題。
對于一項技術(shù)的考驗,便是將其應用于實際。因此,研究該領(lǐng)域的業(yè)務部門,要加強對于核心技術(shù)的研究,建立監(jiān)控視頻結(jié)構(gòu)化模型,對于在視頻分割、內(nèi)容提取、內(nèi)容描述等方面的關(guān)鍵技術(shù)要迎難而上,爭取能夠?qū)⑵涑晒糜谑袌觥?/p>
5.2加強頂層設計,同步構(gòu)建標準體系。
成熟的技術(shù)首要實現(xiàn)的便是標準化。通過對于視頻結(jié)構(gòu)化技術(shù)的研究,能夠建立視頻結(jié)構(gòu)化應用模型,并且能夠制定規(guī)范的技術(shù)研究和設備開發(fā),能夠制定視頻結(jié)構(gòu)化應用標準,在技術(shù)的源頭上做到視頻結(jié)構(gòu)化應用的標準化。
5.3有序開展視頻信息系統(tǒng)平臺,推進信息資源的整合應用。
開展關(guān)于視頻結(jié)構(gòu)化應用模式的研究,能夠制定出應用系統(tǒng)以及解決方案,針對典型應用環(huán)境,建設應用示范系統(tǒng)。如通過視頻結(jié)構(gòu)化技術(shù)提取出的信息,可與網(wǎng)絡之間進行信息整合,能夠更好的應用到公安和交警部門。
總結(jié)語
在科學技術(shù)不斷發(fā)展的今天,視頻結(jié)構(gòu)化應用有助于公安部門對于社會治安監(jiān)控的風險進行評估,同時也能夠在提取出的信息進行分析判斷,能夠找到快速地找出有用的證據(jù)和線索,能夠解決在公共安全中的重要問題。
參考文獻
[1]明巍;基于內(nèi)容的視頻檢索中關(guān)鍵幀提取算法研究[D];武漢工業(yè)學院;2010年
[2]段豪;視頻檢索技術(shù)中關(guān)鍵幀提取算法的研究[D];太原理工大學;2012年
[3]韓冠;基于多媒體的在線協(xié)作學習系統(tǒng)[D];西安電子科技大學;2012年
(作者單位:新疆維吾爾自治區(qū)產(chǎn)品質(zhì)量監(jiān)督檢驗研究院)