陳浩
摘要:視頻廣告就是要傳播商業(yè)信息,在時(shí)間方面是存在限制的,所以,這就需要控制時(shí)間,在有限的時(shí)間內(nèi)將商品的各種信息集中呈現(xiàn)出來(lái)。觀眾是觀看廣告的人,是非常重要的衡量標(biāo)準(zhǔn)。視頻廣告中的鏡頭持續(xù)時(shí)間比較短,本文基于視頻的特征,分析了電視廣告單元的分割技術(shù)運(yùn)用。
關(guān)鍵詞:視頻特征下;電視廣告;單元分割技術(shù);運(yùn)用
視頻廣告就是要將商業(yè)信息傳播給受眾,和一般節(jié)目?jī)?nèi)鏡頭對(duì)比,視頻廣告的鏡頭持續(xù)時(shí)間要更短,一般視頻中廣告段落有一些特征,如,圖像顏色鮮艷、對(duì)象頻繁、鏡頭切換快、內(nèi)部鏡頭切換率高、圖像噪聲大、關(guān)鍵幀極難抽取。廣告的類型很豐富,所以,能夠在規(guī)定中檢測(cè)視頻數(shù)據(jù),在時(shí)間軸的基礎(chǔ)上對(duì)分析針鏡頭頻率的使用情況進(jìn)行統(tǒng)計(jì),從視頻數(shù)據(jù)中定位視頻廣告。
一、算法原理
結(jié)合廣告段落的音頻特征,選擇了圖1的方法來(lái)自動(dòng)分割廣告單元。第一,先把電視廣告進(jìn)行劃分,一部分是音頻流,另一部分是視頻流,視頻分析就是對(duì)切變鏡頭進(jìn)行檢查,而音頻分析中能夠檢測(cè)靜音位置。視頻的基礎(chǔ)是鏡頭,廣告單元切割也是基于檢測(cè)鏡頭基礎(chǔ)上的。廣告單元和單元間的切換主要體現(xiàn)在畫面切換上,因此,能不能檢測(cè)出其切變鏡頭會(huì)直接影響到分割的準(zhǔn)確性[1]。在音頻上,廣告單元的切換主要體現(xiàn)在小段靜音上,要是能夠正確的檢測(cè)出靜音的地方,就能夠更好的明確廣告單元邊界。在匹配處理方面,廣告單元的結(jié)束幀就選擇為靜音位置的鏡頭切變幀。
二、鏡頭檢測(cè)
視頻鏡頭的轉(zhuǎn)換主要有兩種方式,一種是切變,另一種就是漸變。在電視廣告段落中,廣告單元間的轉(zhuǎn)換一般采取的就是前一種方法,即切變。而廣告單元內(nèi)的轉(zhuǎn)換一般就是漸變方式,本文要對(duì)分割廣告單元進(jìn)行研究,因此,要分析的是切變鏡頭檢測(cè)。
現(xiàn)階段對(duì)這一鏡頭的檢測(cè)算法一般有:基于直方圖、像素差、區(qū)域塊、統(tǒng)計(jì)量的方法等。以直方圖為基礎(chǔ)的測(cè)量方法中,其檢測(cè)的準(zhǔn)確性一般在百分之九十之上,但是在噪聲、運(yùn)動(dòng)很小的情況下,則不是很適應(yīng)應(yīng)用,因此,本文選擇基于直方圖的鏡頭檢測(cè)方法,且對(duì)其做出了優(yōu)化。優(yōu)化之后的檢測(cè)算法將直方圖差當(dāng)作判決條件,對(duì)于鏡頭突變的判別標(biāo)準(zhǔn)則應(yīng)用自適應(yīng)閾值,設(shè)計(jì)了滑動(dòng)窗口,進(jìn)而能夠更好的提取自適應(yīng)閾值,還能夠更好的檢測(cè)鏡頭,提升檢測(cè)的正確性,能夠打破固定閾值的限制。
(一)直方圖特征提取
灰度直方圖平均值能夠?qū)ο噜弾g的差距進(jìn)行放大,因此,本文選擇直方圖平均差法進(jìn)行鏡頭的檢測(cè),其計(jì)算公式是:,其中Hi(j)表示的就是第i幀中第j列的灰度值;Di就是第i幀和第i-1幀的直方圖平均差的差。在Di比設(shè)計(jì)的閾值大時(shí),就代表是切變。
(二)自適應(yīng)閾值的選取和算法過(guò)程
在不一樣的視頻片段中轉(zhuǎn)換或者是一個(gè)視頻片段中不一樣鏡頭轉(zhuǎn)換的地方,幀差存在較大的差距。要是應(yīng)用固定閾值進(jìn)行判別,那么就無(wú)法確保檢測(cè)的正確性,很有可能出現(xiàn)遺漏和錯(cuò)誤的問(wèn)題,使得鏡頭檢測(cè)受限,所以,為了避免這一問(wèn)題的出現(xiàn),就需要結(jié)合不同鏡頭的實(shí)際變化情況自適應(yīng)的選擇閾值。經(jīng)過(guò)實(shí)驗(yàn)可以得出,在相同鏡頭內(nèi)的幀差并不明顯,一般都是在該鏡頭幀差的平均值上下,但是在鏡頭邊界處的幀差就要大一些,要比其幀差平均值大出很多,這就需要應(yīng)用幀差平均值自適應(yīng)得出鏡頭的閾值。要想有效的選擇自適應(yīng)閾值,本文應(yīng)用一個(gè)滑動(dòng)窗口,對(duì)其內(nèi)部的幀差進(jìn)行計(jì)算,選擇其平均值當(dāng)做閾值,在窗口內(nèi)判斷有沒(méi)有出現(xiàn)切變,之后把窗口向后滑動(dòng),持續(xù)到檢測(cè)好全部的視頻幀。
本文選擇了優(yōu)化之后的基于直方圖的鏡頭檢測(cè)方法檢測(cè)廣告段落中的鏡頭。因?yàn)閺V告視頻的時(shí)間比較短,所以對(duì)滑動(dòng)窗口進(jìn)行定義的值是11,把幀差平均值和系數(shù)相乘當(dāng)作閾值,在多次驗(yàn)證廣告視頻之后,認(rèn)為閾值系數(shù)取值應(yīng)該是8-9間。實(shí)驗(yàn)結(jié)果也顯示,這一方法適合檢測(cè)切變鏡頭,效果比較理想。
三、音頻檢測(cè)
音頻數(shù)據(jù)在視頻廣告中的變化和視覺(jué)變化相比要更劇烈,對(duì)檢測(cè)廣告視頻是一個(gè)有效的檢測(cè)方法?,F(xiàn)階段在處理音頻時(shí)一般都是考慮其短時(shí)特征,常見的特征包括:頻域、時(shí)域以及聲學(xué)感知特征。時(shí)域特征只是運(yùn)用音頻信號(hào)的時(shí)域上的信息,在提取方面很便利,要檢測(cè)靜音時(shí)能夠直接運(yùn)用短時(shí)過(guò)零率以及短時(shí)能量,實(shí)驗(yàn)證明,這能夠有效的檢測(cè)音頻中靜音的地方。
四、匹配處理
在找出鏡頭切變的地方和靜音地方之后就應(yīng)該匹配處理。對(duì)于廣告單元的切換幀,在選擇圖像幀時(shí),需要符合靜音幀以及切變幀,進(jìn)而能夠獲得每個(gè)廣告單元的起始幀位置,這樣就實(shí)現(xiàn)了廣告單元的分割。在檢測(cè)時(shí),因?yàn)檫x擇的最小靜音幀長(zhǎng)是20ms,在廣告單元間靜音時(shí)間太長(zhǎng)時(shí),就會(huì)檢測(cè)有三個(gè)靜音幀,這時(shí)就要選擇一幀當(dāng)作靜音幀,不然就會(huì)出現(xiàn)重復(fù)錯(cuò)誤;如果切變幀以及靜音幀未全對(duì)應(yīng),這時(shí)要想做到匹配算法,就需要獲得和靜音幀最近的切變幀,這就是切換幀。
五、結(jié)束語(yǔ)
綜上所述,當(dāng)前視頻廣告得到了極大的發(fā)展,隨著科技的高速發(fā)展,視頻廣告的檢測(cè)算法也在不斷的優(yōu)化和完善。通過(guò)靜音以及鏡頭檢測(cè)能夠分割視頻廣告段落中的廣告單元,然而其還是有限制,對(duì)廣告單元之間銜接不是很顯著的靜音的地方是檢測(cè)不出來(lái)的,這就會(huì)誤檢單元內(nèi)的靜音時(shí)段,所以,還需要繼續(xù)優(yōu)化廣告單元的分割算法。
參考文獻(xiàn):
[1]李煒.視頻動(dòng)態(tài)紋理特征提取與分割技術(shù)研究與實(shí)現(xiàn)[J].成都:西南交通大學(xué),2014.