孫曉雪 魏占勝
摘 要:本文中在提取出所研究的預(yù)告片視頻的16個特征后,根據(jù)特征對預(yù)告片的評價的影響對其進(jìn)行選擇。這是因?yàn)樘卣鞯某叽缡谴蟮?,甚至可能不是所有的特征都影響預(yù)告片的評價,找到那些對預(yù)告片受歡迎度最有影響的特征是特征選擇的目的。
關(guān)鍵詞:預(yù)告片;特征選擇
1 緒論
特征選擇是簡化特征的一種方法,其實(shí)質(zhì)是:尋求原始特征集中一個能保持樣本分類能力不變且包含特征最少的最優(yōu)特征子集。所求得到的這個特征子集的特征能將原特征集的樣本很好的表達(dá)出來。本文將獲得的包括“亮度均值”、“對比度均值”、“飽和度均值”、“色彩度均值”、“幀簡單度均值”、“亮度方差”、“對比度方差”、“飽和度方差”、“色彩度方差”、“幀簡單度方差”、“運(yùn)動均值”、“運(yùn)動方差”、“視頻長度”、“鏡頭數(shù)目”、“鏡頭長度均值”和“鏡頭長度方差”16個特征進(jìn)行特征選擇。
2 特征分?jǐn)?shù)散點(diǎn)圖
散點(diǎn)圖通常用于顯示和比較數(shù)值,可表示因變量隨自變量而變化的大致趨勢。為了對所選的特征進(jìn)行選擇,我們首先對所建視頻庫中的所有預(yù)告片繪制了其各自的特征-分?jǐn)?shù)散點(diǎn)圖,通過對散點(diǎn)圖的觀察來大致了解每個特征和分?jǐn)?shù)的關(guān)系的特點(diǎn)。每個預(yù)告片的分?jǐn)?shù)值應(yīng)該在0到5.0之間。然后,我們設(shè)置4.7為閾值,這意味著如果預(yù)告片的分?jǐn)?shù)高于或等于4.7,將被視為“好”,圖中相應(yīng)的點(diǎn)數(shù)將被標(biāo)為綠色。否則,將被視為“差”,對應(yīng)于散點(diǎn)圖中紅色的點(diǎn)。從散點(diǎn)圖中,可以找到特征和分?jǐn)?shù)之間的一些一般趨勢。例如,有較小“鏡頭長度方差”值得預(yù)告片將很有可能獲得較低的分?jǐn)?shù)并被視為“差”。有較高“飽和度均值”的預(yù)告片將更可能獲得較高的分?jǐn)?shù)并被視為“好”。
我們試圖找到特征和分?jǐn)?shù)之間的關(guān)系,但是從上圖中顯示的并不明顯。所以,在接下來的工作中我們嘗試了一些更精確的特征選擇方法來獲得更可靠的結(jié)果。
3 CFS法預(yù)選預(yù)告片的特征
本文以CFS法作為預(yù)告片特征的預(yù)選擇方法,CFS法在采樣樣本對應(yīng)的特征維數(shù)較大、不便于分析的情況下,根據(jù)特征間的互相關(guān)性來選擇對樣本評價影響最大的一些特征,特別適用于圖像分析中的特征選擇,當(dāng)k=1時,提取的16個特征的排序結(jié)果如表1所示。
然后,我們計(jì)算所有可能特征子集合的評價,并標(biāo)號所有的特征:亮度均值(1)、對比度均值(2)、飽和度均值(3)、色彩度均值(4)、幀簡單度均值(5)、亮度方差(6)、對比度方差(7)、飽和度方差(8)、色彩度方差(9)、幀簡單度方差(10)、運(yùn)動均值(11)、運(yùn)動方差(12)、視頻長度(13)、鏡頭數(shù)目(14)、鏡頭長度均值(15)、鏡頭長度方差(16),可以得到表2所示結(jié)果。
從表2中的特征選擇結(jié)果可以看出,“飽和度均值”、“幀簡單度均值”、“鏡頭長度均值”、“鏡頭長度方差”這四個特征相對于其他特征的組合有更多的預(yù)告片能被正確分類,所以選擇這四個特征作為預(yù)告片視頻評價的關(guān)鍵特征。
參考文獻(xiàn):
[1]史婷婷,劉衛(wèi)華,伍春暉.一種新的圖像空間特征提取方法.計(jì)算機(jī)工程,2012,38(3):218-220.
[2]薛菲.網(wǎng)絡(luò)視頻質(zhì)量評估方法研究[D].北京:北京郵電大學(xué),2012:1-54.
項(xiàng)目:吉林農(nóng)業(yè)科技學(xué)院青年基金項(xiàng)目:吉農(nóng)院合字[2018]第3013號
作者簡介:孫曉雪(1988-),女,滿族,吉林吉林人,碩士,講師,研究方向:機(jī)械電子。