国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于特征知識(shí)庫(kù)的動(dòng)漫視頻暴力場(chǎng)景檢測(cè)方法

2022-08-02 11:00張春磊熊麗婷
關(guān)鍵詞:知識(shí)庫(kù)卡通物品

張春磊,熊麗婷

(1.成都理工大學(xué) 工程技術(shù)學(xué)院, 四川 樂(lè)山 614000;2.華東交通大學(xué) 理工學(xué)院, 南昌 330100)

0 引言

動(dòng)畫電影和卡通片是重要的娛樂(lè)來(lái)源,特別對(duì)兒童更是如此。此類視頻在設(shè)計(jì)時(shí)會(huì)考慮到兒童的心智水平,但卡通片中的某些內(nèi)容也可能對(duì)兒童造成負(fù)面影響[1]。由于卡通片中的角色沒(méi)有能力限制,這可能會(huì)使其產(chǎn)生暴力和激進(jìn)的行為。一些研究表明,卡通片中的暴力內(nèi)容會(huì)造成兒童觀眾對(duì)疼痛的不敏感。這些兒童觀眾習(xí)慣了暴力內(nèi)容,在現(xiàn)實(shí)生活中將暴力當(dāng)成了正面元素,并從中得到享受。此外,一些研究認(rèn)為卡通片中的暴力會(huì)增加兒童的攻擊性[2]。

目前暴力場(chǎng)景檢測(cè)技術(shù)在視頻監(jiān)控領(lǐng)域得到了廣泛關(guān)注,并被用于電影的場(chǎng)景過(guò)濾中。過(guò)去提出了很多視頻中暴力內(nèi)容的自動(dòng)檢測(cè)方法,但大部分方法針對(duì)常規(guī)視頻開發(fā),使用不同的低級(jí)和高級(jí)特征進(jìn)行暴力檢測(cè)[3],或者基于視頻圖像進(jìn)行一些異常行為的檢測(cè)[4]。目前已有方法大部分基于聲音和視覺(jué)特征,以及這兩種特征的結(jié)合進(jìn)行視頻中的內(nèi)容感知和暴力檢測(cè)。文獻(xiàn)[5]提出一種結(jié)合多種模態(tài)特征的暴力檢測(cè)技術(shù),首先采用一種新的網(wǎng)絡(luò)模型分別對(duì)音頻和視頻進(jìn)行暴力檢測(cè),然后進(jìn)行視覺(jué)和聽覺(jué)雙模態(tài)融合的暴力檢測(cè),最后采用注意力機(jī)制和雙向網(wǎng)絡(luò)進(jìn)行優(yōu)化。實(shí)驗(yàn)結(jié)果證明,該方法具有較高的準(zhǔn)確率。文獻(xiàn)[6]提出了中等暴力程度的聚類技術(shù),以進(jìn)行視頻中的暴力檢測(cè)。其中使用了聲音-視覺(jué)特征和機(jī)器學(xué)習(xí)技術(shù)。使用多核學(xué)習(xí)對(duì)聲音和視覺(jué)模態(tài)進(jìn)行測(cè)試。該系統(tǒng)在來(lái)自2013 Affect Task的數(shù)據(jù)集上進(jìn)行訓(xùn)練和測(cè)試,并通過(guò)MAP@100進(jìn)行了評(píng)估。文獻(xiàn)[7]提出一種基于局部約束的稀疏分類模型和運(yùn)動(dòng)韋伯特征相結(jié)合的暴力檢測(cè)方法。利用高斯濾波對(duì)輸入視頻去除一些噪聲,提取出運(yùn)動(dòng)韋伯特征;利用改進(jìn)的稀疏分類模型用于特定類字典的學(xué)習(xí);利用相應(yīng)的分類機(jī)制用于對(duì)視頻中的暴力行為進(jìn)行分類。結(jié)果表明,提出的特征具有較強(qiáng)的判別性,且提出的基于局部約束的稀疏分類模型非常有效。文獻(xiàn)[8]利用ImageNet和MIT場(chǎng)景數(shù)據(jù)集中的數(shù)據(jù),對(duì)每個(gè)視頻幀中的成分屬性進(jìn)行檢測(cè)以進(jìn)行對(duì)象識(shí)別。通過(guò)將該屬性與來(lái)自視覺(jué)和聲音模態(tài)的其他低級(jí)特征相結(jié)合,構(gòu)建支持向量機(jī)(Supported Vector Machine, SVM)分類器[9]。

一部卡通中的場(chǎng)景對(duì)于某個(gè)兒童來(lái)說(shuō)是暴力的,但其他兒童則可能認(rèn)為其并非暴力場(chǎng)景。這種情況下的閾值等級(jí)是高度主觀的,且在不同觀眾、不同情況和不同文化背景下存在顯著差異[11]。本文提出了能夠?qū)ㄍㄒ曨l中的暴力內(nèi)容進(jìn)行自動(dòng)檢測(cè)的框架。首先,基于低級(jí)特征將卡通視頻分割為不同片段;然后,并識(shí)別出不同對(duì)象,以找出令人高度反感的元素;最后,基于個(gè)體感知對(duì)卡通視頻進(jìn)行映射。仿真實(shí)驗(yàn)表明,本文方法在對(duì)象識(shí)別中具有較高準(zhǔn)確率。

1 本文方法

1.1 系統(tǒng)架構(gòu)

本文提出了用于卡通視頻的暴力檢測(cè)方法。首先,檢測(cè)并識(shí)別出場(chǎng)景中的物體和動(dòng)畫角色,用于估計(jì)暴力概率。與現(xiàn)實(shí)視頻不同的是,大部分卡通角色具備獨(dú)有的特征,可用于預(yù)測(cè)場(chǎng)景的性質(zhì)。同樣的,在存在暴力元素的情況下,場(chǎng)景中的動(dòng)畫角色和不同物品也可用于估計(jì)場(chǎng)景的暴力性質(zhì)[11]。例如,若視頻中存在暴力角色和刀劍、獻(xiàn)血等對(duì)象,則意味著該場(chǎng)景為暴力場(chǎng)景的概率較高。而非暴力角色例如桌椅、鮮花、樂(lè)器等普通物品則意味著該場(chǎng)景具有非暴力性質(zhì)。本文使用貝葉斯概率模型來(lái)估計(jì)場(chǎng)景中的暴力概率。圖1給出了所提系統(tǒng)概覽。

圖1 暴力檢測(cè)系統(tǒng)

算法1給出了本文所提的暴力估計(jì)模型的處理流程。

算法1:卡通視頻暴力檢測(cè)算法。

輸入:M= 視頻(片段)

1 forn= 1 toNdo //長(zhǎng)度為N的視頻,包含視頻幀1...n。

2Fn= Extract-Frame_RGB(M,n) //將視頻幀轉(zhuǎn)換為RGB格式

3Fgray= RGB-to-Gray(Fn) //灰度轉(zhuǎn)換

4Fr= Extract-Red-Channel(Fn) //RGB分離

5Fg= Extract-Green-Channel(Fn)

6Fb= Extract-Blue-Channel(Fn)

7FHSV= RGB-TO-HSV(Fn) //HSV分離

8Fh= Extract_Hue-channel(FHSV)

9Fs= Extract_saturation-channel(FHSV)

10Fv=Extract_Value_channel(FHSV)

11k= 1

12 for 每個(gè)Gray、RED、GREEN、BLUE、HUE、Value、Saturation通道 do

13 將特征加入特征向量FVn

14 ifn≠1 then

15M=TSS(Fn+1,Fn, mbSize,p)//利用TSS計(jì)算運(yùn)動(dòng)向量,mbSize= 20,p=5

16Δfn=|FVn+1-FVn|

17 ifΔfn>ththen

18k=k+1

19 將視頻幀n標(biāo)記為鏡頭邊界k

20 SBF = 提取從第k-1幀到第k幀的鏡頭特征

21 Obj = 提取從第k-1幀到第k幀的關(guān)鍵幀中的對(duì)象

22 for 每個(gè)對(duì)象Obj do

23 OVF = Extract-Object-Visual-Feature//提取對(duì)象的視覺(jué)特征

24 if OVF在CKB中 then //將OVF與角色知識(shí)庫(kù)相比較

25 Violencefactor(Obj) = extract-average-offensive-factor(Obj)

26 else if OVF在OKB中 then //將OVF與物品知識(shí)庫(kù)相比較

27 Violencefactor(Obj)= extract-average-offensive-factor(Obj)

28 else

29 忽略對(duì)象Obj

30 Append_merge(Scene-Violence-factor, Violencefactor(Obj))//合并對(duì)象的暴力因子數(shù)值

31 Prob_of_SVF = Estimate-SVF(Scene-Violence-Factor)//估計(jì)卡通視頻場(chǎng)景的暴力概率

CKB:角色知識(shí)庫(kù)

OKB:物品知識(shí)庫(kù)

1.2 分鏡檢測(cè)和視頻幀提取

一般卡通視頻的低層次特征提取主要采用兩大類視覺(jué)信息:亮度和色度。亮度信息是最明亮的信息,它包含了視頻內(nèi)容的大部分?jǐn)?shù)據(jù)。在卡通漫畫中,這些信息在理解場(chǎng)景的內(nèi)容中扮演著重要的角色。大部分視頻都是YPbPr格式,亮度信息由Y通道呈現(xiàn)。在本文研究中,視頻以RGB格式提取。在這里,亮度信息以灰度級(jí)的形式提取。

本文利用低級(jí)特征(RBG顏色、亮度、色調(diào))開發(fā)連續(xù)函數(shù),并用于識(shí)別場(chǎng)景中的鏡頭邊界。利用這些鏡頭邊界信息,確認(rèn)子鏡頭。從每個(gè)子鏡頭中選出有代表性的視頻幀作為關(guān)鍵幀,并通過(guò)從子鏡頭中提取出的特征,利用關(guān)鍵幀進(jìn)行對(duì)象提取。

1.3 運(yùn)動(dòng)估計(jì)

本文利用運(yùn)動(dòng)信息,計(jì)算視頻幀中的運(yùn)動(dòng)。進(jìn)行運(yùn)動(dòng)估計(jì)時(shí),首先,將視頻幀分割為108個(gè)子塊,排列為9×12的陣列。在視頻序列的當(dāng)前幀和上一個(gè)已處理幀之間執(zhí)行塊匹配運(yùn)動(dòng)估計(jì)。將當(dāng)前幀分割為非重疊的方形塊,像素大小為N×N,每個(gè)塊在上一幀中均有一個(gè)大小為(2W+N+1)×(2W+N+1)的對(duì)應(yīng)搜索區(qū)域,其中,W為沿水平和垂直方向的最大像素位移。則對(duì)于每個(gè)當(dāng)前塊,尋找搜索區(qū)域中與當(dāng)前塊實(shí)現(xiàn)最優(yōu)匹配的塊。將平均絕對(duì)差(MAD)作為匹配準(zhǔn)則:

MAD(x,y)=

(1)

式中,F(xiàn)c(·,·)和Fp(·,·)分別為當(dāng)前幀和上一幀中的像素強(qiáng)度,(k,l)為當(dāng)前塊的左上角像素坐標(biāo),(x,y)為與當(dāng)前塊位置相關(guān)的像素位移。檢查搜索區(qū)域中的每個(gè)位置后,將運(yùn)動(dòng)向量定為具有MAD最小值(即最小誤差)的(x,y)。

然后,利用圖像塊匹配運(yùn)動(dòng)估計(jì)方法的搜索(TSS)算法[12],計(jì)算出二維運(yùn)動(dòng)向量。雖然TSS最初針對(duì)搜索窗口相對(duì)較小的低速率視頻應(yīng)用而提出,即限制在W= 7,但可對(duì)TSS程序進(jìn)行擴(kuò)展,并用于W> 7的情況,其步數(shù)也將超過(guò)3步。

一般來(lái)說(shuō),給定W,則需要的步數(shù)計(jì)算為:

L=[log2(W+1)]

(2)

式中,[x]表示大于或等于x的最小整數(shù)。由此,第n步的步長(zhǎng)(每步搜索中像素間距)計(jì)算為:

ss(n)=2L-n

(3)

從中可發(fā)現(xiàn),TSS在每步中使用均勻分布的搜索模式,由此表現(xiàn)出簡(jiǎn)單性和規(guī)則性。具體來(lái)說(shuō),第一步的檢查點(diǎn)數(shù)量為9,后續(xù)步的檢查點(diǎn)數(shù)量為8(排查上一步已檢查過(guò)的位置)。W= 7的情況下,TSS的總檢查點(diǎn)數(shù)量為25個(gè)。由此,與FS的225個(gè)檢查點(diǎn)相比,TSS的速度提升了8倍。

最后,將以笛卡爾坐標(biāo)表示的運(yùn)動(dòng),利用以下公式轉(zhuǎn)換為極坐標(biāo):

(4)

(5)

利用上述公式得到運(yùn)動(dòng)的幅度和角度,并用于理解場(chǎng)景的性質(zhì),如圖2所示。本文方法中,將該運(yùn)動(dòng)信息的復(fù)合效應(yīng)作為特征。利用圖像塊數(shù)量、運(yùn)動(dòng)信息及圖像塊類型組成特征向量。

圖2 運(yùn)動(dòng)估計(jì)示例

為了進(jìn)一步完善運(yùn)動(dòng)估計(jì)方法,本文算法使用公式(2)和(3)確定所需步數(shù)和使用的步長(zhǎng)。其創(chuàng)新點(diǎn)在于,將每步分給為兩個(gè)階段:1)選擇1個(gè)搜索象限;2)在選定象限中找到最小誤差位置。以第n步為例。第一個(gè)階段,計(jì)算圖3(a)的A、B和C的MAD,其中,A為中心位置,B和C分別為水平方向和垂直方向上與A距離為ss(n)個(gè)像素的位置。要指出,從A至B和從A至C的方向與圖3(b)中的方向1和方向7相對(duì)應(yīng)。此外,令MAD(X)表示位置X的MAD,并標(biāo)注4個(gè)象限I,II,III和IV,如圖3(a)所示。確定搜索象限的規(guī)則描述如下:

圖3 不同的搜索模式

若MAD(A)≥MAD(B)且MAD(A)≥MAD(C),則選擇I;

若MAD(A)≥MAD(B)且MAD(A)

若MAD(A)

若MAD(A)

實(shí)際上,本文方法在每步中采用相同程序,因此保留了TSS所包含的規(guī)則性。

表1給出了不同W值下,3個(gè)搜索算法的計(jì)算復(fù)雜度和加速比。從中可發(fā)現(xiàn),所提本文方法比TSS的速度進(jìn)一步加快了約1倍。這證明了所提方法的有效性和優(yōu)越性。

表1 搜索算法計(jì)算復(fù)雜度比較

1.4 分割

為理解圖像或視頻中的對(duì)象,需要基于分割處理進(jìn)行對(duì)象提取。視覺(jué)特征和視頻運(yùn)動(dòng)是圖像分割中非常重要的估計(jì)。本文使用空間信息和運(yùn)動(dòng)信息進(jìn)行分割。

1.4.1 空間分割

該步驟中對(duì)有代表性的視頻幀進(jìn)行分析,以進(jìn)行空間分割。由于卡通視頻中包含的陰影較少,所以卡通視頻中的空間分割較為簡(jiǎn)單。本文利用水線分割(water segmentation)技術(shù)進(jìn)行空間分割。

1.4.2 時(shí)間分割

合并從空間分割和時(shí)間分割得到的結(jié)果,以提取具有相似的視覺(jué)和運(yùn)動(dòng)信息的對(duì)象。大部分卡通對(duì)象中包含不同的顏色區(qū)域,將其識(shí)別為單獨(dú)分割結(jié)果。運(yùn)動(dòng)特征中包含作為相同對(duì)象某一部分的最相似特征。圖4給出了輸入圖像,從中計(jì)算出運(yùn)動(dòng)向量。對(duì)于該視頻幀,利用之前的視頻幀和宏塊(36 * 48 = 1728)估計(jì)出運(yùn)動(dòng)向量。對(duì)于每個(gè)宏塊,計(jì)算出運(yùn)動(dòng)向量。運(yùn)動(dòng)向量中,將所有圖像塊的運(yùn)動(dòng)均值作為閾值,并將運(yùn)動(dòng)幅度超過(guò)閾值的宏塊選擇為移動(dòng)圖像塊。

圖4 輸入圖像示例

1.5 物品/角色提取和識(shí)別

圖像分割后,需要從中提取物品和角色。利用水線分割技術(shù)在彩色特征上執(zhí)行基本分割,其后基于運(yùn)動(dòng)信息,將分割結(jié)果合并為物品和角色。由于基于彩色的分割能夠改善對(duì)象邊界,本文所提模型中使用彩色特征和運(yùn)動(dòng)特征以提高對(duì)象提取性能。

在對(duì)象提取后,需要進(jìn)行物品和角色的識(shí)別。在對(duì)象識(shí)別中,使用歐氏距離方法,利用最小值進(jìn)行識(shí)別[13]。若得到多個(gè)結(jié)果,則將所有匹配的對(duì)象/角色均用于暴力估計(jì)。歐氏距離方法的計(jì)算過(guò)程如下:

d(O,F)=

(6)

式中,d(O,F)為物品O和知識(shí)庫(kù)K中的元素之間的歐氏距離;Ofi為場(chǎng)景中物品O的第i個(gè)特征;Kfi為知識(shí)庫(kù)中物品的第i個(gè)特征,i= 1, 2,...,n。在與知識(shí)庫(kù)中的角色進(jìn)行匹配后,得到3個(gè)不同的高級(jí)特征,即角色相關(guān)的暴力強(qiáng)度,視頻中角色的暴力頻率,以及角色的搞笑性質(zhì)(用于確定場(chǎng)景中的幽默性)。暴力強(qiáng)度指的是對(duì)某個(gè)卡通角色可以預(yù)期的暴力類型和程度。例如,貓和老鼠中存在許多暴力場(chǎng)景,但大部分場(chǎng)景的暴力程度不高。但在惡魔獵人動(dòng)畫片中則存在許多嚴(yán)重暴力場(chǎng)景[14]。

暴力頻率特征用于確定暴力場(chǎng)景數(shù)量。從知識(shí)庫(kù)中得到暴力頻率信息,利用貝葉斯概率模型,計(jì)算出當(dāng)前場(chǎng)景提取出的信息中包含暴力的概率[15]:

(7)

式中,P(x)為當(dāng)前場(chǎng)景存在暴力元素的概率;P(y)為當(dāng)前場(chǎng)景中提取出的特征集合在知識(shí)庫(kù)中的概率;P(y|x)為當(dāng)前特征集合符合暴力場(chǎng)景的概率。

1.6 知識(shí)庫(kù)

知識(shí)庫(kù)是所提系統(tǒng)的核心部件,以半自動(dòng)的方式創(chuàng)建,其中包含所有常見物品、卡通角色及其視覺(jué)特征和行為特征的數(shù)據(jù)信息。該知識(shí)庫(kù)給出了物品和角色與暴力之間的關(guān)系。利用該信息,計(jì)算場(chǎng)景的暴力概率。將知識(shí)庫(kù)分為兩類,即角色數(shù)據(jù)庫(kù)和物品數(shù)據(jù)庫(kù)。

1.6.1 角色知識(shí)庫(kù)

知識(shí)庫(kù)的第一個(gè)部分是角色知識(shí)庫(kù),包含卡通角色的形態(tài)和行為。不斷利用新的動(dòng)畫角色對(duì)該知識(shí)庫(kù)進(jìn)行更新。角色知識(shí)庫(kù)包含角色數(shù)據(jù)集,其中保存了每個(gè)角色的不同圖像。本文基于顏色(色調(diào))直方圖特征,提取出角色(對(duì)象)的不同視覺(jué)和幾何特征。顏色直方圖是圖像中色彩分布的真實(shí)描述。所提方法中在提取色調(diào)直方圖特征時(shí),首先從圖像中移除背景。將無(wú)背景的輸入圖像轉(zhuǎn)換為色調(diào)通道并計(jì)算其直方圖,用于特征提取分析。主要形式的圖像輸入如圖5所示。RGB通道直方圖是圖像檢索中最常用的視覺(jué)特征。該階段中,將輸入幀轉(zhuǎn)換為灰度圖像及其紅、綠、藍(lán)通道的直方圖。此外,在物品和角色識(shí)別中還有許多重要的基礎(chǔ)視覺(jué)特征,如紋理特征。由于使用過(guò)濾器提取問(wèn)題特征,計(jì)算成本很高,所以本文使用快速傅立葉變換FFT進(jìn)行問(wèn)題特征的提取。

圖5 輸入圖像處理

1.6.2 物品知識(shí)庫(kù)

知識(shí)庫(kù)的第二個(gè)部分包含常用物品信息,例如玫瑰、槍械、刀具和車輛。該數(shù)據(jù)庫(kù)包含這些物品的視覺(jué)、形狀和運(yùn)動(dòng)信息物品知識(shí)庫(kù)包含物品數(shù)據(jù)集、特征提取、顏色直方圖、RGB通道直方圖、形狀特征和暴力/分暴力物品特征。

另一方面,爆炸性材料(例如炸彈)則更多用在暴力場(chǎng)景中,普通場(chǎng)景中則不多見。為完成場(chǎng)景的暴力分類,識(shí)別出場(chǎng)景內(nèi)的所有物品和角色及其特征,并估計(jì)其暴力傾向。場(chǎng)景的暴力概率計(jì)算為:

(8)

式中,VN表示暴力物品數(shù)量;NVN表示非暴力物品數(shù)量。

2 實(shí)驗(yàn)結(jié)果與分析

為檢驗(yàn)所提算法,本文使用3個(gè)不同數(shù)據(jù)集。第一個(gè)數(shù)據(jù)集包含來(lái)自20個(gè)不同類別的200個(gè)物品。第二個(gè)數(shù)據(jù)集包含513個(gè)不同圖像幀中的23個(gè)不同卡通角色。第三個(gè)數(shù)據(jù)集為暴力和非暴力視頻片段的集合,其中共包含200個(gè)視頻片段,暴力視頻和非暴力視頻分別為100個(gè)。第三個(gè)數(shù)據(jù)集的數(shù)據(jù)分布如表2所示。

表2 暴力/非暴力視頻片段分布

大部分暴力場(chǎng)景會(huì)在場(chǎng)景的鏡頭和對(duì)象中出現(xiàn)高光時(shí)刻[16]。此外,“獻(xiàn)血”“爆炸”“火焰”等元素也會(huì)增加場(chǎng)景中的暴力概率。本文方法旨在將根據(jù)提取出的角色和物品的暴力概率,將場(chǎng)景分類為暴力場(chǎng)景和非暴力場(chǎng)景。使用最小二乘距離,通過(guò)提供知識(shí)庫(kù)提取出的特征(色調(diào)、紅綠藍(lán)、紋理)和3個(gè)主要特征(暴力強(qiáng)度、暴力頻率和搞笑程度)對(duì)角色的暴力水平進(jìn)行評(píng)分,結(jié)果如圖6所示。

圖6 角色的暴力和非暴力分類

卡通視頻中,物品的暴力/非暴力分類比角色分類的難度要大得多。這是因?yàn)槲锲酚兄鞣N不同的形狀類型。為此,實(shí)驗(yàn)首先將視覺(jué)特征與最小二乘距離相匹配;然后,將暴力元素與形狀和物品相關(guān)聯(lián),即某個(gè)物品與特定類型的暴力相關(guān)。如刀或鋸條都屬于高暴力程度的物品,但也可用于各種非暴力場(chǎng)景中,如圖7所示。但當(dāng)卡通圖像中附帶一些文字信息或其他確定性信息時(shí),暴力/非暴力性的檢測(cè)會(huì)發(fā)生一些轉(zhuǎn)變。一些卡通示例如圖8所示,其中,左邊寫有“氫彈之父”字樣的漫畫,雖然有氫彈爆炸的元素,但可定義為積極且有意義的。右邊的潛艇406表示我國(guó)核潛艇的特殊舷號(hào),具有國(guó)防教育意義。因此,卡通視頻中的一些確定性信息可以對(duì)檢測(cè)分類具有直接定性作用。

圖7 物品的暴力和非暴力分類

圖8 一些具有確定性信息的漫畫檢測(cè)分類

實(shí)驗(yàn)通過(guò)構(gòu)建混淆矩陣(列聯(lián)表)及馬修斯相關(guān)系數(shù)(MCC)評(píng)估所提算法性能,實(shí)驗(yàn)結(jié)果如表3所示。

表3 本文方法對(duì)3個(gè)數(shù)據(jù)集中物品/角色識(shí)別結(jié)果

從表3可知,在數(shù)據(jù)集1和數(shù)據(jù)集2的物品識(shí)別中,根據(jù)混淆矩陣,準(zhǔn)確率超過(guò)97%,取得了較好結(jié)果;使用高級(jí)測(cè)量MCC,結(jié)果為75.3%,性能較好。在數(shù)據(jù)集3的角色識(shí)別中,準(zhǔn)確度為96%,MCC結(jié)果則為58.6%。該指標(biāo)性能較低的原因是數(shù)據(jù)集中角色的背景影響。若從中移除背景,能夠顯著提高M(jìn)CC性能。在第三個(gè)數(shù)據(jù)集中,本文方法的分類準(zhǔn)確度為77%,該結(jié)果對(duì)于基于內(nèi)容的視頻檢索系統(tǒng)是較為理想的。本文方法中,若概率超過(guò)閾值,則可將物品或角色識(shí)別為暴力元素,該閾值可根據(jù)觀眾的需求而設(shè)定。

3 結(jié)束語(yǔ)

由于動(dòng)畫片中暴力類型的多樣性,卡通視頻中的暴力檢測(cè)任務(wù)難度很大。在卡通視頻和現(xiàn)實(shí)視頻中,對(duì)象的顏色和視覺(jué)特征存在顯著差異,所以現(xiàn)實(shí)視頻中有用的低級(jí)特征不適用于卡通視頻。但卡通視頻中,大部分情況下動(dòng)畫角色有著特有的性格和情緒。且為展示一些特效,會(huì)使用一些公共特性,例如在戰(zhàn)斗場(chǎng)景中會(huì)使用烏云。本文方法利用了這一理念,通過(guò)識(shí)別出場(chǎng)景中的角色,以用于估計(jì)是否存在暴力。本文方法利用不同的角色和對(duì)象對(duì)暴力概率進(jìn)行預(yù)測(cè),在對(duì)象識(shí)別中取得了較高準(zhǔn)確率,角色識(shí)別的準(zhǔn)確率相對(duì)較低。這是原因是樣本數(shù)據(jù)集中的背景影響到的識(shí)別性能。

猜你喜歡
知識(shí)庫(kù)卡通物品
圖畫捉迷藏
雞鳴狗盜皮皮豬卡通
趣味的卡通穿上身
找物品
創(chuàng)意,源自生活的可愛(ài)小物品
找不同
我國(guó)聯(lián)合虛擬參考咨詢系統(tǒng)知識(shí)庫(kù)現(xiàn)狀研究*
——基于與QuestionPoint的對(duì)比
基于Lucene搜索引擎的研究
位置與方向測(cè)試題