彭月平, 蔣镕圻, 徐 蕾
(武警工程大學(xué)信息工程學(xué)院,西安 710086)
基于視頻行為識別作為時變視頻數(shù)據(jù)分類問題,可根據(jù)數(shù)據(jù)特征提取角度分為兩大類,一是基于人工設(shè)計特征的識別方法,二是基于機(jī)器學(xué)習(xí)的方法。前者是通過人工設(shè)計合適的特征量來提取特征值,以構(gòu)建合適匹配模型;后者注重如何設(shè)計網(wǎng)絡(luò)對行為特征進(jìn)行自適應(yīng)學(xué)習(xí),即基于樣本數(shù)據(jù)分析結(jié)果創(chuàng)建某種模型,一些學(xué)者將基于深度學(xué)習(xí)思想的卷積神經(jīng)網(wǎng)絡(luò)等算法模型開始應(yīng)用在行為識別上,使得深度學(xué)習(xí)算法在行為識別領(lǐng)域占據(jù)一定的優(yōu)勢[1],然而人群行為復(fù)雜性使得這些學(xué)習(xí)訓(xùn)練方法需要處理大量數(shù)據(jù)以獲取網(wǎng)絡(luò)參數(shù),樣本選擇會直接影響參數(shù)估計的準(zhǔn)確性,導(dǎo)致訓(xùn)練不足或過擬合。因此,不少學(xué)者仍在尋求最合適的視頻特征計算方式以求重大突破。
基于人工設(shè)計特征的行為識別方法大致可概括為基于局部特征和基于全局特征這兩類。基于局部特征方法是通過時空興趣點(diǎn)或區(qū)域檢測等方式提取局部特征,實現(xiàn)行為識別,一般選擇對光照、遮擋不敏感的特征作為特征描述符[2-4]。部分學(xué)者將Harris角點(diǎn)檢測擴(kuò)展至?xí)r空區(qū)域,檢測時空維度上變化顯著的點(diǎn)[2],但該方法要求時空興趣點(diǎn)需滿足在時空尺度上均顯著變化的條件,而實際應(yīng)用中符合要求的興趣點(diǎn)較為稀疏;因此有學(xué)者設(shè)計出Hessian時空興趣點(diǎn)檢測器,通過檢測尺度不變興趣點(diǎn)提取局部特征[3];一些學(xué)者還發(fā)現(xiàn)密集采樣能在不同時空尺度上將視頻分割為密集小塊后再提取特征,具有比時空興趣點(diǎn)更優(yōu)的效果,在目標(biāo)遮擋等復(fù)雜環(huán)境下魯棒性較強(qiáng)[4]。而基于全局特征方法是將運(yùn)動目標(biāo)視為整體,通過前景提取、運(yùn)動目標(biāo)檢測和跟蹤處理后,再構(gòu)建包含整體信息的全局特征進(jìn)行識別[5-10]。在光流直方圖基礎(chǔ)上,實現(xiàn)了多尺度光流直方圖,在保留光流特性的同時增加時空域信息[7];一些學(xué)者還利用加速度特征與閾值對比來判斷人群是否發(fā)生異常行為[8],以及利用社會力模型的最小化相互作用力來檢測擴(kuò)散、定向移動等典型異常行為[9],均取得良好的效果。基于人工設(shè)計特征的行為識別方法需要人工設(shè)計合適的特征量來提取特征值,通過局部或全局特征分析空間上的行為來檢測異常行為,雖然提取的特征包含豐富的行為信息,但受人工主觀因素影響較大,且對光照、遮擋等因素較為敏感,缺乏在時間角度的行為變化信息[10]。因此,在人群異常行為識別時,如何選取有效的時空域特征對異常行為識別的效果有著關(guān)鍵影響。
粗糙集是一種刻畫不確定性的數(shù)學(xué)理論,以分類機(jī)制為基礎(chǔ),通過知識庫近似刻畫問題的決策規(guī)則,無需依賴于先驗信息,通過在不可區(qū)分關(guān)系的基礎(chǔ)上引入上下近似等概念來刻畫知識的不確定性和度量屬性的重要性,對不確定數(shù)據(jù)進(jìn)行分析處理,從原始數(shù)據(jù)集中獲取規(guī)則并完成分類,適合從龐雜數(shù)據(jù)中挖掘有用信息[11-12]。針對現(xiàn)有基于人工設(shè)計特征的大多數(shù)行為識別方法只針對單一類人群異常行為,缺少多類異常行為分類研究,以及受人工影響較大等問題。本文以粗糙集分類理論為基礎(chǔ),利用粗糙集分類不依賴先驗信息的獨(dú)特優(yōu)勢,研究四散、群毆、同方向加速跑,以及突然聚集四類中低密度人群異常行為特征及其分類,提出并實現(xiàn)基于粗糙集的多類人群異常行為識別算法,并通過同類方法的對比實驗來驗證所提算法的優(yōu)越性和有效性。
人群異常行為限于特定的場合,一般涉及人數(shù)較多,而且不同的人群異常行為都具有鮮明的變化特征可供參考[13]。如四散異常行為在發(fā)生四散行為之前,場景內(nèi)的目標(biāo)一直在進(jìn)行無規(guī)律的走動,當(dāng)出現(xiàn)異常時,人群會因驚慌而朝著四面八方散開,此時人群目標(biāo)的運(yùn)動量突然加劇,且目標(biāo)之間的平均距離會不斷拉大,即人群目標(biāo)的動能和勢能均發(fā)生明顯變化。而群毆異常行為在發(fā)生前可能會有預(yù)兆,即一群人正向某一方向聚集或已聚在某一處,而后開始大打出手,伴隨著較為激烈的肢體運(yùn)動,相鄰幀的同一像素點(diǎn)的運(yùn)動速度和方向可能會發(fā)生明顯變化,因此可引入幀間混亂程度這一特征量來加以區(qū)分。同向加速跑動異常行為在發(fā)生時除了具備人數(shù)多的特點(diǎn)外,還需要滿足人群由無規(guī)則行走轉(zhuǎn)為開始加速往同一方向跑的特性,運(yùn)動速度會突然提高,且其運(yùn)動方向一致,可采用方向混亂熵來判斷該行為。突聚異常行為首先滿足人群密度較大的特點(diǎn),當(dāng)場景內(nèi)出現(xiàn)異常時,人群目標(biāo)開始朝著某一處集中,此時目標(biāo)之間的平均距離不斷縮小,可通過距離勢能區(qū)別于四散和同向加速跑行為,而它和群毆行為在距離勢能上具有一定的相似性,但其運(yùn)動強(qiáng)度比群毆行為平緩,可采用幀間混亂程度來區(qū)分這兩類異常行為。
在分析四散、群毆、同方向加速跑,以及突然聚集四類中低密度人群異常行為獨(dú)有特點(diǎn)的基礎(chǔ)上,選用人數(shù)、幀平均加速度、矩形框間的距離勢能、方向混亂熵,以及幀間混亂程度來分別描述人群數(shù)量、目標(biāo)運(yùn)動的劇烈程度、個體位置分布、方向變化及相對位置信息,采用矩形框圈定前景圖像中的單個運(yùn)動目標(biāo),并通過改進(jìn)LK(Lucas-Kanade)光流模型計算矩形框的光流特征,從而完成這五個特征值的提取。下面介紹五個特征量的提取過程。
傳統(tǒng)方法多是采用像素數(shù)與人數(shù)的線性關(guān)系來估算人數(shù),存在較大的誤差。而本文采用大小可變的矩形框圈定運(yùn)動目標(biāo),根據(jù)框數(shù)與人數(shù)的線性關(guān)系獲取人數(shù)估計值,矩形框的個數(shù)即為目標(biāo)人數(shù)[14]。具體設(shè)置如下:矩形框的長度h未超過預(yù)設(shè)的閾值T1,判為非人類目標(biāo),計數(shù)器不變;若框的寬度w未超過閾值T2,則計數(shù)器加1;若寬度w超過T2且為T2的N倍時,判定人數(shù)為N,計數(shù)器A=A+[w/T2];再通過最小二乘法對框數(shù)y與人數(shù)x進(jìn)行線性擬合,修正后輸出人數(shù)的估計值。
當(dāng)場景中運(yùn)動目標(biāo)的速度或方向突然發(fā)生變化時,多是由于人群中出現(xiàn)了異常情況,例如突然從緩慢行走轉(zhuǎn)為快速奔跑或是突然轉(zhuǎn)變方向。在物理學(xué)中我們通常采用加速度來體現(xiàn)速度的整體變化,它不僅是速度大小變化的數(shù)值體現(xiàn),還是能表明方向變化的矢量。幀平均加速度[15]是根據(jù)光流信息計算相鄰幀中同一矩形框內(nèi)的同一特征點(diǎn)的運(yùn)動速度和方向,得到速度矩陣,進(jìn)而獲取加速度矩陣,再對加速度非零的特征點(diǎn)求平均值而計算出“幀平均加速度”。
由光流法可知,目標(biāo)運(yùn)動產(chǎn)生的位移是由相鄰兩幀中矩形框的歐式距離來表示的。假設(shè)對于相鄰幀圖像中同一矩形框內(nèi)的同一運(yùn)動特征點(diǎn),坐標(biāo)分別表示為(xi,yi)和(xj,yj),則產(chǎn)生的位移是 Δx=xj-xi,Δy=yj-yi,一般情況下用一幀來代替單位時間,隨即可得出Δx和Δy分別為該時刻特征點(diǎn)在X和Y方向上的速度分量,速度的大小可|v|以通過求兩者平方和的算術(shù)平方根得到。設(shè)當(dāng)前運(yùn)動特征點(diǎn)的速度與X軸所成的夾角為α,當(dāng)|v|>0時,則方向角α為
(1)
當(dāng)|v|=0時,說明該特征點(diǎn)沒有運(yùn)動,則α=-∞。
(2)
式(2)中:ɑt(pi)為當(dāng)前幀某一運(yùn)動特征點(diǎn)的加速度;n為運(yùn)動特征點(diǎn)的個數(shù)。
采用矩形框圈定單個運(yùn)動目標(biāo),框之間的相對距離間接代表運(yùn)動目標(biāo)之間的相對分布。因此將不同矩形框之間的歐式距離稱為距離勢能(D),用于描述場景內(nèi)目標(biāo)之間的遠(yuǎn)近程度。若距離勢能較小,表示該場景中的運(yùn)動目標(biāo)較為密集,反之則比較分散。具體表達(dá)式為
(3)
式(3)中:dE(i,j)為兩個矩形框之間的歐式距離;n為矩形框個數(shù);φ是修正因子;一般取常量。
方向混亂熵用于描述場景內(nèi)目標(biāo)運(yùn)動方向的離散程度,當(dāng)運(yùn)動目標(biāo)的方向差異越大,則方向熵越大,反之則越小[16]。在計算幀平均加速度時已經(jīng)獲取了矩形框中每個運(yùn)動特征點(diǎn)的方向,將方向分為8個級別,統(tǒng)計每個級別中特征點(diǎn)的個數(shù),所含特征點(diǎn)數(shù)最多的級別即為該矩形框的方向。
則某一幀圖像中第i個矩形框的方向概率為
(4)
式(4)中:h(i)為框中屬于該方向級別的特征點(diǎn)數(shù)目;n為該矩形框中特征點(diǎn)總數(shù)。熵值表示事件發(fā)生概率的不確定性,因此定義目標(biāo)運(yùn)動的方向混亂熵為
(5)
鑒于從視頻監(jiān)控的角度,群毆行為和一些正常行為(如多人交叉行走)在人數(shù)、距離勢能這類特征上沒有明顯的區(qū)分,因而引入幀間混亂程度。首先獲取矩形框內(nèi)特征點(diǎn)所對應(yīng)的方向級別,而后計算相鄰幀中同一特征點(diǎn)的方向差與速度差的乘積,最后取均值作為幀間混亂程度(f)的體現(xiàn),具體表達(dá)式為
(6)
式(6)中:n為第k幀圖像中運(yùn)動特征點(diǎn)的總數(shù);v(i,k)為該幀中第i個特征點(diǎn)的光流速度;D(i,k)為相鄰幀中特征點(diǎn)i的方向級別差。
識別的異常行為主要分為四類:四散、同方向加速跑、群毆和突然聚集,將異常行為發(fā)生前的行為,以及這四類異常行為以外的行為均視為正常行為。異常行為識別部分包括特征提取、粗糙集獲取決策規(guī)則和利用決策規(guī)則完成測試分類三個部分。以MATLAB R2017a為實驗平臺,數(shù)據(jù)來源于某高校操場外側(cè)監(jiān)控視頻集,速率為25幀/s,分辨率為1 920×1 080,選取含有四散、同方向加速跑、群毆和突然聚集四類異常行為,以及其他正常行為,時長約106 s(共2 649幀)的視頻集作為實驗數(shù)據(jù),每類行為視頻時長約20 s,含有500幀左右的視頻圖像,并將五類行為數(shù)據(jù)集按照2:1的比例隨機(jī)分為訓(xùn)練樣本集和測試樣本集。
在計算特征量的過程中,噪聲干擾會導(dǎo)致個別幀的某些特征值出現(xiàn)跳變,進(jìn)而造成行為誤判,因此從四散、同方向加速跑、群毆、突然聚集,以及正常這五類行為的訓(xùn)練樣本集選取不低于100幀視頻圖像進(jìn)行計算,結(jié)合相鄰幀的信息補(bǔ)償,對每類行為的視頻幀提取前文所提到的五個特征值,然后再求取每個特征的平均值,更有效地提取每個特征量,從而提高行為識別的準(zhǔn)確性。表1所示為求取平均值后的樣本數(shù)據(jù)。
表1 特征量樣本數(shù)據(jù)表Table 1 Sample data table of characteristic quantities
對表1進(jìn)行橫向分析,可得到如下結(jié)論。
(1)就四散行為而言,除人數(shù)特征量外其他四個特征量的值都較大,這是因為當(dāng)出現(xiàn)四散行為時,人們朝著不同方向跑開,人與人之間的距離拉大,且運(yùn)動強(qiáng)度增大。
(2)對于群毆行為,幀平均加速度和矩形框的距離勢能這兩個特征值沒有明顯增大,顯然監(jiān)控攝像頭近大遠(yuǎn)小的透視效應(yīng),導(dǎo)致無法明確界定它和正常行為,但其方向混亂熵和幀間混亂程度這兩個特征量較大。
(3)同方向加速跑行為最明顯的不同之處在于其人群趨于同向運(yùn)動,因而方向混亂熵的值較小。
(4)至于突聚行為,與四散行為相似,方向混亂熵、幀間混亂程度都較大,但人與人之間的距離不斷縮小,則矩形框間的距離勢能也相應(yīng)較小。
對表1進(jìn)行縱向分析,可得到如下結(jié)論。
(1) 四散和突然聚集這兩類行為具有明顯的相似性,唯一的不同在于人與人之間距離的變化情況,因而可以根據(jù)矩形框間的距離勢能來加以區(qū)分,前者的距離勢能值遠(yuǎn)遠(yuǎn)大于其他四類行為,后者則相反,比其他行為的值要小得多。
(2) 就幀平均加速度這一特征值而言,群毆行為的數(shù)值要比其他三類異常行為略小,這是因為攝像頭的透視效應(yīng)會造成距離攝像頭較遠(yuǎn)的人群目標(biāo)在單位時間內(nèi)位移變化不明顯,從而使得幀平均加速度與正常行為較為接近。
(3) 從方向混亂熵來看,正常行為與同方向加速跑行為的這一特征值略小于其他行為,是由于其他三類異常行為在發(fā)生時會出現(xiàn)人群混亂情況,運(yùn)動方向不一致,而同向加速跑是人群朝著同一方向逃散。
(4) 四種人群異常行為的幀間混亂程度均較大。它是由方向級別變化和速度變化值共同決定的,四散行為的人群運(yùn)動方向混亂且速度變大,所以幀間混亂程度略大。而突聚行為雖然幀平均加速度變化不大,但運(yùn)動方向較為混亂;同方向加速跑行為中方向一致,但加速度變化較大,因而它們的幀間混亂程度較小。
(5) 對于人數(shù)來說,正常情況下正常與異常行為的人數(shù)應(yīng)該一致,但實際應(yīng)用中攝像頭是固定的,難免會出現(xiàn)運(yùn)動目標(biāo)進(jìn)入監(jiān)控視角的盲區(qū)或者剛好出現(xiàn)在攝像頭的拍攝范圍內(nèi),如果僅憑人數(shù)發(fā)生變化就判定異常過于武斷。本文是研究人群異常行為,不考慮單個目標(biāo)的異常行為,故設(shè)定8人以上為人群。當(dāng)目標(biāo)人數(shù)超過8人時,通過對其他四個特征量的計算來進(jìn)一步判定行為類別。
圖1所示為不同行為的同一特征量的數(shù)值對比,直觀反映了五個特征量在描述不同人群行為時具有一定的差異性,從而驗證了所提取特征的有效性。
一般情況下所獲取的原始數(shù)據(jù)存在一些冗余數(shù)據(jù)或是數(shù)據(jù)缺失等情況,需要在精簡信息的同時準(zhǔn)確而快速地分類。粗糙集數(shù)據(jù)處理步驟如圖2所示。
將訓(xùn)練集中提取出的五個特征值組成粗糙集的初始信息表,如表2所示。鑒于樣本數(shù)量較多,僅顯示其中一部分?jǐn)?shù)據(jù)。
圖1 不同人群行為的特征量對比示意圖Fig.1 Comparative schematic diagram of the characteristics of the behavior of different groups of people
由于提取出的特征量均是連續(xù)型數(shù)值,而在粗糙集理論中信息表的屬性值必須為離散型,且為了所提煉出更為精簡的決策規(guī)則,還需將離散的屬性值抽象到更高層次,因此在進(jìn)行粗糙集分類訓(xùn)練前需要先作離散化處理。連續(xù)屬性離散化可歸納為利用斷點(diǎn)集尋找盡可能少且保持信息系統(tǒng)原貌的最優(yōu)解,以減少復(fù)雜性,使得生成適應(yīng)性更好的決策規(guī)則。通過去除冗余斷點(diǎn),簡化決策表,提高決策表的分類能力。具體步驟為:首先計算信息表中各條件屬性的重要性并由小至大依次排序,而后計算對每個連續(xù)屬性進(jìn)行離散化的斷點(diǎn),組成一個候選斷點(diǎn)集B并初始化;再將決策表中與屬性ai的斷點(diǎn)cj相鄰的兩個屬性值中較小的改為較大值,如果并未引起決策表的沖突,則令B=B/Cj,并更新決策表,反之則不更新;對該屬性的每個斷點(diǎn)執(zhí)行完再處理下一屬性,直至輸出最終的斷點(diǎn)集B。獲取的斷點(diǎn)情況如表3所示。
圖2 粗糙集數(shù)據(jù)處理流程Fig.2 Rough set data processing flow
表3 各屬性的斷點(diǎn)選取情況表Table 3 Breakpoint selection of each attribute
對決策表進(jìn)行約簡的目的在于剔除冗余的屬性或者屬性值,在保證不影響決策表整體效果的前提下,尋找決策表中可區(qū)分屬性的最小子集以及每條規(guī)則中屬性的最小組合。在決策表的信息約簡中,大多數(shù)方法是通過重要度函數(shù)的定義來作為啟發(fā)式信息,在核屬性的基礎(chǔ)上逐步增加必要屬性,直至獲得相對簡潔的決策規(guī)則為止[17]。采用的是貪心算法,以獲取的核屬性為基礎(chǔ),根據(jù)粒關(guān)系包含度矩陣添加非核屬性進(jìn)行約簡,再剔除屬性值相同的對象,從而獲取相應(yīng)的決策規(guī)則[18]。該方法利用屬性重要度進(jìn)行約簡,降低了計算復(fù)雜度,一定程度上也提高了處理效率。
表4 高校操場監(jiān)控視頻的部分決策規(guī)則表Table 4 Part of the decision-making rules for the surveillance video of college playgrounds
同一行為在不同場景中可能具有不同意義,例如同方加速行為發(fā)生在天安門廣場前會被認(rèn)為是異常行為,而在馬拉松比賽中屬于正常行為,因此需要針對場景的不同,定義正常行為和異常行為。將四散、群毆、突聚,以及同方向加速跑這四類以外的行為定義為正常。識別視頻中的人群異常行為,需要以人群行為建模為基礎(chǔ),本文采用粗糙集處理后的決策規(guī)則作為模板對包括正常行為在內(nèi)的五種人群行為進(jìn)行訓(xùn)練學(xué)習(xí)。具體流程如圖3所示。
圖3 本文算法流程圖Fig.3 Flow chart of algorithm in this paper
算法實現(xiàn)的具體步驟描述如下:
(1)將視頻分為樣本集和測試集并截成幀圖像,采用隨機(jī)共振級聯(lián)雙邊濾波的方法對圖像進(jìn)行預(yù)處理,減少噪聲等環(huán)境因素的影響。
(2)利用改進(jìn)的GMMs算法提取圖像中的運(yùn)動目標(biāo),得到前景圖像。
(3)對前景圖像進(jìn)一步作形態(tài)學(xué)處理,去除干擾像素并填補(bǔ)孔洞。
(5)離散化處理所提取的特征值并構(gòu)成粗糙集系統(tǒng)的初始信息表,而后通過約簡去除冗余屬性和屬性值,獲取簡潔的決策規(guī)則。
(6)返回步驟(1),跳過步驟(5),通過訓(xùn)練好的決策規(guī)則對測試集中的正常人群行為、四散、群毆和同方向加速跑和突然聚集行為進(jìn)行區(qū)分。
(7)對出現(xiàn)的異常行為立刻預(yù)警。
在MATLAB R2017a的實驗環(huán)境下,首先提取人群行為特征,而后對五類人群行為進(jìn)行建模,并將特征數(shù)據(jù)作為粗糙集系統(tǒng)的輸入,通過數(shù)據(jù)處理和屬性約簡獲取決策規(guī)則,最后對實驗視頻集中的測試樣本集進(jìn)行識別。并以覆蓋率(C)、準(zhǔn)確率(A)兩個指標(biāo)對人群異常行為的識別能力進(jìn)行評價。覆蓋率和準(zhǔn)確率計算公式為
(7)
(8)
式中:S1是測試集中能夠被決策規(guī)則識別的樣本數(shù);S2是測試集中被正確識別的樣本數(shù);S3表示被測試的樣本總數(shù)。
隨機(jī)選取五類行為測試樣本集進(jìn)行識別測試,其中:正常行為樣本幀數(shù)為80,四散行為樣本幀數(shù)為125,同方向加速跑行為樣本幀數(shù)為98,群毆行為樣本幀數(shù)為85,突聚行為樣本幀數(shù)為100。表5所示為本文所提算法對五類人群行為的識別結(jié)果。由表5可知,該算法對包括正常行為在內(nèi)的五種人群行為具有較高的識別能力,群毆和突然聚集行為的識別覆蓋率和準(zhǔn)確率相對其他三類行為而言較低,因為攝像頭視角中兩者相似,某些時刻的特征值相差不大,導(dǎo)致在利用決策規(guī)則對樣本分類時,容易出現(xiàn)誤判。
表5 人群行為識別的實驗數(shù)據(jù)結(jié)果Table 5 Experimental data results of crowd behavior recognition
目前應(yīng)用比較廣泛分類算法有反向(back pro-pagation,BP)神經(jīng)網(wǎng)絡(luò)[20]、K近鄰算法[21]和隨機(jī)森林法[22]等。BP神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),主要優(yōu)點(diǎn)是具有很強(qiáng)的非線性映射能力和柔性的網(wǎng)絡(luò)結(jié)構(gòu),但存在學(xué)習(xí)速度慢、網(wǎng)絡(luò)層數(shù)和神經(jīng)元個數(shù)選擇困難等問題。K近鄰算法是在特征空間中,若一個樣本附近的K個最近(即特征空間中最鄰近)樣本的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別,主要優(yōu)點(diǎn)是準(zhǔn)確性高,對異常值和噪聲有較高的容忍度,缺點(diǎn)是計算量較大。隨機(jī)森林法是利用多個決策樹對樣本數(shù)據(jù)進(jìn)行訓(xùn)練并預(yù)測的一種分類器,其輸出類別是由個別樹輸出類別的眾數(shù)而定,主要優(yōu)點(diǎn)是準(zhǔn)確度較高、靈活簡單等優(yōu)點(diǎn),其主要缺點(diǎn)是當(dāng)決策樹個數(shù)很多時,訓(xùn)練需要的空間和時間會比較大。
采用BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林法和K近鄰算法,以及本文所提算法對上述實驗集數(shù)據(jù)進(jìn)行處理,并進(jìn)行對比分析,結(jié)果如圖4、圖5所示??芍簾o論是覆蓋率和準(zhǔn)確率,五類人群行為隨著樣本數(shù)增加,覆蓋率和準(zhǔn)確率也隨之增大;在相同的樣本數(shù)情況下,除突然聚集行為外,對于其他四類人群行為,本文所提算法的覆蓋率和準(zhǔn)確率均高于BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林法和K近鄰算法,即:與BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林法和K近鄰算法相比,本文所提算法的識別效果更優(yōu)。
圖4 不同分類方法識別覆蓋率結(jié)果對比Fig.4 Comparison of recognition coverage results of different classification methods
為了比較不同分類算法的運(yùn)行速度和效率,以本次實驗測試樣本集數(shù)據(jù)為基礎(chǔ),在MATLAB R2017a的實驗環(huán)境下,選取五類行為的單個樣本幀數(shù)據(jù)進(jìn)行測試,并比較BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林法和K近鄰算法,以及本文所提算法的所耗時間,結(jié)果表明:對于相同樣本幀數(shù)據(jù),BP神經(jīng)網(wǎng)絡(luò)和K近鄰算法所耗時間較大,而本文所提算法和隨機(jī)森林法所耗時間較小,與其他分類算法比較,本文所提算法具有較好的識別速度和效率。
圖5 不同分類方法識別準(zhǔn)確率結(jié)果對比Fig.5 Comparison of recognition accuracy results of different classification methods
需要指出的是:本文所提算法雖然計算量小,空間復(fù)雜度低,識別速度較快,對訓(xùn)練樣本數(shù)量的依賴度也較低,但它是以人工設(shè)計特征為基礎(chǔ),特征提取的效果會對識別結(jié)果產(chǎn)生直接影響,往往會導(dǎo)致無法準(zhǔn)確區(qū)分特征值差異不明顯的異常行為,例如突然聚集和群毆行為,因而需要尋求能夠適應(yīng)場景動態(tài)變化的人群運(yùn)動特征。
為減少人工主觀因素的影響,以粗糙集分類理論為基礎(chǔ),利用粗糙集分類不依賴先驗信息的獨(dú)特優(yōu)勢,設(shè)計并實現(xiàn)了一種基于粗糙集的多類人群異常行為識別算法。該算法提取能夠表征人群目標(biāo)運(yùn)動信息的人數(shù)、幀平均加速度、矩形框距離勢能、方向混亂熵,以及幀間混亂程度五個特征量,再根據(jù)粗糙集決策規(guī)則對正常、四散、同向加速、突然聚集以及群毆五類人群行為進(jìn)行分類,并以識別的覆蓋率和準(zhǔn)確率為衡量指標(biāo),比較不同分類方法對相同實驗數(shù)據(jù)的識別效果,進(jìn)一步驗證了通過粗糙集對提取的特征進(jìn)行分析和約簡,能夠減少冗余特征對行為分類的干擾,有助于提升識別精度。該算法具有計算量小,空間復(fù)雜度低,識別速度較快,對訓(xùn)練樣本數(shù)量的依賴度較低,不足之處在于場景適應(yīng)性不強(qiáng),僅適用于中密度人群場景中的異常行為識別,對于因人群密度過高而產(chǎn)生嚴(yán)重遮擋的情況存在一定的局限性。