劉春玉 朱美玲 祝明慧
摘? 要:老年人異常行為的檢測,是幫助老年人健康生活、安全生活的有效工具。然而,由于人類行為的不確定性,是否存在異?,F(xiàn)象根據(jù)環(huán)境的不同而改變等一系列因素,為老年人異常行為檢測提出重要挑戰(zhàn)。本文針對異常行為檢測的種類、方式方法,提出一種基于深度學(xué)習(xí)的老人異常行為檢測系統(tǒng)優(yōu)化策略,以期為相關(guān)領(lǐng)域的發(fā)展提供有利參考。
關(guān)鍵詞:深度學(xué)習(xí)? 老人? 異常行為
1? 異常行為檢測概述
1.1 異常行為概述
異常行為并沒有一個嚴(yán)格意義上的定義,其異常屬性取決于應(yīng)用的場景,同時也會受到檢測人員主觀思維的影響,繼而造成相同行為在差異性的場景下具有著不同的定義。例如,一個人如果在臥室的床上進(jìn)行跳高,顯然是一種異常行為,但是如果將這個人所處場景換成體育活動中心,那么他的行為將被轉(zhuǎn)化為正常行為;再如,在火災(zāi)發(fā)生現(xiàn)場,人群的奔跑、逃離現(xiàn)象顯然屬于一種異常行為,那么將這些人的場景換成戶外體育場,那么他們的行為同樣會被轉(zhuǎn)化為正常行為。由此可見,根據(jù)特定動作對異常行為作為具體定義顯然是錯誤的、然而,充分結(jié)合異常行為的低頻率屬性和可疑性屬性,綜合實際被檢測人員現(xiàn)場場景,那么我們便能夠?qū)Ξ惓P袨樽龀鼍唧w定義。因為異常行為存在大量的不可確定因素,所以相同算法在不同場景中互相運(yùn)用是不切實際的方案,為將此類不確定因素降至最低,那么就需要針對每一種問題進(jìn)行具體化、針對性的分析,對應(yīng)用場景進(jìn)行合理確定,一場景為出發(fā)點判斷分析是否存在異常行為,或者異常行為的程度和種類。
1.2 異常行為的種類
單個老年人的異常行為是只需要一名老人參見其中的異常行為,包括跌倒、抽搐、越界等等;交互行為異常普遍回的是兩個人發(fā)生肢體碰撞產(chǎn)生的異常行為,包括吵架、打架等;群體性的異常行為指的是多名個體所構(gòu)建的一個具有緊密聯(lián)系的、整體性的異常行為,如由于騷亂而引起的大規(guī)模人群奔跑逃離等。本文主要研究個人化的老年人異常行為和交互異常行為。
1.3 異常行為檢測方法
在現(xiàn)階段的異常行為檢測方法方面,主要可以大致分為兩種類型。其一,是以視覺特征為基礎(chǔ)的異常行為檢測;其二,是以軌跡為基礎(chǔ)的異常行為檢測技術(shù)。針對物體軌跡異常行為檢測技術(shù),大量研究人員將軌跡的運(yùn)行速度、具體位置以及時空曲率作為主要研究元素,通過多次反復(fù)研究,最終提出基于業(yè)務(wù)交互網(wǎng)絡(luò)(DBN.Business Delivery Networking)的異常行為檢測方案。北京大學(xué)楊正源教授提出以軌跡與多實例學(xué)習(xí)為基礎(chǔ)的,局部性異常行為檢測方案;馬金元、趙光道等人提出了以三次樣條曲線對軌跡目標(biāo)進(jìn)行充分展示的異常行為檢測方式等。然而,上述檢測方式均存在一個共同的問題,就是在目標(biāo)被遮擋的條件下,跟蹤性能將會受到嚴(yán)重影響,造成異常檢測失去原有功效。
2? 以深度學(xué)習(xí)為基礎(chǔ)的老年人異常行為檢測技術(shù)
深度學(xué)習(xí)是現(xiàn)階段被廣泛應(yīng)用到智能識別領(lǐng)域的理論內(nèi)容,但是針對特定場景異常行為檢測的深度學(xué)習(xí)應(yīng)用相對較少,導(dǎo)致以深度學(xué)習(xí)為基礎(chǔ)異常行為的檢測方式難以得到更加廣泛的推廣。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)在分割、檢驗、分類等的過程中,針對既定的靜止圖像,進(jìn)行有效分析處理,在視覺任務(wù)的表現(xiàn)出極其優(yōu)越的性能。然而,對于與動態(tài)化視頻分析處理相關(guān)的任務(wù),應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)則顯得有些力不從心,難以有效捕捉視頻當(dāng)中與動態(tài)化的信息數(shù)據(jù)。由此可見,我們需要將額外的輔助性信息應(yīng)用進(jìn)來,在卷積神經(jīng)網(wǎng)絡(luò)現(xiàn)有技術(shù)的基礎(chǔ)上,增設(shè)一個時間維度,使現(xiàn)有二維模式轉(zhuǎn)化為三維模式,繼而使系統(tǒng)具備捕捉運(yùn)動物體的能力。
在深度學(xué)習(xí)異常行為檢測領(lǐng)域中,現(xiàn)階段較為常見的方式是應(yīng)用雙流卷積神經(jīng)網(wǎng)絡(luò)(Dobble Convolutional Neural Networks)。Convol Putional、Ben Well等人提出一種基于雙路的神經(jīng)網(wǎng)絡(luò),將其用來對時間信息和空間信息進(jìn)行雙抽補(bǔ)貨。這種方式的主要特點在于應(yīng)用兩種模態(tài)的基本屬性,應(yīng)用RGB和光流幀,將RGB作為供給外形數(shù)據(jù)信息的主要載體,充分引入光流,繼而有效捕捉行為時間以及老年人的運(yùn)動特征。與此同時,在該研究實現(xiàn)后,也陸續(xù)出現(xiàn)了各種類型的,以雙流網(wǎng)絡(luò)為基礎(chǔ)的變體實驗,較大幅度的推動了動作識別技術(shù)的功能性。但是,上述方式的缺點在于需要對光流進(jìn)行預(yù)先提取,并且對于規(guī)模相對較大的數(shù)據(jù)處理工作來說,是一個消耗時間相對較多的過程,難以符合端到端學(xué)習(xí)的基本要求。
為有效解決雙流網(wǎng)絡(luò)技術(shù)中存在的各種問題,3D卷積神經(jīng)網(wǎng)隨之走進(jìn)研究人員的事業(yè),在行為識別任務(wù)當(dāng)中獲取重大突破。 Christian Connor、 Victor Hammer、Finster Patrick 等人最早提出應(yīng)用3D卷積神經(jīng)網(wǎng)絡(luò)技術(shù),在視頻當(dāng)中提取相關(guān)信息對人體動作進(jìn)行識別的方案,并將該方案應(yīng)用到實際的老年人異常行為檢測系統(tǒng)中。Matthew? Joshua 、Alexander William、Tristan Oliver等人提出C3D網(wǎng)絡(luò),針對時間維度,同時對運(yùn)動、外觀實施建模,并且在每一個視頻分析的過程中的應(yīng)用有效超過了二維卷積網(wǎng)絡(luò)的應(yīng)用效果。
3? 基于深度學(xué)習(xí)的老人異常行為檢測系統(tǒng)改進(jìn)方案
在老年人行為識別的過程中,老年人屬于一種非剛性的主體,其行為表現(xiàn)具備較高的開放性和靈活性特點,這也對智能化檢測提出巨大挑戰(zhàn)。鑒于此,怎樣提取能夠判斷老年人行為特點,是相關(guān)研究領(lǐng)域的難點和重點,和行為外形特點進(jìn)行對比,因為時間上運(yùn)動特征普遍難以較高水平的實現(xiàn)建模,容易造成部分運(yùn)動信息丟失的問題。因此,在常規(guī)性的時間順序結(jié)構(gòu)當(dāng)中,我們普遍在網(wǎng)絡(luò)結(jié)構(gòu)當(dāng)中應(yīng)用一個相對固定的時間順序生層次3D卷積網(wǎng)絡(luò),完成老年人行為提取任務(wù)。該方式與多時間跨度的時間順序信息契合度較低,繼而造成時間順序信息難以得到高水平、全方位的利用,阻礙異常行為識別的準(zhǔn)確性。
4? 結(jié)語
綜上所述,將深度學(xué)習(xí)理論應(yīng)用到老年人異常行為檢測系統(tǒng)當(dāng)中,優(yōu)化深度網(wǎng)絡(luò)模型,在3D卷積網(wǎng)絡(luò)的基礎(chǔ)上,引入可變性的時間順序深度卷積,充分結(jié)合深度可分離卷基層網(wǎng)絡(luò),能夠有效優(yōu)化模型對時間順序數(shù)據(jù)信息的應(yīng)用質(zhì)量和應(yīng)用效率,是一種改善老年人異常行為檢測系統(tǒng)工作能力的有效方式。
參考文獻(xiàn)
[1] 向玉開,孫勝利,雷林建,等.基于計算機(jī)視覺的人體異常行為識別綜述[J].紅外,2018,39(11):1-6,33.
[2] 吳沛佶,梅雪,何毅,等.基于深度網(wǎng)絡(luò)模型的視頻序列中異常行為的檢測方法[J].激光與光電子學(xué)進(jìn)展,2019,56(13):134-140.
[3] 廖鵬,劉宸銘,蘇航,等.基于深度學(xué)習(xí)的學(xué)生課堂異常行為檢測與分析系統(tǒng)[J].電子世界,2018(8):97-98.
[4] 楊銳,羅兵,郝葉林,等.一種基于深度學(xué)習(xí)的異常行為識別方法[J].五邑大學(xué)學(xué)報:自然科學(xué)版,2018,32(2):23-30.