国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)模型的非法流動(dòng)攤販檢測方法研究

2019-07-09 11:43陳晉音鄭海斌
關(guān)鍵詞:攤販攤位流動(dòng)

陳晉音,王 楨,鄭海斌

(浙江工業(yè)大學(xué) 信息工程學(xué)院,杭州 310000)

1 引 言

非法流動(dòng)攤販,是指沒有合法的經(jīng)營許可證、沒有固定的經(jīng)營場所,在人流密集的公共場所擺攤設(shè)點(diǎn),擅自進(jìn)行貨物交易行為的人員[1].流動(dòng)攤販的存在,有一定的積極作用,但也存在極大的弊端.其好處在于,滿足了城市居民的日常需求,為居民生活提供了便利;另一方面,居民對(duì)流動(dòng)攤販的需求,為外來務(wù)工人員以及失業(yè)人員提供了一定的就業(yè)機(jī)會(huì).而其弊端在于,流動(dòng)攤販往往聚集在城市中人流量較大的路段,嚴(yán)重影響了交通秩序和市容市貌;其次,流通攤販?zhǔn)圪u的食物、商品基本是未通過衛(wèi)生與質(zhì)量監(jiān)督部門的檢查,存在著極大的安全隱患問題;此外,流動(dòng)攤販的經(jīng)營活動(dòng)產(chǎn)生的噪音、垃圾污染會(huì)直接影響周邊的環(huán)境與居民日常生活,擾亂了社會(huì)秩序[2].因此,城市管理部門需要對(duì)流動(dòng)攤販進(jìn)行監(jiān)控、管理.

非法流動(dòng)攤販管理的難點(diǎn),在于其流動(dòng)性.城市管理部門執(zhí)法人員無法確定流動(dòng)攤販經(jīng)營的時(shí)間、地點(diǎn),需要不斷的進(jìn)行人工巡視,因此存在監(jiān)管難度大、監(jiān)管盲區(qū)多、管理成本高等問題.

本文結(jié)合注意力機(jī)制提出了一種基于深度學(xué)習(xí)模型的非法流動(dòng)攤販檢測方法.該方法首先對(duì)視頻圖像數(shù)據(jù)進(jìn)行人工標(biāo)注建立訓(xùn)練數(shù)據(jù)集,然后訓(xùn)練并使用改進(jìn)的Faster R-CNN Inception Resnet-v2 attention目標(biāo)檢測模型(FRIRAM),對(duì)非法流動(dòng)攤位與行人進(jìn)行檢測,從監(jiān)控圖像中獲得攤位與行人的位置信息.最后,基于圖像處理技術(shù)通過幀間攤販對(duì)比對(duì)得到的目標(biāo)位置信息進(jìn)行處理,確定非法流動(dòng)攤販,并使用適當(dāng)數(shù)據(jù)處理方式進(jìn)行取證,進(jìn)一步通知管理人員進(jìn)行定點(diǎn)監(jiān)控、管理.

2 相關(guān)工作

在我國,目前的城市非法流動(dòng)攤販管理工作中,以人工形式的城管人員現(xiàn)場巡視管理為主導(dǎo)的管理制度的弊端在于[3]:非法流動(dòng)攤販的反復(fù)性強(qiáng),治理與管理效率低,“城管進(jìn),攤販逃;城管撤,攤販進(jìn)”;同時(shí),如今社會(huì)輿論[4]往往偏向于流動(dòng)攤販經(jīng)營者,攤販與城管若發(fā)生矛盾沖突,網(wǎng)友總是強(qiáng)調(diào)攤販的弱勢群體身份,一味指責(zé)城管部門的粗暴執(zhí)法行為,使工作人員的執(zhí)法處于被動(dòng)與孤立的地位.造成這一治理困境的主要原因在于,無法及時(shí)有效的對(duì)流動(dòng)攤販們的非法經(jīng)營行為進(jìn)行取證與預(yù)警.

作為計(jì)算機(jī)視覺領(lǐng)域的一個(gè)主要的研究方向,圖像目標(biāo)檢測成為數(shù)字取證的一種關(guān)鍵技術(shù).經(jīng)典的目標(biāo)檢測方法,指未使用神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法.此類方法種類較多,如背景差分法[5],混合高斯模型法[6].Shao等人[7]提出了一種基于視頻序列的跟蹤檢測方法用于識(shí)別監(jiān)控中的車輛.He等人[8]提出了一種結(jié)合運(yùn)動(dòng)邊界和稀疏光流的運(yùn)動(dòng)目標(biāo)檢測方法,可以精確地檢測出完整的運(yùn)動(dòng)目標(biāo).

深度學(xué)習(xí)作為新興的機(jī)器學(xué)習(xí)研究領(lǐng)域,最早由多倫多大學(xué)的G.E.Hinton等人[9]提出.其特點(diǎn)在于,免去了傳統(tǒng)機(jī)器學(xué)習(xí)中的特征工程步驟,可以自主地從原始數(shù)據(jù)中獲取有用的特征信息.深度學(xué)習(xí)在計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理等領(lǐng)域均有廣泛的應(yīng)用前景.

隨著深度學(xué)習(xí)的進(jìn)一步研究,出現(xiàn)了使用深度學(xué)習(xí)進(jìn)行目標(biāo)檢測的技術(shù).R-CNN[10]方法將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)方法引入目標(biāo)檢測領(lǐng)域,大大提升了目標(biāo)檢測的效果.Girshick等人[11]針對(duì)R-CNN方法中存在的空間、時(shí)間冗余問題進(jìn)行改進(jìn),提出了Fast R-CNN方法,實(shí)現(xiàn)了大部分端到端的訓(xùn)練,加快了目標(biāo)檢測的運(yùn)行速度.Faster R-CNN[12]使用區(qū)域生成網(wǎng)絡(luò)(Region Proposal Network,PRN),相比于Fast R-CNN,擁有更快的速度.YOLO(You Only Look Once)目標(biāo)檢測模型[13]是一種端到端的神經(jīng)網(wǎng)絡(luò)模型,借鑒了GoogleNet[14]的分類網(wǎng)絡(luò)結(jié)構(gòu).SSD(Single Shot MultiBox Detector)方法[15]與YOLO方法類似,它借鑒了VGG16分類網(wǎng)絡(luò)并使用了非模塊化的端到端模型結(jié)構(gòu),能夠?qū)崿F(xiàn)統(tǒng)一訓(xùn)練,SSD模型能夠?qū)崿F(xiàn)比YOLO更快的處理速度.盡管深度模型具有非常好的目標(biāo)檢測效果,但是需要有盡可能豐富的訓(xùn)練數(shù)據(jù)集.

最近,注意力機(jī)制在深度學(xué)習(xí)中表現(xiàn)出先進(jìn)性能,能夠捕獲全局依賴性,尤其是處理順序決策任務(wù),例如,具有長短期記憶的時(shí)空注意力模型被用于人類行為識(shí)別.Xu等人[16]設(shè)計(jì)了處理視頻字幕的視覺注意力模型,可以密切關(guān)注對(duì)象的關(guān)鍵信息.Yang等人[17]提出了堆疊空間注意力模型,進(jìn)行文本生成和輿情預(yù)測.Bowman等人[18]提出自我關(guān)注的生成對(duì)抗性網(wǎng)絡(luò)進(jìn)行精細(xì)圖像的生成,其中利用注意力機(jī)制遍歷特征圖,專注于空間關(guān)鍵信息.

3 基于深度學(xué)習(xí)的非法流動(dòng)攤販檢測方法

3.1 主要框架

現(xiàn)有的基于視頻監(jiān)控的非法流動(dòng)攤販檢測和識(shí)別方法中,人工檢測方法的人工成本較高且監(jiān)控人員容易疲勞使得檢測效果較差.傳統(tǒng)的目標(biāo)識(shí)別方法,針對(duì)固定的攤位與物體特征進(jìn)行檢測,檢測準(zhǔn)確率低且誤檢率高,并需要人工對(duì)誤檢的數(shù)據(jù)進(jìn)行篩選.本文針對(duì)這一技術(shù)現(xiàn)狀提出了基于深度學(xué)習(xí)模型的非法流動(dòng)攤販檢測方法,該方法結(jié)合注意力機(jī)制和Inception Resnet-v2模型改進(jìn)Faster R-CNN,得到FRIRAM,對(duì)非法流動(dòng)攤位與行人進(jìn)行檢測.為了使模型具有識(shí)別能力,需要從網(wǎng)絡(luò)、監(jiān)控視頻中獲取大量的圖像數(shù)據(jù),并進(jìn)行人工標(biāo)注,構(gòu)成訓(xùn)練數(shù)據(jù)集,以對(duì)模型進(jìn)行訓(xùn)練.使用訓(xùn)練好的目標(biāo)檢測模型,可以從監(jiān)控圖像中獲得攤位與行人的位置信息.通過幀間攤販對(duì)比對(duì)得到的位置信息進(jìn)行處理,可以確定非法流動(dòng)攤販,并使用適當(dāng)?shù)臄?shù)據(jù)處理方式進(jìn)行取證、后臺(tái)預(yù)警.其具體的檢測流程如圖1所示.

圖1 非法流動(dòng)攤販檢測流程圖Fig.1 Flow chart of illegal floating vendor detection

3.2 基于FRIRAM的流動(dòng)攤販檢測模型

本文基于深度學(xué)習(xí)算法提出了改進(jìn)的目標(biāo)檢測模型FRIRAM,基于Faster R-CNN目標(biāo)檢測網(wǎng)絡(luò)加入Attention注意力機(jī)制并采用Inception Resnet-v2網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò),有效提高了模型的精度與計(jì)算速度.

本文所設(shè)計(jì)的目標(biāo)檢測模型進(jìn)行目標(biāo)檢測的主要步驟是:通過Inception Resnet-v2模型提取圖像特征,基于特征圖進(jìn)行候選區(qū)域的選擇與映射,加入注意力機(jī)制進(jìn)行各候選區(qū)域參數(shù)的計(jì)算與優(yōu)化,并得到各候選區(qū)域的特征向量,基于特征向量加入注意力機(jī)制計(jì)算相關(guān)系數(shù)進(jìn)行特征向量的篩選與剔除,最后基于得到的特征向量進(jìn)行目標(biāo)分類與邊界回歸以實(shí)現(xiàn)對(duì)目標(biāo)物體的檢測.具體檢測流程如圖2所示.

圖2 目標(biāo)檢測流程圖Fig.2 Flow chart of target detection

本文使用Inception Resnet-v2網(wǎng)絡(luò)作為特征提取器,網(wǎng)絡(luò)以inception 模塊為主體,其中的殘差連接可以動(dòng)態(tài)調(diào)整模型的復(fù)雜度,并在一定程度上解決了訓(xùn)練過程中的梯度爆炸與過擬合問題,增加網(wǎng)絡(luò)架構(gòu)的精確度.本文將原始圖像輸入Inception Resnet-v2網(wǎng)絡(luò),經(jīng)過一系列卷積、池化與殘差連接等操作后得到特征圖.

候選區(qū)域的選擇指從原始圖像中預(yù)先找出可能存在目標(biāo)的位置,也稱為感興趣區(qū)域(Region of Interest,RoI).本文使用區(qū)域生成網(wǎng)絡(luò)(Region Proposal Network,RPN),通過滑動(dòng)窗口的方式在特征圖上提取候選區(qū)域.

本文基于各候選區(qū)域增加注意力機(jī)制以對(duì)每個(gè)候選區(qū)域在同一特征圖下的不同深度通道進(jìn)行強(qiáng)化,其過程如圖3所示.對(duì)于通道深度l為的特征圖,對(duì)每一個(gè)候選區(qū)域進(jìn)行上采樣或下采樣操作以得到尺寸為64×64×l的統(tǒng)一候選區(qū)域.隨后引入尺寸為64×64×1的卷積核,以步長為1對(duì)各候選區(qū)域進(jìn)行卷積計(jì)算,得到尺寸為64×64×1的區(qū)域特征圖.將區(qū)域特征圖與候選區(qū)域每一層的對(duì)應(yīng)位置相乘求和并取均值以得到每一層的注意力權(quán)重,尺寸為1×l.最后將原始候選區(qū)域的每一層與對(duì)應(yīng)的注意力權(quán)重相乘實(shí)現(xiàn)候選區(qū)域不同通道深度的參數(shù)更新與強(qiáng)化.

圖3 候選區(qū)域注意力機(jī)制示意圖Fig.3 Flow chart of attention mechanism in region of interest

隨后通過在RPN網(wǎng)絡(luò)后增加RoI池化層將每個(gè)候選區(qū)域映射為單個(gè)固定尺度的特征向量.

本文基于得到的尺度固定的特征向量增加注意力機(jī)制以實(shí)現(xiàn)對(duì)特征向量的篩選與剔除,降低算法復(fù)雜度,其過程如圖4所示.以1條特征向量為例,對(duì)于各固定尺寸為1×N的特征向量,引入尺寸為1×1的卷積核,以步長為1對(duì)各特征向量進(jìn)行卷積計(jì)算,得到尺寸為1×N的目標(biāo)向量.隨后對(duì)目標(biāo)向量進(jìn)行轉(zhuǎn)置操作并與特征向量相乘,計(jì)算得到尺寸為1×1的注意力權(quán)重.對(duì)各注意力權(quán)重使用歸一化指數(shù)函數(shù)(softmax)計(jì)算得到相對(duì)應(yīng)的注意力值{βi′,i∈[1,n]}.將各特征向量對(duì)應(yīng)的注意力值進(jìn)行降序排序得到{βi,i∈[1,n]},選取前k個(gè){βi}值對(duì)應(yīng)的特征向量進(jìn)行后續(xù)計(jì)算與操作.k值的選取由原始圖像尺寸,特征向量維度等因素決定.

圖4 特征向量注意力機(jī)制示意圖Fig.4 Flow chart of attention mechanism in feature vector

最后,采用奇異值分解(SVD)將上一步選取得到的特征向量經(jīng)過各自的全連接層計(jì)算分別得到兩個(gè)輸出向量用于分類與回歸操作.其中,目標(biāo)分類以輸出向量作為輸入,使用支持向量機(jī)(SVM)對(duì)目標(biāo)進(jìn)行分類,實(shí)現(xiàn)目標(biāo)識(shí)別.邊界回歸通過輸出向量對(duì)候選區(qū)域邊框進(jìn)行回歸、修正,以獲取與目標(biāo)圖像位置最為吻合的邊框,實(shí)現(xiàn)目標(biāo)物體的位置信息提取.

根據(jù)對(duì)實(shí)際監(jiān)控視頻的觀察,流動(dòng)攤販按圖像特征來區(qū)分,大致可以分為三種:地?cái)倲偽?、固定攤位與車載攤位.地?cái)倲偽?,指直接將貨物擺放在地面上,或在地面上墊布、墊紙后再擺放貨物的攤位,常見的地?cái)倲偽挥惺卟藬?、水果攤等;固定攤位,指帶有桌子、架子或頂棚的攤位,常常帶有較大的招牌、海報(bào),常見的固定攤位有燒烤攤、小吃攤等;車載攤位,指利用機(jī)動(dòng)車、電動(dòng)三輪車運(yùn)載貨物,并直接在街頭販賣的攤位,常見的有車載水果攤、車載小吃攤等.在實(shí)際場景中,流動(dòng)攤位具有種類多樣、特征復(fù)雜、易產(chǎn)生變化等特點(diǎn),對(duì)其進(jìn)行檢測較為困難.本文將流動(dòng)攤位大體上分為三類,實(shí)際上這三類攤位之間存在一定的共性,比如一個(gè)帶招牌的三輪車車載水果攤位,既可能被識(shí)別為固定攤位、也可能被識(shí)別成車載攤位.對(duì)此,本方法在數(shù)據(jù)處理時(shí),將不區(qū)分三類攤位,均將其看成同一類攤位來處理,如圖5所示.

圖5 常見的幾類流動(dòng)攤位Fig.5 Common types of floating vendor

在實(shí)際處理過程中,發(fā)現(xiàn)易混淆的物體有4種,分別為三輪車、垃圾桶、電瓶車、自行車.其中,垃圾桶容易被識(shí)別為固定攤位,三輪車、電瓶車、自行車容易被識(shí)別為車載攤位.為了提高模型的辨識(shí)能力,降低誤判率,本文在數(shù)據(jù)集的構(gòu)建過程中,為這幾類容易產(chǎn)生誤判的目標(biāo)進(jìn)行標(biāo)記.

3.3 流動(dòng)攤販判別方法

由自制數(shù)據(jù)集進(jìn)行訓(xùn)練的基于FRIRAM的目標(biāo)檢測模型可檢測出監(jiān)控圖像中的流動(dòng)攤販與行人并確定其位置信息.基于幀間攤販對(duì)比與圖像處理技術(shù)確定非法流動(dòng)攤販并進(jìn)行取證報(bào)警.

3.3.1 幀間攤位對(duì)比

通過使用改進(jìn)的FRIRAM模型,可以從單幀圖像中獲取到所有流動(dòng)攤販與行人的信息,但是無法獲取到前后幀之間攤販的關(guān)聯(lián)信息,需要使用幀間攤位對(duì)比的方法,對(duì)具體的流動(dòng)攤販進(jìn)行識(shí)別.幀間攤位對(duì)比可以有兩種方法:攤位特征比對(duì)和攤位位置比對(duì).

攤位特征比對(duì),指使用一定的特征提取網(wǎng)絡(luò),提取每個(gè)攤位的特征信息.這里的特征提取網(wǎng)絡(luò)可以直接使用Faster R-CNN網(wǎng)絡(luò)結(jié)構(gòu)中已訓(xùn)練好的特征提取部分.將提取到的特征圖轉(zhuǎn)化為一維向量,作為攤位特征信息.對(duì)每一幀中檢測出的所有攤位,進(jìn)行特征提取,將第n+1幀的所有攤位,與第n幀所有攤位進(jìn)行特征比對(duì),使用歐氏距離度量攤位特征的相似性.歐氏距離計(jì)算定義為公式(1):

(1)

其中,F(xiàn)(n,i,x)指第n幀圖像中,第i個(gè)攤位的第x個(gè)特征的值.人為給定距離閾值TL,若L≤TL,則認(rèn)為兩攤位是同一攤位;若L>TL,則認(rèn)為是不同的兩攤位.該方法使用了攤位圖像的信息特征,來判斷前后幀中出現(xiàn)的兩攤位是否是同一攤位,其優(yōu)點(diǎn)在于:1)適用范圍廣泛,在前后幀攤位位置發(fā)生變化的情況下,也能進(jìn)行正確判斷;2)對(duì)于外觀不同的攤位,識(shí)別準(zhǔn)確率高.但是在實(shí)際應(yīng)用中,我們發(fā)現(xiàn)其缺陷在于:1)運(yùn)算速度慢,需要使用額外的深度神經(jīng)網(wǎng)絡(luò)對(duì)每一攤位進(jìn)行特征提取,需要耗費(fèi)大量的時(shí)間;2)對(duì)于外觀相似的攤位容易發(fā)生誤判.

攤位位置比對(duì),指使用攤位的位置信息,通過前后幀攤位位置坐標(biāo)、覆蓋情況,來判斷是不是同一輛車.該方法參考了RPN網(wǎng)絡(luò)訓(xùn)練過程中使用的GTB(ground true box)方法.首先判斷前后兩幀中,是否存在位置重疊的攤位.假設(shè)A、B兩攤位存在重疊,兩攤位所在矩形區(qū)域面積分別為SA、SB,其重疊面積SC=SA∩SB.對(duì)于存在位置重疊情況的攤位,計(jì)算兩攤位矩形區(qū)域的交集面積,即重疊面積SC,然后計(jì)算兩矩形區(qū)域的并集面積SD=SA∪SB=SA+SB-SC.相似度定義為公式(2):

(2)

IOU的取值在0到1之間,數(shù)值越高,代表兩攤位的重合度越高.給定閾值TIOU,若IOU≥TIOU,則認(rèn)為是同一攤位;若IOU

綜合考慮實(shí)際的非法流動(dòng)攤販檢測應(yīng)用場景,當(dāng)流動(dòng)攤販存在經(jīng)營行為時(shí),攤位往往是靜止不動(dòng)的,此時(shí)需要城市管理部門進(jìn)行相應(yīng)的處理;而當(dāng)流動(dòng)攤位在道路中運(yùn)動(dòng)時(shí),并沒有進(jìn)行經(jīng)營行為,此時(shí)城市管理部門并不需要對(duì)其進(jìn)行處理.因此,流動(dòng)攤販檢測只需檢測靜止的攤位,本文使用攤位位置比對(duì)方法即可得到較好的檢測效果.

3.3.2 流動(dòng)攤販處理及報(bào)警取證

流動(dòng)攤販處理方式由不同的報(bào)警取證方法而定,報(bào)警取證可以有三種方法:流動(dòng)攤位預(yù)警、流動(dòng)攤位取證記錄、流動(dòng)攤販取證記錄.

第一種,流動(dòng)攤位預(yù)警,指僅使用流動(dòng)攤位的信息,對(duì)其進(jìn)行過濾,篩除可能存在的誤判情況,保留可能正在經(jīng)營的非法流動(dòng)攤販信息,給出一個(gè)流動(dòng)攤位預(yù)警值.若該流動(dòng)攤位預(yù)警值超過一定閾值,則記錄存在流動(dòng)攤位、攤販的監(jiān)控場景圖像,并提醒城市管理部門對(duì)其相關(guān)處理.該方法較為簡單,僅進(jìn)行場景照片取證與實(shí)時(shí)報(bào)警,具體的攤位、攤販記錄,對(duì)流動(dòng)攤販的處罰、管理,需要城市管理部門進(jìn)行相應(yīng)操作.

第二種,流動(dòng)攤位取證記錄,類似于幀間攤位對(duì)比中的攤位特征對(duì)比方法,指使用一定的深度學(xué)習(xí)特征提取網(wǎng)絡(luò),提取流動(dòng)攤位的特征,并使用攤位特征進(jìn)行取證的方法.該方法使用流動(dòng)攤位的圖像特征信息作為取證的對(duì)象,將攤位信息存儲(chǔ)到數(shù)據(jù)庫中,同時(shí)提醒城市管理部門進(jìn)行相關(guān)處理.并且每當(dāng)檢測到一個(gè)新的攤位時(shí),將其特征與數(shù)據(jù)庫中的攤位信息進(jìn)行比對(duì),可以判斷該流動(dòng)位是否已多次進(jìn)行非法經(jīng)營行為.該方法可以實(shí)時(shí)檢測城市道路中流動(dòng)攤販的情況,同時(shí)可以記錄一定的流動(dòng)攤位信息,為城市管理部門的取證、管理提供了方便.當(dāng)然,該方法也有一些比較明顯的局限性:首先,流動(dòng)攤位目標(biāo)較為復(fù)雜多變,比如攤販僅僅改變其銷售商品的種類,或者改變招牌,就能在一定程度上改變其流動(dòng)攤位特征,因此攤位的特征并不是固定的,對(duì)攤位進(jìn)行取證不一定會(huì)有較好的效果;其次,對(duì)流動(dòng)攤位、攤販的處理,最終應(yīng)以人為目標(biāo),而不應(yīng)以攤位為目標(biāo);最后,由于該方法引入了額外的深度神經(jīng)網(wǎng)絡(luò),不可避免地會(huì)增加計(jì)算的時(shí)間開銷.綜上所述,流動(dòng)攤位取證記錄方法,不是一個(gè)較好的數(shù)據(jù)處理以及報(bào)警取證方法.

流動(dòng)攤販取證記錄,與流動(dòng)攤位取證記錄類似,而不同之處在于,該方法以流動(dòng)攤販的人物圖像特征信息作為取證的對(duì)象,而不是攤位的圖像特征.要獲取攤販的人物圖像特征信息,首先要將攤販與普通的行人區(qū)分出來,其次是使用一定的特征提取方法,比如人臉識(shí)別、行人重識(shí)別方法,提取流動(dòng)攤販的圖像特征信息,并將該特征信息保存到數(shù)據(jù)庫中,同時(shí)提醒城市管理部門進(jìn)行相關(guān)處理.每當(dāng)檢測到一個(gè)新的攤販時(shí),將其特征與數(shù)據(jù)庫中的攤販信息進(jìn)行對(duì)比,可以判斷該流動(dòng)攤販?zhǔn)欠褚讯啻芜M(jìn)行非法經(jīng)營行為.該方法在對(duì)城市管理部門發(fā)出實(shí)時(shí)提醒的同時(shí),能夠?qū)`法攤販的個(gè)人信息進(jìn)行記錄取證,大大地方便了城市管理部門的工作.該方法的優(yōu)點(diǎn)在于:第一,以個(gè)人信息為對(duì)象進(jìn)行存儲(chǔ)取證,方便城市管理部門進(jìn)行監(jiān)管;其次,行人、人臉信息的區(qū)分度較高,特征比對(duì)的準(zhǔn)確率高.而該方法也有一定的局限性,具體表現(xiàn)為:第一,該方法引入了額外的深度神經(jīng)網(wǎng)絡(luò),不可避免地會(huì)增加計(jì)算的時(shí)間開銷;其次,行人、人臉信息的特征信息提取,對(duì)圖像的要求較高,僅適用于監(jiān)控探頭像素較高,或者具備縮放功能的條件下.綜上所述,該方法適用于處理設(shè)備、監(jiān)控探頭等硬件條件較好的情況下,并且能夠獲得較好的效果.

4 實(shí)驗(yàn)結(jié)果與分析

本文使用了德清縣城市道路監(jiān)控視頻數(shù)據(jù),從其中選取部分作為測試數(shù)據(jù),對(duì)本文的非法流動(dòng)攤販檢測方法進(jìn)行測試.具體測試分為兩部分,第一部分對(duì)改進(jìn)的FRIRAM檢測模型的檢測效果進(jìn)行測試,第二部分對(duì)流動(dòng)攤販取證預(yù)警效果進(jìn)行測試.本文方法實(shí)際上是對(duì)視頻中的每一幀進(jìn)行單獨(dú)處理的,因此在輸入時(shí),要將視頻拆成單幀圖像來處理.目標(biāo)檢測模型每運(yùn)行一次,在不同的物理設(shè)備上所需的時(shí)間是不同的.因此,給定可變參數(shù)N,每N秒從視頻中提取一幀圖像進(jìn)行處理,N的取值需要根據(jù)具體物理設(shè)備而定.本文使用了Nvidia Titan X的GPU對(duì)該模型進(jìn)行實(shí)驗(yàn),每處理一幀大約需要4秒,因此給定N值為5.檢測的對(duì)象為流動(dòng)攤位與攤販,雖然攤位具有流動(dòng)性,但是正在經(jīng)營的攤位往往是固定不動(dòng)的,因此不考慮運(yùn)動(dòng)的攤位,只考慮正在經(jīng)營的固定攤位,5秒/次的處理速度完全能夠滿足應(yīng)用需求.

4.1 數(shù)據(jù)集介紹

本文使用的流動(dòng)攤販識(shí)別數(shù)據(jù)集,包含8種類標(biāo).其中3種流動(dòng)攤位類標(biāo),1種行人類標(biāo),另4種類標(biāo)為易混淆的物體.

表1為流動(dòng)攤販數(shù)據(jù)集.流動(dòng)攤販對(duì)象較為特殊,網(wǎng)絡(luò)中常見的公共數(shù)據(jù)集中都不包含此類標(biāo)注,因此需要自行構(gòu)建數(shù)據(jù)集,才能使目標(biāo)檢測模型具備同時(shí)檢測流動(dòng)攤位與行人的能力.

表1 流動(dòng)攤販識(shí)別訓(xùn)練數(shù)據(jù)集中包含的類標(biāo)及其對(duì)應(yīng)對(duì)象Table 1 Objects and labels in the training dataset

4.2 流動(dòng)攤位檢測與算法對(duì)比

本文選取了幾個(gè)流動(dòng)攤位較多的場景,測試了流動(dòng)攤位檢測模型的檢測效果,結(jié)果如表2所示.由于視頻中不存在預(yù)先的標(biāo)注,本文采用人工辨別的方式進(jìn)行數(shù)據(jù)統(tǒng)計(jì).

表2 流動(dòng)攤位檢測模型的識(shí)別效果統(tǒng)計(jì)Table 2 Statistical result of floating vendor detection model in test videos

從測試后數(shù)據(jù)表3來看,整體上的準(zhǔn)確率達(dá)到了87.99%,召回率達(dá)到了79.95%,可以看出該模型的誤判數(shù)量較低,漏判數(shù)量較高.該模型已經(jīng)具有了一定的流動(dòng)攤位識(shí)別能力,但是識(shí)別準(zhǔn)確率還有待提高.

表3 流動(dòng)攤位檢測模型總體檢測效果Table 3 Result of floating vendor detection model

此外,本文使用COCO數(shù)據(jù)集[19]與測試視頻對(duì)各類目標(biāo)檢測模型以及本文提出的FRIRAM檢測模型進(jìn)行檢測效果的對(duì)比測試與模型的預(yù)訓(xùn)練,具體實(shí)驗(yàn)結(jié)果記錄如表4所示.從COCO數(shù)據(jù)集的預(yù)訓(xùn)練結(jié)果中可以看出,總體上SSD模型擁有較高的運(yùn)行速度,視頻處理的實(shí)時(shí)性較強(qiáng),而Faster R-CNN模型具有較高的目標(biāo)識(shí)別準(zhǔn)確率,識(shí)別精度較好,而本文提出的FRIRAM目標(biāo)檢測模型實(shí)現(xiàn)了最高的mAP準(zhǔn)確率,但運(yùn)行耗時(shí)相對(duì)較長.在監(jiān)控視頻數(shù)據(jù)集的目標(biāo)檢測效果對(duì)比中,F(xiàn)RIRAM目標(biāo)檢測模型相較于對(duì)比算法模型實(shí)現(xiàn)了最高的流動(dòng)攤販識(shí)別準(zhǔn)確率,體現(xiàn)了本文提出方法的可行性與優(yōu)勢.

4.3 流動(dòng)攤販取證預(yù)警

非法流動(dòng)攤販檢測的測試視頻中,出現(xiàn)流動(dòng)攤販的數(shù)量較少.因此,本節(jié)選取具有代表性的測試效果進(jìn)行分析.測試視頻選取了視頻3,在該測試視頻中,僅存在一個(gè)流動(dòng)攤販.視頻一開始該攤販就已處于違法設(shè)攤狀態(tài),過一段時(shí)間后該攤販離開.該測試視頻記錄了從“存在攤販”到“不存在攤販”的狀態(tài)變化,能清楚地展示算法效果.

表4 各類目標(biāo)檢測模型在COCO數(shù)據(jù)集與測試視頻上的檢測效果平均值Table 4 Statistical result of different detection models in CoCo and test videos

圖6為測試視頻初始幀的圖像.此時(shí)已有流動(dòng)攤販處于擺攤的狀態(tài),并且目標(biāo)檢測模型已經(jīng)將其檢測了出來.左上角顯示的是預(yù)警值,其大小與攤位的數(shù)量以及每個(gè)攤位的計(jì)數(shù)值有關(guān),當(dāng)該值超過100%時(shí),則進(jìn)行預(yù)警.由于該幀是初始幀,計(jì)數(shù)值較低,因此預(yù)警值也較低,攤位均使用虛線框標(biāo)注,而非實(shí)線框.隨著時(shí)間累積,攤位的計(jì)數(shù)值將增大,預(yù)警值也將隨之增大,預(yù)警值較高的攤位將使用實(shí)線框標(biāo)注出來.

圖6 測試視頻10:41:47Fig.6 Test video 10:41:47

圖7為初始幀之后1分04秒的圖像,此時(shí)攤位的累計(jì)值已較高,攤位使用實(shí)線框標(biāo)注出來,并且左上角的預(yù)警值超過了100%,此時(shí)應(yīng)向城市管理部門發(fā)出報(bào)警,并進(jìn)行一定的截圖、錄像取證.

圖7 測試視頻10:42:51Fig.7 Test video 10:42:51

圖8為初始幀之后9分56秒的圖像.在初始幀之后1分鐘到9分鐘的時(shí)間內(nèi),場景中的攤位均能夠被識(shí)別出來,并且發(fā)出預(yù)警.圖8中的車輛將部分?jǐn)偽徽趽酰灾劣谀繕?biāo)檢測模型無法正確地檢測出流動(dòng)攤位的位置,沒有框定區(qū)域,此時(shí)無法正確識(shí)別.

圖8 測試視頻10:51:43Fig.8 Test video 10:51:43

圖9為初始幀之后12分08秒的圖像.此時(shí)圖6中的車輛駛離,本文方法再次正確地識(shí)別出流動(dòng)攤位,并進(jìn)行重新框定,但是車輛駛離時(shí)間較短,流動(dòng)攤位的累計(jì)值較低,此時(shí)的預(yù)警值也較低,框定為虛線,還未報(bào)警.由于此時(shí)攤販正在收拾攤位,準(zhǔn)備離開,部分商品轉(zhuǎn)移到了攤販的三輪車上,目標(biāo)檢測模型將三輪車檢測為車載攤位.

圖9 測試視頻10:53:55Fig.9 Test video 10:53:55

圖10為初始幀之后13分20秒的圖像.此時(shí)流動(dòng)攤販正在離開,原本攤販販賣的物品已轉(zhuǎn)移到三輪車上.從圖中可以看出,原擺攤的位置不再檢測出攤位,而將攤販的三輪車檢測為車載攤位.

圖10 測試視頻10:55:07Fig.10 Test video 10:55:07

綜合之上的測試數(shù)據(jù)可以看出,本文提出的非法流動(dòng)攤販檢測方法,具有一定的檢測效果,但其存在一定的誤判、漏判現(xiàn)象,在目標(biāo)被遮擋的情況下,識(shí)別率有所下降.

5 總 結(jié)

隨著城鎮(zhèn)化的快速發(fā)展,城區(qū)流動(dòng)攤販正成為考量城市政府統(tǒng)籌“繁榮與市容、發(fā)展與穩(wěn)定、民生與秩序”宏觀決策能力和城市治理能力的晴雨表,社會(huì)和媒體對(duì)此也高度關(guān)注.流動(dòng)攤販作為市場經(jīng)濟(jì)發(fā)展階段的產(chǎn)物,雖然一定程度上迎合人們的消費(fèi)心理,卻給城市交通與環(huán)境帶來了負(fù)面影響并存在較大的食品安全衛(wèi)生隱患以及商品質(zhì)量問題.

本文使用改進(jìn)的FRIRAM目標(biāo)檢測模型,對(duì)街道及制定路段上的非法流動(dòng)攤位與行人進(jìn)行檢測.為了使模型具有識(shí)別能力,本文從網(wǎng)絡(luò)、監(jiān)控視頻中獲取了大量的圖像數(shù)據(jù),并進(jìn)行人工標(biāo)注,構(gòu)成訓(xùn)練數(shù)據(jù)集,以對(duì)模型進(jìn)行訓(xùn)練.使用訓(xùn)練好的目標(biāo)檢測模型,從監(jiān)控圖像中獲得攤位與行人的位置信息.通過幀間攤位對(duì)比對(duì)得到的位置信息進(jìn)行處理確定非法流動(dòng)攤販,并使用適當(dāng)?shù)臄?shù)據(jù)處理方式進(jìn)行報(bào)警、取證.由實(shí)驗(yàn)結(jié)果可見,本文提出的基于深度學(xué)習(xí)模型的非法流動(dòng)攤販檢測方法在實(shí)際視頻數(shù)據(jù)上取得了較好的效果,能夠?yàn)榱鲃?dòng)擺攤現(xiàn)象的管理與整治提供技術(shù)幫助與支持.在本文方法的研究過程中也發(fā)現(xiàn)了不足之處,該方法識(shí)別效果下降的原因,在于自制數(shù)據(jù)集中的數(shù)據(jù)較少.COCO數(shù)據(jù)集中,車輛類的標(biāo)注數(shù)據(jù)有將近10萬條,訓(xùn)練出的目標(biāo)檢測模型能夠達(dá)到超過90%的識(shí)別準(zhǔn)確率.而本文使用的自制訓(xùn)練集中,僅包含約4000張圖片,可能由于標(biāo)注數(shù)量較少,訓(xùn)練后無法達(dá)到較高的準(zhǔn)確率.因此,在未來的研究中將進(jìn)行進(jìn)一步的改進(jìn).

同時(shí),基于本文方法的應(yīng)用效果,對(duì)于未來的研究方向,將深度學(xué)習(xí)模型與圖像檢測模型應(yīng)用于其他城市管理領(lǐng)域如違停車輛的檢測、店外擺攤的檢測等,都是具有極大理論與實(shí)踐意義的.

猜你喜歡
攤販攤位流動(dòng)
誤 會(huì)
水果攤的主人
一號(hào)攤位
海南:學(xué)校周邊200米禁擺食品攤
為什么海水會(huì)流動(dòng)
母親的攤位
協(xié)作自治:攤販治理的昆山之道
風(fēng)味小吃
曲麻莱县| 雅安市| 株洲县| 溆浦县| 东港市| 乐至县| 舒兰市| 紫金县| 榆树市| 绍兴市| 方城县| 姚安县| 定边县| 特克斯县| 乌什县| 子长县| 勐海县| 田阳县| 石景山区| 乌审旗| 新余市| 兴和县| 镇远县| 淳安县| 东丽区| 汉阴县| 江山市| 新津县| 七台河市| 商南县| 霍山县| 仲巴县| 临湘市| 丰都县| 垫江县| 梁河县| 黄龙县| 金昌市| 紫金县| 马鞍山市| 会昌县|