劉世澤,秦艷君,王晨星,高存遠(yuǎn),羅海勇,趙 方,王寶會
(1.北京航空航天大學(xué)軟件學(xué)院,北京 100191;2.北京郵電大學(xué)計算機(jī)學(xué)院,北京 100876;3.中國科學(xué)院計算技術(shù)研究所,北京 100190)
(?通信作者電子郵箱yhluo@ict.ac.cn)
在移動互聯(lián)網(wǎng)時代,智能手機(jī)的功能越來越強(qiáng)大,使得智能手機(jī)移動設(shè)備的傳感功能的可編程性得到了廣泛的應(yīng)用,使其擁有很高的市場普及率,再加上第三方應(yīng)用軟件的支持和智能手機(jī)快速的發(fā)展,就成為了監(jiān)控人們行為的有效工具。因此基于移動智能終端的場景感知成為場景感知的主要方式。
交通模式識別被認(rèn)為是一種特殊的場景感知[1-2]。通過智能移動設(shè)備捕獲個人交通行為,這對許多領(lǐng)域有著非常積極的影響。例如:對個人交通行為的智能監(jiān)控,可以實(shí)現(xiàn)對移動跟蹤,也可以利用這些信息改善城市規(guī)劃、提供合適的道路出行建議,快速為救護(hù)車安排最合適的行駛方案,以及追蹤用戶碳足跡,呼吁人們低碳出行。最后,智能監(jiān)測可以作為用戶行為分析的一部分,進(jìn)行實(shí)時旅程規(guī)劃或針對性的廣告投放。最廣泛的電子健康、營銷、智能城市、交通管理和安全,其中有關(guān)參與者流動性的信息構(gòu)成了所收集數(shù)據(jù)上下文的一個重要維度。
目前有研究利用全球定位系統(tǒng)(Global Positioning System,GPS)的數(shù)據(jù)來檢測運(yùn)輸方式[3-4]。然而,基于GPS 的方法存在以下缺點(diǎn):1)GPS 信號在城市峽谷、隧道或屏蔽區(qū)域,會出現(xiàn)信號丟失和錯誤。2)GPS傳感器消耗大量的能量,并可能迅速耗盡移動設(shè)備的電池;融合GPS 和地理信號系統(tǒng)(Geographic Information System,GIS)的交通模式識別算法,該方法利用運(yùn)輸網(wǎng)絡(luò)信息,包括實(shí)時總線的位置、空間軌道和巴士站信息,改善了GPS 的數(shù)據(jù)對交通工具識別判斷不準(zhǔn)的一些情況,但是現(xiàn)在的GIS 信息系統(tǒng)更新得仍舊不夠?qū)崟r,存在功耗高的問題。
大量研究使用基于機(jī)器學(xué)習(xí)的算法實(shí)現(xiàn)交通模式識別,例如AdaBoost 分類器、支持向量機(jī)(Support Vector Machine,SVM)[5-6]、決策樹、隨機(jī)森林[7-8]、貝葉斯網(wǎng)絡(luò)[9-10]、分層的分類器[11-14]等算法識別交通工具模式。但是這些算法需要首先根據(jù)人們的先驗(yàn)知識完成特征提取,而實(shí)現(xiàn)人工特征提取過程存在復(fù)雜、耗時和識別準(zhǔn)確率低等問題。目前基于加速度傳感器的交通模式識別方法提取幀特征、段特征和峰特征,并使用這些特征進(jìn)行交通模式識別,但是該方法易受重力的影響,也很容易受到采集設(shè)備的噪聲干擾,這樣就會使收集數(shù)據(jù)時產(chǎn)生數(shù)據(jù)不準(zhǔn)確,導(dǎo)致最終判斷準(zhǔn)確率低。
針對上述問題,研究者們提出了基于深度學(xué)習(xí)的交通模式識別算法,如:常見深度學(xué)習(xí)算法有基于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)、卷積神 經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)[15]、雙向長短期記憶網(wǎng)絡(luò)(Bidirectional Long Short-Term Memory,BiLSTM)[16]和長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)[17-18]等算法。但這些算法存在功耗高、訓(xùn)練時間長和精度低等問題。本文提出了一種融合殘差網(wǎng)絡(luò)和帶孔卷積的算法,實(shí)現(xiàn)交通模式識別,主要工作如下:
1)使用低功耗智能手機(jī)低功耗傳感器,摒棄GPS、Wi-Fi等功耗高的傳感器。使用低功耗的傳感器包含加速度傳感器、氣壓傳感器、地磁、陀螺儀。將這些傳感器得到的原始數(shù)據(jù),通過快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)將時序數(shù)據(jù)轉(zhuǎn)換為頻域數(shù)據(jù)(頻譜圖)。將時序數(shù)據(jù)轉(zhuǎn)換成圖片數(shù)據(jù)的做法,可以有效消除采集原始數(shù)據(jù)從不同部位和不同的從而獲取更穩(wěn)定特征。
2)使用殘差網(wǎng)絡(luò)(Residual Network,ResNet)學(xué)習(xí)交通模式短時間的局部特征。由于神經(jīng)網(wǎng)絡(luò)的每一層對應(yīng)提取特征不同層次特征學(xué)習(xí),而且網(wǎng)絡(luò)結(jié)構(gòu)越深,提取的不同層次的特征越多,不同層次的信息組合也越多。由于網(wǎng)絡(luò)結(jié)構(gòu)越深,會導(dǎo)致網(wǎng)絡(luò)的梯度消失、梯度爆炸和網(wǎng)絡(luò)性能退化問題,造成錯誤率上升。使用殘差網(wǎng)絡(luò)可以解決上述這些問題,更好地提升網(wǎng)絡(luò)性能,從而達(dá)到深度提取各類交通模式的深層局部特征的目的。
3)利用帶孔卷積學(xué)習(xí)長時間的全局特征。對于特征提取不僅僅需要從局部提取特征,更需要從全局提取特征,去獲得更好的識別準(zhǔn)確率。在不損失數(shù)據(jù)信息的情況下增大感受野,能有效地提取基于各種交通工具的全局特征;并且可以有效降低信息的復(fù)雜度,減少運(yùn)算復(fù)雜度。
在目前交通模式識別領(lǐng)域,已經(jīng)有很多的學(xué)者在研究該問題,從算法層面主要分為兩類:一類是利用傳統(tǒng)學(xué)習(xí)方法,主要依賴手工提取特征,實(shí)現(xiàn)交通模式識別;另一類是利用神經(jīng)網(wǎng)絡(luò)方法,通過神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)各類交通模式的深度特征提取,實(shí)現(xiàn)交通模式識別。
文獻(xiàn)[19]提出了一種利用智能手機(jī)位置信息和各種可用的地理信息(如公交站點(diǎn)位置、鐵路線路和公交位置信息)實(shí)時檢測用戶出行方式的方法。與之前的相關(guān)工作不同,用于定位的采樣率為30 s。對于接近實(shí)時的分類,作者使用了一個1 min的移動記錄窗口(相當(dāng)于兩個位置記錄),它使用了以下屬性:平均速度、平均加速度和的變化。該方法利用的是傳統(tǒng)的手工提取特征的方法。
文獻(xiàn)[20]提出了一個基于Bi-LSTM 模型的自動軌跡分類框架,以將原始軌跡分類為不同的運(yùn)輸方式。通過嵌入時間間隔作為外部特征進(jìn)一步提高了性能。該框架不需要耗時的復(fù)雜的人工特征提取過程,而是通過Bi-LSTM框架學(xué)習(xí)特征。
文獻(xiàn)[21]利用基于深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)的方法,將多層神經(jīng)元堆疊起來優(yōu)化權(quán)重,從而進(jìn)行交通模式識別。
文獻(xiàn)[22]提出了一種基于樹的集成分類器,通過原始數(shù)據(jù),手工提取全局特征和局部特征相結(jié)合,因此需要一個復(fù)雜和費(fèi)時的特征工程過程。
在文獻(xiàn)[23]中基于CNN 的架構(gòu),利用原始的GPS 軌跡來預(yù)測出行方式,創(chuàng)建了一個四通道輸入量,其中每個通道代表一個基本運(yùn)動學(xué)屬性序列,包括速度、加速/減速、跳動和承載率,實(shí)現(xiàn)對各類交通模式進(jìn)行區(qū)分。
綜上所述,人工提取特征存在著一些重要缺陷,主要包括對交通和環(huán)境條件的脆弱性,以及在提取高效特征時,對存在手機(jī)型號和采用用戶不具有普適性。為解決這些問題考慮利用神經(jīng)網(wǎng)絡(luò)代替?zhèn)鹘y(tǒng)方法,從而自動地從原始輸入驅(qū)動高級特征;但是現(xiàn)在單一的一些模型并不能很好地處理原始的時間序列數(shù)據(jù)。
本文提出了融合殘差網(wǎng)絡(luò)和帶孔卷積的算法,實(shí)現(xiàn)交通模式識別。本文算法總體框架如圖1 所示,主要包含三個部分,分別是:數(shù)據(jù)預(yù)處理、各類交通工具局部特征提取和各類交通工具全局特征提取。這三個部分具體內(nèi)容如下:
圖1 融合殘差網(wǎng)絡(luò)和帶孔卷積交通模式識別算法框架Fig.1 Framework of transportation mode detection algorithm combining residual network and dilated convolution
1)數(shù)據(jù)預(yù)處理。使用手機(jī)采集原始數(shù)據(jù),采用不同手機(jī)采集數(shù)據(jù),會產(chǎn)生不同設(shè)備之間采集誤差。采集者會放置不同的部位,例如:手持、背包、手臂和褲袋等姿態(tài),對數(shù)據(jù)采集產(chǎn)生不同姿態(tài)誤差影響。為了避免這些誤差的影響,利用手機(jī)傳感器采集原始數(shù)據(jù),通過FFT算法,將時間序列的數(shù)據(jù)轉(zhuǎn)換成圖片數(shù)據(jù),可以有效地去除上述誤差影響。
2)局部特征。由于ResNet 網(wǎng)絡(luò)結(jié)構(gòu),對于圖片數(shù)據(jù),通過深度的學(xué)習(xí)圖片數(shù)據(jù),可以有效地提取交通工具深層局部特征。
3)全局特征提取。帶孔卷積可以在不損失圖片數(shù)據(jù)信息的情況下,增大感受野。通過每個增大卷積的卷積核,可以擴(kuò)大感受野,獲得長時間依賴關(guān)系,且沒有增加參數(shù)數(shù)量,從而有效地捕獲八類交通模式圖片數(shù)據(jù)的全局特征。
最后將全局特征和局部特征通過四層全聯(lián)接層,最后通過SoftMax得到八類交通模式分類結(jié)果。
利用手機(jī)采集與交通模式相關(guān)數(shù)據(jù),進(jìn)行交通模式識別,已經(jīng)是非常普遍的情況[20-21]。
在本文中,數(shù)據(jù)采集人員把收集的數(shù)據(jù)和采集人員的日常生活中想要做的事情結(jié)合起來,例如:參觀博物館,在一個特定的餐館吃午飯,或者騎自行車去拜訪朋友等。這樣數(shù)據(jù)集可以包含真實(shí)的活動和典型位置。
數(shù)據(jù)收集使用了四款華為Mate 9 手機(jī),放在人們通常攜帶手機(jī)的地方:第一部手機(jī),采集者會拿在手里,或者放在胳膊上戴的臂帶中,在數(shù)據(jù)集中,這個位置稱為“手(Hand)”;第二部手機(jī),采集者放在胸袋或胸帶上(例如跑步時),在數(shù)據(jù)集中,此位置稱為“軀干(Torso)”;第三部手機(jī),采集者放在臀部的高度,通常放在褲子的前口袋里,在數(shù)據(jù)集中,此位置稱為“褲袋(Hips)”;第四部手機(jī),采集者放在背包或側(cè)包里,在數(shù)據(jù)集中,這個位置稱為“包(Bag)”。這些手機(jī)配備了專門采集數(shù)據(jù)的數(shù)據(jù)采集器。
本文采用了由英國薩塞克斯大學(xué)(University of Sussex)和華為公司發(fā)布的用于移動用戶多模態(tài)運(yùn)動分析和交通模式識別數(shù)據(jù)集(Sussex-Huawei Locomotion dataset,SHL)。
SHL 數(shù)據(jù)集用途廣泛,主要可以用于:用戶行為識別、多模態(tài)無線網(wǎng)絡(luò)覆蓋范圍估計、衛(wèi)星覆蓋范圍估計、路況分析、交通狀況分析、谷歌公司行為識別應(yīng)用程序接口(Application Programming Interface,API)、活動發(fā)現(xiàn)、傳感器融合定位、基于視覺和聲音的行為識別等方面。
根據(jù)本文對數(shù)據(jù)集的要求,本文對數(shù)據(jù)集做了一定處理。其中,每個傳感器數(shù)據(jù)文件中包含196 072 行×500 列,對應(yīng)于196 072幀,每個幀包含500個樣本(采樣頻率為100 Hz)。
每一個樣本通過快速傅里葉變換,將其轉(zhuǎn)化為一張圖片。使用滑動窗口大小是400,滑動的步長是1。
如圖2 所示,就是將加速度x軸的原始數(shù)據(jù),通過快速傅里葉變換方法,將原始時間序列數(shù)據(jù)轉(zhuǎn)換為圖片頻域數(shù)據(jù)。如圖3 所示,是在不同位置的數(shù)據(jù)采集效果呈現(xiàn),可以看出不同的位置,加速度x軸的數(shù)據(jù)變化量很大。從圖3 可以看出,時間序列的數(shù)據(jù)比較分布不均勻。在一定程度上不同采集者和位置都會有一定的變化,但是通過FFT 轉(zhuǎn)換成圖片(圖4所示)數(shù)據(jù)波動就會很小。
圖2 將時域數(shù)據(jù)轉(zhuǎn)換為頻域圖片數(shù)據(jù)過程Fig.2 Process of converting time domain data into frequency domain image data
圖3 不同位置不同采集者采集的原始數(shù)據(jù)Fig.3 Raw data collected by different users in different locations
圖4 快速傅里葉變換后的圖片數(shù)據(jù)Fig.4 Image data after FFT
經(jīng)過FFT 處理后的表示各種交通模式特征圖片,存在圖片過大的問題。因此會導(dǎo)致出現(xiàn)模型訓(xùn)練復(fù)雜度過大問題,故需要對圖片進(jìn)行降采樣。如果使用普通的插值算法,可能會導(dǎo)致圖片細(xì)節(jié)過多地丟失,從而降低模型的精度。如算法1 所示,本文使用主成分分析(Principal Component Analysis,PCA)方法是先將圖片二維矩陣展開為向量,并進(jìn)行主成分分析,選取所有位置中特征值最大的50 176個,將這些像素再重新組合為新的圖片,大小為224×224。
算法1 數(shù)據(jù)PCA預(yù)處理。
輸入 原始圖像數(shù)據(jù)data。
dataD←去中心化(data);
dataF←Flatten(dataD);
dataC←計算協(xié)方差矩陣(dataF);
dataS←SVD分解(dataC);
dataK←sort(dataS)[0∶50 176];
dataR←dot(dataD,dataK)
dataE←reshape(dataR)
首先,對數(shù)據(jù)進(jìn)行去中心化并展平;接下來,計算整個矩陣的協(xié)方差矩陣,對協(xié)方差矩陣進(jìn)行奇異值分解(Singular Value Decomposition,SVD)選取特征值最高的50 176 個特征向量再組成矩陣;最后,將這個矩陣與原來的矩陣相乘,并轉(zhuǎn)換回大小為224×224 的圖片的形式。此時保留下來的特征點(diǎn)擁有著較大的方差,根據(jù)最大方差理論,這些特征點(diǎn)保留了原始圖像中的大部分關(guān)鍵數(shù)據(jù)。
卷積神經(jīng)網(wǎng)絡(luò)(CNN),能夠有效地提取淺層/中級/深層特征。一般來說,層數(shù)越多,提取到的不同層次的特征就會更豐富、抽象以及富含語義信息。但是要想實(shí)現(xiàn)這個目標(biāo),往往需要加深CNN 網(wǎng)絡(luò)層為代價,同時常常帶來參數(shù)量大、梯度消失、梯度爆炸等問題,導(dǎo)致網(wǎng)絡(luò)無法學(xué)習(xí)到準(zhǔn)確特征。
ResNet 的主要思想是,假定某部分神經(jīng)網(wǎng)絡(luò)的輸入為x,期望的輸出為H(x)。H(x)是期望的復(fù)雜潛在映射,如果要進(jìn)行學(xué)習(xí),則訓(xùn)練難度較大。可以知道的是,當(dāng)學(xué)習(xí)到較為飽和的準(zhǔn)確率時或下層網(wǎng)絡(luò)的誤差開始增大時,接下來學(xué)習(xí)的目標(biāo)就需要轉(zhuǎn)變?yōu)楹愕扔成涞膶W(xué)習(xí),即:使輸入x近似于輸出H(x),以保持后面的網(wǎng)絡(luò)層中不會造成精度繼續(xù)下降。ResNet 引入了捷徑連接(Shortcut Connections)來試圖解決這一問題。如圖5所示,直接將輸入x傳到輸出位置作為初始的結(jié)果,那么輸出則變?yōu)镠(x)=F(x)+x。當(dāng)F(x)=0 時,H(x)=x,即恒等映射。因此,ResNet 的學(xué)習(xí)目標(biāo)則轉(zhuǎn)變?yōu)闅埐頕(x)=H(x)-x。之后的網(wǎng)絡(luò)層的學(xué)習(xí)目標(biāo)全部轉(zhuǎn)變?yōu)槭箽埐頕(x) →0,這樣就使得網(wǎng)絡(luò)隨著層數(shù)加深,精確率不會下降。
圖5 ResNet單元結(jié)構(gòu)Fig.5 Architecture of ResNet unit
殘差網(wǎng)絡(luò)可以有效地避免上述問題,同時學(xué)習(xí)準(zhǔn)確各類交通模式特征。如圖6 所示,輸入層是各類交通模式圖片數(shù)據(jù),數(shù)據(jù)大小是(m,n,q),其中m、n是像素,q是通道數(shù)。本文中的殘差單元如式(1)、(2):
其中:xl是殘差單元的輸入(數(shù)據(jù)圖片);xl+1表示殘差單元的輸出;f表示激活函數(shù)(ReLU 函數(shù));F 是殘差函數(shù);h(xl)=xl;yl是第l層網(wǎng)絡(luò)的輸出;Wl是可訓(xùn)練參數(shù)矩陣。
圖6 的中間模塊是殘差網(wǎng)絡(luò)模塊,該模塊可以有效地提取交通模式的深度特征,W模塊中,使用卷積網(wǎng)絡(luò)實(shí)現(xiàn)特征提取過程。所以第i層殘差單元,計算式如式(3)~(6):
其中:wi是第i個W 模塊的輸出,s是S模塊的輸出是最大池化操作是卷積操作;v是特征矩陣,u是第l層卷積的單元。在本文設(shè)計的網(wǎng)絡(luò)架構(gòu)中,有三層殘差網(wǎng)絡(luò)模塊。
通過每一層的殘差單元,都能夠提取到一定程度特征。通過加深殘差網(wǎng)絡(luò)的深度,就能夠有效地提取八類交通模式的深層特征。由于增加捷徑連接,加入S 模塊,可以有效避免深度卷積網(wǎng)絡(luò)帶來的梯度消失和梯度爆炸問題。
對于每一層模塊的超參數(shù)如表1所示。
表1 殘差網(wǎng)絡(luò)詳細(xì)超參數(shù)Tab.1 Detailed hyperparameters in residual network
帶孔卷積的作用是在同層計算不增加參數(shù)量的同時擴(kuò)大感受野。感受野的大小決定了卷積過程中,一次獲取信息的多少。如圖7 所示,對于輸入,每一次映射的區(qū)域不同,第一層是每兩個節(jié)點(diǎn)映射一個區(qū)域;第二層映射的區(qū)域面積變成每隔一個節(jié)點(diǎn)映射一次;第三層映射區(qū)域最大,變成每隔兩個節(jié)點(diǎn)映射一次。
圖7 空洞卷積表示Fig.7 Representation of dilated convolution
這樣設(shè)計的好處是,能夠在很大程度上減少參數(shù)量,且該網(wǎng)絡(luò)能夠有效保證保留內(nèi)部數(shù)據(jù)結(jié)構(gòu)(傳統(tǒng)下采樣方式就會失去數(shù)據(jù)內(nèi)部結(jié)構(gòu),導(dǎo)致特征提取不夠完整)。利用池化方法在增加感受野時,會將一些數(shù)據(jù)信息丟失,但是帶孔卷積網(wǎng)絡(luò)可以在不損失信息特征的情況下,增大感受野,獲取更多信息。
最重要的是,帶孔卷積網(wǎng)絡(luò)能夠準(zhǔn)確獲取多尺度信息特征,避免提取冗余特征,可以更好地挖掘各類交通模式數(shù)據(jù)之間的內(nèi)部特征。本文利用帶孔卷積從大尺度上提取全局特征,這些全局特征能夠有效地增加交通模式識別的準(zhǔn)確率。
表2 是本文中帶孔卷積設(shè)計到的超參數(shù)的詳細(xì)描述,帶孔卷積的卷積核計算不同于傳統(tǒng)卷積計算方式。逐層增加了卷積核單元間隔距離,分別為0、1、2,在增加特征圖感受野面積的同時有效控制了參數(shù)量的增加。
表2 帶孔卷積網(wǎng)絡(luò)詳細(xì)超參數(shù)Tab.2 Detailed hyperparameters in dilated convolutional network
本文算法的偽代碼如算法2 所示,主要分為三個階段:數(shù)據(jù)輸入、訓(xùn)練階段和測試階段。數(shù)據(jù)輸入階段主要將數(shù)據(jù)進(jìn)行了數(shù)據(jù)標(biāo)準(zhǔn)化、FFT,以及圖像主成分分析等數(shù)據(jù)預(yù)處理方法。在訓(xùn)練和測試階段,通過殘差網(wǎng)絡(luò)實(shí)現(xiàn)數(shù)據(jù)局部特征提取,帶孔卷積實(shí)現(xiàn)數(shù)據(jù)的全局特征。然后,通過Adam 優(yōu)化器目標(biāo)的訓(xùn)練權(quán)重收斂或訓(xùn)練達(dá)到預(yù)定輪數(shù)。最終,通過SoftMax實(shí)現(xiàn)八類交通模式識別。
算法2 融合殘差網(wǎng)絡(luò)和帶孔卷積網(wǎng)絡(luò)。
輸入 SHL數(shù)據(jù)集傳感器數(shù)據(jù)data
本文融合殘差神經(jīng)網(wǎng)絡(luò)和帶孔卷積神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了對八類交通模式的局部特征和全局特征提取,并通過多尺度特征提取,進(jìn)行對交通模式的分類。本章通過對比實(shí)驗(yàn)驗(yàn)證了該算法的有效性。數(shù)據(jù)集區(qū)分過程,將使用的數(shù)據(jù)集,先分為五份,取其中一份作為測試集,剩下的四份作為訓(xùn)練集。
為了實(shí)現(xiàn)對比實(shí)驗(yàn)的公平性,對K最近鄰(K-Nearest Neighbor,KNN)、LSTM、Alexnet、DenseNet201、Googlenet、SVM、隨機(jī)森林、決策樹和本文算法驗(yàn)證時,采用了相同的訓(xùn)練集和測試集進(jìn)行實(shí)驗(yàn)。
在表3 中記錄了各類算法在八類交通模式的準(zhǔn)確率、召回率和F1-分?jǐn)?shù)三個評判標(biāo)準(zhǔn)。從實(shí)驗(yàn)結(jié)果上看,跑步和走路這兩種模式是最容易區(qū)分的,這主要與人體的特殊運(yùn)動方式有關(guān),人們在走路和跑步時,都會有較大的震動和固定的運(yùn)動頻率,所以每一種算法在這兩種模式上表現(xiàn)都較好。
從表3~5 中可以看出,騎自行車這一交通模式在KNN 和SVM 上表現(xiàn)得不好,主要是由于這兩種算法不能夠很好地抓住騎自行車這一交通模式的有效特征;但是其他算法可以有效地抓住有效特征進(jìn)行識別。從表4 中可以得出,融合殘差神經(jīng)網(wǎng)絡(luò)和帶孔卷積神經(jīng)網(wǎng)絡(luò)(ResDilate)算法,在三種評價指標(biāo)上表現(xiàn)最好,全部達(dá)到了95%以上,且準(zhǔn)確率平均超過其他算法10個百分點(diǎn)。
表3 不同算法的準(zhǔn)確率比較 單位:%Tab.3 Accuracy comparison of different algorithms unit:%
表4 不同算法的召回率比較 單位:%Tab.4 Recall comparison of different algorithms unit:%
從實(shí)驗(yàn)結(jié)果可以看出,公交車和私家車這兩種交通模式,在各類算法中是比較容易混淆的。由于這兩種交通模式,在特征上存在一定的相似性,尤其是在交通堵塞以及在高速路上的情況下,公交車和私家車在速度、加速度以及拐彎等,這些特征都會非常相似,所以這兩種交通模式識別存在一定的挑戰(zhàn)性。Alexnet、DenseNet201 和Googlenet 這三種算法,在識別這兩種交通工具的三種評估下均可以達(dá)到50%以上。KNN、LSTM、隨機(jī)森林、SVM 和決策樹這五種算法在識別這兩種交融模式的準(zhǔn)確率在30%~50%。從這個角度上看,深度學(xué)習(xí)算法的性能在一定程度上可以驗(yàn)證,深度學(xué)習(xí)提取的特征比人工提取特征更有具有識別性,更有利于識別交通模式。同理,火車和地鐵在短時間內(nèi)的特征也是非常相似的。使用單一的Alexnet、DenseNet201 和Googlenet 算法提取出的同一緯度的特征,不具有較強(qiáng)的識別性。使用人工提取出的特征,利用SVM 等機(jī)器學(xué)習(xí)算法進(jìn)行分類,也不能達(dá)到所需要的準(zhǔn)確率。本文所提出的算法,在準(zhǔn)確率、召回率和F1-分?jǐn)?shù)評估方法均可以達(dá)到80%以上。
表5 不同算法的F1-分?jǐn)?shù)比較 單位:%Tab.5 F1-score comparison of different algorithms unit:%
本文為了驗(yàn)證所提出算法各個部分的有效性,進(jìn)行了自對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表6~8所示。
其中,表6 是單一使用殘差神經(jīng)網(wǎng)絡(luò)對交通模式進(jìn)行分類。從殘差神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)上可以看出,該網(wǎng)絡(luò)結(jié)構(gòu)可以對數(shù)據(jù)集中的局部特征進(jìn)行有效提取,也就是說,可以將數(shù)據(jù)集中的各類交通模式上的短時間內(nèi)的特征有效提取出來,因此在識別自行車、公交車、靜止和火車上可以提取出有效的特征。從實(shí)驗(yàn)結(jié)果上看,這些短時間的局部特征比長時間的全局特征更加有效,準(zhǔn)確率、召回率和F1-分?jǐn)?shù)均優(yōu)于帶孔卷積神經(jīng)網(wǎng)絡(luò)。
表6 使用殘差網(wǎng)絡(luò)的實(shí)驗(yàn)結(jié)果 單位:%Tab.6 Experimental results of utilization of residual network unit:%
表7 是使用帶孔卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)交通模式識別實(shí)驗(yàn)結(jié)果,帶孔卷積神經(jīng)網(wǎng)絡(luò)可以在較長時間內(nèi)提取全局特征。從實(shí)驗(yàn)結(jié)果可以看出,對于火車這一交通模式,獲得全局特征更有利于識別該交通模式。因?yàn)榛疖嚦3_\(yùn)行時間較長,而且加速度或者勻速的時間較長,在短時間內(nèi)提取的局部特征,往往不具備很多的區(qū)分性,所以提取長時間的全局特征更加具有區(qū)分效果。
表7 使用帶孔卷積神經(jīng)網(wǎng)絡(luò)的實(shí)驗(yàn)結(jié)果 單位:%Tab.7 Experimental results of utilization of dilated convolutional network unit:%
利用殘差網(wǎng)絡(luò)學(xué)習(xí)特征圖像,可以將感受野控制在相對較小的范圍內(nèi),從而學(xué)習(xí)局部更細(xì)粒度的特征表達(dá);同理,利用帶孔卷積的卷積核間隔,在不擴(kuò)大參數(shù)規(guī)模的前提下,增加感受野,忽略掉一定的局部特征但是可以學(xué)習(xí)到全局特征。
綜合上面的實(shí)驗(yàn)結(jié)果可知,本文算法將兩種神經(jīng)網(wǎng)絡(luò)進(jìn)行融合,就可以得到表8 中的識別效果。如表8 所示,殘差網(wǎng)絡(luò)和帶孔卷積融合后,八類交通模式識別精度均有一定的提高,可以驗(yàn)證本文設(shè)計算法的有效性和兩種算法融合的必要性。
表8 融合殘差網(wǎng)絡(luò)和帶孔卷積神經(jīng)網(wǎng)絡(luò)的實(shí)驗(yàn)結(jié)果 單位:%Tab.8 Experimental results of fusion of residual network and dilated convolutional network unit:%
在本文中,主要調(diào)整了模型中的超參數(shù),其中包括學(xué)習(xí)率、正則化參數(shù)值,以及殘差神經(jīng)網(wǎng)絡(luò)卷積核大小。其中本文使用效果最好的參數(shù)已經(jīng)在表1和表2給出。
本文調(diào)整的其他參數(shù)如表9 所示。通過控制變量法的原則,每次調(diào)整一個參數(shù)。從各個交通模式的準(zhǔn)確率可以看出,超級參數(shù)的調(diào)整,對于準(zhǔn)確率影響非常大,尤其是對于公交車和私家車、地鐵和火車,這些比較難以區(qū)分的交通模式有明顯準(zhǔn)確率變化。
表9 不同參數(shù)的準(zhǔn)確率比較 單位:%Tab.9 Accuracy comparison of different parameters unit:%
本文通過融合殘差網(wǎng)絡(luò)和帶孔卷積,對八類交通模式識別進(jìn)行識別。首先,通過FFT 算法將一維傳感器時域數(shù)據(jù)轉(zhuǎn)換二維頻域圖像數(shù)據(jù);然后,使用PCA 算法有效降低圖像數(shù)據(jù)復(fù)雜度;接著,使用殘差網(wǎng)絡(luò)提取交通模式局部特征,使用帶孔卷積網(wǎng)絡(luò)提取全局特征;最后,通過對局部特征和全局特征的深度融合,實(shí)現(xiàn)了對交通模式的準(zhǔn)確識別,驗(yàn)證了融合殘差網(wǎng)絡(luò)和帶孔卷積網(wǎng)絡(luò)模型的準(zhǔn)確性和有效性。后續(xù)工作中將著力于繼續(xù)提升模型精度并進(jìn)一步降低模型復(fù)雜度,從而更好地滿足低功耗應(yīng)用需求。