国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

自編碼器與分類(lèi)器相結(jié)合的時(shí)間序列異常檢測(cè)方法

2022-01-11 09:42遲百峰
現(xiàn)代計(jì)算機(jī) 2021年32期
關(guān)鍵詞:分類(lèi)器編碼器樣本

遲百峰

(北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院,北京 100044)

0 引言

時(shí)間序列是隨時(shí)間變化的一組實(shí)值數(shù)據(jù),時(shí)間序列異常檢測(cè)廣泛運(yùn)用在工業(yè)、環(huán)境、網(wǎng)絡(luò)和醫(yī)療等領(lǐng)域,研究學(xué)者設(shè)計(jì)異常檢測(cè)方案發(fā)掘時(shí)間序列中不符合歷史發(fā)展趨勢(shì)的數(shù)據(jù)模式,進(jìn)一步預(yù)測(cè)可能發(fā)生的潛在危險(xiǎn)事件[1]。例如網(wǎng)絡(luò)入侵檢測(cè)可發(fā)現(xiàn)人為操作的惡意活動(dòng)[2],醫(yī)療異常檢測(cè)可輔助醫(yī)生對(duì)各種疾病進(jìn)行診斷[3],等。多元時(shí)間序列異常檢測(cè)通過(guò)識(shí)別異常輔助專(zhuān)業(yè)人員工作、避免重大事故發(fā)生等。為了更好地檢測(cè)出時(shí)間序列這一特殊數(shù)據(jù)形式中的異常,大量基于規(guī)則、統(tǒng)計(jì)、距離、密度的傳統(tǒng)方法被提出,在不同應(yīng)用場(chǎng)景下也取得了一定的效果,但這些方法難以適應(yīng)大規(guī)模量級(jí)的數(shù)據(jù),也不能較好地捕捉數(shù)據(jù)間的時(shí)序關(guān)系,導(dǎo)致異常檢測(cè)的性能和準(zhǔn)確率有所下降。

近幾年,基于深度學(xué)習(xí)的異常檢測(cè)方案受到了廣泛的關(guān)注。深度神經(jīng)網(wǎng)絡(luò)能處理復(fù)雜數(shù)據(jù),循環(huán)神經(jīng)網(wǎng)絡(luò)特別適用于序列數(shù)據(jù),能進(jìn)一步捕捉數(shù)據(jù)之間的時(shí)間依賴(lài)關(guān)系。卷積神經(jīng)網(wǎng)絡(luò)能捕捉數(shù)據(jù)間的局部空間特征。深度自編碼器是一種廣泛用于數(shù)據(jù)壓縮的技術(shù),由編碼器和解碼器兩部分組成。不同于傳統(tǒng)主成分分析法(principle component analysis,PCA)[4],編碼器對(duì)數(shù)據(jù)進(jìn)行降維、降噪處理,解碼器重建原始數(shù)據(jù)樣本[5]。使用CNN 和LSTM 搭建的DAE 在將多元高維時(shí)間序列數(shù)據(jù)映射到特征子空間時(shí),考慮到數(shù)據(jù)之間的順序關(guān)系和局部相關(guān)性,有助于在全局或局部區(qū)域識(shí)別某點(diǎn)數(shù)據(jù)是否為異常值。

本文核心工作是將卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)融合搭建自編碼器,既能得到數(shù)據(jù)的隱層空間表示,還可以捕捉數(shù)據(jù)間的一些局部特性和時(shí)間依賴(lài)關(guān)系。在隱層空間使用傳統(tǒng)分類(lèi)器檢測(cè)識(shí)別異常樣本。

1 相關(guān)工作

異常檢測(cè)的發(fā)展歷史悠久,其異常定義通常是指明顯偏離其他樣本觀(guān)測(cè)值的數(shù)據(jù)[6]。在時(shí)間序列領(lǐng)域中異常通常包括點(diǎn)異常、上下文異常和子序列異常三種類(lèi)型[7]。點(diǎn)異常指的是時(shí)間序列中某時(shí)間戳的數(shù)據(jù)明顯不同于其他數(shù)據(jù)。上下文異常類(lèi)似于點(diǎn)異常,只不過(guò)上下文異常是屬于一種局部異常,在時(shí)間序列中表示該時(shí)間戳的數(shù)據(jù)明顯區(qū)別于前后鄰域時(shí)間的數(shù)據(jù)變化。子序列異常指的是時(shí)間序列中某片段為異常。

針對(duì)于以上不同的異常類(lèi)型,經(jīng)典的兩類(lèi)解決方案為基于統(tǒng)計(jì)學(xué)和基于傳統(tǒng)機(jī)器學(xué)習(xí)異常檢測(cè)方法。其中基于統(tǒng)計(jì)學(xué)的方法是較早替代專(zhuān)家人工設(shè)定規(guī)則的時(shí)間異常檢測(cè)方法。針對(duì)時(shí)間序列這一數(shù)據(jù)類(lèi)型,使用回歸模型對(duì)時(shí)間序列歷史趨勢(shì)進(jìn)行建模,學(xué)習(xí)其內(nèi)在的演變規(guī)律或模式,對(duì)未來(lái)值進(jìn)行預(yù)測(cè)。當(dāng)實(shí)際值與回歸模型產(chǎn)生的預(yù)期值出現(xiàn)顯著偏差時(shí),該數(shù)據(jù)將被標(biāo)記為異常樣本。常見(jiàn)的方法有自回歸模型(autoregressive model,AR)、自回歸移動(dòng)平均模型(autoregressive moving average model,ARMA)、差分整合移動(dòng)平均自回歸模型(autoregressive integrated moving average model,ARIMA)[8]?;貧w模型的方法解釋性強(qiáng)、運(yùn)行效率高,在金融等領(lǐng)域也有廣泛的應(yīng)用,但難以準(zhǔn)確設(shè)定衡量差異性的閾值,也無(wú)法遷移到多維非線(xiàn)性時(shí)間序列異常檢測(cè)任務(wù)場(chǎng)景中。

基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法不同于基于統(tǒng)計(jì)學(xué)的方法,傳統(tǒng)機(jī)器學(xué)習(xí)方法可以在不關(guān)注數(shù)據(jù)底層特定分布的情況完成時(shí)間序列異常檢測(cè)任務(wù)。如局部離群因子(local outlier factor,LOF)通過(guò)密度估計(jì)方式搜索最近鄰,將位于稀疏區(qū)域的數(shù)據(jù)標(biāo)記為異常[9]。后來(lái)Oehmcke 等人將LOF 擴(kuò)展應(yīng)用到時(shí)間序列數(shù)據(jù)[10],Tang 等人提出基于連接的離群因子(connective-based outliers factor,COF)改進(jìn)密度估計(jì)的計(jì)算方式[11]。孤立森林(isolation forest,iForest)方法使用隨機(jī)超平面切割數(shù)據(jù)空間,分布密度稀疏的異常樣本或離群點(diǎn)更容易被切分到一個(gè)子空間中[12,13]。單類(lèi)支持向量機(jī)(One-Class SVM,OC-SVM)并不依靠密度劃分尋找異常,而是改進(jìn)支持向量機(jī)(SVM)利用分類(lèi)技術(shù)在類(lèi)極度不平衡的時(shí)間序列數(shù)據(jù)上進(jìn)行異常檢測(cè)[14]。本質(zhì)上將二分類(lèi)轉(zhuǎn)化成單分類(lèi),只要數(shù)據(jù)不屬于正常類(lèi),就將其標(biāo)記為異常樣本[15]。

相比于上文所介紹的兩大經(jīng)典方案,隨著深度神經(jīng)網(wǎng)絡(luò)的快速發(fā)展,深度學(xué)習(xí)異常檢測(cè)方案已經(jīng)在離群點(diǎn)檢測(cè)上取得了顯著性效果[16]。比如循環(huán)神經(jīng)網(wǎng)絡(luò)(RNNs)可有效捕捉時(shí)間序列數(shù)據(jù)的特征,其經(jīng)典模型長(zhǎng)時(shí)間記憶網(wǎng)絡(luò)(LSTM)和門(mén)控遞歸單元(GRU)通過(guò)內(nèi)部獨(dú)特結(jié)構(gòu)存儲(chǔ)、遺忘或傳遞時(shí)間信息,通過(guò)反饋連接建立前后時(shí)間值的關(guān)聯(lián)。在時(shí)間序列異常檢測(cè)中,LSTM序列模型預(yù)測(cè)未來(lái)時(shí)間序列趨勢(shì),如果不符合LSTM捕捉到的上下文發(fā)展規(guī)律可當(dāng)異常樣本處理,并已經(jīng)證明與傳統(tǒng)方法相比算法性能顯著提高[17]。卷積神經(jīng)網(wǎng)絡(luò)(CNN)能從復(fù)雜的高維數(shù)據(jù)中提取局部特征,可作為特征提取器用于序列數(shù)據(jù)或圖像數(shù)據(jù)的離群點(diǎn)檢測(cè)[18]。深度自編碼器通過(guò)重構(gòu)輸入數(shù)據(jù)學(xué)習(xí)一個(gè)恒等變換函數(shù),當(dāng)自編碼器使用正常數(shù)據(jù)作為輸入進(jìn)行模型訓(xùn)練時(shí),僅能夠?qū)φ颖具M(jìn)行恒等變換,無(wú)法重建的異常樣本會(huì)因高殘差被標(biāo)記為離群值[19]。此外,結(jié)合自編碼器的編碼器編碼能力和傳統(tǒng)分類(lèi)器分類(lèi)能力,將異常檢測(cè)問(wèn)題轉(zhuǎn)化為有監(jiān)督的分類(lèi)問(wèn)題也取得了很好的進(jìn)展[20]。

本文采用混合深度學(xué)習(xí)異常檢測(cè)思路,在數(shù)據(jù)預(yù)處理的基礎(chǔ)上,第一步將深度自編碼器的編碼器作為特征提取器,第二步將易區(qū)分的編碼數(shù)據(jù)送入傳統(tǒng)分類(lèi)器中進(jìn)行異常檢測(cè),實(shí)際結(jié)果表明該結(jié)合方案具有很強(qiáng)的魯棒性[21-22]。

2 方法原理與設(shè)計(jì)

本文提出的混合深度學(xué)習(xí)異常檢測(cè)方法分三大階段,分別是數(shù)據(jù)預(yù)處理、模型搭建、預(yù)訓(xùn)練模型中的編碼器先對(duì)數(shù)據(jù)進(jìn)行編碼,然后送入傳統(tǒng)分類(lèi)器進(jìn)行異常檢測(cè),本章節(jié)依次對(duì)三個(gè)階段展開(kāi)論述。

2.1 多重滑窗采樣

時(shí)間序列的尺度選擇、缺失值處理或噪聲污染處理嚴(yán)重影響異常檢測(cè)的準(zhǔn)確性。本文采用滑動(dòng)窗口技術(shù)和二次下采樣技術(shù)對(duì)原始正常數(shù)據(jù)進(jìn)行處理,有助于深度自編碼器在此基礎(chǔ)上學(xué)習(xí)到更加明顯的區(qū)分特征,具體操作如下,總體過(guò)程如圖1所示。

(3)二次下采樣技術(shù)處理滑動(dòng)窗口序列。下采樣技術(shù)廣泛運(yùn)用在視覺(jué)圖像領(lǐng)域,通過(guò)對(duì)圖像進(jìn)行下采樣,可使得圖像符合顯示區(qū)域的大小或生成對(duì)應(yīng)圖像的縮略圖。將其遷移到時(shí)間序列領(lǐng)域上對(duì)數(shù)據(jù)進(jìn)行采樣縮減,使得深度自編碼器訓(xùn)練速度更快并一定程度避免過(guò)擬合情況的發(fā)生。下采樣技術(shù)還能充分考慮數(shù)據(jù)的分布不均衡等問(wèn)題,以相對(duì)較少的樣本考慮全體數(shù)據(jù)的特性。首先第一次下采樣使用在滑動(dòng)窗口技術(shù)處理后的序列集合上,即對(duì)滑窗產(chǎn)生的各個(gè)窗口進(jìn)行下采樣,假設(shè)采樣的個(gè)數(shù)為k,那么Wsample=[wstart,…,wend],其中k=wend-wstart。進(jìn)而在對(duì)Wsample內(nèi)的數(shù)據(jù)進(jìn)行第二次下采樣,這樣可以考慮到不同時(shí)刻不同時(shí)間段和不同時(shí)間間隔的情況。

2.2 模型架構(gòu)

本文使用的主要模型為深度自編碼器,主要內(nèi)部網(wǎng)絡(luò)結(jié)構(gòu)包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)和長(zhǎng)短時(shí)記憶(LSTM)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)(CNN)通常用于計(jì)算機(jī)視覺(jué)中的目標(biāo)檢測(cè)、圖像分類(lèi)等任務(wù)[23-25],但時(shí)間序列數(shù)據(jù)在形式上類(lèi)似于圖像數(shù)據(jù),可更好地關(guān)注數(shù)據(jù)的局部特征。長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)通過(guò)內(nèi)部結(jié)構(gòu)引入基于上下文的加權(quán)自循環(huán)機(jī)制,可自動(dòng)判定過(guò)去信息是否遺忘或向后傳遞[26-27],被廣泛用于自然語(yǔ)言處理、語(yǔ)音識(shí)別和時(shí)間序列各種任務(wù)中[26-28]。

深度自編碼器有機(jī)地統(tǒng)一CNN 和LSTM 兩種經(jīng)典神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),對(duì)時(shí)間序列數(shù)據(jù)既捕捉局部特征,也考慮前后時(shí)間依賴(lài)程度。其中編碼器部分可對(duì)數(shù)據(jù)樣本進(jìn)行隱層特征的表示學(xué)習(xí),解碼器部分通過(guò)重構(gòu)原始樣本約束其隱變量學(xué)習(xí)的程度,重構(gòu)誤差越小表示自編碼器對(duì)數(shù)據(jù)樣本重建能力越好,那么自編碼器重建異常樣本則會(huì)產(chǎn)生一個(gè)較差的效果從而發(fā)現(xiàn)異常。

深度自編碼器通編碼部分為將原始數(shù)據(jù)映射到隱層特征空間,相當(dāng)于對(duì)原始數(shù)據(jù)進(jìn)行一種潛在空間的表示學(xué)習(xí)[29]。解碼部分則試圖將原始數(shù)據(jù)的新表示還原成原始數(shù)據(jù)。一般使用均方誤差(mean square error,MSE)衡量原始輸入和重建輸入差異度,即重構(gòu)效果。數(shù)學(xué)表達(dá)如下:

公式(1)代表自編碼器對(duì)原始數(shù)據(jù)的編碼過(guò)程,本質(zhì)上是一個(gè)映射函數(shù)f用隱變量z來(lái)表示原始數(shù)據(jù)x。公式(2)代表自編碼器對(duì)隱變量z的解碼過(guò)程,本質(zhì)上也是一個(gè)映射函數(shù)g將隱變量z還原成原始數(shù)據(jù)x^。公式(3)就是使用均方誤差MSE盡可能的降低原始數(shù)據(jù)與重建數(shù)據(jù)的差異性。

本文所采用的模型架構(gòu)如圖2 所示,預(yù)處理數(shù)據(jù)作為輸入依次經(jīng)使用Relu 激活的卷積層、帶有正則操作的最大池化層、使用Relu 激活的全連接層以及兩次LSTM 層獲得最終輸出,具體代碼流程見(jiàn)算法1:訓(xùn)練CNN+LSTM自編碼器。

圖2 模型架構(gòu)

算法1:訓(xùn)練CNN+LSTM自編碼器

2.3 異常檢測(cè)階段

模型預(yù)訓(xùn)練過(guò)程使用僅包含正常樣本的數(shù)據(jù)集,這樣深度自編碼器可以對(duì)正常樣本的時(shí)間序列有較好的重建能力,對(duì)異常樣本則無(wú)法進(jìn)行重建或重建效果很差。異常檢測(cè)階段主要使用預(yù)訓(xùn)練好的自編碼器的編碼器對(duì)數(shù)據(jù)進(jìn)行編碼,在潛在空間對(duì)數(shù)據(jù)進(jìn)行隱層表示,異常樣本將明顯遠(yuǎn)離正常樣本的所在范圍。傳統(tǒng)分類(lèi)器(如SVM 等)就可以明確地劃分出決策邊界,從而精準(zhǔn)地發(fā)現(xiàn)異常點(diǎn)和正常點(diǎn),具體過(guò)程如圖3所示。

圖3 異常檢測(cè)過(guò)程

異常檢測(cè)過(guò)程重要的環(huán)節(jié)為數(shù)據(jù)編碼表示、訓(xùn)練傳統(tǒng)分類(lèi)器、使用傳統(tǒng)分類(lèi)器在測(cè)試集上進(jìn)行標(biāo)簽類(lèi)別預(yù)測(cè)。使用二進(jìn)制表示輸出結(jié)果,即1表示該樣本為異常,0表示該樣本為正常。具體代碼流程見(jiàn)算法2。

算法2:異常檢測(cè)過(guò)程

3 實(shí)驗(yàn)

本文在Mammography、Satimage-2、Campaign三個(gè)數(shù)據(jù)集上進(jìn)行了廣泛的實(shí)驗(yàn),與單純使用傳統(tǒng)分類(lèi)器、普通全連接網(wǎng)絡(luò)搭建的自編碼器結(jié)合傳統(tǒng)分類(lèi)器的方法對(duì)比,評(píng)價(jià)本文所提出的使用CNN 和LSTM 搭建的深度自編碼器與傳統(tǒng)分類(lèi)器結(jié)合的異常檢測(cè)效果。此外,還與經(jīng)典的異常檢測(cè)方法進(jìn)行比較,如局部異常因子(Local Outlier Factor,LOF)[9]、一類(lèi)支持向量機(jī)(One Class SVM,OCSVM)[14]、孤立森林(Isolation Forest,IForest)[12]以及先進(jìn)的 Copula-Based Outlier Detection(COPOD)[30]。實(shí)驗(yàn)結(jié)果表明本文提出的方法異常檢測(cè)效果普遍更佳。

3.1 數(shù)據(jù)集

本文在3 個(gè)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),分別來(lái)自O(shè)DDS 異常檢測(cè)數(shù)據(jù)庫(kù)的Mammography、Satimage-2 數(shù)據(jù)集,和來(lái)自于UCI 機(jī)器學(xué)習(xí)數(shù)據(jù)庫(kù)的Campaign數(shù)據(jù)集,基本信息如表1所示。

表1 數(shù)據(jù)集介紹

(1)Mammography 數(shù)據(jù)集最初是Aleksandar Lazarevic 提供的乳腺攝影,記錄乳腺是否存在鈣化的情況。在異常檢測(cè)任務(wù)中,將鈣化情況視為異常樣本(標(biāo)記為1),其他全部情況視為正常樣本(標(biāo)記為0)。

(2)Satimage-2 數(shù)據(jù)集由陸地衛(wèi)星(statlog)記錄采集并最初用于多分類(lèi)任務(wù),在異常檢測(cè)任務(wù)中,對(duì)原始數(shù)據(jù)集的第2 類(lèi)別下采樣出71 個(gè)異常樣本(標(biāo)記為1),其他所有類(lèi)別視為正常樣本(標(biāo)記為0)。

(3)Campaign 數(shù)據(jù)集記錄的是葡萄牙某銀行機(jī)構(gòu)的一次營(yíng)銷(xiāo)活動(dòng)情況,在異常檢測(cè)任務(wù)中,用戶(hù)在本次活動(dòng)中成功訂閱該機(jī)構(gòu)產(chǎn)品視為異常(標(biāo)記為1),反之視為正常(標(biāo)記為0)。

3.2 實(shí)驗(yàn)結(jié)果分析

本文主要參數(shù)為數(shù)據(jù)預(yù)處理中使用的滑窗及兩次采樣大小,和CNN+LSTM-AE 模型中的卷積核、神經(jīng)單元數(shù)等,具體信息如表2所示。

表2 實(shí)驗(yàn)參數(shù)

本文評(píng)價(jià)標(biāo)準(zhǔn)采用F1 Score,原因是異常檢測(cè)問(wèn)題本質(zhì)上是一個(gè)類(lèi)極度不平衡情況下的分類(lèi)問(wèn)題,使用F1 Score 可以兼顧檢測(cè)的精確率和召回率,能客觀(guān)地表明模型的健壯程度。

與普通全連接層搭建的自編碼器結(jié)合傳統(tǒng)分類(lèi)器、原始傳統(tǒng)分類(lèi)器進(jìn)行對(duì)比,可以發(fā)現(xiàn)使用CNN+LSTM 對(duì)原始數(shù)據(jù)編碼后再結(jié)合傳統(tǒng)分類(lèi)器,在這三個(gè)數(shù)據(jù)集上均表現(xiàn)出良好的效果,實(shí)驗(yàn)結(jié)果如表3 所示。Mammography 數(shù)據(jù)集上效果尤為顯著,F(xiàn)1 Score均有明顯提高。在Satimage-2數(shù)據(jù)集上,本文提出的方法略?xún)?yōu)于使用普通全連接層的編碼后結(jié)合傳統(tǒng)分類(lèi)器,并且F1 Score 接近滿(mǎn)分趨勢(shì)。Campaign 數(shù)據(jù)集樣本量偏大,異常分布極不均衡,本文提出的方法雖優(yōu)于其他兩種方案,但F1 Score 均在0.9 以下??偟膩?lái)說(shuō),CNN+LSTM-AE 方法在小數(shù)據(jù)集上可保持較高的F1 Score,對(duì)于大數(shù)據(jù)集只能小幅度提升F1 Score,并不能像其他數(shù)據(jù)集達(dá)到接近F1 Score=1的結(jié)果。

表3 實(shí)驗(yàn)結(jié)果

與經(jīng)典的異常檢測(cè)方法進(jìn)行對(duì)比,如局部異常因子(local outlier factor,LOF)、一類(lèi)支持向量機(jī)(one class SVM,OCSVM)、孤立森林(isolation forest,IForest),本文提出的方法依舊領(lǐng)先于其他三種方法,實(shí)驗(yàn)結(jié)果如表4 所示。原因很簡(jiǎn)單,三種經(jīng)典方法均無(wú)法有效捕捉序列相關(guān)性等局部特征,F(xiàn)1 Score 僅能保持在0.5 左右,而本文提出的CNN+LSTM 作為數(shù)據(jù)的預(yù)編碼結(jié)合傳統(tǒng)分類(lèi)器有效克服經(jīng)典方法的缺點(diǎn),可取得F1 Score 平均保持在0.9左右顯著效果。

表4 實(shí)驗(yàn)結(jié)果

基于概率累計(jì)函數(shù)設(shè)計(jì)的快速異常檢測(cè)方法COPOD 的異常檢測(cè)效果特別快,實(shí)際應(yīng)用場(chǎng)景廣泛,但主要問(wèn)題與上面三種經(jīng)典方法一樣,無(wú)法考慮到數(shù)據(jù)之間的局部信息或順序信息導(dǎo)致檢測(cè)效果不佳。本文提出的方法與COPOD比較的實(shí)驗(yàn)結(jié)果如表5所示。

表5 實(shí)驗(yàn)結(jié)果

根據(jù)廣泛的實(shí)驗(yàn)結(jié)果分析可知,本文提出的混合方法可有效提高異常檢測(cè)的效果,F(xiàn)1 Score均能保持一個(gè)較高的程度。此外僅使用普通的全連接層搭建自編碼器結(jié)合傳統(tǒng)分類(lèi)器都能取得比較好的性能,間接證明先使用神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行編碼,提取內(nèi)在更具區(qū)分性的特征,再進(jìn)行異常檢測(cè)的思路行之有效。不過(guò)本方案也存在比較明顯的問(wèn)題是先對(duì)深度自編碼器進(jìn)行預(yù)訓(xùn)練得到強(qiáng)大的編碼器,再進(jìn)行異常檢測(cè)不屬于端到端模型,導(dǎo)致兩部分可能均陷入局部最優(yōu)解,無(wú)法動(dòng)態(tài)權(quán)衡兩部分得到一個(gè)全局最優(yōu)解,所以在大數(shù)據(jù)集Campaign 上的F1 Score 始終無(wú)法與其他數(shù)據(jù)集相媲美。

4 結(jié)語(yǔ)

本文提出了一種深度混合多元時(shí)間序列異常檢測(cè)的方法,使用CNN 和LSTM 搭建深度自編碼器,目的是學(xué)習(xí)到數(shù)據(jù)有效的隱層表示,基于這種隱層表示結(jié)合傳統(tǒng)分類(lèi)器高效快速地檢測(cè)識(shí)別異常樣本。該方案也進(jìn)一步表明CNN 和LSTM 的組合確實(shí)能較為充分地考慮數(shù)據(jù)之間的時(shí)間依賴(lài)關(guān)系,經(jīng)編碼器編碼得到的隱層特征表示在潛在空間的區(qū)分邊界更加容易確定。在今后的工作中,將考慮設(shè)計(jì)原始混合模型為端到端模型并加入注意力機(jī)制,提升在任何大小、任何形式數(shù)據(jù)集上的異常檢測(cè)性能,同時(shí)考慮時(shí)間序列不同維度之間的影響程度,進(jìn)一步提升本文方法在結(jié)構(gòu)復(fù)雜的實(shí)際應(yīng)用場(chǎng)景下的魯棒性、高效性。

猜你喜歡
分類(lèi)器編碼器樣本
分類(lèi)器集成綜述
基于ResNet18特征編碼器的水稻病蟲(chóng)害圖像描述生成
少樣本條件下基于K-最近鄰及多分類(lèi)器協(xié)同的樣本擴(kuò)增分類(lèi)
學(xué)貫中西(6):闡述ML分類(lèi)器的工作流程
基于A(yíng)daBoost算法的在線(xiàn)連續(xù)極限學(xué)習(xí)機(jī)集成算法
直擊高考中的用樣本估計(jì)總體
基于TMS320F28335的絕對(duì)式光電編碼器驅(qū)動(dòng)設(shè)計(jì)
隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
基于支持向量機(jī)的測(cè)厚儀CS值電壓漂移故障判定及處理
七年級(jí)數(shù)學(xué)下冊(cè)期末檢測(cè)題(B)
青浦区| 玉门市| 博野县| 科技| 龙川县| 上杭县| 建宁县| 油尖旺区| 通山县| 金平| 綦江县| 洛扎县| 肃北| 淳安县| 桐庐县| 福安市| 威信县| 漠河县| 苏州市| 柳河县| 青阳县| 抚顺市| 枣强县| 保定市| 会东县| 红安县| 宜阳县| 鄂州市| 浑源县| 南溪县| 乌拉特中旗| 读书| 肥城市| 综艺| 池州市| 揭西县| 葵青区| 上饶市| 崇义县| 汤阴县| 瑞安市|