張嬌陽,孫 黎
(西安交通大學(xué) 信息與通信工程學(xué)院,陜西 西安 710049)
異常檢測[1-2]和流量預(yù)測是無線網(wǎng)絡(luò)數(shù)據(jù)分析和管理中的重要任務(wù),有利于提高網(wǎng)絡(luò)的智能化管理水平,實(shí)現(xiàn)網(wǎng)絡(luò)資源的優(yōu)化分配和按需調(diào)度。在邊緣計(jì)算場景下,異常檢測和流量預(yù)測任務(wù)在距離數(shù)據(jù)源更近的位置——基站進(jìn)行計(jì)算,以減少移動(dòng)業(yè)務(wù)交付的端到端時(shí)延,發(fā)掘無線網(wǎng)絡(luò)的內(nèi)在能力,從而提升用戶體驗(yàn)。
現(xiàn)有的異常檢測研究工作中,監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)算法已被廣泛應(yīng)用于流量異常檢測研究中。基于有監(jiān)督學(xué)習(xí)的異常檢測方法依賴于已標(biāo)記網(wǎng)絡(luò)正常行為的數(shù)據(jù)集,然而在實(shí)際應(yīng)用中,沒有異常的數(shù)據(jù)集非常罕見并且獲得代價(jià)昂貴。無監(jiān)督學(xué)習(xí)的異常檢測方法中,K均值(K-means)聚類方法[3-4]由于其簡易性,被廣泛應(yīng)用到異常檢測任務(wù)當(dāng)中?;?K-means 聚類的異常檢測方法通過將數(shù)據(jù)劃分為正常流量集群和異常流量集群的方式來檢測異常。但是,該異常檢測的方法依然存在一些問題,直接利用聚類算法檢測異常可以檢測到高流量區(qū)域的異常,但會(huì)忽略低流量區(qū)域存在的異常。另外有基于流量模式的K-means聚類的異常檢測方法[5],在大規(guī)模長時(shí)間序列檢測問題中,存在處理區(qū)域數(shù)量有限、處理數(shù)據(jù)時(shí)長有限等缺陷。
現(xiàn)有的流量預(yù)測研究工作中[6],基于統(tǒng)計(jì)的方法將無線網(wǎng)絡(luò)流量預(yù)測視為時(shí)間序列預(yù)測問題,其性能取決于利用哪一種統(tǒng)計(jì)模型進(jìn)行建模,常用的模型包括回歸移動(dòng)平均(ARIMA)、α穩(wěn)定模型等,但這些基于統(tǒng)計(jì)的模型無法同時(shí)建模多種因素的影響。為了挖掘無線網(wǎng)絡(luò)流量數(shù)據(jù)中隱藏著的復(fù)雜依賴性關(guān)系,深度學(xué)習(xí)模型被應(yīng)用到無線網(wǎng)絡(luò)流量預(yù)測中。文獻(xiàn)[7]提出了一種基于深度學(xué)習(xí)的混合模型進(jìn)行時(shí)空流量預(yù)測,采用自編碼器建模空間依賴性,同時(shí)采用長短期記憶網(wǎng)絡(luò)建模時(shí)間依賴性。但是這種建模方式是有損的,而且需要對(duì)每個(gè)區(qū)域分別進(jìn)行建模,無法同時(shí)獲得預(yù)測結(jié)果。文獻(xiàn)[8-9]采用卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行建模,可以實(shí)現(xiàn)用一個(gè)模型對(duì)無線網(wǎng)絡(luò)流量進(jìn)行預(yù)測。然而,空間依賴性不能只局限于與目標(biāo)位置相鄰的區(qū)域,以市中心的大學(xué)和郊區(qū)的大學(xué)為例,兩個(gè)地區(qū)屬于地理位置不相鄰的同種功能區(qū),流量模式存在強(qiáng)相關(guān)性,如果僅能學(xué)習(xí)相鄰區(qū)域的相關(guān)性,會(huì)缺失如上例所述的非相鄰但功能相同的區(qū)域間的重要信息,導(dǎo)致學(xué)習(xí)效果不佳。上述基于卷積神經(jīng)網(wǎng)絡(luò)的研究工作僅能捕獲目標(biāo)區(qū)域相鄰的局部區(qū)域的相關(guān)性,不能捕獲全局的空間依賴性。非局部神經(jīng)網(wǎng)絡(luò)(NLnet)預(yù)測方法對(duì)全局空間相關(guān)性進(jìn)行建模,但是忽略了不同通信數(shù)據(jù)間的相關(guān)性。
針對(duì)異常檢測和流量預(yù)測任務(wù)面臨的上述問題,本文提出一種基于特征降維的異常檢測方法和多數(shù)據(jù)集聯(lián)合預(yù)測的移動(dòng)網(wǎng)絡(luò)流量預(yù)測方法。基于特征降維的異常檢測方法首先在全局范圍內(nèi)提取所有區(qū)域流量特征,利用特征數(shù)據(jù)鎖定可疑異常出現(xiàn)的網(wǎng)格,再分別對(duì)出現(xiàn)可疑異常警報(bào)網(wǎng)格中的原始流量數(shù)據(jù)使用K-means聚類方法進(jìn)行局部異常檢測,本方法可以快速準(zhǔn)確檢測大規(guī)模流量數(shù)據(jù)的可疑異常,更適用于規(guī)模大、持續(xù)時(shí)間長的蜂窩網(wǎng)絡(luò)數(shù)據(jù)。在多數(shù)據(jù)集聯(lián)合預(yù)測的移動(dòng)網(wǎng)絡(luò)流量預(yù)測方法中,引入注意力機(jī)制學(xué)習(xí)各個(gè)時(shí)刻不同業(yè)務(wù)間的相關(guān)性,并利用循環(huán)神經(jīng)網(wǎng)絡(luò)記憶這種相關(guān)性,進(jìn)一步提高了流量預(yù)測的準(zhǔn)確度,適用于對(duì)歷史數(shù)據(jù)量少、相關(guān)業(yè)務(wù)數(shù)據(jù)多的活動(dòng)進(jìn)行預(yù)測。
系統(tǒng)模型由邊緣計(jì)算網(wǎng)絡(luò)架構(gòu)組成,如圖1所示[10],邊緣計(jì)算架構(gòu)分為終端設(shè)備、邊緣、云端三層。終端層由各種設(shè)備組成,主要完成收集原始數(shù)據(jù)并上報(bào)的功能,以事件源的形式作為應(yīng)用服務(wù)的輸入。邊緣計(jì)算層由網(wǎng)絡(luò)邊緣節(jié)點(diǎn)構(gòu)成,廣泛分布在終端設(shè)備與計(jì)算中心之間,邊緣計(jì)算層通過合理部署和調(diào)配網(wǎng)絡(luò)邊緣側(cè)的計(jì)算和存儲(chǔ)能力,實(shí)現(xiàn)基礎(chǔ)服務(wù)響應(yīng),邊緣計(jì)算層的上報(bào)數(shù)據(jù)將在云計(jì)算中心進(jìn)行永久性存儲(chǔ)。本文的異常檢測和流量預(yù)測功能依托邊緣計(jì)算下沉到基站完成。
圖1 邊緣計(jì)算網(wǎng)絡(luò)架構(gòu)Fig.1 Edge computing network architecture
本文使用的蜂窩流量數(shù)據(jù)集由意大利電信移動(dòng)公司提供[11],該數(shù)據(jù)集是大數(shù)據(jù)挑戰(zhàn)賽的一部分。原始數(shù)據(jù)集收集了整個(gè)米蘭城市內(nèi)每隔10 min的手機(jī)活動(dòng)記錄(62天, 300百萬條記錄,大約19 GB)。米蘭市的面積為550 km2,根據(jù)基站分布情況,被劃分為100 × 100正方形網(wǎng)格。每個(gè)正方形網(wǎng)格的大小約為0.235 km×0.235 km,在本節(jié)中每一個(gè)正方形網(wǎng)格被稱為網(wǎng)格或網(wǎng)格區(qū)域。米蘭市的部分網(wǎng)格區(qū)域如圖2所示。
在原始數(shù)據(jù)集中,每條手機(jī)流量活動(dòng)記錄均由以下條目組成。
① 網(wǎng)格編號(hào)(Square ID):對(duì)已劃分網(wǎng)格的編號(hào);
② 時(shí)間戳(Time-stamp):每一條手機(jī)流量活動(dòng)的時(shí)間戳;
③ 接收短消息活動(dòng)量(SMS-in Activity):某一特定網(wǎng)格內(nèi)每10 min內(nèi)接收的短消息活動(dòng)流量值;
④ 發(fā)送短消息活動(dòng)量(SMS-out Activity):某一特定網(wǎng)格內(nèi)每10 min內(nèi)發(fā)送的短消息活動(dòng)流量值;
⑤ 接聽電話活動(dòng)量(Call-in Activity):某一特定網(wǎng)格內(nèi)每10 min內(nèi)接聽的電話活動(dòng)流量值;
⑥ 撥打電話活動(dòng)量(Call-out Activity):某一特定網(wǎng)格內(nèi)每10 min內(nèi)撥打的電話活動(dòng)流量值;
⑦ 互聯(lián)網(wǎng)活動(dòng)量(Internet Activity):某一特定網(wǎng)格內(nèi)每10 min內(nèi)互聯(lián)網(wǎng)接入活動(dòng)流量值;
⑧ 國家代碼(Country Code):電話國家代碼。
圖2 米蘭部分網(wǎng)格區(qū)域Fig.2 Part of the grid area in Milan
在大規(guī)模蜂窩數(shù)據(jù)異常檢測任務(wù)中,由于數(shù)據(jù)收集覆蓋范圍大,流量數(shù)據(jù)持續(xù)時(shí)間長,直接在全局范圍對(duì)原始數(shù)據(jù)進(jìn)行異常檢測會(huì)花費(fèi)大量時(shí)間,消耗計(jì)算機(jī)資源。所以在全局范圍內(nèi)異常檢測前需要對(duì)流量數(shù)據(jù)進(jìn)行合理的降維處理,提取高維流量數(shù)據(jù)的特征,便于獲取全局范圍內(nèi)的異常信息。
蜂窩流量數(shù)據(jù)記錄了不同時(shí)刻各個(gè)網(wǎng)格的流量值,相鄰時(shí)刻流量值具有強(qiáng)相關(guān)性,為了有效提取這種相關(guān)性,這里使用長短期記憶(Long Short Term Memory,LSTM)自編碼器對(duì)原始蜂窩流量數(shù)據(jù)提取流量特征,使用這一模型可以更好地學(xué)習(xí)歷史時(shí)間序列的相關(guān)性,同時(shí)提取蜂窩流量數(shù)據(jù)的流量特征,模型框圖如圖3所示。
圖3 LSTM自編碼器結(jié)構(gòu)Fig.3 LSTM autoencoder structure
其中,LSTM的網(wǎng)絡(luò)結(jié)構(gòu)是鏈?zhǔn)窖h(huán)的結(jié)構(gòu)[12],能夠用來處理長時(shí)依賴的問題,一個(gè)方塊代表一個(gè)時(shí)刻的LSTM單元,包括3個(gè)門:輸入門、遺忘門、輸出門。輸入門控制著網(wǎng)絡(luò)的輸入,遺忘門控制著網(wǎng)絡(luò)的記憶單元,決定之前的哪些記憶將被保留,哪些記憶將被去除,輸出門控制著網(wǎng)絡(luò)的輸出。
(1)
式中,N代表x的維度,下標(biāo)i代表向量的第i個(gè)分量。
為了保證隱變量h中信息的有效性,在構(gòu)建自編碼器時(shí),通常限制隱變量h輸入的維度小于輸入數(shù)據(jù)x的維度,這使得編碼器能夠完成數(shù)據(jù)壓縮的任務(wù)。
經(jīng)過LSTM自編碼器可以得到蜂窩流量數(shù)據(jù)的低維特征,在新的低維空間找到與整體數(shù)據(jù)樣本表現(xiàn)出來的特點(diǎn)不一致的數(shù)據(jù)點(diǎn)標(biāo)記為可疑異常,鎖定可疑異常出現(xiàn)的網(wǎng)格,下一步對(duì)所有可疑異常出現(xiàn)的網(wǎng)格進(jìn)行局部異常檢測。
通過上一步使用LSTM自編碼器獲得新的蜂窩流量特征,在新的特征空間發(fā)現(xiàn)可疑異常出現(xiàn)的網(wǎng)格。獲取到所有異??赡艹霈F(xiàn)的網(wǎng)格后,在每個(gè)可疑異常出現(xiàn)的網(wǎng)格中對(duì)原始數(shù)據(jù)進(jìn)行聚類檢測異常,將聚類結(jié)果中流量值大且同一類中樣本數(shù)少的樣本標(biāo)記為異常數(shù)據(jù)。
這里選擇K-means[13]進(jìn)行異常檢測,與其他聚類方法相比,K-means算法的時(shí)間復(fù)雜度更低,占用的計(jì)算資源更少,因此,這里選用 K-means算法檢測可疑異常。應(yīng)用該算法時(shí),首先采用戴維森堡丁指數(shù)(DBI)確定聚類集群的最佳數(shù)目,DBI定義為:
(2)
(3)
mi,j=‖ai-aj‖2,
(4)
(5)
將數(shù)據(jù)集中的樣本劃分為若干不相交的子集,每個(gè)子集為一個(gè)“簇”,通過這樣的劃分可以尋找出異常數(shù)據(jù)對(duì)應(yīng)的簇。最后,因?yàn)楫惓A髁恐蹬c正常流量值有很大的差異,所以異常流量樣本將組成單獨(dú)的集群,將具有最少樣本數(shù)量且流量值數(shù)量級(jí)別最高的集群認(rèn)定為異常。
本節(jié)使用經(jīng)過上述方法剔除異常后的5種數(shù)據(jù),包括互聯(lián)網(wǎng)數(shù)據(jù)、接聽的話音業(yè)務(wù)數(shù)據(jù)、撥打的話音業(yè)務(wù)數(shù)據(jù)、接收的短消息業(yè)務(wù)數(shù)據(jù)和發(fā)送的短消息業(yè)務(wù)數(shù)據(jù),然后利用互聯(lián)網(wǎng)數(shù)據(jù)和其余業(yè)務(wù)數(shù)據(jù)的相關(guān)性預(yù)測未來的互聯(lián)網(wǎng)數(shù)據(jù)。預(yù)測模型如圖4所示,首先將各類業(yè)務(wù)分別輸入相同的循環(huán)神經(jīng)網(wǎng)絡(luò)中,記錄各時(shí)刻的輸出,然后將同一時(shí)刻所有業(yè)務(wù)數(shù)據(jù)在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)單元的輸出輸入到注意力單元中,計(jì)算當(dāng)前時(shí)刻其余業(yè)務(wù)與目標(biāo)業(yè)務(wù)的相關(guān)性,各個(gè)時(shí)刻依次進(jìn)行相同操作,最后一個(gè)時(shí)間節(jié)點(diǎn)目標(biāo)業(yè)務(wù)的輸出即為流量預(yù)測的結(jié)果。
圖4 基于注意力機(jī)制的多數(shù)據(jù)集聯(lián)合預(yù)測方案Fig.4 Multi-data set joint prediction scheme based on attention mechanism
以第一個(gè)時(shí)刻為例,注意力單元內(nèi)部結(jié)構(gòu)如圖5所示。
圖5 注意力模塊內(nèi)部結(jié)構(gòu)Fig.5 Internal structure of attention module
為保證模型訓(xùn)練正確,將輸入模型的數(shù)據(jù)分別進(jìn)行歸一化,接下來生成查詢張量qj、鍵張量kj、值張量vj,考慮到預(yù)測目標(biāo)是互聯(lián)網(wǎng)數(shù)據(jù),所以僅需要對(duì)互聯(lián)網(wǎng)數(shù)據(jù)生成查詢張量qj。然后根據(jù)查詢張量qj和鍵張量kj計(jì)算不同數(shù)據(jù)的相似度α1m。
(6)
最后使用相似度張量和值張量做乘法得到自注意力機(jī)制的輸出。
流量數(shù)據(jù)根據(jù)數(shù)據(jù)集可知,每個(gè)流量活動(dòng)值(SMS-in Activity,SMS-out Activity,Call-in Activity,Call-out Activity,Internet Activity)表示某一網(wǎng)格在10 min內(nèi)所有用戶的通信強(qiáng)度。在實(shí)驗(yàn)中,為了避免數(shù)據(jù)稀疏,首先將每條流量活動(dòng)記錄的5種活動(dòng)值相加為一個(gè)值,該值描述一個(gè)網(wǎng)格內(nèi)所有用戶的總活動(dòng)量。然后,將數(shù)據(jù)時(shí)間間隔由10 min匯總到1 h。因此,本文中所需檢測的異常確切指代高于正常模式的流量值。
為全面評(píng)估不同的異常檢測算法,將本文異常剔除方案與其他異常剔除方案進(jìn)行流量預(yù)測對(duì)比。流量預(yù)測過程中,采用了2個(gè)評(píng)價(jià)指標(biāo)進(jìn)行評(píng)價(jià)。
第一個(gè)是均方根誤差(RMSE),這是度量模型預(yù)測值和真實(shí)值之間平方差的指標(biāo)。定義為:
(7)
第二個(gè)是平均絕對(duì)誤差(MAE),這是度量預(yù)測值與真實(shí)值之間絕對(duì)誤差的指標(biāo),定義為:
(8)
為了證明所提出異常檢測效果優(yōu)越性,將基于特征降維的異常檢測方法、經(jīng)典K-means聚類方法以及基于流量模式的異常檢測3種方法進(jìn)行性能對(duì)比。分別對(duì)經(jīng)過3種異常檢測方法剔除異常后的流量數(shù)據(jù)分區(qū)域進(jìn)行預(yù)測,輸入歷史記錄中168 h的流量預(yù)測未來84 h的流量值,在預(yù)測過程中,采用如下的基準(zhǔn)方法。
(1) 線性回歸模型
回歸問題中最簡單的模型,模型的具體表示形式如式(9):
y=wTx,
(9)
式中,x代表輸入的歷史流量數(shù)據(jù),w代表要學(xué)習(xí)的參數(shù)。
(2) 支持向量回歸模型
支持向量回歸(Support Vector Regression,SVR)[14]是支持向量機(jī)一個(gè)重要分支,其思想在于尋找一個(gè)超平面使得所有樣本點(diǎn)到其距離最小。
(3) 長短期記憶網(wǎng)絡(luò)
LSTM網(wǎng)絡(luò)是深度學(xué)習(xí)常用模型之一,通過加入門機(jī)制解決傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)中梯度爆炸和梯度消失的問題,常用于解決有關(guān)序列預(yù)測和分類的問題。
以上所有模型均取在測試集上表現(xiàn)最好的結(jié)果和本文所提出的方法進(jìn)行比較。
4.4.1 異常檢測結(jié)果
特征降維后的數(shù)據(jù)可視化結(jié)果如圖6所示,可以看到異常蜂窩網(wǎng)絡(luò)數(shù)據(jù)的特征向量會(huì)與正常蜂窩網(wǎng)絡(luò)數(shù)據(jù)的特征向量分離,分別記為異常簇和正常簇。
圖6 特征空間樣本分布Fig.6 Feature space sample distribution
可視化異常簇中出現(xiàn)的網(wǎng)格中的流量數(shù)據(jù),以網(wǎng)格3667、3983、4181、4621為例,結(jié)果如圖7所示??梢钥吹搅髁繑?shù)據(jù)整體呈現(xiàn)周期性分布,部分時(shí)刻會(huì)出現(xiàn)與常規(guī)模式不一致的極大值。將這些網(wǎng)格區(qū)域標(biāo)記為可疑異常網(wǎng)格。然后對(duì)所有異常網(wǎng)格中的數(shù)據(jù)使用K-means算法,檢測可疑網(wǎng)格中異常出現(xiàn)的具體時(shí)刻,結(jié)果如圖8所示,檢測到了可疑網(wǎng)格中出現(xiàn)的流量突增異常。
(a) 網(wǎng)格3667
(a) 網(wǎng)格3667
獲得異常網(wǎng)格和異常出現(xiàn)的具體時(shí)刻后,為了驗(yàn)證異常檢測的準(zhǔn)確度,對(duì)通過該方案剔除異常后的數(shù)據(jù)進(jìn)行流量預(yù)測,與使用其他異常檢測方法剔除異常后的流量預(yù)測效果進(jìn)行對(duì)比,結(jié)果如表1所示。
表1 3種異常檢測方法在高、低流量區(qū)域內(nèi)性能比較
經(jīng)典的K-means算法將均值最大的簇標(biāo)記為異常樣本,這些異常樣本中也包含部分未發(fā)生異常的高流量網(wǎng)格,所以使用該法剔除異常后的數(shù)據(jù)預(yù)測誤差在高流量地區(qū)小,在低流量地區(qū)大?;诹髁磕J降漠惓z測方法在高、低流量地區(qū)異常檢測性能均不是最佳?;谔卣鹘稻S的異常檢測方法通過訓(xùn)練得到特征向量,可以排除虛假異常,快速、準(zhǔn)確檢測到不同流量地區(qū)的異常??偠灾?,在高流量區(qū)域,所提方案可以有效檢測出可疑異常,在低流量區(qū)域本方案可以以更高的準(zhǔn)確度進(jìn)行流量預(yù)測。
4.4.2 流量預(yù)測結(jié)果
使用上節(jié)所述方法,對(duì)5種業(yè)務(wù)數(shù)據(jù)分別剔除異常后,采用基于注意力的多數(shù)據(jù)集聯(lián)合預(yù)測方法和RNN預(yù)測方法進(jìn)行對(duì)比試驗(yàn)。表2為這兩種方法在RMSE和MAE上的預(yù)測效果。圖9(a)~圖9(c)為基于注意力機(jī)制的多數(shù)據(jù)集聯(lián)合預(yù)測方法對(duì)不同時(shí)長的流量數(shù)據(jù)的預(yù)測結(jié)果圖,圖9(d)~圖9(f)為基于RNN預(yù)測方法對(duì)不同時(shí)長的流量數(shù)據(jù)的預(yù)測結(jié)果圖。橙線為真實(shí)數(shù)據(jù),藍(lán)線為預(yù)測數(shù)據(jù),可以看到RNN預(yù)測方法可以準(zhǔn)確預(yù)測流量數(shù)據(jù)周期性等大體趨勢,但是無法精準(zhǔn)預(yù)測流量的細(xì)節(jié),缺少對(duì)具體時(shí)刻流量值的信息預(yù)測。采用基于注意力的多數(shù)據(jù)集聯(lián)合預(yù)測方法的預(yù)測結(jié)果不只顯示數(shù)據(jù)的周期信息,而且在峰值處可以更準(zhǔn)確地預(yù)測數(shù)據(jù),對(duì)未來48 h、72 h、168 h的流量數(shù)據(jù)預(yù)測結(jié)果對(duì)比均顯示了該方法的有效性。
(a) 多數(shù)據(jù)集聯(lián)合預(yù)測模型預(yù)測未來 48 h流量值
表2 兩種預(yù)測方法對(duì)不同時(shí)長數(shù)據(jù)的預(yù)測性能比較
由于訓(xùn)練時(shí)長為168 h,所以當(dāng)預(yù)測時(shí)長小于168 h時(shí),多數(shù)據(jù)集聯(lián)合預(yù)測模型預(yù)測誤差在RMSE和MAE兩個(gè)指標(biāo)上均小于RNN。利用注意力模塊可以學(xué)習(xí)目標(biāo)業(yè)務(wù)數(shù)據(jù)與其余業(yè)務(wù)數(shù)據(jù)的相關(guān)性,充分利用業(yè)務(wù)間的相關(guān)性輔助目標(biāo)業(yè)務(wù)預(yù)測,不僅可以預(yù)測流量數(shù)據(jù)變化周期,還可以更精準(zhǔn)預(yù)測不同時(shí)刻流量值。
針對(duì)大規(guī)模蜂窩流量數(shù)據(jù)異常檢測中直接對(duì)原始數(shù)據(jù)進(jìn)行檢測存在的數(shù)據(jù)冗余和計(jì)算冗余的問題,為減少移動(dòng)業(yè)務(wù)交付的端到端時(shí)延,實(shí)現(xiàn)網(wǎng)絡(luò)資源的優(yōu)化分配,提出了基于特征降維的蜂窩流量數(shù)據(jù)異常檢測方法。該方法利用LSTM自編碼器提取流量數(shù)據(jù)低維特征,再對(duì)新的特征空間進(jìn)行理論分析,選取異常特征參數(shù)挖掘異常數(shù)據(jù),實(shí)現(xiàn)針對(duì)大規(guī)模高維流量數(shù)據(jù)的異常檢測功能。該方法可以更好地檢測出高、低不同活躍度區(qū)域內(nèi)的漏報(bào)異常;針對(duì)流量預(yù)測中存在的忽略不同通信數(shù)據(jù)間相關(guān)性的問題,提出基于注意力機(jī)制的多數(shù)據(jù)集聯(lián)合預(yù)測方案,將提出的流量預(yù)測方法與基準(zhǔn)預(yù)測方法在不同時(shí)長預(yù)測任務(wù)中進(jìn)行對(duì)比實(shí)驗(yàn),所提出的流量預(yù)測方法在RMSE和MAE性能指標(biāo)上都獲得了最好的性能表現(xiàn),從而證明了所提出方法的有效性。