董昱燦 趙奎
摘 要: 現(xiàn)有的基于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的日志異常檢測方法通常存在語義信息提取不完整、依賴日志序列構(gòu)建和依賴日志解析器等問題. 基于注意力機(jī)制多特征融合和文本情感分析技術(shù),提出了一種日志異常檢測方法. 該方法首先采用詞嵌入方法將日志文本向量化以獲取日志消息的詞向量表示,接著將詞向量輸入到由雙向門控循環(huán)單元網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)組成的特征提取層中分別提取日志消息的上下文依賴特征和局部依賴特征,使用注意力機(jī)制分別加強(qiáng)兩種特征中的關(guān)鍵信息,增強(qiáng)模型識別關(guān)鍵信息的能力. 使用基于注意力機(jī)制的特征融合層為兩種特征賦予不同權(quán)重并加權(quán)求和后輸入由全連接層構(gòu)成的輸出層中,實(shí)現(xiàn)日志消息的情感極性分類,達(dá)到日志異常檢測的目的. 在BGL 公開數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該模型的分類準(zhǔn)確率和F1 值分別達(dá)到了96. 36% 和98. 06%,與同類日志異常檢測模型相比有不同程度的提升,從而證明了日志中的語義情感信息有助于異常檢測效果的提升,并且經(jīng)過實(shí)驗(yàn)證明了使用注意力機(jī)制的模型可以進(jìn)一步提高文本情感分類效果,進(jìn)而提升日志異常檢測的準(zhǔn)確率.
關(guān)鍵詞: 多特征融合; 注意力機(jī)制; 文本情感分析; 日志分析; 系統(tǒng)異常檢測
中圖分類號: TP391 文獻(xiàn)標(biāo)志碼: A DOI: 10. 19907/j. 0490-6756. 2024. 023001