曾光輝
摘要:為提升網(wǎng)絡(luò)信息的識別與分類準(zhǔn)確率,針對海量網(wǎng)絡(luò)信息的高維、高噪等特點(diǎn),提出基于匹配自主學(xué)習(xí)的網(wǎng)絡(luò)信息識別與分類算法。首先,利用支持向量機(jī)對網(wǎng)絡(luò)信息進(jìn)行識別;然后,通過奇異值分解算法構(gòu)建檢索矩陣進(jìn)行奇異值分解、相關(guān)性查詢;接著,計(jì)算網(wǎng)絡(luò)信息的相似性匹配度,并將匹配度較高的網(wǎng)絡(luò)信息輸入到卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí)、訓(xùn)練;最后,輸出網(wǎng)絡(luò)信息分類結(jié)果。實(shí)驗(yàn)結(jié)果顯示,該算法網(wǎng)絡(luò)信息識別準(zhǔn)確率達(dá)到97.90%以上,針對不同類別網(wǎng)絡(luò)信息的平均分類準(zhǔn)確率為98.04%,證明了該算法在實(shí)際應(yīng)用中的有效性。
關(guān)鍵詞:匹配自主學(xué)習(xí);網(wǎng)絡(luò)信息;支持向量機(jī);奇異值分解;卷積神經(jīng)網(wǎng)絡(luò);識別與分類
中圖分類號:TP309 ???????? 文獻(xiàn)標(biāo)志碼:A ????? ?? 文章編號:1674-2605(2024)03-0007-06
DOI:10.3969/j.issn.1674-2605.2024.03.007
Network Information Recognition and Classification Algorithm Based on Matching Autonomous Learning
Abstract: To improve the accuracy of network information recognition and classification, a network information recognition and classification algorithm based on matching autonomous learning is proposed to address the high dimensionality, high noise and other characteristics of massive network information. Firstly, using support vector machine to recognize network information; Then, a retrieval matrix is constructed using singular value decomposition algorithm for singular value decomposition and correlation queries; Finally, calculate the similarity matching degree of network information, and input the network information with higher matching degree into the convolutional neural network for learning and training, outputting the network information classification results. The experimental results show that the network information recognition accuracy of the algorithm reaches over 97.90%, and the average classification accuracy for different types of network information is 98.04%, which has certain practical application effectiveness.
Keywords: matching autonomous learning; network information; support vector machine; singular value decomposition; convolutional neural network; recognition and classification
0? 引言
在當(dāng)前的信息時(shí)代,網(wǎng)絡(luò)信息呈海量式與爆炸式增長[1]。網(wǎng)絡(luò)信息不僅涉及多個(gè)特征,如文本內(nèi)容、圖像像素、格式類別等,還包含大量的干擾或噪聲,如文本拼寫錯(cuò)誤、圖像噪點(diǎn)或失真、網(wǎng)絡(luò)攻擊等,故其應(yīng)用性與安全性受到相關(guān)研究人員的重視。網(wǎng)絡(luò)信息的識別與分類是提升其應(yīng)用性與安全性的基礎(chǔ)[2-3]。
周家愷等[4]基于樸素貝葉斯對網(wǎng)絡(luò)信息進(jìn)行特征識別,識別效率較高,但易受來源數(shù)據(jù)噪聲影響,識別精準(zhǔn)度還有一定的提升空間。朱方娥等[5]提出基于分類規(guī)則挖掘的數(shù)據(jù)多標(biāo)記特征分層識別方法,特征識別及分類的準(zhǔn)確度較高,但較為依賴數(shù)據(jù)來源,需進(jìn)行更加完善的數(shù)據(jù)預(yù)處理。
本文提出一種基于匹配自主學(xué)習(xí)的網(wǎng)絡(luò)信息識別與分類算法。通過支持向量機(jī)、奇異值分解算法、卷積神經(jīng)網(wǎng)絡(luò)的匹配應(yīng)用,實(shí)現(xiàn)網(wǎng)絡(luò)信息的識別與分類。
1? 算法流程
匹配自主學(xué)習(xí)算法是指對輸入數(shù)據(jù)進(jìn)行匹配并比較的自主學(xué)習(xí)算法。自主學(xué)習(xí)算法以多智能體深度強(qiáng)化學(xué)習(xí)類方法為代表,通過構(gòu)建認(rèn)知智能體,自動(dòng)學(xué)習(xí)和獲取復(fù)雜系統(tǒng)深層次的規(guī)律[6]。
本文引入自主學(xué)習(xí)算法中的支持向量機(jī)、奇異值分解算法、卷積神經(jīng)網(wǎng)絡(luò)對網(wǎng)絡(luò)信息進(jìn)行識別與分類?;谄ヅ渥灾鲗W(xué)習(xí)的網(wǎng)絡(luò)信息識別與分類算法流程如圖1所示。
本文利用支持向量機(jī)實(shí)現(xiàn)網(wǎng)絡(luò)信息的識別;采用奇異值分解算法提取異常網(wǎng)絡(luò)信息的特征向量;運(yùn)用一維卷積神經(jīng)網(wǎng)絡(luò)算法分類處理異常網(wǎng)絡(luò)信息[7]。其中,一維卷積神經(jīng)網(wǎng)絡(luò)不易出現(xiàn)信息損耗、丟失和信息畸變等問題,可提升網(wǎng)絡(luò)信息識別與分類的效率。
2 網(wǎng)絡(luò)信息識別
支持向量機(jī)能夠處理高維特征空間的分類問題,通過構(gòu)建最優(yōu)的超平面來實(shí)現(xiàn)數(shù)據(jù)分類,可有效地處理小樣本問題,且對未見過的數(shù)據(jù)具有較好的泛化能力,減少過擬合風(fēng)險(xiǎn)。首先,對網(wǎng)絡(luò)信息進(jìn)行觸發(fā)詞檢測預(yù)處理,并均等分為訓(xùn)練數(shù)據(jù)集與測試數(shù)據(jù)集[8];然后,利用支持向量機(jī)對訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行訓(xùn)練,構(gòu)建網(wǎng)絡(luò)信息識別模型;接著,將測試數(shù)據(jù)輸入到網(wǎng)絡(luò)信息識別模型,界定網(wǎng)絡(luò)信息識別閾值;最后,得到網(wǎng)絡(luò)信息的識別結(jié)果。基于支持向量機(jī)的網(wǎng)絡(luò)信息識別流程如圖2所示。
網(wǎng)絡(luò)信息的主要特征表現(xiàn)為海量性與高度開放性[9]。若對全部的網(wǎng)絡(luò)信息都進(jìn)行分析處理,將降低網(wǎng)絡(luò)信息的識別效率,同時(shí)分析不重要的網(wǎng)絡(luò)信息也會提升識別成本。因此在對網(wǎng)絡(luò)信息進(jìn)行識別與分類前,采用觸發(fā)詞檢測方法對網(wǎng)絡(luò)信息進(jìn)行預(yù)處理,清除網(wǎng)絡(luò)信息中的無用信息,減少數(shù)據(jù)維度。觸發(fā)詞是可最大限度地反映事件的詞語。
利用支持向量機(jī)訓(xùn)練網(wǎng)絡(luò)信息識別模型,獲得網(wǎng)絡(luò)信息性能指標(biāo)曲線與閾值查閱表,由此可獲取網(wǎng)絡(luò)信息識別閾值[10]?;谠摼W(wǎng)絡(luò)信息識別閾值對測試數(shù)據(jù)集的網(wǎng)絡(luò)信息進(jìn)行識別,確定其為正常網(wǎng)絡(luò)信息或異常網(wǎng)絡(luò)信息。基于支持向量機(jī)的網(wǎng)絡(luò)信息識別,以徑向基函數(shù)(radial basis function, RBF)為核函數(shù),以接受者操作特性曲線(receiver operating characteristic curve, ROC)與坐標(biāo)軸圍成的面積(area under curve, AUC)為識別參數(shù)優(yōu)化指標(biāo),對懲罰系數(shù)與核函數(shù)進(jìn)行優(yōu)化;同時(shí)引入交叉驗(yàn)證的方法避免支持向量機(jī)出現(xiàn)過擬合。
基于支持向量機(jī)的網(wǎng)絡(luò)信息識別過程描述如下:
設(shè)為訓(xùn)練數(shù)據(jù)集,和分別表示第i個(gè)網(wǎng)絡(luò)信息向量和的類別標(biāo)簽。以為樣本點(diǎn),構(gòu)建最優(yōu)超平面,即網(wǎng)絡(luò)信息識別模型的計(jì)算過程為
式中:為超平面的法向量,和分別為懲罰系數(shù)與網(wǎng)絡(luò)信息識別的誤項(xiàng)。
其約束條件為
式中:為超平面的常數(shù)項(xiàng)。
3 網(wǎng)絡(luò)信息分類
3.1 基于奇異值分解算法的相似性匹配度計(jì)算
在網(wǎng)絡(luò)信息特征分類之前,先對網(wǎng)絡(luò)信息進(jìn)行特征提取[11]。將網(wǎng)絡(luò)信息識別模型輸出的識別結(jié)果作為輸入,采用奇異值分解算法進(jìn)行特征提取。通過隱含語義提取,清除不相關(guān)詞匯,得到關(guān)鍵詞向量,目標(biāo)特征描述矩陣向量間的內(nèi)在屬性;對目標(biāo)特征進(jìn)行變換與分解處理,得到的相似性匹配結(jié)果作為輸出,具體過程如下:
1) 構(gòu)建詞條——文檔矩陣,對待提取特征的網(wǎng)絡(luò)信息文檔進(jìn)行處理,清除不相關(guān)詞匯,獲取網(wǎng)絡(luò)信息文檔的關(guān)鍵詞向量,維數(shù)為n。若網(wǎng)絡(luò)信息文檔包含m個(gè)文件,則可獲取一個(gè)n × m維矩陣。奇異值分解算法將詞條——文檔矩陣分解為3個(gè)不同的矩陣,公式描述為
式中:描述網(wǎng)絡(luò)信息文檔內(nèi)不同詞條間的相關(guān)性[12],描述網(wǎng)絡(luò)信息不同文檔間的相關(guān)性,與均為正交矩陣;為對角矩陣。
考慮到矩陣和均具有線性獨(dú)立特性,可通過近似矩陣取代進(jìn)行分析,如公式(4)所示。
式中:和分別為和的前K列,為包含X的前K個(gè)最大奇異值,;,由此可提升特征提取效率。
2) 網(wǎng)絡(luò)信息文檔中的若干個(gè)關(guān)鍵詞通過變換生成一個(gè)K維向量,其代表一個(gè)虛文檔,將與文檔相關(guān)性矩陣內(nèi)的文檔向量進(jìn)行對比,得到相似性匹配結(jié)果[13]的計(jì)算公式為
(5)
值越大,表明網(wǎng)絡(luò)信息相似性匹配度越高,分類效果較好;值越小,表明網(wǎng)絡(luò)信息相似性匹配度越低,分類效果較差。
應(yīng)用奇異值分解算法進(jìn)行網(wǎng)絡(luò)信息特征提取的過程中,在一定程度上去除了網(wǎng)絡(luò)信息中的噪聲或異常點(diǎn),通過保留主要的奇異值和特征向量,可以恢復(fù)經(jīng)去噪處理后的原始信息,為后續(xù)網(wǎng)絡(luò)信息的精準(zhǔn)分類提供保障。
3.2 基于卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)信息分類
根據(jù)網(wǎng)絡(luò)信息特征建立一維卷積神經(jīng)網(wǎng)絡(luò)分類模型,實(shí)現(xiàn)網(wǎng)絡(luò)信息的分類處理。一維卷積神經(jīng)網(wǎng)絡(luò)模型包括輸入層、卷積層、池化層、全連接層、輸出層等,輸出層可輸出網(wǎng)絡(luò)信息的分類結(jié)果,結(jié)構(gòu)如圖3所示。
一維卷積神經(jīng)網(wǎng)絡(luò)模型的輸入是相似性匹配結(jié)果。
卷積層作為一維卷積神經(jīng)網(wǎng)絡(luò)的核心,主要負(fù)責(zé)對網(wǎng)絡(luò)信息進(jìn)行稀疏連接[14],降低網(wǎng)絡(luò)信息特征的參
數(shù)量。利用公式(6)確定卷積層的輸出為
式中:和e分別為激活函數(shù)和網(wǎng)絡(luò)信息特征數(shù)量,為第j個(gè)網(wǎng)絡(luò)信息數(shù)據(jù),和分別為輸出偏置與卷積核尺寸。
池化層主要負(fù)責(zé)進(jìn)一步降低卷積層輸出的特征參數(shù),同時(shí)保留網(wǎng)絡(luò)信息的主要特征[15]。利用公式(7)描述最大池化函數(shù)為
(7)
式中:和分別為池化層移動(dòng)步長和池化尺寸。
在卷積層與池化層的逐漸堆疊下,不僅能夠提取網(wǎng)絡(luò)信息的深層特征,還能夠顯著降低參數(shù)量。
將提取的網(wǎng)絡(luò)信息特征轉(zhuǎn)換為一維向量,并輸出至全連接層進(jìn)行分類,其中為最后一層池化層的神經(jīng)節(jié)點(diǎn)數(shù)量。
輸出層是一維卷積神經(jīng)網(wǎng)絡(luò)的最后一層,其輸出的結(jié)果即為網(wǎng)絡(luò)信息所屬類別:
式中:為全連接層的輸出,和分別為網(wǎng)絡(luò)信息類別的索引和全部網(wǎng)絡(luò)信息的數(shù)量。
4 實(shí)驗(yàn)分析
4.1 實(shí)驗(yàn)準(zhǔn)備
為驗(yàn)證本文算法在實(shí)際網(wǎng)絡(luò)信息識別與分類中的效果,分別對網(wǎng)絡(luò)信息識別、特征向量提取、網(wǎng)絡(luò)信息分類的性能進(jìn)行測試。
實(shí)驗(yàn)環(huán)境為Ubuntu 18.04操作系統(tǒng),Python3.7編程語言,TensorFlow2.0開發(fā)框架,具備GPU加速功能的NVIDIA GeForce RTX 2080 Ti。計(jì)算資源方面,Intel Core i7-8700K CPU @ 3.70 GHz的計(jì)算機(jī),32 GB內(nèi)存。觸發(fā)詞匹配閾值設(shè)定為0.7,當(dāng)網(wǎng)絡(luò)信息中某個(gè)詞與觸發(fā)詞的相似度高于0.7時(shí),將該詞輸入到綜合數(shù)據(jù)庫中以待后續(xù)處理;當(dāng)網(wǎng)絡(luò)信息中某個(gè)詞與觸發(fā)詞的相似度低于0.7時(shí),忽略或丟棄該詞。奇異值分解降維維度設(shè)置為100維,卷積核大小設(shè)置為3、5和7,以便對不同尺度的網(wǎng)絡(luò)信息進(jìn)行特征提取,利用最大池化對網(wǎng)絡(luò)信息特征進(jìn)行降維。
實(shí)驗(yàn)數(shù)據(jù)集選取KDD cup 99數(shù)據(jù)集,包括正常網(wǎng)絡(luò)信息(文本信息、圖片信息、視頻信息)、異常網(wǎng)絡(luò)信息(虛假信息、攻擊信息)共4 909 542條。其中,攻擊信息包含6種類型,如表1所示。
4.2 支持向量機(jī)訓(xùn)練
選取KDD cup 99數(shù)據(jù)集的50%,即2 454 771條網(wǎng)絡(luò)信息作為訓(xùn)練樣本進(jìn)行訓(xùn)練,得到支持向量機(jī)的網(wǎng)絡(luò)信息識別準(zhǔn)確率波動(dòng)圖如圖4所示。
由圖4可知:隨著支持向量機(jī)迭代次數(shù)的增加,網(wǎng)絡(luò)信息識別準(zhǔn)確率也逐漸提高,當(dāng)?shù)螖?shù)小于30次時(shí),識別準(zhǔn)確率提高速度較快;當(dāng)?shù)螖?shù)大于30次時(shí),識別準(zhǔn)確率提高速度逐漸趨于平緩;當(dāng)?shù)螖?shù)達(dá)到40次時(shí),識別準(zhǔn)確率穩(wěn)定在98.70%左右。至此,完成網(wǎng)絡(luò)信息識別模型的訓(xùn)練。
4.3 實(shí)驗(yàn)結(jié)果與分析
4.3.1 網(wǎng)絡(luò)信息識別性能測試
利用訓(xùn)練好的網(wǎng)絡(luò)信息識別模型對KDD cup 99數(shù)據(jù)集剩余的50%,即2 454 771條網(wǎng)絡(luò)信息進(jìn)行識別,判斷網(wǎng)絡(luò)信息狀態(tài)。為驗(yàn)證本文算法的性能,選取文獻(xiàn)[4]的基于樸素貝葉斯方法和文獻(xiàn)[5]的基于分類規(guī)則挖掘方法進(jìn)行對比實(shí)驗(yàn),結(jié)果如表2所示。
由表2可知:隨著測試樣本數(shù)據(jù)量的增加,3種方法的識別準(zhǔn)確率均有所下降,在測試樣本數(shù)據(jù)量為10 000條時(shí),本文算法、基于樸素貝葉斯方法、基于分類規(guī)則挖掘方法的識別準(zhǔn)確率最高,分別為99.21%、97.87%、95.79%;在測試樣本數(shù)據(jù)量為2 454 771條時(shí),3種方法的識別準(zhǔn)確率最低,分別為97.90%、95.73%、93.57%,表明測試樣本數(shù)據(jù)量對準(zhǔn)確率造成影響,且本文算法具有較高的網(wǎng)絡(luò)信息識別性能。
4.3.2 特征向量提取性能測試
對于相同的網(wǎng)絡(luò)信息,不同方法提取的特征向量會有所差異。采用本文算法與基于樸素貝葉斯方法、基于分類規(guī)則挖掘方法分別進(jìn)行網(wǎng)絡(luò)信息特征向量
提取性能對比實(shí)驗(yàn),以方差、偏度、峰度為評估指標(biāo)。其中,方差越大,說明樣本數(shù)據(jù)在這一維度上的差異性越大,數(shù)據(jù)包含大量的噪聲或異常值;偏度用于衡量數(shù)據(jù)分布的不對稱性,正值表示數(shù)據(jù)右偏,負(fù)值表示數(shù)據(jù)左偏,接近0表示數(shù)據(jù)近似對稱;峰度正值表示尖峭峰,即比正態(tài)分布更集中,而負(fù)值表示平坦峰,即比正態(tài)分布更平緩,峰值大說明存在極端值。3種評估指標(biāo)的計(jì)算公式為
式中:為整體的樣本數(shù)據(jù),為樣本數(shù)量,為第i個(gè)樣本數(shù)據(jù),為樣本均值。
本文算法與基于樸素貝葉斯方法、基于分類規(guī)則挖掘方法的特征向量提取性能對比結(jié)果如表3所示。
由表3可知:隨著關(guān)鍵詞數(shù)量逐漸增加,3種方法的特征向量方差也逐漸增大,說明關(guān)鍵詞數(shù)量越多,特征提取的難度越大,越容易存在噪聲;在不同關(guān)鍵詞數(shù)量下,3種方法均保持較小且接近0的偏度,表明特征向量分布相對對稱,本文算法的偏度值穩(wěn)定且偏負(fù),顯示特征向量分布可能略向左偏,相比之下,另外2種方法在關(guān)鍵詞數(shù)量增多時(shí)偏度值增加,說明其分布偏斜較大;本文算法特征向量的峰度相對另外2種方法較低,說明特征提取后,極端值較少,特征向量提取效果較好。
4.3.3 網(wǎng)絡(luò)信息分類性能測試
采用本文算法、基于樸素貝葉斯方法、基于分類規(guī)則挖掘方法對識別的2 454 771條網(wǎng)絡(luò)信息進(jìn)行分類處理,結(jié)果如表4所示。
由表4可知:本文算法的平均分類準(zhǔn)確率為98.04%;基于樸素貝葉斯方法和基于分類規(guī)則挖掘方法的平均分類準(zhǔn)確率分別為95.29%和92.44%,驗(yàn)證了本文算法對網(wǎng)絡(luò)信息的分類準(zhǔn)確率較高、分類處理性能較好。對異常網(wǎng)絡(luò)信息的精準(zhǔn)分類能夠更好地對攻擊信息采取相應(yīng)的防御措施。
5 結(jié)論
本文研究基于匹配自主學(xué)習(xí)的網(wǎng)絡(luò)信息識別與分類算法,利用自主學(xué)習(xí)算法中的支持向量機(jī)、奇異值分解算法、一維卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)網(wǎng)絡(luò)信息的識別與分類。實(shí)驗(yàn)結(jié)果顯示,該算法的網(wǎng)絡(luò)信息識別準(zhǔn)確率、特征向量提取性能以及網(wǎng)絡(luò)信息分類準(zhǔn)確率均較高,說明該算法具有較好的應(yīng)用性能。在本文算法研究的過程中,受時(shí)間與經(jīng)費(fèi)的限制,在處理大規(guī)模網(wǎng)絡(luò)信息時(shí),算法的運(yùn)行效率受到一定程度的限制。因此,未來將會探索更高效和可擴(kuò)展的算法形式,以應(yīng)對大規(guī)模網(wǎng)絡(luò)信息的識別與分類。
參考文獻(xiàn)
[1] 周毅,張雪.網(wǎng)絡(luò)信息內(nèi)容生態(tài)安全風(fēng)險(xiǎn)整體智治的理論框架與實(shí)現(xiàn)策略研究[J].圖書情報(bào)工作,2022,66(5):44-52.
[2] 韓正彪,馬毛寧,翟冉冉.網(wǎng)絡(luò)學(xué)術(shù)信息搜索中用戶情感的識別及變化研究[J].情報(bào)學(xué)報(bào),2022,41(3):314-324.
[3] 蔣岑,吳迪.隱蔽無線通信網(wǎng)絡(luò)傳輸信息云存儲密文檢索[J].計(jì)算機(jī)仿真,2021,38(6):125-128;137.
[4] 周家愷,綦方中.網(wǎng)絡(luò)流量時(shí)延特征數(shù)據(jù)的識別方法仿真[J].計(jì)算機(jī)仿真,2022,39(5):398-401;460.
[5] 朱方娥,郭建方,曹麗娜.基于分類規(guī)則挖掘的數(shù)據(jù)多標(biāo)記特征分層識別[J].計(jì)算機(jī)仿真,2021,38(4):310-314.
[6] 朱曉慧,錢麗萍,傅偉.基于生成對抗網(wǎng)絡(luò)增強(qiáng)惡意代碼的方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2021,42(11):3034-3042.
[7] 高昂,郭齊勝,董志明,等.基于EAS+MAD RL的多無人車體系效能評估方法研究[J].系統(tǒng)工程與電子技術(shù),2021,43(12): 3643-3651.
[8] 蔣麗,黃仕建,嚴(yán)文娟.基于低秩行為信息和多尺度卷積神經(jīng)網(wǎng)絡(luò)的人體行為識別方法[J].計(jì)算機(jī)應(yīng)用,2021,41(3):721-726.
[9] 陸曉松,王國慶,李勖之,等.場地環(huán)境大數(shù)據(jù)采集和機(jī)器學(xué)習(xí)方法在污染智能識別中的應(yīng)用研究進(jìn)展[J].生態(tài)與農(nóng)村環(huán)境學(xué)報(bào),2022,38(9):1101-1111.
[10] 張澤鋒,毛存禮,余正濤,等.融入領(lǐng)域術(shù)語詞典的司法輿情敏感信息識別[J].中文信息學(xué)報(bào),2022,36(9):76-83;92.
[11] 陳思佳,羅志增.基于長短時(shí)記憶和卷積神經(jīng)網(wǎng)絡(luò)的手勢肌電識別研究[J].儀器儀表學(xué)報(bào),2021,42(2):162-170.
[12] 向志華,梁玉英.基于機(jī)器學(xué)習(xí)的視頻識別與自適應(yīng)推送算法[J].沈陽工業(yè)大學(xué)學(xué)報(bào),2022,44(3):336-340.
[13] 張玲,衛(wèi)傳征,林臻彪,等.一種基于機(jī)器學(xué)習(xí)的Tor網(wǎng)絡(luò)識別探測技術(shù)[J].電子技術(shù)應(yīng)用,2021,47(4):54-58.
[14] 華萌萌,尹君,胡召玲,等.基于機(jī)器學(xué)習(xí)的歷史氣候重建論文智能識別與數(shù)據(jù)挖掘初探[J].第四紀(jì)研究,2021,41(2): 550-561.
[15] 宋雅文,楊志豪,羅凌,等.基于字符卷積神經(jīng)網(wǎng)絡(luò)的生物醫(yī)學(xué)變異實(shí)體識別方法[J].中文信息學(xué)報(bào),2021,35(5):63-69.