姚嘉偉 蔡延光
摘要:為提高心電圖身份識別過程中神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效率及識別正確率,提出一種基于多核卷積和多頭自注意力的心電圖身份識別方法。首先,利用多個大小不同的卷積核對預(yù)處理后的單個心拍進行特征提取;然后,采用多頭自注意力模塊加強卷積通道中全局特征的提取效果;接著,將特征通道一分為二進行半實例歸一化,使多頭自注意力模塊能夠關(guān)注歸一化前后的特征,提升神經(jīng)網(wǎng)絡(luò)的收斂速度;最后,將多核多頭自注意力模塊進行ResNet殘差連接。該方法在QT數(shù)據(jù)集上經(jīng)過20個epoch訓(xùn)練,實現(xiàn)了94.92%的識別正確率。利用ResNet進行對比實驗的結(jié)果表明,該方法能夠有效地提升神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效率及識別正確率。
關(guān)鍵詞:多核卷積;多頭自注意力機制;半實例歸一化;心電圖;身份識別
中圖分類號:TP391 ?????????文獻標志碼:A ???????????文章編號:1674-2605(2023)05-0005-06
DOI:10.3969/j.issn.1674-2605.2023.05.005
ECG Identity Recognition Method Based on Multi-kernel?Convolution and Multi-head Self-attention
YAO Jiawei ?CAI Yanguang
(College of Automation, Guangdong University of Technology, Guangzhou 510006, China)
Abstract: To improve the training efficiency and recognition accuracy of neural networks in the process of electrocardiogram identity recognition, a electrocardiogram identity recognition method based on multi-kernel convolution and multi-head self-attention is proposed. Firstly, feature extraction is performed on a preprocessed single heartbeat using multiple convolution checks of different sizes; Then, a multi-head self-attention module is used to enhance the extraction effect of global features in the convolutional channel; Next, the feature channels are divided into two for semi instance normalization, enabling the multi-head self-attention module to focus on the features before and after normalization, thereby improving the convergence speed of the neural network; Finally, connect the multi-kernel and multi-head self-attention module to ResNet residual. This method achieved a recognition accuracy of 94.92% after 20 epochs of training on the QT dataset. The results of comparative experiments using ResNet show that this method can effectively improve the training efficiency and recognition accuracy of the neural network.
Keywords: multi-kernel convolution; multi-head self-attention mechanism; semi instance normalization; electrocardiogram; identity recognition
0??引言
心電圖(electrocardiogram, ECG)是一種無創(chuàng)檢查手段,因價格便宜、操作簡便,是心臟疾病初篩的重要方式。隨著人們對加密需求的不斷提高,生物認證的方式逐漸成為熱點研究方向。利用ECG進行身份識別就是一種有效的生物認證方式。
近年來,利用ECG進行身份識別引起了許多學者的關(guān)注。BIEL等[1]通過手動提取ECG的形態(tài)特征并采用相似分類法進行身份識別,證明了利用ECG進行身份識別的可行性。LEE等[2]利用一種可擴展的極限學習機進行ECG身份識別,采用增量學習的策略
解決了由于新成員加入使模型參數(shù)發(fā)生更新而導(dǎo)致的災(zāi)難性遺忘問題。DALAL等[3]從ECG中提取多累積量特征,利用內(nèi)核極限學習機(kernel extreme learning machine,?KELM)對基于多累積量特征的ECG進行身份識別,雖然取得了較高的識別正確率,但該方法不是端對端的,且需要先對ECG進行多階統(tǒng)計量的特征計算,影響識別效率。SRIVASTVA等[4]將殘差網(wǎng)絡(luò)(ResNet)和DenseNet的預(yù)訓(xùn)練模型進行堆疊,利用ECG對堆疊后的模型進行微調(diào),構(gòu)成身份識別模型,雖能獲得較好的識別效果,但訓(xùn)練開銷巨大。LI等[5]將極端隨機樹(extra?tree,?ET)和統(tǒng)一流形逼近與投影(uniform manifold approximation and projection,?UMAP)兩種方法疊加,在ECG中提取集成特征,再利用極限梯度提升器(XGBoost)對集成特征進行身份識別,雖然能夠達到96.88%的識別正確率,但需要復(fù)雜的特征工程。JYOTISHI等[6]提出基于分層的長短期記憶模型和注意力機制的ECG身份識別系統(tǒng),在250個epoch訓(xùn)練后,取得較好的識別效果。TUNCER等[7]提出一種基于Tietze模式和鄰域成分分析(neighborhood component analysis, NCA)的身份識別方法,雖然表現(xiàn)出色,但處理過程十分繁瑣。楊向林等[8]提出一種小波分解和特征融合的ECG身份識別方法,通過將波形特征和小波特征融合,利用相關(guān)系數(shù)閾值法對融合特征進行身份識別,達到95%的識別正確率。雖然過往利用ECG進行身份識別的研究已經(jīng)提出了許多有效的方法,但這些方法僅關(guān)注識別正確率,沒有考慮模型深度和訓(xùn)練效率的問題。
為減少模型深度,提高訓(xùn)練效率,并保證模型的識別正確率,本文提出基于多核卷積和多頭自注意力的多核多頭自注意力(multi-kernel multi-head self-attention, MKMSA)模塊,并利用ResNet對MKMSA模塊進行連接,構(gòu)造并訓(xùn)練能夠準確進行身份識別的方法。
1 ?數(shù)據(jù)處理
1.1 ?數(shù)據(jù)預(yù)處理
ECG中一個完整的P、QRS、T波的過程稱為一個心拍。在不同的采樣頻率下,ECG心拍的波形會出現(xiàn)不同步的現(xiàn)象,容易導(dǎo)致神經(jīng)網(wǎng)絡(luò)將其預(yù)測為2個不同的心拍;同時,神經(jīng)網(wǎng)絡(luò)無法對不同長度的數(shù)據(jù)進行處理。為此,需對ECG進行預(yù)處理,過程如下:
1) 將ECG進行重采樣,采樣頻率為360 Hz;
2) 根據(jù)專家標注,截取P波前40 ms到T波結(jié)束的片段作為一個心拍數(shù)據(jù);
3) 將每個心拍的數(shù)據(jù)長度調(diào)整為512個樣本點,在長度不足的心拍數(shù)據(jù)后用0填充。
正常的心拍數(shù)據(jù)長度一般為0.8~1.2 s,預(yù)處理后的心拍數(shù)據(jù)長度為1.42 s,既能保證心拍的完整性,又能滿足神經(jīng)網(wǎng)絡(luò)的輸入要求。
1.2 ?數(shù)據(jù)劃分
對不同采樣者的ECG進行獨熱編碼標注,并將心拍數(shù)量的70%作為訓(xùn)練集,30%作為測試集,保證了每個身份標簽對應(yīng)的數(shù)據(jù)在訓(xùn)練集和測試集的分布相同。
2 ?識別方法
2.1 ?多核卷積通道
在神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過程中,卷積核大小是一個難以確定和調(diào)整的超參數(shù)。本文采用Inception模塊的思想[9],并聯(lián)卷積核大小不一的卷積神經(jīng)網(wǎng)絡(luò)。ECG的信號較長,為了盡可能地擴大卷積核,同時減少網(wǎng)絡(luò)參數(shù),采用空洞卷積層作為多核卷積通道的構(gòu)成部分。通過這種方式,神經(jīng)網(wǎng)絡(luò)在反向傳播的過程中,能自動地從最適合的通道快速擬合,提升網(wǎng)絡(luò)的訓(xùn)練速度。
2.2 ?特征權(quán)重調(diào)整
為提高特征的提取能力,采用注意力機制[10]廣泛關(guān)注卷積通道中的整體特征,并對權(quán)重進行調(diào)整。自注意力機制的計算過程如下:
2.5 ?神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計
采用ResNet的殘差連接對MKMSA模塊進行連接,本文方法的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2中,2個卷積層主要用于調(diào)整輸入和輸出MKMSA模塊的特征通道數(shù)量;線性層整合具有類別區(qū)分性的特征,用于身份識別。
2.6 ?算法流程
基于多核卷積和多頭自注意力的心電圖身份識別方法的訓(xùn)練流程、識別流程分別如算法1、算法2所示。
3 ?實驗
3.1 ?實驗環(huán)境
本文方法采用Pytorch框架實現(xiàn),實驗采用的編程語言為Python,處理器為Intel I7-12700KF,內(nèi)存為32 GB,顯卡為 Nvidia RTX 3060Ti。
3.2??實驗數(shù)據(jù)
實驗數(shù)據(jù)采用Physionet[14]的公開數(shù)據(jù)庫QT[15]。QT數(shù)據(jù)庫包括105段15 min采樣頻率為250 Hz?的ECG,且含有專家標注的P、QRS、T波邊界和峰值。
3.3 ?參數(shù)設(shè)置
實驗采用交叉熵損失函數(shù)、選擇隨機梯度下降算法作為優(yōu)化器,學習率為0.002,batch size為256,訓(xùn)練了20個epoch,本文方法的神經(jīng)網(wǎng)絡(luò)參數(shù)如表1所示。
3.4 ?評估指標
實驗采用正確率(Accuracy)對本文方法進行評估,計算公式為
式中:TP為真陽性的數(shù)量,表示在預(yù)測的身份結(jié)果中與真實身份相匹配的人數(shù),FP為假陽性的數(shù)量,表示在預(yù)測的身份結(jié)果中與真實身份不匹配的人數(shù)。
3.5 ?實驗結(jié)果與分析
對本文方法的神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,訓(xùn)練曲線如圖3所示。
由圖4可知:本文方法能夠正確地識別大部分心電圖;同時由公式(6)對實驗數(shù)據(jù)進行統(tǒng)計,本文方法在20個epoch上獲得94.92%的識別正確率。
為進行對照實驗,設(shè)計一個參數(shù)數(shù)量與本文神經(jīng)網(wǎng)絡(luò)相當?shù)腞esNet,并對其進行訓(xùn)練,訓(xùn)練曲線如圖5所示。
由圖5可知,ResNet在接近80個epoch時,訓(xùn)練集的正確率才超過90%;對比本文提出的神經(jīng)網(wǎng)絡(luò),其收斂速度較慢。
在對照實驗中,采用相同的優(yōu)化器和損失函數(shù)在ResNet上訓(xùn)練了200個epoch,結(jié)果如圖6所示。
由圖6可知:ResNet中出現(xiàn)了部分心電圖無法正確識別的情況,同時由公式(6)對實驗數(shù)據(jù)進行統(tǒng)計,其正確率為89.45%;相比本文方法,在保證正確率的情況下提高了訓(xùn)練效率,加快了神經(jīng)網(wǎng)絡(luò)的收斂。
4 ?結(jié)論
為了減少身份識別中神經(jīng)網(wǎng)絡(luò)的深度,提高神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效率,本文設(shè)計了一種MKMSA模塊并構(gòu)建了基于多核卷積和多頭自注意力的心電圖身份識別方法,在公開數(shù)據(jù)集QT數(shù)據(jù)集上獲得的識別正確率為94.92%,且有效地提升了訓(xùn)練效率。在未來的研究中,隨著聯(lián)邦機器學習的發(fā)展能夠給心電圖提供更好的隱私保護,使基于心電圖的生物識別方法能夠應(yīng)用到更多現(xiàn)實的場景。
參考文獻
參考文獻
[1]BIEL L, PETTERSSON O, PHILIPSON L, et al. ECG analysis: a new approach in human identification[J]. IEEE Transactions on Instrumentation and Measurement, 2001,50(3):808-812.
[2]LEE C L, CHEN Y T, WU A Y. A scalable extreme learning machine (S-ELM) for class-incremental ECG-based user identification[C]//2021 IEEE International Symposium on Circuits and Systems (ISCAS). IEEE, 2021: 1-5.
[3]DALAL S, VISHWAKARMA V P. Classification of ECG signals using multi-cumulants based evolutionary hybrid classifier[J]. Scientific Reports, 2021, 11(1): 15092.
[4]SRIVASTVA R, SINGH Y N, SINGH A. Statistical independence of ECG for biometric authentication[J]. Pattern Recognition, 2022, 127: 108640.
[5]LI M, SI Y, YANG W, et al. ET-UMAP integration feature for ECG biometrics using stacking[J]. Biomedical Signal Processing and Control, 2022, 71: 103159.
[6]JYOTISHI D, DANDAPAT S. An ECG biometric system using hierarchical lstm with attention mechanism[J]. IEEE Sensors Journal, 2021, 22(6): 6052-6061.
[7]TUNCER T, AYDEMIR E, DOGAN S, et al. New human identification method using Tietze graph-based feature generation[J]. Soft Computing, 2021, 25(21): 13437-13449.
[8]楊向林,嚴洪,李延軍,等.基于小波分解和數(shù)據(jù)融合方法的ECG身份識別[J].航天醫(yī)學與醫(yī)學工程,2009,22(4):296-301.
[9]SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2015:1-9.
[10]VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need[J]. Advances in Neural Information Processing Systems, 2017, 30.
[11]ULYANOV D, VEDALDI A, LEMPITSKY V. Instance normalization: The missing ingredient for fast stylization[J]. arXiv preprint arXiv:1607.08022, 2016.
[12]IOFFE S, SZEGEDY C. Batch normalization: Accelerating deep network training by reducing internal covariate shift[C]// International Conference on Machine Learning, 2015: 448-456.
[13]CHEN L, LU X, ZHANG J, et al. Hinet: Half instance normalization network for image restoration[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2021:182-192.
[14]GOLDBERGER A L, AMARAL L A N, GLASS L, et al. PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals[J]. Circulation, 2000,101(23): e215-e220.
[15]LAGUNA P, MARK R G, GOLDBERG A, et al. A database for evaluation of algorithms for measurement of QT and other waveform intervals in the ECG[C]//Computers in Cardiology 1997. IEEE, 1997:673-676.
作者簡介:
姚嘉偉,男,1996年生,碩士研究生,主要研究方向:機器學習。E-mail:?yaojw199@163.com
蔡延光,男,1963年生,博士,教授/博士生導(dǎo)師,主要研究方向:網(wǎng)絡(luò)控制與優(yōu)化、組合優(yōu)化、智能優(yōu)化、智能交通系統(tǒng)等。E-mail: caiyg99@163.com