摘要: 基于深度學(xué)習(xí)的脈搏波分類依賴大量有標(biāo)注數(shù)據(jù),現(xiàn)有脈搏波帶有疾病標(biāo)注的數(shù)據(jù)少、標(biāo)注方法不統(tǒng)一,導(dǎo)致模型準(zhǔn)確率低、泛化能力弱。針對此問題,提出一種基于神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索與特征融合的小樣本脈搏波分類方法。首先,在并行的雙維度拆分卷積分支與因果空洞卷積分支中進(jìn)行態(tài)射搜索,每次搜索結(jié)束,獲取超網(wǎng)絡(luò)分支的子網(wǎng)絡(luò)作為候選網(wǎng)絡(luò)進(jìn)行訓(xùn)練評估。雙維度拆分卷積分支提取脈搏波橫、縱向維度時(shí)空特征,因果空洞卷積分支提取脈搏波節(jié)律特征。然后,利用特征融合方法整合分支多尺度特征。最后,依據(jù)評估指標(biāo)得到最佳網(wǎng)絡(luò)模型完成分類。實(shí)驗(yàn)結(jié)果表明,所提方法在兩個(gè)小樣本脈搏波數(shù)據(jù)集上準(zhǔn)確率為97.04%和95.96%,F(xiàn)1值為97.04%和95.95%,具有較好分類效果。
關(guān)鍵詞: 脈搏波; 小樣本; 神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索; 特征融合; 卷積神經(jīng)網(wǎng)絡(luò)
中圖分類號: TP183
文獻(xiàn)標(biāo)志碼: A
文章編號: 1671-6841(2024)06-0054-08
DOI: 10.13705/j.issn.1671-6841.2023025
Small-sample Pulse Wave Classification Based on Neural Architecture
Search and Feature Fusion
XING Yuyang1,2, CHEN Feng3, MAO Xiaobo1,2, SUN Zhixia4, LU Peng1,2,5, QIAO Yunfeng1,2, DOU Yamei1,2
(1.School of Electrical and Information Engineering, Zhengzhou University, Zhengzhou 450001, China;
2.Research Center for Intelligent Science and Engineering Technology of TCM, Zhengzhou 450001, China;
3.Zhengzhou Seventh People′s Hospital, Zhengzhou 450016, China; 4.The Fifth Affiliated Hospital
of Zhengzhou University, Zhengzhou 450052, China; 5.Henan Collaborative Innovation Center for Internet
Based Medical and Health Services, Zhengzhou 450052, China)
Abstract: Classification of pulse wave based on deep learning relied on a large amount of labeled data. However, the existing pulse wave data with disease labels were small and the labeling methods were not uniform, which led to the problems of low accuracy and weak generalization ability of the model. To address this problem, a small-sample pulse wave classification method based on neural architecture search and feature fusion was proposed. Firstly, the morphism search was performed in the parallel super-network branches, the bi-dimensional split convolutional branch and the causal dilated convolutional branch. At the end of each search, the subnetworks in the super-network branches were obtained as candidate networks for training and evaluation. The spatio-temporal features in the horizontal and vertical dimensions of the pulse wave were extracted by the bi-dimensional split convolution branch, and the rhythmic features of the pulse wave were extracted by the causal dilated convolution branch. Then, the branching multiscale features were integrated using the feature fusion method. Finally, the best network model was obtained based on the evaluation index to complete the classification. The experimental results showed that the accuracy of the proposed method on two small sample pulse wave datasets was 97.04% and 95.96%, and the F1 was 97.04% and 95.95%, respectively, which could realize well classification results.
Key words: pulse wave; small sample; neural architecture search; feature fusion; convolutional neural network
0 引言
脈搏波是高度非平穩(wěn)、非線性、周期性的弱生理信號,蘊(yùn)含著極其豐富的心血管生理病理信息[1]。
基于脈搏波解決心血管疾病的分類方法主要包括基于先驗(yàn)知識的方法與基于深度學(xué)習(xí)的方法。
基于先驗(yàn)知識的脈搏波分類方法通常提取脈搏波的時(shí)頻域特征,利用支持向量機(jī)(support vector machine,SVM)[2]、隨機(jī)森林(random forest,RF)[3]等算法進(jìn)行分類識別。該類方法特征提取的準(zhǔn)確性易受噪聲影響,且手工設(shè)計(jì)特征不足以精準(zhǔn)地表達(dá)原始脈搏波數(shù)據(jù)[4]。
基于深度學(xué)習(xí)的脈搏波分類方法屏蔽了主觀特征設(shè)計(jì),通過不斷訓(xùn)練調(diào)整網(wǎng)絡(luò)連接權(quán)重等參數(shù),自動擬合輸入與輸出之間映射關(guān)系。文獻(xiàn)[5]采用一維卷積神經(jīng)網(wǎng)絡(luò)(one dimensions convolution neural network,1D-CNN)將脈搏波映射到高維空間,提取脈搏波靜態(tài)特征。文獻(xiàn)[6]首先將一維脈搏波信號重組變換為二維數(shù)據(jù)形式,然后利用二維卷積神經(jīng)網(wǎng)絡(luò)(two dimensions convolution neural network,2D-CNN)提取脈搏波空間特征。文獻(xiàn)[7-8]將脈搏波視為離散時(shí)間序列,采用遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)與長短時(shí)記憶網(wǎng)絡(luò)(long short-term memory,LSTM)挖掘脈搏波中的時(shí)序與節(jié)律特征。提取單一特征的方式未能充分利用脈搏波蘊(yùn)含的多尺度特征,文獻(xiàn)[9-10]將CNN與LSTM結(jié)合構(gòu)建多分支網(wǎng)絡(luò)提取脈搏波多尺度特征。
然而,一方面基于深度學(xué)習(xí)的脈搏波分類依賴大量有標(biāo)注數(shù)據(jù),現(xiàn)有脈搏波數(shù)據(jù)集帶有疾病標(biāo)注的數(shù)據(jù)少、標(biāo)注方法不統(tǒng)一,影響深度學(xué)習(xí)模型分類性能。另一方面,僅通過訓(xùn)練調(diào)整網(wǎng)絡(luò)參數(shù)提高模型非線性擬合能力,網(wǎng)絡(luò)結(jié)構(gòu)始終固定不變,而模型知識不僅存在于網(wǎng)絡(luò)參數(shù)中,而且蘊(yùn)含在網(wǎng)絡(luò)結(jié)構(gòu)內(nèi)[11]。
與僅調(diào)整網(wǎng)絡(luò)參數(shù)不同,神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索(neural architecture search,NAS)綜合考慮調(diào)整網(wǎng)絡(luò)參數(shù)與網(wǎng)絡(luò)結(jié)構(gòu)兩方面,在搜索與訓(xùn)練過程優(yōu)化網(wǎng)絡(luò)參數(shù)與隱層結(jié)構(gòu),針對特定任務(wù)構(gòu)建高質(zhì)量網(wǎng)絡(luò)模型,是提高小樣本數(shù)據(jù)條件下神經(jīng)網(wǎng)絡(luò)模型分類性能的新途徑。
Wang等[12]采用NAS方法優(yōu)化網(wǎng)絡(luò)模型,在小樣本數(shù)據(jù)條件下改善分類效果,并指出模型訓(xùn)練由網(wǎng)絡(luò)參數(shù)與網(wǎng)絡(luò)結(jié)構(gòu)共同決定,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)可以降低網(wǎng)絡(luò)參數(shù)擬合的需求,進(jìn)而減少模型訓(xùn)練所需要的樣本數(shù)量。
針對脈搏波有標(biāo)注數(shù)據(jù)少、標(biāo)注方法不統(tǒng)一的問題,本文設(shè)計(jì)一種基于NAS與特征融合的小樣本脈搏波分類方法。本文的主要工作總結(jié)如下。
1) 設(shè)計(jì)了一種基于超網(wǎng)絡(luò)態(tài)射的神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索算法,擴(kuò)展人工設(shè)計(jì)的網(wǎng)絡(luò)成為超網(wǎng)絡(luò),然后采用網(wǎng)絡(luò)態(tài)射方式進(jìn)行結(jié)構(gòu)搜索,獲取超網(wǎng)絡(luò)的子網(wǎng)絡(luò)作為候選網(wǎng)絡(luò)進(jìn)行訓(xùn)練評估,最終依據(jù)評估指標(biāo)得到最佳模型結(jié)構(gòu)用于分類。
2) 采用了一個(gè)雙維度拆分卷積特征提取結(jié)構(gòu),考慮脈搏波數(shù)據(jù)屬于時(shí)序性數(shù)據(jù),二維數(shù)據(jù)形式下橫向和縱向維度信息含義不同,將二維卷積核進(jìn)行分解,在橫向和縱向維度提取脈搏波時(shí)間與空間特征。
3) 構(gòu)建了一個(gè)雙分支特征融合脈搏波分類網(wǎng)絡(luò),雙維度拆分卷積分支提取脈搏波橫向和縱向維度的時(shí)空特征;因果空洞卷積分支提取脈搏波隨時(shí)間變化的節(jié)律特征。采用特征融合方法整合網(wǎng)絡(luò)分支中的多尺度特征完成分類。
4) 在光電容積脈搏波和壓力脈搏波數(shù)據(jù)集上進(jìn)行分類實(shí)驗(yàn),準(zhǔn)確率達(dá)到97.04%和95.96%,F(xiàn)1值達(dá)到97.04%和95.95%,取得較好的分類效果。
1 方法
1.1 問題描述
NAS核心是一個(gè)參數(shù)和結(jié)構(gòu)聯(lián)合損失優(yōu)化問題。對于一個(gè)脈搏波數(shù)據(jù)集D={(xk,yk)}nk=1,xk為樣本序列,yk為對應(yīng)類別標(biāo)簽。訓(xùn)練集Dtrain、驗(yàn)證集Dval、測試集Dtest是D={(xk,yk)}nk=1的劃分,
Dtrain={(xk,yk)}tk=1,
Dval={(xk,yk)}vk=t+1,
Dtest={(xk,yk)}nk=v+1。
學(xué)習(xí)問題是尋找一系列參數(shù)θ滿足
y≈f(x;θ), (x,y)∈Dval,
θ*=argminθ∑(x,y)∈DtrainL(f(x,θ),y),
式中:L為損失函數(shù),計(jì)算預(yù)測結(jié)果與真實(shí)標(biāo)簽之間的損失;f表示當(dāng)前神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);θ*為f學(xué)習(xí)的目標(biāo)參數(shù)。
脈搏波分類任務(wù)使用交叉熵作為損失函數(shù),計(jì)算方法為
loss=-1N∑Ni=1(-∑Mj=1yijlog(pij)),
式中:N為樣本數(shù);M為脈搏波類別數(shù)量;yij為脈搏波的標(biāo)簽;pij為每個(gè)標(biāo)簽對應(yīng)的預(yù)測結(jié)果。
基于交叉熵?fù)p失函數(shù)由Dtrain中樣本擬合一個(gè)非線性決策函數(shù),并以最小損失值對參數(shù)θ優(yōu)化,然后在Dval上評估模型性能,在Dtest上測試。同時(shí),在搜索空間F中,找到一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)f*∈F滿足
f*=argminθ Cost(f(θ*),Dval),
其中:Cost()為評價(jià)度量函數(shù)。
1.2 超網(wǎng)絡(luò)態(tài)射搜索
算法1呈現(xiàn)了超網(wǎng)絡(luò)態(tài)射搜索的整個(gè)流程,主要由訓(xùn)練階段3)~6)、搜索階段8)~25)迭代完成,最終進(jìn)行擇優(yōu)。以現(xiàn)有人工設(shè)計(jì)的網(wǎng)絡(luò)結(jié)構(gòu)作為初始網(wǎng)絡(luò),并將其擴(kuò)展為超網(wǎng)絡(luò),然后采用網(wǎng)絡(luò)態(tài)射的方式在預(yù)定義的超網(wǎng)絡(luò)中進(jìn)行搜索變換。每次搜索結(jié)束,獲取超網(wǎng)絡(luò)中子網(wǎng)絡(luò)作為候選網(wǎng)絡(luò)進(jìn)行訓(xùn)練評估,最終依據(jù)評估指標(biāo)得到最佳模型結(jié)構(gòu),如圖1所示。
算法1 超網(wǎng)絡(luò)態(tài)射搜索
輸入: Dtrain,Dval,模擬退火溫度(T),最低溫度(Tlow),溫度下降率(Rtd),搜索次數(shù)(g),最大搜索次數(shù)(G),結(jié)構(gòu)變換函數(shù)(M),超網(wǎng)絡(luò)空間(O)。
輸出: 搜索所得最佳網(wǎng)絡(luò)模型(f*)。
1) 初始化:T=1,g=1,i=1,初始網(wǎng)絡(luò)f(1)
2) While g≤G do
3) 使用Dtrain訓(xùn)練當(dāng)前候選網(wǎng)絡(luò)f(i)
4) 使用Dval 評估f(i)獲取評估指標(biāo)值c(i)
5) 將f(i)與c(i)存入H={(f(i),θ(i),c(i))}與擬搜索網(wǎng)絡(luò)集合MQ中
6) 根據(jù)c(i)對H={(f(i),θ(i),c(i))}排序,得到有序優(yōu)先序列PQ,根據(jù)lowest(c(i))更新cmin
7) While MQ≠ and T>Tlow do
8) 從MQ中彈出一個(gè)候選網(wǎng)絡(luò)f(i)
9) T=T*Rtd
10) 對f(i)進(jìn)行結(jié)構(gòu)變換得到一系列子代網(wǎng)絡(luò){fj}:{fj}←M(f(i),O)
11) While {fj}≠ do
12) 從{fj}中取出一個(gè)子代網(wǎng)絡(luò)fj
13) 計(jì)算α(f)=μ(yf)-βσ(yf)
14) if rand()<exp(cmin-α(fj)T) then
15) 將fj存入MQ
16) else
17) 舍棄fj
18) end if
19) if α(fj)<cmin then
20) cmin=α(fj), fmin=fj
21) end if
22) end while
23) end while
24) f(i+1)=fmin,g=g+1
25) end while
26) 依據(jù)cmin,從PQ中選取出f*
算法1中的9)表示不斷更新模擬退火溫度T的值,13)表示計(jì)算子代網(wǎng)絡(luò)fj對應(yīng)的采集函數(shù)α(fj)[13],14)~17)表示利用模擬退火算法與接收函數(shù)exp(cmin-α(fj)T) [13]決定是否將fj存入MQ中,19)~25)表示基于α(fj)對fj評估,若α(fj)值小于cmin,則fj作為下一個(gè)候選網(wǎng)絡(luò),并對其進(jìn)行新一輪訓(xùn)練評估,26)表示當(dāng)達(dá)到預(yù)設(shè)最大搜索次數(shù)或?qū)ΤW(wǎng)絡(luò)中所有候選網(wǎng)絡(luò)完成訓(xùn)練評估后,選取cmin對應(yīng)的最佳網(wǎng)絡(luò)模型f*。
1.3 雙分支特征融合分類網(wǎng)絡(luò)
雙分支特征融合分類網(wǎng)絡(luò)整體架構(gòu)如圖2所示,由雙維度拆分卷積分支(bi-dimensional split convolutional branch,BSCB)、因果空洞卷積分支(causal dilated convolutional branch,CDCB)以及融合推理層組成。
1.3.1 雙維度拆分卷積分支 將基于optimal CNN[6]BSCB作為初始網(wǎng)絡(luò)。脈搏波數(shù)據(jù)屬于時(shí)序性數(shù)據(jù),經(jīng)分割堆疊轉(zhuǎn)換為二維數(shù)據(jù),水平和垂直方向信息含義不同,包括空間相對位置變化信息與時(shí)序變化信息。
脈搏波數(shù)據(jù)經(jīng)過分割堆疊轉(zhuǎn)換二維數(shù)據(jù)形式,作為BSCB的輸入,將對稱卷積核進(jìn)行拆分,使用分解卷積核(1*k和k*1)取代optimal CNN中的對稱卷積核(k*k),在橫向和縱向維度提取脈搏波的時(shí)間與空間特征。
分解卷積層定義為
Yk=f(Yk-1×Wk+bk),
其中:Yk為第k層輸出特征向量;f為激活函數(shù);Wk、bk為權(quán)重參數(shù)與偏差。
池化層用于降低數(shù)據(jù)維度,定義為
Yi=g(Yi-1),
其中:g為池化函數(shù);Yi為第i層輸出特征向量。
1.3.2 因果空洞卷積分支
將基于TEMPO-net[14]前兩組單元CDCB作為初始網(wǎng)絡(luò)。TEMPO-net由因果空洞卷積、一維卷積、平均池化及全連接層構(gòu)成,用于處理時(shí)序生理信號。
因果卷積在時(shí)間維度以并行方式處理時(shí)序數(shù)據(jù),空洞卷積在卷積時(shí)進(jìn)行間隔采樣。CDCB將一維脈搏波數(shù)據(jù)作為輸入,采用因果空洞卷積提取隨時(shí)間變化的節(jié)律特征,如圖3所示。
因果空洞卷積層定義為
ymt=∑K-1i=0∑Cin-1l=0xlt-di·Wl,mi,
其中:x、y表示輸入與輸出特征向量;t、m表示輸出時(shí)間步長與輸出通道數(shù);W表示濾波器權(quán)重,Cin表示輸入通道數(shù);d表示空洞因子;K表示濾波器尺寸;t-di表明方向。
1.3.3 特征融合及推理層
不同特征信息從不同方面描述脈搏波數(shù)據(jù)。采用并行分支網(wǎng)絡(luò)結(jié)構(gòu)可以減少模型深度,同時(shí)提取與融合脈搏波多尺度特征綜合分析。
推理層由全連接層構(gòu)成,整合網(wǎng)絡(luò)層中具有類別區(qū)分性的局部信息,最后通過Sigmoid層得到預(yù)測分類結(jié)果作為輸出。
FYi=f(FYi-1×Wi+bi),
Y=Sigmoid(FYi-1×Wi+bi),
其中:FYi-1、FYi表示第i層全連接層的輸入與輸出特征向量;f表示激活函數(shù);Wi、bi表示權(quán)重參數(shù)與偏差;Y表示0~1之間的輸出值。
2 實(shí)驗(yàn)設(shè)置
2.1 數(shù)據(jù)集
實(shí)驗(yàn)所用數(shù)據(jù)集為光電容積脈搏波數(shù)據(jù)集和壓力脈搏波數(shù)據(jù)集,數(shù)據(jù)集的具體信息見表1。
數(shù)據(jù)集Ⅰ[15]為公開的光電容積脈搏波數(shù)據(jù)集。收集自桂林人民醫(yī)院的219名受試者(104名男性和115名女性),提供了正常血壓、高血壓前期、高血壓I期、Ⅱ期四種標(biāo)簽,每種疾病類型均包含三組樣本,共包含657條數(shù)據(jù),經(jīng)預(yù)處理后分別得到正常與疾病標(biāo)簽樣本700條與655條。
數(shù)據(jù)集Ⅱ?yàn)楸卷?xiàng)目采集的連續(xù)無創(chuàng)血壓脈搏波數(shù)據(jù)集,采集地點(diǎn)為鄭州大學(xué)第五附屬醫(yī)院,每種疾病類型均包含六組樣本,一共包含221名年齡在18~83歲之間的受試者6種脈壓下的1 326個(gè)脈搏波,經(jīng)預(yù)處理后分別得到正常與疾病標(biāo)簽樣本1 115條與1 271條。數(shù)據(jù)集在標(biāo)準(zhǔn)實(shí)驗(yàn)條件和規(guī)范下收集,實(shí)驗(yàn)方案均已獲鄭州大學(xué)第五附屬醫(yī)院藥物臨床試驗(yàn)倫理委員會批準(zhǔn),并填寫知情同意書。采集儀器為ZM-300智能脈搏波采集器,采樣頻率為200 Hz。
2.2 數(shù)據(jù)預(yù)處理
臨床采集的脈搏波信號信噪比低,易受到高頻干擾、運(yùn)動偽影的影響。實(shí)驗(yàn)前對臨床采集脈搏波進(jìn)行預(yù)處理,得到可訓(xùn)練的脈搏波數(shù)據(jù)。
脈搏波頻率主要分布于低頻段。實(shí)驗(yàn)采用經(jīng)驗(yàn)?zāi)B(tài)分解法[16]自適應(yīng)提取脈搏波的本征模函數(shù),剔除高頻部分,達(dá)到去除高頻噪聲的目的。
實(shí)驗(yàn)運(yùn)用皮爾遜相關(guān)系數(shù)(Pearson correlation coefficient, PCC)衡量去噪前后信息損失程度,
PCC=∑XY-∑X∑YN(∑X2-(∑X)2N)(∑Y2-(∑Y)2N),
其中:X、Y分別為原始脈搏波及去噪后脈搏波中元素按時(shí)間排列組成的集合;N為樣本點(diǎn)數(shù)。
實(shí)驗(yàn)中僅保留濾波后PCC大于0.9的數(shù)據(jù),以保證濾波后最大程度保留原始信息。
脈搏波是準(zhǔn)周期性波形圖,單個(gè)周期記錄了絕大多數(shù)信息。對濾波后的脈搏波進(jìn)行波峰、波谷檢測,取相鄰波谷間的波形作為單周期信號進(jìn)行分割。
脈搏波數(shù)據(jù)預(yù)處理后按照7∶1∶2的比例隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測試集。
2.3 搜索空間設(shè)置
BSCB搜索子空間中卷積操作采用雙維度拆分卷積,即采用分解卷積核(1*k與k*1)取代optimal CNN[6]中的對稱卷積核(k*k)進(jìn)行卷積處理,1*k與k*1卷積核的具體搜索空間設(shè)置如表2所示。
CDCB搜索子njrrshKucFecMxTTC580zw==空間中卷積操作采用因果空洞卷積,因果空洞卷積的具體搜索空間設(shè)置如表3所示。
融合推理層中Dropout取值范圍:最小值為0.2,最大值為0.7,步長為0.1。特征融合方式為Concatenate。模型訓(xùn)練時(shí)可選擇的優(yōu)化器包括Adam、SGD以及Adam weight decay。學(xué)習(xí)率的取值包括10-1、10-2、10-3、10-4、10-5。批量值為32,epoch值為100。
2.4 評估指標(biāo)
準(zhǔn)確率(Acc):整體分類準(zhǔn)確率;敏感度(Sen):異常脈搏波預(yù)測結(jié)果正確的比例;精確度(Pre):被分為異常的脈搏波中實(shí)際為異常的比例;F1:Sen與Pre的加權(quán)調(diào)和平均;模型參數(shù)量:搜索所得網(wǎng)絡(luò)模型包含的參數(shù)數(shù)量。Acc、Sen、Pre與F1的具體計(jì)算為
Acc=TP+TNTP+TN+FP+FN,
Sen=TPTP+FN,
Pre=TPTP+FP,
F1=2×Pre×SenPre+Sen,
其中:TP、TN、FP、FN分別表示真陽性、真陰性、假陽性、假陰性。
3 結(jié)果與討論
為驗(yàn)證所提方法的有效性,在兩個(gè)小樣本脈搏波數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。所有實(shí)驗(yàn)均在Python(3.8.3)、TensorFlow(2.8.0)、Autokeras(1.0.18)條件下執(zhí)行。
3.1 不同搜索策略對比
為分析不同搜索策略對脈搏波分類效果的影響,采用貪婪策略(Greedy)、隨機(jī)策略(Random)、貝葉斯優(yōu)化策略(Bayesian)與Hyperband策略[17]四種搜索策略進(jìn)行實(shí)驗(yàn),并選擇效果較好的搜索策略應(yīng)用于后續(xù)實(shí)驗(yàn)。
實(shí)驗(yàn)設(shè)置epoch為100,最大搜索次數(shù)為100,批量值為32。為避免搜索結(jié)果的偶然性,每種搜索策略執(zhí)行20次實(shí)驗(yàn)。
實(shí)驗(yàn)結(jié)果如圖4所示,針對脈搏波數(shù)據(jù),采用Hyperband策略進(jìn)行網(wǎng)絡(luò)架構(gòu)搜索,與其他三種搜索策略相比,模型參數(shù)量在同一個(gè)量級內(nèi),分類指標(biāo)平均值最佳,取得更好的分類效果。此外,由圖4可知,采用Hyperband策略執(zhí)行20次實(shí)驗(yàn)所得的指標(biāo)值波動程度更小,表明采用Hyperband策略搜索結(jié)果更穩(wěn)定。
3.2 消融實(shí)驗(yàn)
消融實(shí)驗(yàn)分析特征融合分支BSCB與CDCB的有效性。實(shí)驗(yàn)設(shè)置最大搜索次數(shù)為100,搜索策略采用Hyperband,實(shí)驗(yàn)結(jié)果如表4所示。
由實(shí)驗(yàn)結(jié)果可知,特征融合分支在兩個(gè)小樣本脈搏波數(shù)據(jù)集上取得較好的分類效果,表明BSCB與CDCB能夠有效提取脈搏波特征,有利于提升小樣本脈搏波分類效果。此外,與采用均勻卷積的CNN模型相比,BSCB采用拆分卷積,有效降低了模型參數(shù)量,適用于小樣本數(shù)據(jù)學(xué)習(xí)任務(wù);與LSTM模型相比,CDCB分類效果提升明顯,能夠有效提取脈搏波長時(shí)間尺度變化的節(jié)律特征。
3.3 不同方法對比
本文方法在數(shù)據(jù)集Ⅰ上搜索所得最佳模型記為NAS-FF-1,在數(shù)據(jù)集Ⅱ上搜索所得最佳模型記為NAS-FF-2。NAS-FF-1與NAS-FF-2的區(qū)別在于模型內(nèi)部卷積、池化等操作具有不同的參數(shù)值大小。
為進(jìn)一步驗(yàn)證本文方法在兩個(gè)數(shù)據(jù)集上搜索所得最佳模型的有效性,與其他脈搏波特征提取方法進(jìn)行對比實(shí)驗(yàn)。對比方法包括:SVM[2]、RF[3]、1D-CNN[5]、optimal CNN[6]、LSTM[7]、CNN-LSTM[9]、CNN-CNN[10]、TEMPO-Net[14]、CNN搜索[18]。實(shí)驗(yàn)結(jié)果取最后10次結(jié)果的平均值,如表5所示。
實(shí)驗(yàn)結(jié)果表明,本文方法在兩個(gè)小樣本脈搏波數(shù)據(jù)集上搜索得到的最佳模型取得了較好的分類效果,并且與其他模型相比,模型參數(shù)量較小,表明模型能夠有效提取脈搏波特征,更好地平衡分類效果與模型參數(shù)量,降低了模型過擬合風(fēng)險(xiǎn),適用于小樣本數(shù)據(jù)學(xué)習(xí)任務(wù)。
NAS-FF-1在兩個(gè)數(shù)據(jù)集上Acc相差3.56%,Sen相差3.55%,Pre相差3.56%,F(xiàn)1相差3.56%;NAS-FF-2在兩個(gè)數(shù)據(jù)集上Acc相差1.15%,Sen相差1.14%,Pre相差0.91%,F(xiàn)1相差1.15%。實(shí)驗(yàn)結(jié)果表明,模型在兩個(gè)小樣本脈搏波數(shù)據(jù)集上的交叉實(shí)驗(yàn)取得了較好分類效果,且分類差異較小,模型具有一定的泛化能力。
4 結(jié)論
針對脈搏波有標(biāo)注數(shù)據(jù)少、標(biāo)注方法不統(tǒng)一影響模型分類性能的問題,本文設(shè)計(jì)了一個(gè)基于特征融合的NAS方法用于小樣本脈搏波分類。首先,擴(kuò)展兩個(gè)人工設(shè)計(jì)的網(wǎng)絡(luò)結(jié)構(gòu)成為超網(wǎng)絡(luò),分別對應(yīng)兩個(gè)并行分支:BSCB與CDCB。然后,在預(yù)定義的超網(wǎng)絡(luò)分支中采用NAS方法進(jìn)行結(jié)構(gòu)變換搜索,獲取超網(wǎng)絡(luò)中子網(wǎng)絡(luò)作為候選網(wǎng)絡(luò)進(jìn)行訓(xùn)練評估,BSCB采用雙維度拆分卷積提取二維脈搏波矩陣橫向和縱向維度的時(shí)間與空間特征,CDCB采用因果空洞卷積提取一維脈搏波向量隨時(shí)間變化的節(jié)律特征,然后采用特征融合方式整合分支特征。最后,依據(jù)評估指標(biāo)獲取最佳網(wǎng)絡(luò)模型完成分類。
在兩個(gè)小樣本脈搏波數(shù)據(jù)集上進(jìn)行分類實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,該方法得到的最佳模型能夠有效提取脈搏波特征,在小樣本脈搏波條件下取得較好的分類效果。
由于數(shù)據(jù)量有限,本文只研究所提方法對小樣本脈搏波數(shù)據(jù)的二元分類識別。后續(xù)將擴(kuò)充脈搏波數(shù)據(jù)量進(jìn)行多分類實(shí)驗(yàn),并在搜索過程中考慮多目標(biāo)優(yōu)化方式。
參考文獻(xiàn):
[1] SORELLI M, PERRELLA A, BOCCHI L. Detecting vascular age using the analysis of peripheral pulse[J]. IEEE transactions on bio-medical engineering, 2018, 65(12): 2742-2750.
[2] DEY J, GAURAV A, TIWARI V N. InstaBP: cuff-less blood pressure monitoring on smartphone using single PPG sensor[C]∥The 40th Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Piscataway: IEEE Press, 2018: 5002-5005.
[3] KACHUEE M, KIANI M M, MOHAMMADZADE H, et al. Cuffless blood pressure estimation algorithms for continuous health-care monitoring[J]. IEEE transactions on biomedical engineering, 2017, 64(4): 859-869.
[4] 逯鵬, 王漢章, 毛曉波, 等. 基于卷積自編碼器網(wǎng)絡(luò)的脈搏波分類模型[J]. 鄭州大學(xué)學(xué)報(bào)(工學(xué)版), 2021, 42(5)56-61.
LU P, WANG H Z, MAO X B, et al. Pulse wave classification model based on convolutional autoencoder[J]. Journal of Zhengzhou university (engineering science), 2021, 42(5)56-61.
[5] GOH C H, TAN L K, LOVELL N H, et al. Robust PPG motion artifact detection using a 1-D convolution neural network[J]. Computer methods and programs in biomedicine, 2020, 196: 105596.
[6] LI G Y, WATANABE K, ANZAI H, et al. Pulse-wave-pattern classification with a convolutional neural network[J]. Scientific reports, 2019, 9(1): 1-11.
[7] SONG W Z, SUN X Y, HU C H. Cuffless blood prediction with fingertip pulse wave[J]. Journal of physics: conference series, 2020, 1544(1): 012137.
[8] GHOSH S, BANERJEE A, RAY N, et al. Using accelerometric and gyroscopic data to improve blood pressure prediction from pulse transit time using recurrent neural network[C]∥The IEEE International Conference on Acoustics, Speech and Signal Processing. Piscataway: IEEE Press, 2018: 935-939.
[9] HARPER R, SOUTHERN J. End-to-end prediction of emotion from heartbeat data collected by a consumer fitness tracker[C]∥The 8th International Conference on Affective Computing and Intelligent Interaction. Piscataway: IEEE Press, 2019: 1-7.
[10]劉國華, 周文斌. 基于卷積神經(jīng)網(wǎng)絡(luò)的脈搏波時(shí)頻域特征混疊分類[J]. 吉林大學(xué)學(xué)報(bào)(工學(xué)版), 2020, 50(5): 1818-1825.
LIU G H, ZHOU W B. Pulse wave signal classification algorithm based on time-frequency domain feature aliasing using convolutional neural network[J]. Journal of Jilin university (engineering and technology edition), 2020, 50(5): 1818-1825.
[11]LI C L, PENG J F, YUAN L C, et al. Block-wisely supervised neural architecture search with knowledge distillation[C]∥The IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE press, 2020: 1986-1995.
[12]WANG N N, LUO C J, HUANG X, et al. DeepCS: training a deep learning model for cervical spondylosis recognition on small-labeled sensor data[J]. Neurocomputing, 2022, 472: 24-34.
[13]JIN H F, SONG Q Q, HU X. Auto-keras: an efficient neural architecture search system[C]∥Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York: ACM Press, 2019: 1946-1956.
[14]ZANGHIERI M, BENATTI S, BURRELLO A, et al. Robust real-time embedded EMG recognition framework using temporal convolutional networks on a multicore IoT processor[J]. IEEE transactions on biomedical circuits and systems, 2020, 14(2): 244-256.
[15]LIANG Y B, CHEN Z C, LIU G Y, et al. A new, short-recorded photoplethysmogram dataset for blood pressure monitoring in China[J]. Scientific data, 2018, 5(1): 1-7.
[16]ABDULHAY E, ALAFEEF M, ALZGHOUL L, et al. Computer-aided autism diagnosis via second-order difference plot area applied to EEG empirical mode decomposition[J]. Neural computing and applications, 2020, 32(15): 10947-10956.
[17]LI L S, JAMIESON K, DESALVO G, et al. Hyperband: a novel bandit-based approach to hyperparameter optimization[EB/OL]. (2016-10-31)[2022-06-18]. https:∥arxiv.org/abs/1603.06560.
[18]MA J C, HE N, YOON J H, et al. Distinguishing benign and malignant lesions on contrast-enhanced breast cone-beam CT with deep learning neural architecture search[J]. European journal of radiology, 2021, 142: 109878.