周鈞鍇 王 念 崔 莉
1(中國科學院計算技術(shù)研究所 北京 100190)
2(中國科學院大學 北京 100190)
(zjk934865517@163.com)
隨著科技的發(fā)展,物聯(lián)網(wǎng)對于社會的重要性日益增加,物聯(lián)網(wǎng)的應用和技術(shù)挑戰(zhàn)也不斷拓展.其中基于含噪一維物聯(lián)網(wǎng)時序信號的有效活動區(qū)間起止點識別問題受到了關注,例如基于加速度信號的運動區(qū)間識別、基于聲音信號的語音識別和基于肌電等生理信號的臨床運動信息采集等.但是在物聯(lián)網(wǎng)實際應用中,原始采集信號數(shù)據(jù)中多含有大量的噪聲,特別是在運動相關場景里,大量噪聲的存在會干擾信號活動區(qū)間起止點的識別準確性.傳統(tǒng)的人工標記方法[1]成本高且操作繁瑣.為降低標記成本,有研究者提出了能夠自動標記信號活動起止時間點的雙閾值法[2],但是雙閾值法對于信號中的噪聲十分敏感,難以滿足對多樣化的數(shù)據(jù)集和數(shù)據(jù)段的差異化信號進行標記的需求.于是一些研究者提出了基于機器學習[3]或者深度學習[4]的活動區(qū)間識別方法.該類方法對原始信號進行特征提取并據(jù)此訓練分類器來識別信號活動區(qū)間.但此類方法需要大量的訓練樣本數(shù)據(jù),不適用于樣本量較小的場景.因此,研究一種抗噪聲干擾能力強且適合小樣本的高效準確的信號活動區(qū)間識別方法具有重要意義,本工作擬針對此問題開展.
基于一維時序信號的數(shù)據(jù)分析是物聯(lián)網(wǎng)場景中最為常見的應用之一,例如基于表面肌電信號的手勢識別[5]和基于肌電信號的步態(tài)識別[6]等.基于一維時序信號的物聯(lián)網(wǎng)數(shù)據(jù)分析通常需要算法首先進行信號活動區(qū)間識別,之后方可基于區(qū)間的識別結(jié)果進行后續(xù)的算法研究[7].如果活動區(qū)間識別不精準,會導致后續(xù)分析無效等問題.例如在基于肌電信號的臨床研究中[8],錯誤的運動識別區(qū)間會導致待分析數(shù)據(jù)中引入無關信號和噪聲數(shù)據(jù)段的問題,從而影響數(shù)據(jù)的可用性以及分析特征的有效性.因此,面向一維時序信號的活動區(qū)間識別具有十分重要的研究意義.
目前已有的基于一維時序信號的信號活動區(qū)間識別研究有3種類型:
1) 人工標記法.在該方法中,研究者根據(jù)原始信號對信號中的各個信號活動區(qū)間的開始時間點和結(jié)束時間點進行手工標記.但手工標記方法會花費大量的人力和時間成本,而且標記結(jié)果會根據(jù)研究者的經(jīng)驗呈現(xiàn)出不同程度的主觀誤差.此類方法的人力和時間成本需要降低,同時信號活動區(qū)間的識別精度也需要進一步提升.
2) 雙閾值法.為實現(xiàn)信號活動區(qū)間的自動標記從而達到降低人工和時間成本的目的,Wang等人[2]提出了DeepLap方法,該方法提出使用基于雙閾值的信號活動區(qū)間識別方法進行活動區(qū)間識別.DeepLap利用高低2個閾值捕捉信號活動區(qū)間的開始時間點和結(jié)束時間點,低閾值對于信號的微小擾動十分敏感,因此可以用于捕捉細微的信號變化,達到提升信號活動區(qū)間起止點識別靈敏度和精度的目的.該方法還設置了信號高閾值,該高閾值用于再次確定信號活動區(qū)間的產(chǎn)生,從而有效減少短時噪聲尖峰的誤識別問題.該方法的具體過程為:設置1個低閾值和1個高閾值,并將信號與低閾值和高閾值做比較.低閾值和高閾值確定方法是基于整體輸入信號的均值和方差進行計算的,低閾值和高閾值的計算分別為
(1)
(2)
其中,Nall為整體區(qū)間信號的采樣點個數(shù),xi為第i個采樣點的信號值,k1,k2,k3,k4分別為不同的閾值確定系數(shù).
Fig. 1 Recognition method of signal activity interval based on double threshold圖1 基于雙閾值的信號活動區(qū)間識別方法
當信號值高于低閾值時,將此時間點記錄為時間點1.當信號值在始終不小于低閾值的情況下超越了高閾值時,算法將時間點1作為信號活動區(qū)間的開始時間點.當信號值低于低閾值時,算法將此時間點作為信號活動區(qū)間的結(jié)束時間點.DeepLap方法實現(xiàn)了信號活動區(qū)間的自動標記,降低了人工和時間成本.但DeepLap是基于固定閾值的,對于物聯(lián)網(wǎng)數(shù)據(jù)集來說,不同運動時間段、不同運動屬性的信號之間固定閾值的最佳取值差異較大,難以適用于不同的數(shù)據(jù)集和數(shù)據(jù)段,這降低了信號活動區(qū)間的識別精度.比如在含有大量噪聲的信號中,算法需要使用較高的方差和均值乘數(shù),否則會造成非噪聲的誤識別;而在含有少量噪聲的信號中,算法需要用到較低的方差和均值乘數(shù),否則會造成運動區(qū)間的忽略捕捉問題.如圖1所示,由于信號中含有的噪聲較多,噪聲信號會提升整體信號的均值和方差.因此在雙閾值法中,基于全局信號均值和信號方差所計算出的低閾值和高閾值均會大于最優(yōu)低閾值和最優(yōu)高閾值.因此無法準確識別出包含噪聲和多種運動的一維時序信號中的起始點和終止點,造成了信號活動區(qū)間遺漏識別的問題.
3) 基于機器學習[3]或者深度學習[4]的活動區(qū)間識別方法.該類方法對原始信號進行特征提取并據(jù)此訓練分類器來識別信號活動區(qū)間.比如Yamaba等人[9]使用支持向量機模型實現(xiàn)運動分類;Korpela等人[10]提出了一種結(jié)合Dynamic Time Warping和k-NN的運動識別分類模型;Nguyen等人[11]使用k-NN實現(xiàn)對不同行走類型的分類識別.基于傳統(tǒng)機器學習的活動區(qū)間識別算法依賴于人工特征的提取,可能會造成原始信號的浪費.于是一些工作提出使用深度學習網(wǎng)絡直接利用原始一維時序信號識別運動區(qū)間,比如Quivira等人[12]使用LSTM利用肌電信號識別手指運動;Lee等人[13]通過構(gòu)建一維的CNN實現(xiàn)了運動的分類識別.基于深度學習的方法雖然提升了識別的精度,但它們需要大量的訓練樣本數(shù)據(jù),而某些物聯(lián)網(wǎng)場景數(shù)據(jù)量較小,使用該類方法通常會導致模型欠擬合,從而降低模型的泛化能力.
為了解決上述問題,本研究提出了EasiLTOM:一種基于局部動態(tài)閾值的信號活動區(qū)間識別方法.該方法的特點是通過利用局部一維信號的均值和方差對不同段信號區(qū)域的動態(tài)雙閾值進行計算,并使用最短信號長度對噪聲尖峰進行過濾,從而使算法能夠適用于不同的信號環(huán)境,并且避免了局部噪聲信號對識別閾值的影響,減少了信號特點在不同運動和不同噪聲中存在差異所導致的信號活動區(qū)間誤識別問題.此外,EasiLTOM方法可適用于數(shù)據(jù)量較小的物聯(lián)網(wǎng)場景.
在物聯(lián)網(wǎng)場景中,傳感器可根據(jù)自身傳感特征對環(huán)境數(shù)據(jù)進行感知.所感知的數(shù)據(jù)可描述為S=Ssignal+Snoise,其中Ssignal為目標信號,Snoise為噪聲.在不同的物聯(lián)網(wǎng)數(shù)據(jù)場景中,噪聲的種類和幅值會有所差異.算法需要基于原始信號識別出信號中的活動區(qū)間的起始點和終止點.
雖然不同場景中的信號屬性存在較大差異,但是活動信號區(qū)間的起始點和終止點都具有一些共同的特點,算法可以基于此進行高精度的信號活動區(qū)間的識別.在一維信號的活動區(qū)間識別場景中,活動信號區(qū)間起始點的特點是,自該時間點起,信號開始持續(xù)活躍,并在較高的幅值維持一段時間.活動信號區(qū)間終止點的特點是,自該時間點起,信號開始靜息,信號的幅值較小.
Fig. 2 Recognition method of signal activity interval based on local dynamic threshold EasiLTOM圖2 基于局部動態(tài)閾值的信號活動區(qū)間識別方法EasiLTOM示意圖
考慮到活動信號區(qū)間起止點的特點,本文提出了EasiLTOM方法,其中局部是指長度為時間窗口T的信號區(qū)間.EasiLTOM方法通過設置基于時間窗口T計算出的低閾值和高閾值對信號進行狀態(tài)劃分,再通過對信號狀態(tài)的判斷確定信號活動區(qū)間的起止點.其中低閾值和高閾值是基于時間窗口T內(nèi)的信號值的平均值和方差計算的,當時間窗口T過小時,算法難以利用信號中全部的有效信息,從而導致部分有效信號信息被浪費;當時間窗口過大時,算法會引入更多的信號噪聲,導致識別閾值的適用性降低.所以EasiLTOM方法需要根據(jù)不同的信號類型設置合適的時間窗口T.此外,EasiLTOM方法加入了最短信號長度tmin對噪聲尖峰進行過濾.由于EasiLTOM方法中的低閾值和高閾值是使用時間窗口為T的局部區(qū)域信號平均值和方差進行確定的,從而能夠避免噪聲信號對識別閾值的影響,并提升信號活動區(qū)間的識別精度,EasiLTOM方法示意圖如圖2所示.在圖2中,EasiLTOM使用第1個局部信號區(qū)間的信號平均值和方差計算出低閾值1和高閾值1用于第1個信號區(qū)間的起止點(在圖2中即為開始點1和結(jié)束點1)識別;EasiLTOM再使用第2個局部信號區(qū)間的信號平均值和方差計算出低閾值2和高閾值2用于第2個信號區(qū)間的起止點(在圖2中即為開始點2和結(jié)束點2)識別.下面本文將對信號活動區(qū)間的起始點和終止點的識別方法進行介紹.
為識別信號活動區(qū)間的起止點,本方法提出使用信號低閾值和信號高閾值共同用于信號活動區(qū)間的起始點和終止點識別.當信號值高于信號低閾值,視為信號開始波動,方法進入狀態(tài)1,并將此時間點記錄為t1.當信號在始終不低于低閾值的情況下高于信號高閾值時,方法進入狀態(tài)2,當信號值低于低閾值時,方法將此時間點記錄為t2,此時方法判斷t2與t1的差值Δt是否大于最短信號長度tmin.如果Δt≥tmin,方法此時可以確認t1為信號活動區(qū)間的起始點,t2為信號活動區(qū)間的終止點;如果Δt 為充分利用當前信號區(qū)間的信號特點,并避免噪聲的影響,基于局部動態(tài)閾值的信號活動區(qū)間識別方法使用局部信號的均值和方差對低閾值和高閾值進行計算.由于信號時域特征中的均值和方差能夠較好地反映出不同運動信號的特點,所以基于局部信號的均值和方差對用于運動識別的低閾值和高閾值進行計算.方法根據(jù)此窗口中的信號均值及方差分別對低閾值和高閾值進行計算,低閾值的計算為 (3) 其中,Nlocal為局部區(qū)間信號的采樣點個數(shù),xi為第i個采樣點的信號值,k5和k6分別為不同的低閾值確定系數(shù). 高閾值的計算為 (4) 其中,Nlocal為局部區(qū)間信號的采樣點個數(shù),xi為第i個采樣點的信號值,k7和k8分別為不同的高閾值確定系數(shù). 本文設計了EasiLTOM的算法流程,如算法1所示: 算法1.EasiLTOM算法. 輸入:signal,T,tmin; 輸出:開始時間點、結(jié)束時間點. ① 算法初始化為狀態(tài)0; ② 基于時間窗口T使用局部平均信號值和局部信號方差值計算低閾值和高閾值; ③ if信號值高于低閾值 ④ 算法進入狀態(tài)1,記錄時間點t1; ⑤ if信號值在不低于低閾值的情況下高于高閾值 ⑥ 算法進入狀態(tài)2; ⑦ if信號值低于低閾值 ⑧ 算法記錄時間點t2; ⑨ end if ⑩ end if 算法1可以對信號活動區(qū)間的起始時間點和終止時間點進行識別,其流程如圖3所示.下面結(jié)合流程圖對算法1進行闡述.算法首先初始化為0狀態(tài),然后算法基于時間窗口T使用局部信號區(qū)間的平均值和方差計算低閾值和高閾值.之后算法判斷信號值高于低閾值的時間點,當信號值高于低閾值時,算法進入狀態(tài)1,并將此時間點標記為t1.如果信號值在始終不低于低閾值的情況下高于高閾值,算法進入狀態(tài)2,當信號值低于低閾值時,算法將此時間點記錄為t2,此時算法判斷時間點t2與時間點t1的差值Δt是否大于最短信號長度tmin,如果Δt≥tmin,算法分別將t1和t2作為信號活動區(qū)間的起始點和終止點進行輸出,最后算法恢復0狀態(tài). Fig. 3 Flow of signal interval recognition algorithm based on local dynamic threshold圖3 基于局部動態(tài)閾值的信號區(qū)間識別算法流程圖 為驗證本文提出的EasiLTOM方法的準確性,本節(jié)將EasiLTOM方法與DeepLap方法,以及基于機器學習的信號活動區(qū)間識別方法進行對比實驗.實驗內(nèi)容包括方法的識別準確性驗證,方法在小數(shù)據(jù)量場景中的識別精度對比.實驗數(shù)據(jù)包括本研究實際部署采集的肌電數(shù)據(jù)集EasiEMG及2個UCI公開數(shù)據(jù)集中的部分數(shù)據(jù). 為驗證本方法的有效性,本節(jié)首先對本文所選用的實際數(shù)據(jù)集的采集情況(3.1.1節(jié))以及選擇的公開數(shù)據(jù)集(3.1.2節(jié))的情況進行介紹.之后本節(jié)總結(jié)和對比EasiLTOM方法、DeepLap方法以及基于機器學習的信號活動區(qū)間識別方法在多個場景中的識別精度. 3.1.1 肌電數(shù)據(jù)集采集情況 Fig. 4 Schematic diagram of EMG test exercise圖4 肌電測試運動示意圖 肌電信號是一種人體生理信號,它記錄了肌肉細胞產(chǎn)生的收縮力[14].表面肌電信號是淺層肌肉肌電信號和神經(jīng)干上電活動在皮膚表面的綜合效應,能在一定程度上反映神經(jīng)肌肉的活動;表面肌電信號在測量上具有無創(chuàng)傷等優(yōu)點,并且可以作為肌肉疼痛疾病診斷的有效依據(jù)[15],所以廣泛應用于康復醫(yī)學等領域.但肌肉疼痛疾病的診斷依賴于表面肌電信號的運動區(qū)間識別.為驗證EasiLTOM方法的有效性,本研究組在2017-09—2017-11期間于中國中醫(yī)科學院西苑醫(yī)院實際部署了一套肌電信號采集裝置,對非特異性腰痛患者和正常人的肌電信號進行采集.在采集期間,該系統(tǒng)共采集到14位受試者的肌電信號,構(gòu)成肌電信號數(shù)據(jù)集EasiEMG.每次采集時,受試者執(zhí)行3次屈曲放松運動(如圖4(a)所示)、1次左足橋式運動(如圖4(b)所示)、1次右足橋式運動(如圖4(c)所示)、1次雙足橋式運動(如圖4(d)所示)和1次Biering Sorensen等長運動(如圖4(e)所示).在肌電信號的采集過程中,各種運動的肌電信號按時間順序串行拼接,每2種運動之間存在無序運動,無序運動的肌電信號會作為噪聲存在于整體肌電信號中. 3.1.2 公開數(shù)據(jù)集情況 本文選擇了UCI公開數(shù)據(jù)集中的2個手部動作肌電信號測試數(shù)據(jù)集手部動作集1(sEMG for basic hand movements data set database 1, Hand move-ments 1)[16]和手部動作集2(sEMG for basic hand movements data set database 2, Hand movements 2)[17],每個測試數(shù)據(jù)集中含有6個手部動作的多次肌電信號測試.分別選擇手部動作集1中的1名男性受試者的180次肌電測試信號和手部動作集2中的1名男性受試者的600次肌電測試信號進行信號活動區(qū)間的識別,肌電信號中存在無序手部運動的肌電信號作為噪聲. 3.2.1 識別精度驗證 Fig. 5 Recognition accuracy of EasiLTOM, DeepLap and machine learning methods圖5 EasiLTOM,DeepLap及機器學習方法的識別精度 為驗證EasiLTOM方法的有效性及識別精度,本節(jié)分別使用EasiLTOM,DeepLap以及機器學習方法對數(shù)據(jù)集EasiEMG和2個UCI公開數(shù)據(jù)集中數(shù)據(jù)進行了信號活動區(qū)間的識別,其中識別精度與誤檢率和漏檢率的關系為 Pacc=1-Pfalse-Pmissed, (5) 其中,Pacc為識別精度,Pfalse為誤檢率,Pmissed為漏檢率.由于隨機森林模型[18]對于噪聲的穩(wěn)定性好,分類精度高,且具有較強的泛化能力,適用于信號活動區(qū)間的起止點識別問題,所以本文選擇隨機森林模型作為機器學習方法以識別信號活動區(qū)間的起止點,EasiLTOM,DeepLap及機器學習方法對于各數(shù)據(jù)集的識別精度結(jié)果如表1所示: Table 1 EasiLTOM, DeepLap and Machine Learning Recognition Accuracy Results for Each Data Set 實驗結(jié)果表明:EasiLTOM方法對于信號活動區(qū)間的識別精度超過了DeepLap方法以及基于機器學習的信號活動區(qū)間識別方法,達到了平均93.17%的識別精度,EasiLTOM方法的識別精度比雙閾值法的識別精度高15.03%,比基于機器學習的信號活動區(qū)間識別方法的識別精度高4.70%. 3.2.2 小數(shù)據(jù)量場景中的識別精度對比 許多物聯(lián)網(wǎng)場景中的數(shù)據(jù)量稀少,因此需要一種適用于小數(shù)量場景的信號活動區(qū)間識別方法.為驗證EasiLTOM,DeepLap及機器學習方法在小數(shù)據(jù)量場景中的識別精度,本文使用EasiLTOM,DeepLap及機器學習方法對各個數(shù)據(jù)集分別在數(shù)據(jù)量為12條和18條的場景下進行了信號活動區(qū)間的識別,識別精度結(jié)果如圖5所示. 通過實驗結(jié)果可以得到,當數(shù)據(jù)量為12條和18條時,機器學習方法對于各個數(shù)據(jù)的平均識別精度分別為79.44%和83.12%,EasiLTOM方法對于各個數(shù)據(jù)的平均識別精度分別為97.22%和96.29%,EasiLTOM方法的識別精度分別比機器學習方法高17.78%和13.17%. 通過實驗在小數(shù)據(jù)量場景中的識別精度結(jié)果對比可得,在數(shù)據(jù)量稀少的物聯(lián)網(wǎng)場景中,機器學習方法因為模型欠擬合,導致模型的泛化能力變差,從而使識別精度下降.而EasiLTOM方法因為識別閾值的適用性在數(shù)據(jù)量稀少的場景中相較于在數(shù)據(jù)量大的場景中更好,從而提升了信號活動區(qū)間的識別精度.所以,EasiLTOM方法僅需使用少量數(shù)據(jù)即可對信號活動區(qū)間進行準確地識別,十分適用于數(shù)據(jù)量稀少的物聯(lián)網(wǎng)數(shù)據(jù)場景. 本文提出了基于局部動態(tài)閾值信號活動區(qū)間識別方法EasiLTOM,EasiLTOM方法的特點是:可以有效地克服將噪聲信號誤檢為信號活動區(qū)間或信號活動區(qū)間漏檢的現(xiàn)象,而且避免了信號中的隨機噪聲對于信號屬性不同的區(qū)間識別所帶來的影響,從而提升了信號活動區(qū)間的識別準確率.此外,EasiLTOM方法僅需使用少量數(shù)據(jù)即可對信號活動區(qū)間進行準確的識別,十分適用于數(shù)據(jù)量較小的物聯(lián)網(wǎng)數(shù)據(jù)場景. 相對于現(xiàn)有的信號活動區(qū)間識別方法DeepLap來說,EasiLTOM由于使用了局部動態(tài)閾值機制,所以方法對噪聲的容忍度高,能夠適用于更廣泛的信號活動區(qū)間識別的物聯(lián)網(wǎng)場景.例如在3.2節(jié)中,EasiLTOM方法對于信號活動區(qū)間的識別精度超過了其他方法,達到了平均93.17%的識別精度,比雙閾值法的識別精度高15.03%,比基于機器學習的信號活動區(qū)間識別方法的識別精度高4.70%. EasiLTOM適用于含有噪聲的一維物聯(lián)網(wǎng)場景,因為在確定識別低閾值和高閾值時,方法綜合使用了信號的局部區(qū)間的信號均值和信號方差,充分利用了當前信號區(qū)間的信號特點,避免了信號中其他段信號的噪聲影響,并且加入了最短信號長度對噪聲尖峰進行過濾,從而使得信號中的噪聲不會對方法的適用性產(chǎn)生影響.例如在EasiEMG數(shù)據(jù)集中,肌電信號數(shù)據(jù)中含有因無序運動造成的噪聲.針對此類信號,在本文3.2節(jié)的結(jié)果中可以看到本方法的信號活動區(qū)間識別精度最優(yōu).針對UCI公開數(shù)據(jù)集中的噪聲,在本文3.2節(jié)中可以看到本方法的信號活動區(qū)間識別精度最優(yōu). EasiLTOM方法適用于數(shù)據(jù)量稀少的物聯(lián)網(wǎng)數(shù)據(jù)集中,對于小數(shù)量場景,EasiLTOM方法因為識別閾值的適用性在數(shù)據(jù)量稀少的場景中相較于在數(shù)據(jù)量大的場景中更好,所以提升了信號活動區(qū)間的識別精度,而機器學習方法因為在小數(shù)據(jù)量場景中模型欠擬合導致識別精度下降.比如在3.2節(jié)中,數(shù)據(jù)量為12條和18條時,EasiLTOM方法的平均識別精度分別比機器學習方法高17.78%和13.17%. 本文針對含有大量噪聲的一維時序信號難以確定活動區(qū)間的開始和結(jié)束時間點的問題,提出了一種基于局部動態(tài)閾值的信號活動區(qū)間識別方法EasiLTOM.相對于單閾值和雙閾值的信號活動區(qū)間識別方法,EasiLTOM有效地避免了信號中的隨機噪聲對于信號屬性不同的區(qū)間識別所帶來的影響,解決了信號活動區(qū)間的漏檢和誤檢問題,從而提高了信號活動區(qū)間的識別精度.相對于機器學習方法,EasiLTOM方法具有識別精確度高、所需數(shù)據(jù)量少等優(yōu)點,使其更加適用于數(shù)據(jù)量稀少的物聯(lián)網(wǎng)場景.通過對比實驗證明,EasiLTOM方法達到了平均93.17%的識別精度,EasiLTOM方法的識別精度比雙閾值法的識別精度高15.03%,比基于機器學習的信號活動區(qū)間識別方法的識別精度高4.70%,達到了目前最佳的運動區(qū)間識別精度.EasiLTOM方法適用于含有大量噪聲的一維時序信號活動區(qū)間識別場景. 作者貢獻聲明:周鈞鍇負責論文的寫作及實驗;王念負責論文的修改及實驗;崔莉負責整體指導及論文的修改.2.2 EasiLTOM流程及描述
3 實驗分析
3.1 實驗設計
3.2 實驗結(jié)果
4 討 論
5 結(jié) 論