国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于不平衡數(shù)據(jù)分類的人體姿態(tài)分類算法*

2019-09-11 02:25:10王忠震王中森
傳感器與微系統(tǒng) 2019年9期
關鍵詞:分類器姿態(tài)人體

黃 勃, 王忠震, 陳 歡, 王中森

(1.上海工程技術(shù)大學 電子電氣工程學院,上海 201620; 2.邵陽學院 電氣工程學院,湖南 邵陽 422000)

0 引 言

針對人體日常行為活動的分類問題越來越受到國內(nèi)外專家學者的關注。文獻[1]提出一種基于加速度信息與腳底壓力的下肢運動信息采集系統(tǒng),通過采集腳底壓力信息監(jiān)測關鍵步態(tài)事件,對4種常見行為(走路、跑步、上樓和下樓)進行識別。文獻[2]提出一種非參數(shù)聚類的方法,通過加速度計對人體運動的特征數(shù)據(jù)進行采集。已有文獻的關于人體姿態(tài)識別方法,其更加注重的是姿態(tài)信息數(shù)據(jù)的獲取,而忽略了獲取數(shù)據(jù)自身類別分布的特性。在現(xiàn)實生活場景中,由于年齡、所處環(huán)境以及場所的不同,人體所展現(xiàn)的姿態(tài)分布并不是理想狀態(tài)下的均衡分布,呈現(xiàn)出不平衡的類別分布狀態(tài)。例如年青人的姿態(tài)分布,“運動”姿態(tài)的數(shù)量遠多于“靜止”的姿態(tài),老年人則是相反的狀態(tài)。

基于此,本文提出一種基于不平衡數(shù)據(jù)分類的人體姿態(tài)分類算法。該算法首先針對數(shù)據(jù)集中存在噪聲樣本影響分類效果的情況,提出K-means噪聲樣本濾除算法,對少數(shù)類樣本集中的噪聲樣本進行濾除。其次通過采樣算法SMOTE來生成少數(shù)類樣本,使數(shù)據(jù)達到平衡。最后使用以J48決策樹為基分類器的Adaboost學習框架,利用集成學習的思想提高整體樣本的分類精度。采用G-mean、F-value及AUC作為評價標準,通過將本文提出的算法與CUS-Boost、SMOTEBoost以及RUS-Boost算法相對比,在AReMr人體姿態(tài)數(shù)據(jù)集上的實驗結(jié)果表明,該算法的預測性能優(yōu)于其他三種算法。

1 預備理論

1.1 不平衡數(shù)據(jù)分類

在已有的多數(shù)分類算法中,模型的訓練往往是基于數(shù)據(jù)集中各類樣本分布,處于一個較為平衡的狀態(tài)下進行訓練的,但在現(xiàn)實世界中,樣本的分布確是不平衡的。在不平衡數(shù)據(jù)集中,通常把樣本數(shù)量較多的類稱為多數(shù)類,樣本數(shù)量較少的類稱為少數(shù)類[3]。而在一些領域少數(shù)類樣本所包含的信息更加重要,例如信用卡欺詐、故障檢測、醫(yī)療診斷以及網(wǎng)絡入侵等領域。

1.2 K-means算法

K-means算法[4]核心思想是中心探索法[5],從數(shù)據(jù)集中選取K個簇心zt1,zt2,……,ztK,使得每一個樣本點xi到其最近簇心ztj的距離之和達到相對最小。通過選取樣本之間的歐氏距離作為樣本相似性的判斷準則,計算各類簇中樣本到簇心ztj的距離平方和

(1)

式中j=1,2,…,K;i=1,2,…,|Cj|,|Cj|為第j個類簇包含的樣本數(shù);xi∈Cj表示第j個類簇中的第i個樣本;聚類的過程便是使式(2)中J(C)被最小化的過程

(2)

2 基于K-means不平衡數(shù)據(jù)分類算法

本文提出的基于K-means不平衡數(shù)據(jù)分類模型共分為兩階段:噪聲樣本濾除階段、數(shù)據(jù)平衡以及模型訓練分類階段。分類模型如圖1所示。

圖1 基于K-means不平衡數(shù)據(jù)分類模型

2.1 K-means噪聲樣本濾除算法

在現(xiàn)實場景條件下,在進行人體姿態(tài)數(shù)據(jù)監(jiān)測過程中,由于人體動作幅度、動作頻率等其他客觀情形的影響,極易使傳感器產(chǎn)生噪聲樣本數(shù)據(jù),進而影響分類性能。尤其在少數(shù)類樣本數(shù)目較小且樣本抗干擾能力較弱的情況下,噪聲數(shù)據(jù)所產(chǎn)生的影響越大。所以,本文在對少數(shù)類樣本采樣之前,提出K-means噪聲樣本濾除算法。

K-means噪聲樣本濾除算法根據(jù)樣本集中樣本的分布特性:同類樣本之間分布較為緊密,異類樣本之間分布相對稀疏。對樣本集中所包含的噪聲樣本予以識別、濾除。本文關于噪聲樣本的定義如下:若某一樣本距離其簇心的距離大于該類簇最遠樣本到簇心距離的98 %,則該樣本定義為噪聲樣本。

算法1K-means噪聲樣本濾除算法

Input:少數(shù)類樣本集Sm

Output:去噪后少數(shù)類樣本樣本集S'm

1)定義K-means算法,類簇數(shù)為K

2)使用K-means算法將少數(shù)類樣本集Sm劃分為K個類簇

3)根據(jù)式(1)計算各類簇中樣本到其類簇簇心的距離

4)Forj=1,2,…,K:

a.以類簇中距離簇心最遠樣本距離的98 %為半徑Rj,簇心為圓心,定義類簇邊界

b.根據(jù)類簇邊界,若一樣本在其類簇邊界之內(nèi)則定義為安全樣本,反之定義為噪聲樣本

5)End For∥結(jié)束循環(huán)

6)根據(jù)第(4)步,將Sm所有定義為噪聲的樣本刪除,安全樣本保存到S'm

7)ReturnS'm

2.2 基于K-means不平衡數(shù)據(jù)集成分類算法

針對數(shù)據(jù)集中存在噪聲樣本干擾的情形,本文提出算法1基于K-means噪聲樣本濾除算法。數(shù)據(jù)集中的少數(shù)類樣本集經(jīng)過算法1處理后,會得到一個相對“干凈”的數(shù)據(jù)集。其次為了獲得類別數(shù)目相對平衡的數(shù)據(jù)集,本文采用經(jīng)典的采樣算法SMOTE,對去噪后數(shù)據(jù)集進行采樣操作。最后對于采樣后的數(shù)據(jù)集,本文選用以J48決策樹為基分類器的Adaboost模型[6,7],進行分類模型的訓練。詳細算法訓練過程如算法2所示。

算法2基于K-means不平衡數(shù)據(jù)集成分類算法

1)通過算法1對少數(shù)類樣本集中噪聲樣本識別、濾除

2)使用SMOTE算法對去噪后的樣本集進行新樣本的合成,平衡樣本集

3)初始化樣本分布權(quán)重D1(i)=1/n,i=1,2,3,…,n,(n表示平衡樣本集中樣本數(shù)據(jù)目)

4)Fort=1toT:(T表示迭代次數(shù))

根據(jù)樣本分布Dt訓練弱分類器ft:X→Y

5)End For

7)ReturnH(X)

3 實驗結(jié)果與分析

3.1 數(shù)據(jù)集選取

實驗數(shù)據(jù)選自UCI公開數(shù)據(jù)庫中的AReM人體姿態(tài)數(shù)據(jù)集[8]。該數(shù)據(jù)集中的所有數(shù)據(jù)是通過對人體3個部分(胸部—右腳踝,胸部—左腳踝,右腳踝—左腳踝)佩戴無線傳感器收集得到。數(shù)據(jù)信息分類:bending、cycling、lying down、sitting、standing、walking,共42 240條且每條有6個屬性。

3.2 數(shù)據(jù)預處理

文獻[9]提出意外摔倒是老年人尤其是獨居老人面臨的一個威脅生命的嚴重風險,住院率乃至死亡率都很高。有報告曾統(tǒng)計,有10 %~15 %的摔倒甚至會直接威脅老年人的生命。由此本文針對所選數(shù)據(jù)集選取lying down動作為少數(shù)類標記為1占比15.4 %,其他動作為多數(shù)類標記為0占比84.6 %。預處理數(shù)據(jù)信息如表1所示。

表1 預處理后數(shù)據(jù)集

3.3 性能評價指標

針對不平衡數(shù)據(jù)分類問題,分類模型性能的優(yōu)劣采用以往分類準確率的方式來評價,已經(jīng)不在適用。因此,本文采用被國內(nèi)外廣泛使用的不平衡分類器評價指標:G-mean、F-value及AUC,對提出的不平衡數(shù)據(jù)分類模型進行評定,依據(jù)表2所示的混淆矩陣得到。

表2 混淆矩陣

AUC即ROC(receiver operating characteristic)曲線下的面積。ROC曲線反映敏感性和特異性連續(xù)變量的綜合指標,曲線下面積越大,模型的準確性越高。

3.4 算法對與結(jié)果分析

為驗證本文所提出方法的優(yōu)越性,將本文算法與已有的三種經(jīng)典不平衡分類模型,在上述數(shù)據(jù)集上在G-mean、F-value及AUC進行對比。三種對比模型:CUS-Boost[10]、SMOTEBoost[11]以及RUS-Boost[12]算法。實驗數(shù)據(jù)取自通過10折交叉驗證后的平均值。

表3列出了4種不同算法在G-mean、F-value及AUC的實驗結(jié)果。實驗結(jié)果顯示,本文所提出的不平衡分類算法,相對于其他三種算法,分類效果最優(yōu)。在AUC衡量指標上,本文算法在AReMr數(shù)據(jù)集上取值達到了94.6 %,相對于其他算法,最高提高了21.1 %。在G-mean上最低提高了10.1 %,以及F-value上最高提高了16.6 %。

表3 四種不同分類模型的分類結(jié)果對比

4 結(jié)束語

在AReMr數(shù)據(jù)集上與經(jīng)典的三種不平衡分類模型實驗對比表明:本文方法相對于其他算法識別率更高,更能準確判斷出人體姿態(tài),分類性能更優(yōu)。然而本文所提出的算法是基于二分類情況下提出的,但是在較多應用領域中,樣本類別的分類還是以多類別為主。因此,下一步的研究工作將會是對本文算法進行改進,使其可以應用在多類別樣本預測中。

猜你喜歡
分類器姿態(tài)人體
人體“修補匠”
人體冷知識(一)
排便順暢,人體無毒一身輕
攀爬的姿態(tài)
學生天地(2020年3期)2020-08-25 09:04:16
全新一代宋的新姿態(tài)
汽車觀察(2018年9期)2018-10-23 05:46:40
跑與走的姿態(tài)
中國自行車(2018年8期)2018-09-26 06:53:44
奇妙的人體止咳點
特別健康(2018年3期)2018-07-04 00:40:10
BP-GA光照分類器在車道線識別中的應用
電子測試(2018年1期)2018-04-18 11:52:35
加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
安新县| 新河县| 南陵县| 新晃| 新密市| 灌阳县| 萍乡市| 丘北县| 常州市| 龙陵县| 阿拉善左旗| 军事| 东海县| 苏尼特右旗| 澄迈县| 慈利县| 安仁县| 阳信县| 若尔盖县| 常德市| 铜陵市| 闻喜县| 彩票| 株洲县| 正定县| 拉孜县| 武穴市| 根河市| 安龙县| 荔浦县| 宜兰市| 屏南县| 景洪市| 印江| 洪泽县| 团风县| 上林县| 应城市| 如东县| 墨竹工卡县| 宝鸡市|