孫恩澤 李宇昊
【摘 要】 隨著可穿戴智能設(shè)備走進(jìn)千家萬戶,利用可穿戴智能設(shè)備進(jìn)行人類識(shí)別在大數(shù)據(jù)和云計(jì)算領(lǐng)域有著廣泛應(yīng)用前景。本文提出了一種基于長(zhǎng)短時(shí)記憶(LSTM)型的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)識(shí)別方法,在標(biāo)準(zhǔn)數(shù)據(jù)集PAMAP2上構(gòu)建模型進(jìn)行實(shí)驗(yàn)評(píng)估,取得了良好的準(zhǔn)確率。
【關(guān)鍵詞】 深度學(xué)習(xí) 可穿戴智能設(shè)備 長(zhǎng)短時(shí)記憶(LSTM)
1 研究背景
由于可穿戴智能設(shè)備具有價(jià)格便宜、攜帶方便、不受場(chǎng)地限制等優(yōu)點(diǎn),在人們?nèi)粘I詈徒∩磉\(yùn)動(dòng)中應(yīng)用的越來越廣泛。并且可穿戴智能設(shè)備含有加速度計(jì)、陀螺儀、重力感應(yīng)儀器等傳感器,可以與傳統(tǒng)基于視覺的運(yùn)動(dòng)識(shí)別方法在實(shí)際應(yīng)用中互為補(bǔ)充,基于傳感器的人體運(yùn)動(dòng)識(shí)別已經(jīng)被廣泛應(yīng)用于體育競(jìng)技,人體體力研究測(cè)量,智能家居系統(tǒng),老人和兒童監(jiān)護(hù)領(lǐng)域等。
2 LSTM型循環(huán)神經(jīng)網(wǎng)絡(luò)
長(zhǎng)短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò),通常也被LSTM,是一種由 Sepp Hochreiter 和Jürgen Schmidhuber在提出的一種特殊循環(huán)神經(jīng)網(wǎng)絡(luò)[1]。 LSTM擁有三個(gè)“門”結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)?!斑z忘門”的可以讓循環(huán)神經(jīng)網(wǎng)絡(luò)根據(jù)當(dāng)前的輸入、上一時(shí)刻狀態(tài)個(gè)上一時(shí)刻輸出共同決定哪一部分記憶需要遺忘?!拜斎腴T”會(huì)根據(jù)、和決定那些部分進(jìn)入當(dāng)前時(shí)刻的狀態(tài)?!拜敵鲩T”來控制最后信息的輸出。
3 實(shí)驗(yàn)驗(yàn)證
3.1 數(shù)據(jù)收集
本文引用是一個(gè)由加州大學(xué)歐文分校提出的有關(guān)身體運(yùn)動(dòng)的公開數(shù)據(jù)集——PAMAP2。其對(duì)被要求進(jìn)行12項(xiàng)日常生活的9個(gè)參與者進(jìn)行了數(shù)據(jù)記錄,包括家庭活動(dòng)和各種各樣的活動(dòng)(散步,跑步,踢足球等)。最終的數(shù)據(jù)是52維度的[2]。
3.2 數(shù)據(jù)預(yù)處理
因?yàn)樵紨?shù)據(jù)會(huì)包含噪音,無效數(shù)據(jù)和失蹤樣本,所以對(duì)數(shù)據(jù)預(yù)處理是不可或缺的。在真正進(jìn)行訓(xùn)練之前,對(duì)PAMAP2數(shù)據(jù)集進(jìn)行了如下處理:移除時(shí)間戳、移除方向信息、移除過渡狀態(tài)、估計(jì)缺失值、數(shù)據(jù)分割、數(shù)據(jù)歸一化等。
3.3 構(gòu)建LSTM型循環(huán)神經(jīng)網(wǎng)絡(luò)
我們使用谷歌推出的TensorFlow開源深度學(xué)習(xí)平臺(tái)來構(gòu)建所需的LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)模型。構(gòu)建的LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)模型分為輸入層、LSTM層、dropout層、輸出層。TensorFlow 搭建模型中的主要訓(xùn)練參數(shù)包括輸入層到隱藏層的權(quán)重和偏斜、LSTM單元 中 3 個(gè)門的權(quán)重和偏斜、以及邏輯回歸層的權(quán)重和偏斜。
3.4 度量標(biāo)準(zhǔn)
由于各個(gè)運(yùn)動(dòng)的樣本數(shù)較為均衡,可以采用準(zhǔn)確率(accuracy)來評(píng)估模型最終的識(shí)別效果:
其中,者被正確識(shí)別的樣本數(shù),指樣本總量。
3.5結(jié)果分析
在訓(xùn)練LSTM環(huán)神經(jīng)網(wǎng)絡(luò)前要先把數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)。前者用于訓(xùn)練 LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)以確定權(quán)值和閾值,后者用于驗(yàn)證其經(jīng)過訓(xùn)練后的分類效果,兩者比例為8:2。
通過使用GPU訓(xùn)練100次模型后得到的訓(xùn)練集和驗(yàn)證集的輸出如表 1所示。
從表2中我們看出,模型在8個(gè)不同的實(shí)驗(yàn)對(duì)象的訓(xùn)練集和驗(yàn)證集上表現(xiàn)良好,準(zhǔn)確率普遍在90%以上。通過實(shí)驗(yàn)充分證明基于LSTM型循環(huán)神經(jīng)網(wǎng)絡(luò)的識(shí)別模型對(duì)運(yùn)動(dòng)時(shí)間序列數(shù)據(jù)具有良好的分類預(yù)測(cè)能力。
4 結(jié)語
本文提出了一種基于LSTM型循環(huán)神經(jīng)網(wǎng)絡(luò)的人體運(yùn)動(dòng)識(shí)別方法,相對(duì)于傳統(tǒng)的算法,能夠自動(dòng)提取特征進(jìn)行學(xué)習(xí),并且在標(biāo)準(zhǔn)公開數(shù)據(jù)集上進(jìn)行了驗(yàn)證,取得了良好的識(shí)別準(zhǔn)確度。雖然深度學(xué)習(xí)目前普遍存在黑箱問題,缺乏可解釋性,無法在出現(xiàn)錯(cuò)誤之后根據(jù)輸入追蹤出錯(cuò)的原因,但鑒于人體運(yùn)動(dòng)識(shí)別屬于低風(fēng)險(xiǎn)任務(wù),即使發(fā)生錯(cuò)誤,也不會(huì)向無人汽車、醫(yī)療手術(shù)一樣造成無法挽回的后果,以此來看將該算法應(yīng)用在人體運(yùn)動(dòng)識(shí)別領(lǐng)域還是具有實(shí)際意義的。
【參考文獻(xiàn)】
[1] Hochreiter S, Schmidhuber J. Long Short-Term Memory[J]. Neural computation, 1997, 9(8):1735-1780.
[2] Reiss A, Stricker D. Introducing a New Benchmarked Dataset for Activity Monitoring[C]// International Symposium on Wearable Computers. IEEE Computer Society, 2012:108-109.