摘 要:近年人們的健康意識不斷提高,全民健身熱潮也隨之來臨,然而大量因運動姿勢和運動習慣不當引起的損傷令人擔憂。臨床研究表明,不合理的健身動作會造成關節(jié)磨損、肌肉拉傷,甚至跟腱永久性損傷。因此開發(fā)一款能夠幫助人們進行運動姿態(tài)輔助識別的設備具有深遠意義。該設備通過Retinaface技術識別使用者身份,并通過Alphapose姿態(tài)識別技術和DTW技術,利用“設備+手機+服務器”的架構模式,將跑者的運動姿態(tài)與數(shù)據(jù)庫中標準姿態(tài)進行對比,實時監(jiān)測運動狀態(tài)并給予對應的語音提示和建議。
關鍵詞:Alphapose姿態(tài)識別;DTW算法;跑步運動;機器人設備;人像識別技術;運動健康
中圖分類號:TP39 文獻標識碼:A 文章編號:2095-1302(2024)03-000-04
0 引 言
根據(jù)人民數(shù)據(jù)研究院發(fā)布的《2022全民跑步運動健康報告》顯示,經(jīng)常參加體育鍛煉的人已達4.4億人,經(jīng)常參加體育鍛煉人數(shù)比例為31.2%。然而跑步作為最受人們歡迎的運動,卻暗藏危機,據(jù)調查曾有23.2%的人因為不恰當?shù)呐懿阶藙荻l(fā)傷病[1]。
人體姿態(tài)識別技術作為當前計算機視覺技術方面的重點領域,被廣泛應用于虛擬現(xiàn)實、視頻健康和醫(yī)療康復中。許志豪等[2]通過Openpose進行滑雪動作分析;劉蘭淇等[3]通過深度卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN)提取區(qū)域候選集,經(jīng)過池化層獲得單目視覺的感興趣目標集;Qiao等[4]提出一種基于單目圖像的人體姿態(tài)分級系統(tǒng),通過計算標準與實時姿勢間的離散弗雷歇距離來進行動作相似度的比較。近年來隨著網(wǎng)絡通信和設備算力的提升,在移動設備和小型機器人上部署新式的人工智能圖像識別算法成為可能。我們擬通過將新的Alphapose技術應用于個人運動健身指導領域,能夠及時地捕捉人體運動姿勢,并基于Kinect的人體關節(jié)點識別技術將其和標準姿勢對比,實現(xiàn)如跑步和各類形體運動等方面的識別,同時結合我們的軟件給予相應的語音激勵與提示。
1 產(chǎn)品描述
1.1 設計思路
本產(chǎn)品采用運動機器人的承載方式,在健身房中可以通過設置來選擇自動運動方式和手動運動方式。自動運動:本產(chǎn)品可以通過掃描最近的運動人群,自動運動到合適的位置,將其與標準動作進行比對并糾正。在家庭中,本產(chǎn)品將攝像頭置于一個運動型機器人之上,使機器人可以運用人體檢測技術和人體跟蹤技術,自動識別和掃描主人位置并跟隨。同時,也可以將其帶出戶外,在戶外運動時進行指導。
在運動過程中,如圖1所示,設備通過深度攝像機和Kinect 傳感裝置識別人體關節(jié)并計算關節(jié)角度和位置信息[5],同時將雷達掃描得出的距離和方位數(shù)據(jù)進行數(shù)據(jù)處理和計算,得出步長、步數(shù)等關鍵運動信息。將關節(jié)角度和位置信息等與標準姿勢進行比對分析,通過語音提醒使用者進行動作修正。
本產(chǎn)品命名為“YG”,取自YOUNG的首尾字母,寓意通過健身運動永遠保持年輕的身體和心理狀態(tài),中文名“漁歌”,取自“授人以魚不如授人以漁”,希望運動者能夠通過我們的幫助掌握正確的跑步方式,奏響生命贊歌。
1.2 產(chǎn)品介紹
機器人產(chǎn)品對人體動作相似度的評估流程如圖2所示,基于Alphapose識別技術[6]和DTW算法對跑者進行運動評估,并通過Retinaface技術進行額外監(jiān)督與自監(jiān)督結合的多任務學習,對跑步者的人臉進行精準定位[7],以實現(xiàn)對跑者的自動跟隨技術。該產(chǎn)品不僅可通過遙控器遙控,也可以通過語音與其進行交流進而控制其運動;同時還添加了諸多語音包,可與主人進行不同類型的語音交流??梢愿鶕?jù)回復信息設置自己的狀態(tài),即用戶可以通過語音控制機器人。
除此之外,本產(chǎn)品可以與運動手環(huán)連接,可以實時監(jiān)測記錄主人心率、運動狀態(tài),在心率不正常、運動不健康時將及時提醒主人,會將運動全程的信息記錄并存儲起來;在運動結束時可以對其進行評估并給予最專業(yè)的指導,可以說是家庭版的健身教練。
1.3 產(chǎn)品設計
本產(chǎn)品以ROS開源機器人為主體,如圖3所示,加裝改造后的型體為類似汽車中存在一個駕駛小人,較好地隱藏了機器人的內部零件。通過調用Kinect深度傳感裝置獲取運動者的深度數(shù)據(jù),識別與使用者的距離關系;通過Retinaface技術鎖定使用者位置后,利用麥克奈姆萬向輪進行調節(jié),實現(xiàn)360°自動跟隨。如圖3、圖4所示,我們的團隊已經(jīng)完成Ubuntu系統(tǒng)內ROS3.0的調試,通過連接手機進行局域網(wǎng)輔助,并與中繼服務器連接,完成了APP與機器人設備之間的聯(lián)通。
與本產(chǎn)品配套的APP如圖5所示,有成熟的應用界面與功能,可以查看之前的運動記錄,并提醒進行何種運動是最有益于身心健康的,可以通過設置鬧鐘來提醒主人進行運動,同時具有查找設備的功能。當無法找到該產(chǎn)品時,可以通過APP上一鍵返回,該產(chǎn)品將自動回到主人所在的位置,完全不用擔心丟失問題。
2 產(chǎn)品分析
2.1 產(chǎn)品創(chuàng)新點分析
當前的人像識別技術主要應用于安防、考勤等領域[8],往往限制在一臺固定的機器設備中,難以主動識別人員并跟隨移動。同時在運動健身領域缺乏智能的機器人設備,往往只有固定的健身器材,很難滿足使用者便攜、多功能的需求。我們的產(chǎn)品能夠通過Retinaface技術識別用戶,自主跟隨使用者,通過Alphapose和DTW算法對其進行姿態(tài)識別,同時將識別結果傳輸至服務器;經(jīng)過大量深度學習后,結合醫(yī)療專家的建議,給出專業(yè)的動作糾正意見和個性化的運動方案。
2.2 產(chǎn)品技術分析
過去常規(guī)多人姿態(tài)識別是首先檢測出環(huán)境中的所有肢體節(jié)點,然后進行拼接得到多人的骨架(自底向上的方法),當兩人離得十分近時,容易出現(xiàn)模棱兩可的情況,而且由于是依賴兩個部件之間的關系,也失去了對全局的信息獲取。Alphapose作為一種新方案,采用自頂向下的方法,提出了RMPE(區(qū)域多人姿態(tài)檢測)框架,使用了自創(chuàng)的姿態(tài)距離度量方案比較姿態(tài)之間的相似度。用數(shù)據(jù)驅動的方法優(yōu)化姿態(tài)距離參數(shù)。通過PGPG強化訓練數(shù)據(jù),學習輸出結果中不同姿態(tài)的描述信息,進而模仿人體區(qū)域框的生成過程,進一步產(chǎn)生一個更大的訓練集。
DTW時間序列數(shù)據(jù)處理方法被廣泛應用于語音識別領域。與HMM算法相比,由于其不需要額外計算已獲得模型參數(shù)的優(yōu)點,在孤立詞識別領域仍占據(jù)著重要地位。我們將該時間序列數(shù)據(jù)處理方法引入到對視頻中人體關節(jié)點數(shù)據(jù)處理之中,能夠較好地提高運算效率,以實現(xiàn)實時運算處理。
3 軟件架構
3.1 軟件功能模塊
在當今社會,隨著5G技術的廣泛運用,在智能手機上運行高速數(shù)據(jù)傳輸成為了可能。在此基礎上我們提出了以已有的便攜電子設備為載體,通過數(shù)據(jù)傳輸至云服務進行實時運算的軟件服務。在應用程序上采用了新式上下式設計,在YG主頁可以點擊各按鈕迅速開始運動記錄并給出相應的語音糾正和激勵。
“YG主頁”模塊下,主要有四大分模塊,分別為運動模塊、推薦模塊、活動模塊和設備模塊,主要包含了軟件對運動者的運動健康建議,對各賽程跑步以及配套的運動設備進行管理。APP界面如圖6所示。
“社區(qū)模塊”下,主打設備交友和運動團功能,既可以通過線上的虛擬運動設備寵物化交友,也可以通過組織活動與線下跑團進行交流。
“我的”模塊下,可以查看今日運動時長、飲水、睡眠等健康數(shù)據(jù),并提供個性化分析,給出健康簡報,指導運動設備使用者改進生活方式。
3.2 基于Alphapose的人體運動關節(jié)點獲取
人體檢測技術能夠對人體姿勢進行識別,將圖像或者視頻中的人提取出來進行分析處理。主要的方法有以下兩種:時域差分法、光流法,其中時域差分法主要分為背景差分法(背景減法)和連續(xù)幀間幀差法(相鄰幀差法)。
運用Alphapose對設備采集的圖像進行關節(jié)點的實時提取,在MSCOCO數(shù)據(jù)集里將15個關鍵人體節(jié)點進行標記,通過建立的坐標系了解各個節(jié)點位置。已有的Alphapose在姿態(tài)估計(Pose Estimation)標準測試集 MSCOCO上mAP達到 72.3%,是首個mAP超過70%的開源系統(tǒng),比Mask-RCNN提高8.2%,比OpenPose(CMU)提高17%[9-10]。模型的骨架網(wǎng)絡使用ResNet101,在下采樣部分添加SE模塊作為attention模塊。除此之外,使用PixelShuffle進行3次上采樣,輸出關鍵點的熱度圖,在提高分辨率的同時,保持特征信息不丟失。如圖7所示,對人體骨骼關鍵件進行了識別,并按照量綱歸一化方法,將單幀圖像的動作進行對比。我們采用余弦相似度做對比,首先輸入標準動作作為基準向量,再輸入測試跑步動作作為對比向量,最終結果中余弦相似度越大代表動作越相似。其余弦相似度的轉化方法如式(1)和式(2)所示:
(1)
(2)
3.3 基于DTW算法的跑步動作相似度評估
運用Alphapose識別技術獲取各個關節(jié)點坐標,進行范數(shù)歸一化后,可將各個關節(jié)點坐標輸入DTW算法進行動作序列的歐氏距離輸出與整體相似度評估,本文選取了跑步過程中主要運動關節(jié)點進行分析比較。
動態(tài)時間規(guī)整(Dynamic Time Warping, DTW)算法是按照距離最近原則,構建兩個長度不同的序列元素的對應關系,評估兩個序列的相似性。在構建兩個序列元素對應關系時,需要對序列進行延伸或壓縮[11]。我們選取一組跑步標準動作為對照組,并通過操場實錄的方式取得另一組自測動作為實驗組,如圖8所示。
臨床研究認為,超過60%的跑步損傷可歸因于訓練錯誤[12]。當跑步姿勢不正確時會引起多種危害,如肌肉拉傷、頸椎損傷、關節(jié)損傷等。不正確的跑步姿勢不但達不到健身效果,還會損傷身體。比如,有些人跑步時采用全腳掌著地的步伐,缺乏緩沖和過渡。長期可刺激小腿肌肉,造成運動損傷,還有可能震傷頸椎。有些人跑步時步伐過大,導致重心起伏較大,落地時對人體產(chǎn)生較大的沖擊力,可能損傷跟腱、髂腰肌等。
因此我們選擇對左手、右手、左腿、右腿在移動中的X軸數(shù)據(jù)進行運動軌跡分析,可以分析出本算法的有效性,且從本次實驗里X軸的特征點變化能夠看出跑步動作的擺動幅度較大。運動過程的關節(jié)點DTW距離見表1所列。
由以上結果可知,在運動過程中,標準序列與基準序列的DTW距離較為相似,驗證了本文算法的有效性。
4 結 語
目前健身領域的智能設備中缺少能夠360°自主跟隨,并對運動者進行動作識別的產(chǎn)品,僅有的固定設備難以滿足使用者便攜舒適的要求。為此設計了“漁歌”智能動作識別機器人來解決以上問題。該設備利用Alphapose識別技術對使用者進行實時動態(tài)監(jiān)測,通過藍牙與應用程序軟件進行連接,將處理后的數(shù)據(jù)與數(shù)據(jù)庫標準動作數(shù)據(jù)進行比對,及時給出用戶運動姿態(tài)糾正的建議,減少用戶受傷情況的發(fā)生。后續(xù)可以進一步拓展設備的識別范圍,將其應用于瑜伽、羽毛球、養(yǎng)生功法等領域的動作識別,并給出相應的動作調整建議。
參考文獻
[1]周葉子,王梅. 不同跑步訓練方式對大學生運動功能的影響[C]//第十一屆全國體育科學大會論文摘要匯編.[出版地不詳]:[出版者不詳],2019:2.
[2]許志豪,高銘,殷紹軒,等. 基于OpenPose的滑雪動作分析[J]. 智能計算機與應用,2022,12(4): 101-103.
[3]劉蘭淇,劉鐘濤. 基于單目視覺與深度神經(jīng)網(wǎng)絡的行為識別研究[J]. 無線電工程,2022,52(11):2072-2080.
[4] QIAO S,WANG Y L,LI J. Real-time human gesture grading based on OpenPose [C]// 2017 10th International Congress on Image and Signal Processing,BioMedical Engineering and Informatics.Shanghai,China:IEEE,2017.
[5]查晶晶. 基于Kinect視頻的圖像增晰與檢測算法研究[J].太原學院學報(自然科學版),2022,40(3):65-70.
[6]劉立名,馬傳香.基于AlphaPose的行人重識別姿態(tài)評價方法[J].湖北大學學報(自然科學版),2023,45(5):702-711.
[7]王鵬,尹勇,宋策. 基于改進RetinaFace和YOLOv4的船舶駕駛員吸煙和打電話行為檢測[J].上海海事大學學報,2022,43(4): 44-50.
[8]陳志宏,王明曉.計算機視覺在智慧安防中的應用[J].電信科學,2021,37(8):142-147.
[9] FANG H S,XIE S Q,TAI Y W,et al. RMPE:regional multi-person pose estimation [C]// 2017 IEEE International Conference on Computer Vision. Venice,Italy:IEEE,2017.
[10]馬子越,彭瑞陽,孫曉晗,等. 基于OpenPose的人體姿態(tài)估計技術研究綜述[J]. 軟件導刊,2022,21(11):247-252.
[11]呂佳朋,史賢俊,肖支才.基于DTW時序距離的故障可診斷性評估方法[J/OL].兵工學報:1-14[2024-01-18]. http://kns.cnki.net/kcms/detail/11.2176.tj.20221213.1200.004.html.
[12]楊一卓,矯瑋,袁紹婷. 業(yè)余馬拉松跑者跑步損傷調查及影響因素分析[J]. 山東體育學院學報,2020,36(3):91-97.
作者簡介:王 甬(2001—),男,四川宜賓人,本科在讀,主要研究領域為人體動作識別。
魏少文(2000—),男,福建寧化人,本科在讀,主要研究領域為軟件工程。
伍程成(2001—),男,四川成都人,本科在讀,主要研究領域為物聯(lián)網(wǎng)工程。
李 騰(1986—),女,黑龍江哈爾濱人,博士,副教授,主要研究領域為大數(shù)據(jù)分析。