孫乾 夏澤昊
摘要:情緒帶有生動性,也帶有感知。目前從研究的現(xiàn)狀看,情緒識別已經(jīng)被應(yīng)用到很多智能設(shè)備上。智能設(shè)備帶有情緒識別,使設(shè)備更加靈活化,且設(shè)備的人性化更符合人們的需求。智能控制筆屬于智能化的一種設(shè)備,在生活中應(yīng)用很多,在智能控制筆中假如情緒識別的功能,對智能控制筆人性化提升有一定的意義。本文主要分析情緒識別在智能控制筆上的運用,希望在指導(dǎo)智能控制方面的發(fā)展有一定的作用。
關(guān)鍵詞:智能化;情緒識別;識別方法
中圖分類號:TP391.41文獻標(biāo)識碼:A文章編號:1672-9129(2020)14-0063-01
1情緒識別在智能控制筆上的應(yīng)用原理
在智能控制筆中,有基礎(chǔ)按鍵,在基礎(chǔ)按鍵的功能上搭載了6軸加速度傳感器,通過姿態(tài)識別算法,可以構(gòu)建出運動軌跡,并擬合出運動手勢,是一種識別情緒的方式。同時在優(yōu)化設(shè)備功能方面也有指導(dǎo)性作用,相比于當(dāng)前市面上已出現(xiàn)的固定按鍵功能上,本作品還加入了遠(yuǎn)程移動光標(biāo)功能,當(dāng)教師需要切換頁面,或者打開其他程序時,可以將教鞭光標(biāo)操作功能開啟,并移動光標(biāo)指向,此時教鞭即可實現(xiàn)藍牙鼠標(biāo)的功能。在識別原理方面,該模塊是基于 MEMS 動作傳感器開發(fā)模型,其提供在三軸向加速度與角加速度的測量,通過 IIC 通信協(xié)議與主控芯片STM32連接,并實時計算移動距離實現(xiàn)控制光標(biāo)的移動。
2對相關(guān)情緒識別的判斷功能
在識別過程中,對情緒的判斷是主要的識別功能。一般情況下,都需要加入情緒檢測模塊,實時判斷教師情緒。除了上述加速度傳感器外,還搭載了聲音傳感器檢測來實時獲取聲音數(shù)據(jù),通過IIC連接主控芯片STM32,由語音識別算法將模擬信號轉(zhuǎn)換為文字,并通過自然語言處理(NPL)算法根據(jù)已知文字分類結(jié)合聲音大小與教鞭狀態(tài)來判斷教師此時情緒,解決實時監(jiān)測教師情緒問題。此外,為了提高算法識別的準(zhǔn)確度,我們擬采用二級觸發(fā)的方式,即識別出教師情緒不穩(wěn)定時,會觸發(fā)搭載在教鞭前端的攝像頭模塊,通過人臉識別算法和表情識別算法進行再次判斷并輸出結(jié)果。
3核心算法思路
運動軌跡計算:運動軌跡提取算法模塊負(fù)責(zé)處理由MEMS加速度傳感器采集的離散的數(shù)據(jù)。假設(shè)設(shè)定傳感器的采樣時間間隔為 Δt,迭代后可得:速度vn=vn-1+an+a[n-1]2×△t(n>1);位移sn=sn-1+vn-1×△t+14an+an-1×△t(n>1)。
計算步驟分為以下四個步驟:
(1)將MEMS輸出三軸角速度數(shù)據(jù)通過姿態(tài)矩陣算出重力加速度;
(2)將MEMS輸出三軸加速度數(shù)據(jù)濾除重力加速度分量后,計算出x,y,z三軸方向上的瞬時速度;
(3)根據(jù)速度求出MEMS傳感器在x,y,z三軸方向的位移;
(4)通過連線各個時刻的空間位置坐標(biāo)點就可得MEMS傳感器在三維空間的運動軌跡。
人臉識別:采用多任務(wù)級聯(lián)卷積網(wǎng)絡(luò)(MTCNN)人臉檢測算法來進行人臉識別操作。其由三個網(wǎng)絡(luò)構(gòu)成,由粗到細(xì)進行人臉檢測和人臉關(guān)鍵點定位。具體步驟如下:
(1)將圖片調(diào)整到不同比例,制作圖像金字塔,為輸入網(wǎng)絡(luò)準(zhǔn)備;
(2)將金字塔圖像輸入P-Net(Proposal Network),獲取含人臉的候選窗口(Proposal boundding boxes),并通過非極大值抑制(NMS)算法合并高度重合的候選框,去除冗余框;
(3)將P-Net輸出得到的人臉圖像輸入R-Net(Refinement Network),對人臉檢測框回歸校準(zhǔn),通過NMS算法去除冗余框,此時的到的人臉檢測框更加精準(zhǔn)且冗余框更少。
(4)將R-Net輸出得到的人臉圖像輸入O-Net(Output Network),一方面對人臉檢測框坐標(biāo)進行進一步的細(xì)化,另一方面輸出人臉5個關(guān)鍵點(左眼、右眼、鼻子、左嘴角、右嘴角)坐標(biāo)。
表情識別:我們采用神經(jīng)卷積網(wǎng)絡(luò)采用經(jīng)典的網(wǎng)絡(luò)來進行表情識別,該模型的構(gòu)建主要參考谷歌的Going Deeper設(shè)計如下網(wǎng)絡(luò)結(jié)構(gòu),輸入層后加入(1,1)卷積層增加非線性表示且模型層次較淺,參數(shù)較少(大量參數(shù)集中在全連接層)。
結(jié)語:情緒識別在智能控制筆中的應(yīng)用,是一種科技水平的提升。但是在實際應(yīng)用中,識別功能芯片。識別的過程設(shè)計是需要一個長期優(yōu)化的過程,每一個部分的識別都需要做好控制,才能達到識別功能的最佳性。智能控制筆中加入情緒識別功能,也是智能控制水平的提升。
參考文獻:
[1]梁路宏,艾海舟,徐光檔, 等.人臉檢測研究綜述[J].計算機學(xué)報,2002,25(5):449-458.
[2]周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計算機學(xué)報,2017,40(6):1229-1251.
[3]陳沙利,張柳依,江鋒, 等.基于多種生理信號的情緒識別研究[J].中國醫(yī)療器械雜志,2020,44(4):283-287.
[4]辛創(chuàng)業(yè),許芬.基于LSTM神經(jīng)網(wǎng)絡(luò)的語音情緒識別[J].工業(yè)控制計算機,2020,33(8):87-89.
[5]劉芾,李茂軍,胡建文, 等.基于低像素人臉圖像的表情識別[J].激光與光電子學(xué)進展,2020,57(10):89-96.