熊笑顏 陳栩 劉云花 陳艷
關(guān)鍵詞: 抑郁癥; 癥狀檢測; 行為感知; 貝克抑郁量表; 建模方法; 情緒監(jiān)測
中圖分類號: TN919?34; TP391.9 ? ? ? ? ? ? ? 文獻標識碼: A ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2018)24?0121?04
Research on psychological depression symptom detection based on behavior data
XIONG Xiaoyan, CHEN Xu, LIU Yunhua, CHEN Yan
(School of Science and Technology, Nanchang University, Nanchang 330029, China)
Abstract: The symptom changes of the depression are explored in this paper by analyzing the data collected by the user′s smartphone, so as to analyze the changes in depression symptom and patient behavior, and then track and treat the disease. Two modeling methods are adopted to analyze the characteristics of patients′ physical activity, sleep, and emotional state, so as to better predict depression symptom changes. By comparing features selected by the two modeling methods, it is found that there exist some common key features. The growth of the Beck′s depression inventory (BDI) is predicted to obtain the model based on the measured data, and the accuracy of the model is verified.
Keywords: depression; symptom detection; behavior perception; BDI; modeling method; emotional monitoring
本文采用貝克抑郁量表(Becks Depression Inventory,BDI)[1]通過日常用戶輸入影響與價值準則(Circumplex模型)的調(diào)查結(jié)果和被動感知的用戶活動數(shù)據(jù),探索其測量抑郁癥狀長期變化的能力,并將每日的Circumplex結(jié)果與被動感知用戶活動行為的效用進行比較[2?3]。研究發(fā)現(xiàn),日常自我調(diào)查評估的衡量準則與患者情緒長期變化衡量準則之間的關(guān)系復(fù)雜。而通過分析觀測得到用戶活動水平和睡眠持續(xù)時間等數(shù)據(jù),其對抑郁癥狀增加的預(yù)測性遠超出日常調(diào)查評估。BDI特征與情緒變化之間的相關(guān)性強度是通過p值建立其線性回歸模型系數(shù),它在Lasso懲罰線性模型中被選擇為大系數(shù)[4?5]。本文的研究表明,睡眠持續(xù)時間與抑郁癥狀預(yù)測的相關(guān)性較強。同時,也發(fā)現(xiàn)調(diào)查中的單個異常值能夠嚴重影響調(diào)查結(jié)果。這說明了需要調(diào)查多樣性人群,以防止人為過度擬合的數(shù)據(jù)集而造成誤差。
為了證實每日自我情緒評估與日?;顒印⑺叩谋O(jiān)測及情緒的整體變化如何相關(guān),本文對107名學(xué)生進行數(shù)據(jù)采集。這些學(xué)生被要求隨時攜帶一臺Android智能手機,并安裝定制程序。在8周研究期間,該應(yīng)用程序?qū)⑻崾居脩裘刻?次輸入其健康和能量水平(Circumplex影響和價值)。此外,還收集了來自傳感器的各種數(shù)據(jù)。
表1所示為研究中用于描述參與者的特征及其在研究期間的行為特性。每個信號的分布計算觀測熵特征,其量化了信號的不規(guī)則性。特征的差異性試圖量化從基準值到研究結(jié)束的變化,而不考慮中間波動[6?7]。本文用1周的時間作為時標,以穩(wěn)定日常波動,表明每周的情緒均值與每周的PHQ?9分數(shù)相關(guān)。采用的PHQ?9模型公式為:
[α=KK-1·1-i=1kσ2Yσ2X] (1)
式中:[K]是測試項目的數(shù)量,此處為9;[σ2Y]是總體得分的方差;[σ2X]是當前樣本的方差;[α]取值在[0,1]之間,當[α]<0.5時結(jié)果不可接受,數(shù)值越高代表結(jié)果越好。
根據(jù)各特征值調(diào)查結(jié)果對BDI增長預(yù)測的模型如下:
[W=β0i+β1i+β2i+β3i+β4i+β5i+β6i+β7i+α] (2)
[β0i=γ0i+γ1i+γ2i+γ3i+γ4i+γ5i+γ6i+γ7i] (3)
式(2)和式(3)描述了針對Big5因素與白天活動及夜間睡眠時長等進行BDI增長預(yù)測的模型。其中,[β(1~7)i]分別對應(yīng)用戶神經(jīng)質(zhì)、外向性、開放性、和藹度、良心度、日間活動時長和夜間睡眠時長的均值;[γ(1~7)i]為這7項特征包含排除在外的樣本的均值;[β0i]為異常值平均加權(quán);[α]為PHQ?9分數(shù)。
研究目標是了解參與者的抑郁癥狀(BDI評分)長期變化所產(chǎn)生的相關(guān)行為因素;第二個目標是使用這些因素預(yù)測抑郁癥狀表現(xiàn)的變化。為了識別相關(guān)和預(yù)測特征,文中選擇使用線性模型。因其有明確的解釋,因此是特征選擇與模型分析的理想選擇。
1) 特征選擇。為探索特征的相關(guān)性,本文使用線性回歸模型,并針對這些模型采用兩種特征選擇方法:使用貝葉斯信息準則(BIC)進行前向選擇,以選擇在每個后續(xù)步驟中應(yīng)添加哪些特征或何時前向選擇應(yīng)被終止;線性回歸與L1(Lasso)懲罰。這兩種方法均產(chǎn)生了具有有限數(shù)量的項數(shù)及表明其對模型貢獻的系數(shù)。
2) 特征比較。為了使特征的權(quán)重相當,本文將所有特征量化為單位方差,其產(chǎn)生的特征是可比的尺度模型。因此,特征系數(shù)之間的比較更具有參考性。
3) 異常值。研究中一個參與者的數(shù)據(jù)集中存在異常值,說明該參與者經(jīng)歷了一個特別困難的時期。由于本次調(diào)查規(guī)模較小,該異常值會對模型產(chǎn)生較大影響。相對于控制觀察,本文提供了包含和排除異常值的模型。
上述使用的回歸方法的特征選擇、模型擬合和預(yù)測精度之間的比較如表2所示。
2.1 ?具有正向選擇和BIC的線性回歸
表2小括號中為適當情況下的線性回歸系數(shù)的p值,“*”表示小于0.001的值。異常值的基線為83.212,移除的異常值為25.184。方括號中的數(shù)字是以非離群值集合計算的MSE,第一列系數(shù)表示適合整個數(shù)據(jù)集的線性模型。通過使用最小化BIC的模型和前向選擇模型來選取這些特征。該建模程序選擇了6個特征,其中5個具有統(tǒng)計學(xué)顯著性(p值<0.05)。除了量化參與者的個性特征外,所有其他特征均來自傳感器測量。該模型具有較高的R2為0.785,表明數(shù)據(jù)的可變性主要由這5個特征來解釋。
2.2 ?L1懲罰線性模型
表2中的第3列系數(shù)為被選中的L1(Lasso)懲罰線性回歸模型。采用該建模方法,每當新的系數(shù)被包含進來時,通過對模型精度項添加懲罰因子進行特征選擇[8?9]。此過程會將不必要項的系數(shù)遞歸為零,進而將其從模型中移除。Lasso方法選擇了可觀察到的最大模型,具有8個特征。與正向選擇相同,參與者個性的開放性被選為對該時期BDI評分增加的高度預(yù)測。同時,描述參與者白天靜止和“睡眠”的多樣性、變化性的特征也被選中。Lasso懲罰線性模型選擇了表示參與者自我評估能量水平的多樣性和變化性的兩個特征,還選擇了描述平均活動水平與日間平均活動水平變化的兩個特征。雖選擇了參與者能量水平的兩個特征,但并未選擇參與者的自我評估功能。在所選的8個功能中,有5個描述了傳感器測量到的活動。
2.3 ?刪除異常值
在收集的數(shù)據(jù)集中存在一個異常值。異常值是由于一個參與者經(jīng)歷了一個特別困難的時期,其BDI評分增加了50分。分數(shù)第二大變化是14分,故該參與者是一個異常值,對模型選擇有重大影響。為了探索以前模型的魯棒性,文中使用相同的方法將兩個模型應(yīng)用于剔除單個異常值參與者后的數(shù)據(jù)集中。這兩個模型在表2中的第2和第4列系數(shù)中呈現(xiàn)。
所得到的模型與包含異常值的模型不同。這一結(jié)果表明,模型對參與者的經(jīng)驗極為敏感。然而,參與者的開放度仍被選為前向選擇和Lasso懲罰回歸的特征,這意味著該個性特征與BDI得分的變化強烈相關(guān)。另外,在使用Lasso懲罰回歸的模型從研究的開始到結(jié)束中,自我評估的能量變化特征也被選中。
2.4 ?一次性預(yù)測精度
最終測試時將采用這些模型進行抑郁癥預(yù)測,并測試這些模型與對比組間的預(yù)測精度。由于數(shù)據(jù)集的大小受限,本文使用一次性的交叉驗證。在該方法中,一個用戶被保持在外,使用所有其他用戶來訓(xùn)練該模型。隨后通過對保持在外的用戶預(yù)測誤差,來測量訓(xùn)練模型的誤差。對所有用戶重復(fù)此過程,測量的最終誤差用所有參與者之間均方誤差(MSE)衡量[10],如表2最后一行所示。較低的MSE表示模型的預(yù)測性能較好,零表示完美的模型。為選擇一個模型比較的參考基準,以對比其預(yù)測性能,本文選擇使用空模型的結(jié)果作為基準MSE。當包含異常值時,該空模型計算的基準MSE為83.212;當異常值從數(shù)據(jù)集中排除時,為25.184??梢钥吹剑谜蜻x擇和BIC構(gòu)建的模型產(chǎn)生的MSE低于基準,這意味著這些模型具有更優(yōu)的預(yù)測精度,可均勻地預(yù)測數(shù)據(jù)集的均值。適合Lasso懲罰模型產(chǎn)生的預(yù)測MSE(96.149)高于基準(83.212)。然而,當排除異常值時,Lasso懲罰模型則呈現(xiàn)出比具有兩個特征的基準(MSE = 25.184)更優(yōu)的模型(MSE = 16.939)。這表明了參與者的開放度與本時期BDI評分相關(guān)性的強弱。
圖1顯示當異常值參與者被包括在數(shù)據(jù)集中時,觀察到的BDI評分增長預(yù)測與實際BDI增長預(yù)測的分布。圖2與其類似,但其顯示了在排除異常值后數(shù)據(jù)集上的預(yù)測分布。兩個數(shù)字預(yù)測均是通過擬合線性模型來形成的,這些模型基于前向選擇所確定的特征,而BIC則是以一對一的交叉驗證方案。兩個數(shù)字在預(yù)測誤差中顯示出較小的差異,即BDI增加不一定低于或超過預(yù)測。此外,這些數(shù)據(jù)大多預(yù)測在BDI的真實評估浮動的5分(虛線)之內(nèi)。
本文探討了不同特征數(shù)據(jù)對預(yù)測評估抑郁癥的效用。研究發(fā)現(xiàn),兩種建模方法的R2值相對較大。同時,還分析了不同模型對抑郁癥數(shù)據(jù)集的預(yù)測能力,證明了被動感知的數(shù)據(jù)在兩種模型中比預(yù)期的用戶自我評估輸入更能預(yù)測BDI的增加。盡管研究證實了所提算法可以衡量行為模式,并可以預(yù)測抑郁癥情緒狀況。但未來仍需進行更多的工作,尤其是針對更大的數(shù)據(jù)樣本進行調(diào)查研究。此外,比較具有不同BDI評分分布的臨床抑郁人群的結(jié)果也是值得進一步研究的領(lǐng)域。
參考文獻
[1] 陳茜,史殿習(xí),楊若松.多維數(shù)據(jù)特征融合的用戶情緒識別[J].計算機科學(xué)與探索,2016,10(6):751?760.
CHEN Qian, SHI Dianxi, YANG Ruosong. User emotion recognition based on multidimensional data feature fusion [J]. Journal of frontiers of computer science & technology, 2016, 10(6): 751?760.
[2] 張振.基于智能移動終端觸屏行為的情緒識別研究[D].重慶:重慶郵電大學(xué),2016.
ZHANG Zhen. Emotional state detection from touch?based behavior on touch?screen device [D]. Chongqing: Chongqing University of Posts and Telecommunications, 2016.
[3] 帥靜.行為決策信息與情緒間的關(guān)系[D].西安:西北大學(xué),2015.
SHUAI Jing. Relationship between behavioral decision?making information and emotions [D]. Xian: Northwestern University, 2015.
[4] 朱響斌,邱慧玲.基于智能手機傳感器數(shù)據(jù)的人類行為識別研究[J].計算機工程與應(yīng)用,2016,52(23):1?5.
ZHU Xiangbin, QIU Huiling. Human activity recognition with smartphone sensor data [J]. Computer engineering and applications, 2016, 52(23): 1?5.
[5] 郭傲.基于智能手機的個人行為特征分析系統(tǒng)的設(shè)計與實現(xiàn)[D].武漢:華中科技大學(xué),2016.
GUO Ao. Design and implementation of personal behavior feature analysis system based on smartphone [D]. Wuhan: Huazhong University of Science and Technology, 2016.
[6] 熊娜.手持移動設(shè)備中基于記憶心理學(xué)的效率型服務(wù)設(shè)計研究[D].杭州:浙江大學(xué),2012.
XIONG Na. Research on efficient service design based on memory psychology for hand?held mobile device [D]. Hangzhou: Zhejiang University, 2012.
[7] 沈麒.基于校園網(wǎng)的用戶行為分析系統(tǒng)的設(shè)計與實現(xiàn)[D].蘇州:蘇州大學(xué),2011.
SHEN Qi. Design and implementation of user behavior analysis system based on campus network [D]. Suzhou: Soochow University, 2011.
[8] 葉舒雁,張未展,齊天亮,等.一種基于傳感器與用戶行為數(shù)據(jù)分析的移動學(xué)習(xí)場景感知分類方法[J].計算機研究與發(fā)展,2016,53(12):2721?2728.
YE Shuyan, ZHANG Weizhan, QI Tianliang, et al. A sensor and user behavior data analysis based method of mobile learning situation perception [J]. Journal of computer research and development, 2016, 53(12): 2721?2728.
[9] 任艷.微信息大數(shù)據(jù)粗糙集的近似約簡[J].沈陽工業(yè)大學(xué)學(xué)報,2016,38(3):309?313.
REN Yan. Approximate reduction of micro?message big data rough set [J]. Journal of Shenyang University of Technology, 2016, 38(3): 309?313.
[10] LATHIA N, PEJOVIC V, RACHURI K K, et al. Smartphones for large?scale behavior change interventions [J]. IEEE pervasive computing, 2013, 12(3): 66?73.