高廣銀, 劉 姜, 丁 勇
(1.南京理工大學(xué) 泰州科技學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)系,泰州 225300;2.上海理工大學(xué) 管理學(xué)院,上海 200093)
大學(xué)校園里因心理問題引發(fā)的心理危機(jī)事件呈上升趨勢,各種從壓力、抑郁到自傷、他傷等失控行為并不鮮見.專家學(xué)者積極研究大學(xué)生心理健康教育,分析影響心理健康的因素,并提出了從學(xué)生心理委員到學(xué)校心理咨詢中心層層報(bào)送的高校心理危機(jī)監(jiān)控報(bào)送體系[1],及以建設(shè)校園文化、確立價(jià)值觀導(dǎo)向?yàn)楹诵牡男睦砦C(jī)干預(yù)機(jī)制[2],這促進(jìn)了人們對心理危機(jī)問題的關(guān)注和思考.然而,這些研究大都停留在心理健康教育的層面,缺乏有效的手段預(yù)知大學(xué)生是否產(chǎn)生了心理危機(jī).人的心理活動(dòng)極其復(fù)雜,其變化過程也不可見,通過心理危機(jī)預(yù)測能夠盡早地發(fā)現(xiàn)問題,及時(shí)采取干預(yù)措施,有效避免心理危機(jī)形成、惡化帶來的后果.
隱 馬 爾 科 夫 模 型(hidden Markov model,HMM)[3]作為一種統(tǒng)計(jì)分析模型,創(chuàng)立于20世紀(jì)70年代,80年代得到了傳播和發(fā)展,并應(yīng)用于語音人工合成、圖像處理、模式識(shí)別及生物信號(hào)處理等領(lǐng)域[4].近年來,該模型被應(yīng)用于金融市場的波動(dòng)性分析、經(jīng)濟(jì)預(yù)算、網(wǎng)絡(luò)安全[5]、人的行為分析[6]等諸多領(lǐng)域,從而被證明對于解決一類問題,即系統(tǒng)中表層可見事件可能由低層隱藏狀態(tài)引發(fā),具有重要意義.
本文將隱馬爾科夫模型應(yīng)用于高校學(xué)生心理危機(jī)的預(yù)測,在分析影響大學(xué)生心理健康因素的基礎(chǔ)上,利用Vague集理論[7]建立核心因素集,由此確定可觀察序列集,建立隱馬爾科夫模型,對模型參數(shù)進(jìn)行訓(xùn)練,并將訓(xùn)練后的模型應(yīng)用于心理危機(jī)預(yù)測.實(shí)例分析結(jié)果表明基于該模型預(yù)測大學(xué)生心理危機(jī)是可行的.
在大學(xué)生心理健康教育研究中,不同的學(xué)者由于研究工具和研究對象的不同而得出了許多不同的結(jié)論.針對綜合性大學(xué)新生的心理調(diào)查發(fā)現(xiàn),大學(xué)新生的主要心理問題是學(xué)習(xí)壓力大、人格缺陷和人際交往障礙[8].基于高職學(xué)生的研究表明,導(dǎo)致心理壓力因素主要是學(xué)習(xí)、就業(yè)和情感等[9].這些研究成果都從不同層面指出了影響大學(xué)生心理健康的因素,但是關(guān)于這些因素對心理危機(jī)產(chǎn)生的影響程度并未闡明.本文首先在已有研究成果的基礎(chǔ)上,結(jié)合某獨(dú)立學(xué)院的實(shí)際情況,通過與學(xué)院心理輔導(dǎo)教師和輔導(dǎo)員的訪談,概括影響大學(xué)生心理健康有4大因素共19項(xiàng)指標(biāo):家庭因素(氛圍、父母教養(yǎng)方式、經(jīng)濟(jì)條件、重大變故)、社會(huì)因素(價(jià)值多元化、擴(kuò)招學(xué)費(fèi)高、競爭就業(yè)難)、學(xué)校因素(學(xué)習(xí)壓力、教育方式、管理制度、設(shè)施條件、教工素質(zhì))及個(gè)人因素(認(rèn)知方式、應(yīng)對方式、歸因方式、自我定位、人際關(guān)系、社會(huì)認(rèn)同、生理疾?。黄浯位赩ague集對這些因素約簡得出影響心理危機(jī)產(chǎn)生的核心因素[10].
根據(jù)上述分析的19項(xiàng)指標(biāo),可以建立大學(xué)生心理健康影響因素的完備集D={a1,a2,…,am},其中m =19.然而這些因素對于心理危機(jī)的形成作用不等,只有那些起關(guān)鍵作用的因素對于開展心理危機(jī)預(yù)測有意義,即核心因素.
首先,組建能夠代表心理健康教育各層面的專家組,組員有市教育局心理咨詢師、高校心理學(xué)專業(yè)教師、輔導(dǎo)員、其他心理健康教育工作者及家長代表共n 名,并請這n 位專家,對m個(gè)因素的重要性表態(tài),分重要、不重要和不好判斷,并分別記為1,-1和0.其次,匯總專家意見,確定每個(gè)因素的重要程度,并用Vague集表示[11].
從而,因素完備集D 到核心因素集C 的關(guān)系R(D→C)可以定義為一Vague 集關(guān)系.每一指標(biāo)ai(i=1,2,…,m)的 重 要 程 度 可 以 表 示 為(t(ai),1-f(ai)).其中,t(ai)表示指標(biāo)ai對大學(xué)生心理危機(jī)產(chǎn)生重要影響的成分;f(ai)表示指標(biāo)ai不對大學(xué)生心理危機(jī)產(chǎn)生重要影響的成分.t(ai)及f(ai)定義如下:
最后,計(jì)算核函數(shù)H(ai),并給出重要性標(biāo)準(zhǔn)α(0<α<1),當(dāng)H(ai)≥α 時(shí),ai入選核心因素集C.核函數(shù)H(ai)可以解釋為因素ai對心理危機(jī)產(chǎn)生重要影響的重要程度,其定義為
根據(jù)經(jīng)驗(yàn),取α=0.3,并用H(ai)≥α 作為判斷準(zhǔn)則,從19個(gè)因素中篩選出5個(gè)核心因素,得到核心因素集C={父母教養(yǎng)方式、重大變故、競爭就業(yè)難、教工素質(zhì)、人際關(guān)系},如表1所示(見下頁).
表1 專家評分表Tab.1 Expert score table
隱馬爾科夫模型是一種用參數(shù)表示的用于描述隨機(jī)過程統(tǒng)計(jì)特性的概率模型,是一個(gè)雙重隨機(jī)過程.它由馬爾科夫鏈和一般隨機(jī)過程兩部分組成,其中馬爾科夫鏈用轉(zhuǎn)移概率矩陣描述狀態(tài)的轉(zhuǎn)移,而一般隨機(jī)過程則用觀察概率矩陣描述狀態(tài)與觀察序列間的關(guān)系[12].HMM 定義如下:
a.X 表 示 一 組 狀 態(tài) 集 合,X ={S1,S2,…,SN},狀態(tài)數(shù)為N,并用qt表示t 時(shí)刻的狀態(tài);
b.O 表示一組可觀察序列的集合,O={V1,V2,…,VM},其中,M 是從每一個(gè)狀態(tài)可能輸出的不同觀察值數(shù)目;
c.狀態(tài)轉(zhuǎn)移概率矩陣A={aij},其中,aij=P{qi+1=Sj|qi=Si},i≥1,j≤N;
d.狀態(tài)Sj的觀察概率矩陣B={bj(k)},表示狀態(tài)Sj輸出相應(yīng)觀察值的概率,其中bj(k)=P{Ot=Vk|qt=Sj},1≤j≤N,1≤k≤M;
e.初始化狀態(tài)分 布π={πi},πi=P{q1=Si},1≤i≤N.
由上,HMM 可以定義為一個(gè)五元組λ=(X,O,π,A,B),并簡寫為λ=(π,A,B).
HMM 主要解決3類問題:評估、解碼和學(xué)習(xí).
a.評估.給定模型參數(shù)λ=(X,O,π,A,B)及觀察序列O={V1,V2,…,VM},根據(jù)此模型計(jì)算此觀察序列的概率P(O|λ).
b.解碼.根據(jù)給定的模型λ=(X,O,π,A,B)及一個(gè)觀察序列,選擇最符合該觀察序列的狀態(tài)序列.
c.學(xué)習(xí).給出一個(gè)觀察序列,調(diào)整模型的參數(shù)A,B,π,使得P(O|λ)最大.
建立預(yù)測大學(xué)生心理危機(jī)的隱馬爾科夫模型,即要確定隱馬爾科夫模型的5個(gè)要素,可通過5個(gè)步驟完成[13].
步驟1 通過心理專家對大學(xué)生心理狀態(tài)進(jìn)行評估,確定其狀態(tài)的幾種可能情況,一般描述為心理健康、心理亞健康、心理危機(jī)等,以此作為預(yù)測大學(xué)生心理危機(jī)的隱馬爾科夫模型的隱狀態(tài),定義隱狀態(tài)集合為:X={S1,S2,…,SN},N=3,其中,S1,S2,S3分別為心理危機(jī)、心理亞健康、心理健康3種心理狀態(tài).
步驟2 將核心因素集C={父母教養(yǎng)方式,重大變故,競爭就業(yè)難,教工素質(zhì),人際關(guān)系}記為C={a1,a2,a3,a4,a5},為了便于描述這些因素對心理危機(jī)產(chǎn)生的影響以及建立隱馬爾科夫模型,本文采用這5個(gè)因素的一個(gè)組合V 表示,定義為
其中顯然,V 是由0或1組成、長度為m 的串,且可以通過學(xué)生問卷調(diào)查或心理測試等方式獲得,從而可以作為隱馬爾科夫模型的可觀察狀態(tài),定義可觀察序列集合為:O={V1,V2,…,VM},M=2m.
步驟3 設(shè)置初始狀態(tài)轉(zhuǎn)移概率矩陣
步驟4 根據(jù)大學(xué)生心理健康評估歷史數(shù)據(jù)分別統(tǒng)計(jì)心理健康、心理亞健康、心理危機(jī)3種狀態(tài)下各影響因素組合V,即觀察狀態(tài)的概率B.
步驟5 設(shè)置π={1,0,0},即假設(shè)大學(xué)生入校時(shí)不存在心理危機(jī)問題.
通過以上步驟,預(yù)測大學(xué)生心理危機(jī)的隱馬爾科夫初始模型λ=(π,A,B)已建立,然而其中的參數(shù)未進(jìn)行優(yōu)化,無法真正應(yīng)用于心理危機(jī)的預(yù)測中,因此需要對模型中的參數(shù)進(jìn)行訓(xùn)練和優(yōu)化.
初始模型λ=(π,A,B)經(jīng)過Baum-Welch算法優(yōu)化后,可以得到模型λ′=(π′,A′,B′),其參數(shù)經(jīng)過大量訓(xùn)練數(shù)據(jù)訓(xùn)練得出,具體的訓(xùn)練優(yōu)化流程如下:
a.引入兩個(gè)變量εt(i,j)和γt(i,j),其中
式中,εt(i,j)為給定隱馬爾科夫模型λ 和觀察序列O 的前提下,在t 時(shí)刻狀態(tài)為Si且在t+1時(shí)刻狀態(tài)為Sj的概率;αt(i)為前向變量,表示t 時(shí)刻狀態(tài)為Si,且t 時(shí)刻之前(包括t 時(shí)刻)滿足給定觀測序列的概率;βt(i)為后向變量,表示t 時(shí)刻狀態(tài)為Si,且t 時(shí)刻以后滿足給定觀測序列的概率.
式中,γt(i)為給定隱馬爾科夫模型λ 和觀察序列O 的前提下,在時(shí)刻t 狀態(tài)為Si的概率.合并后得到
b.利用前面定義的變量εt(i,j)和γt(i),可得出狀態(tài)轉(zhuǎn)移概率矩陣A 的優(yōu)化算法,具體推導(dǎo)過程為
最后得出經(jīng)過優(yōu)化后的aij為
c.觀察值概率分布B 的優(yōu)化算法為
d.初始狀態(tài)概率分布π 的優(yōu)化算法為
通過式(9)、式(10)及式(11)分別對轉(zhuǎn)移概率矩陣A、觀察概率矩陣B 及初始化狀態(tài)分布π 進(jìn)行優(yōu)化,得到訓(xùn)練后的模型λ′=(π′,A′,B′),并用于心理危機(jī)預(yù)測.
模型λ′=(π′,A′,B′)應(yīng)用于心理危機(jī)預(yù)測,根據(jù)核心因素的觀察序列,尋找生成該觀察序列最可能的隱狀態(tài)序列,即學(xué)生的心理狀態(tài),達(dá)到預(yù)測的目的.這屬于隱馬爾科夫模型中的解碼問題,使用Viterbi算法解決,具體算法過程如下:
a.t=1時(shí),δ1(j)=π(j)bjk1;
b.t>1時(shí),δt(j)=maxi{bjktδt-1(i)aij};
c.t=T 時(shí),計(jì)算δT(j),選擇包含最大局部概率的狀態(tài),相應(yīng)的局部最優(yōu)路徑即為全局最優(yōu)路徑;
d.反 向 指 針φt(j)用 于 回 溯,φt(j)=arg maxi{δt-1(i)aij}.
模型訓(xùn)練及預(yù)測程序基于Eclipse平臺(tái),采用Java語言及google jahmm-0.6.1包編寫.
實(shí)例分析數(shù)據(jù)來自南京理工大學(xué)泰州科技學(xué)院大學(xué)生心理健康教育與咨詢中心近兩年來學(xué)生心理健康評估原始記錄約2 000條.根據(jù)前文定義的隱狀態(tài)集合及可觀察序列集合對心理健康評估原始數(shù)據(jù)進(jìn)行預(yù)處理,得到觀測符號(hào)對應(yīng)隱狀態(tài)的記錄,其中觀察符號(hào)是由0,1組成的長度為5的字符串,共32種,隱狀態(tài)共3種.將預(yù)處理后的數(shù)據(jù)分成兩部分:訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),分別用于模型訓(xùn)練和預(yù)測.
分析結(jié)果表明,隨著訓(xùn)練樣本容量的增加,模型的預(yù)測準(zhǔn)確率逐步提高,并在達(dá)到一定數(shù)目后趨于穩(wěn)定,模型是收斂的,如圖1所示.使用單個(gè)因素的預(yù)測效果遠(yuǎn)低于使用核心因素集,使用核心因素集的預(yù)測準(zhǔn)確率能夠達(dá)到90%以上;另一方面,各因素對預(yù)測結(jié)果的影響程度是不等的,其中“父母教養(yǎng)方式、重大變故、競爭就業(yè)難”這3個(gè)因素對預(yù)測影響較大.
圖1 基于各因素及核心因素集的預(yù)測結(jié)果Fig.1 Prediction result based on single factor and core factor set
此外,將該模型應(yīng)用于在校一年級(jí)學(xué)生心理危機(jī)預(yù)測,并與心理衛(wèi)生測試國際通用標(biāo)準(zhǔn)UPI篩選及SCL-90進(jìn)行比較,其中UPI是大學(xué)人格問卷,SCL-90是心理健康測試量表.從表2中數(shù)據(jù)可以看到心理衛(wèi)生測試標(biāo)準(zhǔn)的評測結(jié)果具有一致性,即UPI與SCL-90對S1,S2,S3這3種狀態(tài)樣本數(shù)的統(tǒng)計(jì)結(jié)果保持一致.但兩者都傾向于將樣本由S3評測為S2,由S2評測為S1,繼而采取后續(xù)約談等干預(yù)手段實(shí)施心理健康教育;使用HMM 的預(yù)測結(jié)果與使用測試標(biāo)準(zhǔn)的評測結(jié)果基本吻合,且準(zhǔn)確率更高一些,表3中準(zhǔn)確率的比較也說明了這一點(diǎn).
表2 實(shí)際預(yù)測與標(biāo)準(zhǔn)評測Tab.2 Practical prediction and standard evaluation
表3 準(zhǔn)確率對比Tab.3 Accuracy comparison among various methods %
為了解決大學(xué)生心理危機(jī)預(yù)測問題,基于Vague集理論分析并建立了影響大學(xué)生心理危機(jī)的核心因素集,構(gòu)造了可觀察序列集合,建立了預(yù)測大學(xué)生心理危機(jī)的隱馬爾科夫模型.運(yùn)用Baum-Welch算法對模型參數(shù)進(jìn)行訓(xùn)練,并將訓(xùn)練后的模型應(yīng)用于心理危機(jī)預(yù)測,通過基于真實(shí)數(shù)據(jù)的實(shí)例分析驗(yàn)證模型的正確性.研究結(jié)果表明,單個(gè)因素?zé)o法準(zhǔn)確預(yù)測,而采用核心因素集能夠顯著提高預(yù)測的準(zhǔn)確率,且各因素對預(yù)測所起的作用不等.下一階段將繼續(xù)研究更合理的因素組合,對模型進(jìn)行優(yōu)化,運(yùn)用序列挖掘方法挖掘大學(xué)生心理活動(dòng)變化的規(guī)律,細(xì)化隱狀態(tài)及隱狀態(tài)之間的轉(zhuǎn)移,提高預(yù)測的精度,通過反向算法還原心理危機(jī)的產(chǎn)生過程,分析并給出合理的干預(yù)措施建議.
[1]王群,刁靜,林磊.大學(xué)生心理危機(jī)預(yù)防與干預(yù)體系的研究[J].上海中醫(yī)藥大學(xué)學(xué)報(bào),2013,27(2):88-92.
[2]陳小紅,李三崗.生命教育視角下大學(xué)生心理危機(jī)及其干預(yù)探析[J].渭南師范學(xué)院學(xué)報(bào),2013,28(12):78-80.
[3]Rabiner L R.A tutorial on hidden Markov models and selected applications in speech recognition [J].Proceedings of the IEEE,1989,77(2):257-286.
[4]Yamato J,Ohya J,Ishii K.Recognition human action in time sequential images using hidden Markov model[C]∥Proceedings of IEEE Conference on Computer Vision and Pattern Recognition.Champaign,IL:IEEE,1992:379-385.
[5]Bilmes J A.What HMMs can do [J].IEICE Transactions on Information and Systems,2006,89(3):1-24.
[6]鄔書躍,田新廣.基于隱馬爾可夫模型的用戶行為異常檢測新方法[J].通信學(xué)報(bào),2007,28(4):38-43.
[7]Gau W L,Buehrer D J.Vague sets [J].IEEE Transactions on Systems,Man and Cybernetics,1993,23(2):610-614.
[8]劉伶俐,王朝立,于震.CHMM 語音識(shí)別初值選擇方法 的 研 究[J].上 海 理 工 大 學(xué) 學(xué) 報(bào),2012,34(4):323-326.
[9]馬廣水.基于系統(tǒng)動(dòng)力學(xué)大學(xué)生心理安全預(yù)警技術(shù)研究[D].武漢:武漢理工大學(xué),2012.
[10]林志貴,徐立中,劉英平.Vague集理論及其在模糊信息處 理 中 的 應(yīng) 用[J].信 息 與 控 制,2005,34(1):54-59.
[11]張麗,馬良.基于粗糙集屬性約簡的模糊模式識(shí)別[J].上海理工大學(xué)學(xué)報(bào),2003,25(1):50-53.
[12]彭子平,張嚴(yán)虎,潘露露.隱馬爾科夫模型原理及其重要應(yīng)用[J].計(jì)算機(jī)科學(xué),2008,35(4):138-139.
[13]閆新娟,譚敏生,嚴(yán)亞周,等.基于隱馬爾科夫模型和神經(jīng)網(wǎng)絡(luò)的入侵檢測研究[J].計(jì)算機(jī)應(yīng)用與軟件,2012,29(2):294-297.