楊娟 徐大宏
摘要:在高職心理健康教育具體工作中都會產生大量多樣化和碎片化數(shù)據(jù),本文通過數(shù)據(jù)預處理和深度學習技術運用,利用BP算法對影響心理問題的多種類型的歷史數(shù)據(jù),包括學生心理普查數(shù)據(jù)、個人基本信息及社會支持統(tǒng)計數(shù)據(jù)等進行表征學習,不僅能充分考慮到數(shù)據(jù)之間的異質性,還能探究到它們之間潛在的關聯(lián)性,最終提升心理問題風險預測的作用,實現(xiàn)心理問題預測工作精準化和深入化。
關鍵詞:深度學習;心理問題預測;BP算法;高職學生
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2020)29-0001-03
我國各級教育部門高度重視高職學生心理預警工作,然而在實際工作中普遍缺乏信息化技術應用意識,增加工作的被動性。此外高職學生的心理健康水平受到內外諸多因素的影響,各因素間又有復雜的關聯(lián),是一個非線性問題。
近幾年隨著大數(shù)據(jù)時代、云計算的到來,深度學習在實際運用中都有極大地突破,它不僅具備較深的網(wǎng)絡結構,是一種智能化機器學習,并且通過一系列算法,使計算機從海量歷史數(shù)據(jù)中學習規(guī)律,建立分析模型,實現(xiàn)工從特征提取至特征分類的全過程端到端( end-end),對新的樣本進行智能識別或對未來做預測。很多學者提出利用機器學習等算法對影響學生心理問題的影響因素進行分析,通過機器算法或建立分析模型,將原始數(shù)據(jù)開始每層表示(或特征)經(jīng)過不斷訓練,逐漸轉換為更高層的表示,獲得最大數(shù)據(jù)價值,從而進行分類預測,從而達到心理問題預測的目的。
1 研究路線
本文將影響高職學生心理問題主要因素作為樣本輸入,數(shù)據(jù)主要體現(xiàn)在SCL-90量表中加入個人基本信息、社會支持等因子,利用BP神經(jīng)網(wǎng)絡建立心理問題預測模型,通過各影響因素與心理問題的映射關系,對輸入的測試樣本進行學習訓練,只要不斷輸入影響因素數(shù)據(jù),完成訓練分析,使預測模型更貼近調查樣本實際特點,達到心理問題預測的目的。
2 數(shù)據(jù)采集及預處理
2.1 數(shù)據(jù)采集
本研究所使用的數(shù)據(jù)源于湖南工業(yè)職業(yè)技術學院、湖南科技職業(yè)技術學院、湖南工程職業(yè)技術學院具有代表性3所高職院校近5年的新生心理普查數(shù)據(jù)、學生基本情況表、社會支持問卷統(tǒng)計數(shù)據(jù),共計1036名學生歷史數(shù)據(jù)。在數(shù)據(jù)收集過程中,心理普查數(shù)據(jù)主要參考90項癥狀清單(SCL-90量表),采用五級評分法,從10個因子分反映心理健康狀況(F1-F10),并有特定正常值參考范圍;學生基本情況表是基于高職院校學生具有相同的基礎屬性特征:如年齡、教育程度、教育經(jīng)歷等,也有不同的屬性特征,如性別、專業(yè)、生源地、家庭狀況等,在本研究中主要參考了性別、年齡、專業(yè)、生源地、家庭經(jīng)濟收入五類數(shù)據(jù);在外部影響因素中主要參考了物質支持滿意度、精神支持滿意度兩類數(shù)據(jù)。
2.2 數(shù)據(jù)預處理
2.2.1 數(shù)據(jù)特征提取
本研究根據(jù)影響高職院校學生心理問題的有關的各種屬性特征因素,通過對這些因素的加權調整,使調整后的結果更準確反映高職院校學生的心理健康情況。具體分為:首先收集心理問題影響內外因素的三類別大量小數(shù)據(jù),如個人基本情況、社會支持情況等;其次依據(jù)表現(xiàn)特征進行分類,按影響大小進行分級,制定各特征分數(shù)的加權影響分值的范圍值,以及遞進和遞減規(guī)則。如SCL-90量表中有10個因子,每個因子所含的項目不同,對數(shù)據(jù)進行因子均分處理,結果如下表1所示。
2.2.2 數(shù)據(jù)歸一化處理
樣本數(shù)據(jù)進行網(wǎng)絡訓練時,樣本數(shù)據(jù)呈現(xiàn)碎片化、多樣化、維度單一等特點,必須將大量存在的小數(shù)據(jù)進行歸一化處理,符合可追蹤、可量化、可比較、可分析、高維度的大數(shù)據(jù)特征,并映射到[-1,1]區(qū)間處理,更加簡便。設置網(wǎng)絡輸入、輸出矩陣,如表2所示。
3 構建BP網(wǎng)絡預測模型
以構建BP神經(jīng)網(wǎng)絡模型為工具,基于內外因影響大學生心理問題因素,進行BP算法優(yōu)化,并對模型進行仿真訓練,不斷達到優(yōu)化狀態(tài)。BP學習網(wǎng)絡模型指預測模型中的神經(jīng)網(wǎng)絡結構設計,本研究將影響學生心理健康問題結構化數(shù)據(jù)(訓練樣本數(shù)據(jù))為輸入節(jié)點,從心理預測角度設定過濾條件,即中間設置層數(shù)(隱藏層)、節(jié)點數(shù)模型結構,輸出節(jié)點為心理問題預測初步預期值。
3.1 輸入層神經(jīng)元數(shù)目的確定
在BP網(wǎng)絡輸入層神經(jīng)元數(shù)目的選取時,表現(xiàn)樣本整體特征的變量,必須滿足選取的輸入變量之間線性關系不強,且對輸出影響大并且能檢測的變量。
結合前期研究基礎,從內外角度分析高職生心理問題預測指標的特征層包括三個,即心理自評、個人基本情況及社會支持。綜合確定17個神經(jīng)元數(shù)目。如:A1性別(xb)、A2年齡(nl)、A3專業(yè)(zy)、A4生源地(syd)、A5家庭經(jīng)濟收入(jtsr);B1物質支持程度(wzzc)、B2精神支持程度(jszc);C1軀體化因子(qth)(量表1、4、12、27、40、42、48、49、52、53、56、58)C,強迫因子(qp)(量表3、9、10、28、38、45、46)、C3人際敏感因子(rjmg)(量表6、21、34、36、37、41、61、69、73)、C4抑郁因子(yy)(量表5、14、15、20、22、26、29、30、31、32、54、71、79)、C.焦慮因子(jl)(量表2、17、23、33、39、57、72、78、80、86)、C6敵對因子(dd)(量表11、24、63、67、74、81)C7恐怖因子(kb)(量表13、25、47、50、70、75、82)、C8偏執(zhí)因子(pz)(量表8、18、43、68、76、83)、C。精神病性因子(jsbx)(量表7、16、35、62、77、84、85、87、88、90)、C10其他因子(qt)(量表19、44、59、60、64、66、89)。
對應每1項特征層各選取影響較大、關聯(lián)較強的指標,并對基礎層各項指標賦值,賦值為0-10,同時,確定各項基礎層系數(shù),取值為0-1,因此計算出每項特征層指標對應的數(shù)值。
3.2 輸出層神經(jīng)元數(shù)目的確定
輸出層神經(jīng)元數(shù)目的確定,決定于如何定標準的輸出。輸出節(jié)點代表系統(tǒng)要實現(xiàn)的功能目標。在本研究中,研究對象的期望輸出是高職學生心理問題風險的預測。因此,輸出層神經(jīng)元數(shù)目選擇為3(zhengchang:等于1,表明處于正常范圍;qingdu:等于1,表明有心理困惑,但處于正常范圍內;yanzhong等于1,表明心理異常。)
3.3 隱層神經(jīng)元數(shù)目的確定
在隱層節(jié)點數(shù)實際的結構實現(xiàn)上,選擇合理的數(shù)目的隱層節(jié)點是個復雜的問題,關系到整個網(wǎng)絡精準度。在本研究中采用黃金分割法來確定隱層節(jié)點數(shù),即設置該BP網(wǎng)絡中輸入層節(jié)點數(shù)為A,輸出層節(jié)數(shù)為B,隱層節(jié)點數(shù)為L,L的取值范圍為[A,B],具體公式如下:
計算公式l1=0.712x( b-a)+a,將l1作為隱層節(jié)點數(shù)計人訓練模型,訓練后誤差E=(1,);同樣設定1:為隱層節(jié)點數(shù)計算模型,訓練后誤差為E(1,)……對比E(1,)與E(l2),假如E(l1)
4 深度網(wǎng)絡訓練
BP(Back prapagation)算法是一類有導學習算法,主要用于模式識別、分類、函數(shù)逼近等主要方面。BP算法基本思路是建立BP網(wǎng)絡對網(wǎng)絡權值不斷調適修正,達到誤差函數(shù)沿梯度方向下降,分為正向傳播和誤差反向傳播兩個部分。具體為首先輸入樣本數(shù)據(jù)通過輸入層,經(jīng)過隱含層計算每個單元的實際輸出值;其次為當輸出層實際輸出與期望的輸出值存在誤差,則需不斷調整權值,進行網(wǎng)絡的學習訓練過程,當誤差達到期望誤差,則網(wǎng)絡學習過程結束。
4.1訓練參數(shù)設置
BP網(wǎng)絡中輸入向量為X=(x1,x2,X3,...,Xn)T,隱層輸出向量為Y
4.2 具體訓練過程
讀人訓練樣本數(shù)據(jù),對樣本數(shù)據(jù)進行刪除、增補等預處理后,對所有管理數(shù)據(jù)賦予初始值。選取load函數(shù)讀取樣本數(shù)據(jù),具體如表3所示。
設置100組數(shù)據(jù)為訓練樣本,20組為預測樣本,所有數(shù)據(jù)根據(jù)其遞進規(guī)則進行訓練,所得結果與實際值進行比較得到在上述訓練數(shù)據(jù)情況下最匹配模型,該模型可以隨著訓練標本數(shù)量的增加以及標本數(shù)據(jù)中屬數(shù)據(jù)的增加變得更加準確真實,如表4所示。
網(wǎng)絡訓練算法選取trainlm算法,把學習訓練網(wǎng)絡設置為17個神經(jīng)元,其神經(jīng)網(wǎng)絡模型結構為[17,17,1],則神經(jīng)輸入第1層為17個輸人數(shù)據(jù),對應預測結果為第3層,第2、3層神經(jīng)元選取用tansig函數(shù),如表5所示。
運用BP算法對網(wǎng)絡進行學習訓練,并不斷對各參數(shù)進行調整:
net.trainparam.epochs=980;
net.trainparam.ir=0.12;
設置訓練目標為0.000000001
則net.trainparam.goal=0.000000001
在本文中所建立的神經(jīng)網(wǎng)絡不斷學習訓練過程中,誤差在不斷減少,在預期900步時,誤差率控制在3%能在較短時間內完成數(shù)據(jù)擬合,基本實現(xiàn)對高職學生心理問題的預測研究。
4.3 仿真測試
將測試數(shù)據(jù)錄入已建好的神經(jīng)網(wǎng)絡模型進行仿真測試,通過若干組數(shù)據(jù)仿真測試可以得出,每組預測結果誤差比較小,基本達到要求,證明模型能對所研究樣本狀況進行問題的預測,如表6所示。
本文將影響高職學生心理問題因素通過BP神經(jīng)網(wǎng)絡學習訓練映射到相應的心理健康狀況,經(jīng)過特征選取,不斷學習訓練及自我訓練,將初始權值與閾值調整,達到問題預測并完成結果對比,如表7所示。
5 結論
結合我國現(xiàn)階段高職學生心理健康特點,將內外影響因素數(shù)據(jù)進行預處理,建立神經(jīng)網(wǎng)絡預測模型,并利用BP算法不斷進行學習訓練,將神經(jīng)網(wǎng)絡進行最佳優(yōu)化,并通過仿真訓練測試模型的性能,顯示誤差值在可控制范圍內,在一定程度上可以對心理問題進行預測,模型具有可行性。
參考文獻:
[1]楊娟.大數(shù)據(jù)背景下高職學生心理健康影響因素調查研究[J].現(xiàn)代職業(yè)教育,2020(7):12-13.
[2]魯瑋.數(shù)據(jù)挖掘技術在高職學生心理健康數(shù)據(jù)中的應用研究[D].合肥:安徽大學,2019.
[3]王麗.基于神經(jīng)網(wǎng)絡的研究生心理健康狀況預測分析[D].西安:西安科技大學,2016.
[4)耿紅.研究生心理健康問題產生的原因和對策分析[J].管理學家,2013(24):497-498。
[5]杜婷.碩士研究生心理健康狀況及其影響因素的相關研究[D].鄭州:鄭州大學,2005.
【通聯(lián)編輯:唐一東】
作者簡介:楊娟(1982-),女,湖南會同人,碩士研究生學歷,湖南工業(yè)職業(yè)技術學院,副教授,研究方向:思想政治教育;徐大宏(1971-),男,湖南岳陽人,副教授,博士,研究方向為數(shù)字計算處理、計算機視覺。