摘要:本文通過大數(shù)據(jù)文本處理技術(shù),采用知識圖譜技術(shù)實時監(jiān)控所覆蓋學生群體網(wǎng)絡(luò)自媒體(如微博)等文本信息,實時形成三級危機預(yù)警報告,輔助人工評估進行危機預(yù)防及干預(yù),并通過大數(shù)據(jù)輔助建構(gòu)“實時評估—智能風控—危機干預(yù)”心理危機預(yù)警的智能服務(wù)體系,為高校心理健康工作提供智能保障。
關(guān)鍵詞:大數(shù)據(jù);智能服務(wù);心理危機預(yù)警;心理健康
中圖分類號:G642 ?文獻標識碼:B ?論文編號:1674-2117(2021)07-0105-04
十九大報告指出,推動互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能與實體經(jīng)濟深度融合。[1]說明大數(shù)據(jù)時代的數(shù)據(jù)儲備、技術(shù)理念,正以前所未有的方式預(yù)測事物發(fā)展趨勢,改變大學生的知識體系、生活方式及心理健康水平。大學生作為接觸最活躍思想、最先進技術(shù)、最密集知識的排頭兵群體,其心理健康標準體系在大數(shù)據(jù)時代產(chǎn)生了革命性的變化,導(dǎo)致認知、情感與行為方式的改變,給高校危機干預(yù)提供了海量化、實時化、個性化、可量化數(shù)據(jù)資源。[2]在互聯(lián)網(wǎng)高速發(fā)展的今天,網(wǎng)絡(luò)社交媒體成為大學生傾訴想法、宣泄情緒的重要平臺,這些信息中包含了很多心理危機信息,為危機干預(yù)提供了豐富而寶貴的數(shù)據(jù)。[3]
高校心理危機干預(yù)的研究現(xiàn)狀
目前,抑郁癥、焦慮癥等心理問題已經(jīng)成為高校大學生心理危機干預(yù)中的高發(fā)問題,然而目前高校心理危機干預(yù)面臨很多因互聯(lián)網(wǎng)技術(shù)的發(fā)展而帶來的挑戰(zhàn)[4]:第一,微信、微博、QQ等社交媒體蘊含著大學生心理危機評估診斷重要線索,但無法實時提取分析;第二,傳統(tǒng)心理危機評估多依靠經(jīng)驗或直覺,反饋模糊延遲,難以量化評估與風險控制[5];第三,危機干預(yù)機制延遲僵化,效率低下,事故頻發(fā)[6];第四,危機干預(yù)的跟蹤評估機制缺乏可持續(xù)性。
知識圖譜技術(shù)
本研究利用互聯(lián)網(wǎng)大數(shù)據(jù)提供海量數(shù)據(jù),挖掘微博大數(shù)據(jù)文本信息,采用知識圖譜技術(shù),對特定群體的學生“實時監(jiān)控”其微博、知乎等特定網(wǎng)站,從學生信息中篩選高風險的自殺人群,并實時監(jiān)控心理危機的風險程度,根據(jù)監(jiān)控報告結(jié)合人工評估結(jié)果,采取心理危機干預(yù)行動。[7]對清洗出來的準確可靠的信息進行結(jié)構(gòu)化描述、關(guān)聯(lián)、組織,將其轉(zhuǎn)化為知識圖譜的知識。[8]2018年1月至2019年1月,本研究已經(jīng)對770余人進行心理危機預(yù)警及干預(yù)行動,對58人獲得有效干預(yù),及時發(fā)現(xiàn)自殺情緒,阻止自殺行為。
危機預(yù)警分級標準
為了更加精準地篩選、甄別危機個體,本研究提出危機預(yù)警分級系統(tǒng)。根據(jù)自殺方式的確定性、時間緊迫性等因素確定危機風險級別,級別越高代表危機越大、自殺風險越大。[9]具體的危機預(yù)警分級如下頁表所示。
本研究通過Python爬蟲八爪魚等工具抓取大數(shù)據(jù),獲得心理危機監(jiān)測智能系統(tǒng)所需的信息知識支撐,構(gòu)建常見高危心理病癥的知識圖譜,提供心理危機相關(guān)的各種基本信息,如抑郁癥表征、焦慮癥表征,用于篩選、抓取社交媒體(如微博等)信息進行分析與判斷。本研究對心理危機進行心理畫像描述,如抑郁癥的知識圖譜對自殺方式、自殺計劃、自殺行動、自殺時間、自殺地點、自殺體驗、負性情緒、痛苦表達等描述,由不同心理危機的知識圖譜組合構(gòu)成。本研究的文本處理知識圖譜由自殺圖譜、時間圖譜、空間圖譜、意愿圖譜等作為主要構(gòu)成集合。
(1)自殺圖譜。本研究利用大數(shù)據(jù)文本處理技術(shù)監(jiān)控高、中、底三級自殺危機學生群體。根據(jù)自殺方式(采用何種行為方式實施自殺計劃,如跳樓、投河、服藥、上吊等)、自殺計劃(根據(jù)自殺計劃的詳細具體程度判定,計劃越詳細、實施的可能性越大)、自殺行動(根據(jù)采取自殺行動,如相約自殺、遺言自殺等)描述進行記分評估。
(2)時間圖譜。時間圖譜是對危機事件中嵌入時間的描述,包括絕對時間(如日歷、節(jié)假日等)和相對時間(如過去、現(xiàn)在、將來等)的描述。
(3)空間圖譜??臻g圖譜或稱為地點圖譜,是對危機事件中嵌入空間地理位置的描述,包括定位地點(自媒體軟件定位)和描述地點(空間地理位置的文本描述)。
(4)意愿圖譜。意愿圖譜是對危機事件的主體的主觀愿望或相近情緒的描述,主要用于判定分析危機主體是否有自殺意愿及自殺意愿強烈程度(分為不想自殺、比較想自殺、非常想自殺三級)。
根據(jù)以上危機預(yù)警分級標準,進行語義數(shù)據(jù)處理,對抓取的數(shù)據(jù)進行數(shù)據(jù)挖掘、分析,生成對應(yīng)的危機預(yù)警報告,針對高危、中危、低危三級不同危機程度,采取相應(yīng)的危機干預(yù)行動方案。
危機預(yù)防智能系統(tǒng)
本研究根據(jù)心理危機預(yù)警分級標準,建立語義大數(shù)據(jù)處理流程,能夠每天固定時間段從系統(tǒng)抓取數(shù)據(jù),進行數(shù)據(jù)清洗、數(shù)據(jù)分析、結(jié)果報告、危機判斷、生成報告等步驟,并根據(jù)危機報告結(jié)合人工評估復(fù)核,最后制訂危機干預(yù)方案,進行危機干預(yù)行動。
本研究對心理危機預(yù)警的文本處理過程如下頁圖所示,大數(shù)據(jù)分析通過以下幾個步驟完成。
(1)數(shù)據(jù)抓取:利用八爪魚工具在微博抓取當天數(shù)據(jù),生成HTML格式數(shù)據(jù)。數(shù)據(jù)抓取模塊需要根據(jù)各個知識圖譜設(shè)定操作化指標判斷需要抓取的數(shù)據(jù),且避免重復(fù)抓取造成數(shù)據(jù)冗余。
(2)數(shù)據(jù)清洗:把抓取的數(shù)據(jù)對其每一條信息提取關(guān)鍵詞信息,關(guān)鍵詞需要10個屬性——時間、發(fā)文地址、微博賬號、微博名稱、文案內(nèi)容、情緒關(guān)鍵詞、回復(fù)對象微博名稱、回復(fù)對象微博地址、回復(fù)內(nèi)容、回復(fù)情緒關(guān)鍵詞,將關(guān)鍵詞信息生成一個文件,將其他無關(guān)信息刪除。
(3)數(shù)據(jù)分析:將數(shù)據(jù)清洗后匯總文件進行分析處理。采用自然語言處理工具進行分詞與句法分析。采用知識圖譜進行推理分析,分級提取信息:0~3級為低危,3~6級為中危,7~10級為高危。這一過程需要使用知識圖譜及其風險判斷的規(guī)則算法。這些規(guī)則采用了基于邏輯程序語言Prolog中的定義子句文法(Definite Clause Grammars,DCG)知識轉(zhuǎn)換規(guī)則。對于DCG規(guī)則加上面向知識圖譜推理能力的擴展描述,從知識圖譜中獲得領(lǐng)域知識的理解來解讀每一條信息,以判斷此信息的風險級別,如定義8級危機風險為:自殺計劃已定,自殺日期基本確定。描述這種邏輯程序規(guī)則的算法為:
Statement(crisis risk(7),[plan,time)),-->
Uninterested Text(_M1),rdfs Subclass of (Time, future, timeOntology),
Uninterested Text(_M2),rdfs Subclass of (Plan, crisisplan, crisisOntology),
Uninterested Text(_M3).
Statement(crisis risk(7),[plan,time)),-->
Uninterested Text(_M1),
rdfs Subclass of (Plan, crsisPlan, crsisOntology),
Uninterested Text(_M2),
rdfs Subclass of (Time future,timeOntology),
Uninterested Text(_M3).
這一算法邏輯為:如果一條信息談到自殺計劃和自殺時間,且沒有關(guān)于這個自殺計劃的否定表達,這條信息將被判斷為危機風險7級,即高危風險。
(4)危機判斷:上述算法規(guī)則中,“rdfs Subclass of”用于判斷是否包含自殺圖譜中描述的某種自殺計劃及時間圖譜中關(guān)于將來的時間描述?!皍ninterestedText”進一步判斷這個語句不包含否定愿望圖譜。根據(jù)算法篩選評估信息危機評分:7~10分為高危信息,4~6分為中危信息,0~3分為低危信息。
(5)生成報告:根據(jù)算法評估結(jié)果,生成大數(shù)據(jù)危機預(yù)警報告。高危信息為立刻上報人工復(fù)核處理,中危信息為每天固定時間上報,待人工復(fù)核,低危信息為過濾信息,不做處理。
(6)人工復(fù)核:高校心理健康中心組織心理學專家團隊進行人工復(fù)核,專家根據(jù)平臺預(yù)警信息追溯信息來源,對文本進行專業(yè)評估,如復(fù)核結(jié)果為高危自殺信息,會立刻通知學校危機干預(yù)工作團隊,如復(fù)核結(jié)果為中危自殺信息,會定期通知學校危機干預(yù)工作團隊。
(7)危機方案制訂:學校危機干預(yù)工作團隊根據(jù)大數(shù)據(jù)報告和人工復(fù)核結(jié)果,迅速做出反應(yīng),制訂對應(yīng)的危機干預(yù)方案。
(8)危機干預(yù)行動:學校由學生處、保衛(wèi)處、校醫(yī)院等多個危機干預(yù)核心部門協(xié)同展開危機干預(yù)行動,及時聯(lián)系校外醫(yī)院、公安等部門聯(lián)動,力求在最短時間內(nèi)化解危機。
結(jié)果分析
本研究通過對選定的某高校大學生學生微博數(shù)據(jù)進行實時監(jiān)控,從2018年1月至2019年1月,每日發(fā)布危機報告。為了評估該系統(tǒng)的危機干預(yù)大數(shù)據(jù)分析的信度與效度,隨機抽取了30天的監(jiān)控數(shù)據(jù)進行人工數(shù)據(jù)分析檢驗。數(shù)據(jù)共有42702條危機信息,平均每天1423.4條有效信息,其中發(fā)現(xiàn)了58條高危信息(7級以上),125條中危信息(4~6級),587條低危信息(3級以下)。通過對中危、高危信息進行大數(shù)據(jù)結(jié)果和人工復(fù)核結(jié)果的風險級別和正確率進行分析發(fā)現(xiàn),本研究心理危機預(yù)警的大數(shù)據(jù)評估結(jié)果高危信息檢出正確率為84.98%,中危信息檢出正確率為78.74%,低危信息檢出正確率為72.36%,總體平均正確率為78.69%。本研究從42702條信息中抓取770條危機信息,抓取1.80%危機數(shù)據(jù),剔除98.20%無效信息,大大減輕了人工復(fù)核的工作量,從而提高人工復(fù)核的工作效率和復(fù)核準確率。
盡管本研究的風險信息報告的平均正確率為78.69%,但是大數(shù)據(jù)報告生成后,仍然立刻對危機信息進行人工復(fù)核,即讓心理學專業(yè)人員進行文本評估后,再制訂危機干預(yù)方案,從而保證了危機干預(yù)行動沒有出現(xiàn)誤判或失誤。
本研究對心理危機預(yù)警的危機評估和危機干預(yù)中體現(xiàn)了大數(shù)據(jù)分析的優(yōu)勢,尤其是知識圖譜的技術(shù)特點。雖然本系統(tǒng)不能做到100%的危機檢出率,但本研究將從這些遺漏信息中再次分析,以改進現(xiàn)有的危機判斷規(guī)則,提高大數(shù)據(jù)技術(shù)支撐的決策準確率。
結(jié)論
本研究采用文本處理技術(shù)建立高校心理智能干預(yù)平臺,對特定群體的大學生社交媒體信息進行實時監(jiān)控,發(fā)現(xiàn)心理危機信息并生成危機報告進行預(yù)警,進而為高校心理中心提供危機干預(yù)方案和行動的數(shù)據(jù)支撐。通過一年的數(shù)據(jù)監(jiān)測,監(jiān)測結(jié)果充分證明了大數(shù)據(jù)技術(shù)在心理危機預(yù)警與危機干預(yù)領(lǐng)域中的巨大應(yīng)用價值和發(fā)展空間。大數(shù)據(jù)技術(shù)作為心理危機干預(yù)的支撐,拓展了大數(shù)據(jù)的技術(shù)價值,提高了危機檢出率,減少了自殺發(fā)生率,突出了大數(shù)據(jù)技術(shù)的社會價值。今后的研究將進一步改進危機判斷規(guī)則與算法,以提高大數(shù)據(jù)技術(shù)的正確檢出率。
參考文獻:
[1]習近平.決勝全面建成小康社會奪取新時代中國特色社會主義偉大勝利——在中國共產(chǎn)黨第十九次全國代表大會上的報告[N].人民日報,2017-10-28(01).
[2]高雯,董成文,竇廣波,等.心理危機干預(yù)的任務(wù)模型[J].中國心理衛(wèi)生雜志, 2017,31(01):89-93.
[3]高勁松,黃梅,付家煒.基于年度高頻關(guān)鍵詞的研究熱點提取與可視化研究[J].現(xiàn)代情報,2020,40(12):130-139.
[4]李飛,葛魯嘉.大數(shù)據(jù)之于心理健康教育:功能邊界與實施取向[J].思想理論教育,2016(07):87-91.
[5]張麗,周建松,李凌江.精神創(chuàng)傷急性期危機干預(yù)方法評價[J].中國心理衛(wèi)生雜志, ?2016,30(08):561-567.
[6]陳真真,楊雪梅.中小學生心理援助熱線來電者的特征及咨詢內(nèi)容[J].中國心理衛(wèi)生雜志,2016,30(12):933-935.
[7]馬海群,張濤,李鐘雋.新時代文獻信息的價值重構(gòu):人工智能技術(shù)和智慧服務(wù)[J/OL].情報理論與實踐,2020.
[8]陳婉珍,何雪松.大數(shù)據(jù)驅(qū)動的社會工作:前景與挑戰(zhàn)[J].社會科學,2017(07):74-81.
[9]張倩,鄭涌.創(chuàng)傷后成長:5·12地震創(chuàng)傷的新視角[J].心理科學進展,2009,17(03):623-630.
作者簡介:王會麗(1985—),河北雄安人,重慶大學副教授,研究方向為心理健康教育。
本文為2019年度教育部人文社會科學研究項目“基于大數(shù)據(jù)的高校心理危機‘實時評估—智能風控—危機干預(yù)—發(fā)展可塑智能機制”2018年重慶市教委人文社會科學研究項目(18SKSZ001)“大數(shù)據(jù)時代增強青年文化自信的引領(lǐng)力與凝聚力研究”的階段性成果,2018年重慶市“十三五”教育科學規(guī)劃重點項目(2018-GX-083)“基于大數(shù)據(jù)的高校心理健康服務(wù)智能化服務(wù)體系研究”、重慶大學“心理育人”名師工作室(2020SZK-19)等階段性成果。