王冬燕,張秀琴,周甦
摘要:在疫情的大環(huán)境下,大學(xué)生的心理健康狀況需要更多的關(guān)注。本文通過文本采集及分析工具和技術(shù),對(duì)大學(xué)生較為關(guān)注的幾個(gè)心理健康方面進(jìn)行了文本收集、預(yù)處理與文本挖掘分析。從語義網(wǎng)絡(luò)模型,可以看出大學(xué)生目前最關(guān)心的是情緒問題,其次是與他人的交往。高校教育者需要更多地關(guān)注大學(xué)生的情緒,在疫情期間,盡可能幫助他們創(chuàng)造更多的機(jī)會(huì)與他人交往。
關(guān)鍵詞:文本挖掘;語義網(wǎng)絡(luò)模型;心理健康
中圖分類號(hào):TP311? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2022)32-0020-02
1 問題提出
疫情背景下,大學(xué)生心理健康問題尤為受到關(guān)注。國家也多次出臺(tái)《高等學(xué)校學(xué)生心理健康教育指導(dǎo)綱要》等文件,旨在強(qiáng)調(diào)心理健康教育在高校中的重要地位?,F(xiàn)在心理健康課程和心理咨詢都在高校中發(fā)揮重要作用,可是隨著疫情的發(fā)生,很多課程改為線上形式,這樣就不能讓學(xué)生體驗(yàn)面對(duì)面的情感交流,因此在課程形式上也是不斷改進(jìn),希望能給予學(xué)生盡可能多的幫助。有研究表明,社會(huì)環(huán)境的變化會(huì)對(duì)人的心理產(chǎn)生巨大而深刻的影響[1]。因此為了彌補(bǔ)不能當(dāng)面交流的情況,也為了能在疫情環(huán)境下更好地掌握學(xué)生當(dāng)下的心態(tài),同時(shí)順應(yīng)“互聯(lián)網(wǎng) + ”時(shí)代的課改要求,教師可以利用課余時(shí)間,讓學(xué)生以文字的方式寫下困惑或煩惱,以便在課程中有針對(duì)性地討論。而這些文本一方面可以作為課上討論的參考,另一方面,可以進(jìn)行整體的分析,從而了解學(xué)生目前集中的心理問題點(diǎn)。
在心理現(xiàn)象的研究中,大多采用數(shù)據(jù)的形式,以及有關(guān)數(shù)據(jù)的統(tǒng)計(jì)分析方法,較少采用純文本的分析方法,除了質(zhì)性研究。因此,想了解學(xué)生關(guān)注的問題有什么特點(diǎn),如果用傳統(tǒng)的統(tǒng)計(jì)方法,很難對(duì)這種文本的描述方式進(jìn)行分析,需要借助數(shù)據(jù)挖掘方法中的文本挖掘方法。文本挖掘(Text Mining)是從非結(jié)構(gòu)化文本中獲取有用信息的[2]。文本挖掘也是機(jī)器學(xué)習(xí)的一種方法,可以幫助我們找到隱藏的相互關(guān)系。文本挖掘不強(qiáng)調(diào)文本的計(jì)算和定量分析,而是通過理論揭露隱藏的觀點(diǎn)和真相。文本挖掘的應(yīng)用非常廣泛,尤其在輿情[3-4]、用戶評(píng)價(jià)等方面應(yīng)用較多[5-6],在心理學(xué)的研究中應(yīng)用較少。一般會(huì)與網(wǎng)絡(luò)爬蟲技術(shù)結(jié)合使用,爬取文本信息后,再進(jìn)行相關(guān)語義分析。文本挖掘過程需要從海量的文本信息中提取重要可用的信息,因此要經(jīng)過文本整理、文本的分詞、提取高頻詞等一系列預(yù)處理過程,才能最終建立語義模型。而對(duì)文本進(jìn)行預(yù)處理,詞的分割、單詞去除和特征提取等過程都十分重要[7]。本研究則利用ROSTCM6 軟件,對(duì)采集的學(xué)生問題文本進(jìn)行分詞處理、高頻詞匯統(tǒng)計(jì)以及語義網(wǎng)絡(luò)模型的分析,使繁雜的文本內(nèi)容得到提煉與簡化,從而了解學(xué)生較為關(guān)注的問題焦點(diǎn)在哪里。
2 研究方法
(1)研究對(duì)象
南京中醫(yī)藥大學(xué)大一新生349名,在整學(xué)期課程中圍繞:自我意識(shí)、人際關(guān)系、戀愛與性、壓力與情緒四個(gè)主題,讓學(xué)生分別寫出自己的困惑,共收集有效問題490條。
(2)分詞與詞頻整理
首先,需要進(jìn)行數(shù)據(jù)的預(yù)處理。對(duì)于文本而言,就是將文本格式同一,并對(duì)內(nèi)容進(jìn)行過濾,例如將一些無意義詞或者出現(xiàn)次數(shù)較多的單字詞刪除。利用ROSTCM6 軟件的“分詞”功能對(duì)文本進(jìn)行分詞[6]。分詞后,將與研究內(nèi)容關(guān)聯(lián)程度較弱的詞,例如“怎么辦” “什么”等無意義詞刪除,并另存為新的分詞文件。
其次,對(duì)過濾過的分詞文件進(jìn)行詞頻統(tǒng)計(jì),得到一個(gè)較長的詞頻統(tǒng)計(jì)表,由于篇幅太大,詞頻頻數(shù)也逐漸遞減,因此只列舉前12個(gè)關(guān)鍵詞頻表,見表1。從表中可以看出,用于分析大學(xué)生關(guān)注的心理健康問題的高頻詞匯中,名詞主要有情緒、戀愛、自我、關(guān)系、朋友、他人和異性;而動(dòng)詞則有認(rèn)知、影響、交往、相處和控制。可見大學(xué)生比較關(guān)注情緒、自我,以及交往中的各種問題。
(3)建立語義網(wǎng)絡(luò)模型
從語義網(wǎng)絡(luò)模型看,有點(diǎn)類似神經(jīng)網(wǎng)絡(luò)的樣子,都是由一個(gè)個(gè)節(jié)點(diǎn)組成。而詞語就是這網(wǎng)絡(luò)中的一個(gè)個(gè)節(jié)點(diǎn),詞語之間的聯(lián)系(也就是節(jié)點(diǎn)之間的聯(lián)系)則表明了它們之間的相互關(guān)系。由于詞語是否共現(xiàn),以及共現(xiàn)頻次的高低,也預(yù)示著節(jié)點(diǎn)不同的地位和角色。一般情況下,關(guān)鍵詞都反映了話題的討論熱點(diǎn)。有些詞與詞聯(lián)系緊密,有些則相對(duì)比較疏遠(yuǎn)。因此通過語義網(wǎng)絡(luò)分析,可以發(fā)現(xiàn)隱藏的很多關(guān)系,對(duì)分析學(xué)生討論的話題熱點(diǎn)有一定的幫助。
利用分詞后刪除整理過的語句表建立語義網(wǎng)絡(luò)模型,經(jīng)過分析,得到核心詞語義網(wǎng)絡(luò)分析圖,從網(wǎng)絡(luò)圖中可以看出數(shù)據(jù)內(nèi)容的核心是圍繞“情緒”“自我”“戀愛”和“朋友”等關(guān)鍵詞展開,說明了大學(xué)生很關(guān)心的核心問題大概集中在這些方面。從語義模型分析圖中的箭頭指向,可以看出“情緒”和“自我”是學(xué)生困惑的主要來源,見圖1。
3 討論
從各個(gè)大學(xué)不斷完善心理健康課程與咨詢服務(wù),可見大學(xué)生的心理健康狀況是很受重視的。在疫情背景下,大學(xué)生的心理健康更是需要更多關(guān)注。從語義模型中可以看出,首先,大學(xué)生最關(guān)心的就是情緒問題。包括從情緒節(jié)點(diǎn)出發(fā)的情緒認(rèn)識(shí)、調(diào)節(jié)和控制等,以及回到情緒節(jié)點(diǎn)的他人的情緒、時(shí)常的情緒,負(fù)面的情緒怎樣去面對(duì)。其次,大學(xué)生很迫切地想要了解自己,從而能更好地投入友誼與愛情的關(guān)系中去。全面、完善、影響、偏差等詞都與自我緊密相關(guān),而朋友與戀愛也都是從自我的發(fā)展中引出的。朋友和戀愛之間的關(guān)系也是十分微妙,較多的學(xué)生會(huì)糾結(jié)在是友誼還是愛情的困惑里。最后,本研究是在課程上,圍繞情緒、人際關(guān)系、自我和戀愛幾個(gè)主題來討論的,可是我們通常認(rèn)為的最主要的人際問題,在語義網(wǎng)絡(luò)中都被分散到了其他主題中,比如他人的情緒的認(rèn)識(shí),自我與交友的關(guān)系,朋友和戀愛中的表達(dá)與聯(lián)系等,無不隱藏著人際關(guān)系的問題。再看學(xué)生的具體問題,比如“在別人面前表現(xiàn)負(fù)面情緒是不是不好”“很害怕拒絕他人,該怎么調(diào)整”“戀愛中能不能表現(xiàn)真實(shí)的自己”……大多數(shù)的問題都不僅僅是一個(gè)維度,里面都包含著自我的認(rèn)知與成長,以及怎樣處理現(xiàn)在的關(guān)系,如何讓關(guān)系變得更好。因此,從語義模型中,會(huì)發(fā)現(xiàn)自我是學(xué)生關(guān)注的一個(gè)焦點(diǎn),而在表1的詞頻中,大多高頻詞匯與交往有關(guān),可見學(xué)生對(duì)良好的人際關(guān)系的重視與渴望。情緒與交往也是疫情環(huán)境下,比較容易出現(xiàn)困惑的方面,需要高校的管理者以及心理健康老師格外要關(guān)心,主動(dòng)幫助學(xué)生去面對(duì)和解決的問題。
在大數(shù)據(jù)時(shí)代,每時(shí)每刻都會(huì)產(chǎn)生大量的數(shù)據(jù)。用人工或者傳統(tǒng)的心理統(tǒng)計(jì)方法,往往已經(jīng)滿足不了研究者的需要,也會(huì)在處理復(fù)雜數(shù)據(jù)中產(chǎn)生更多的困難。心理學(xué)的研究也是會(huì)涉及更多跨學(xué)科的內(nèi)容,比如說人工智能,如果還用傳統(tǒng)的實(shí)驗(yàn)和測(cè)量也是不夠的,而且不能全面地反映問題。文本提取,為心理學(xué)研究提供了新的思路,在條件允許的情況下,我們可以做更多的主觀研究來代替客觀數(shù)據(jù)。對(duì)被試來說,有更大的發(fā)揮空間和自由,不必拘泥于固定的實(shí)驗(yàn)范式或問卷描述。而研究者要做的,就是如何從主觀文本中獲得更多的相關(guān)信息與結(jié)論。雖然沒有了統(tǒng)計(jì)學(xué)的p值,準(zhǔn)確性略有下降,但可以有效地提取大量信息,仍然可以給研究者帶來啟發(fā)和思考??傊谋就诰蚣夹g(shù)易于理解且具有良好的可操作性,可重復(fù)性,便于心理學(xué)領(lǐng)域廣泛使用。
4 建議與結(jié)論
(1)大學(xué)生關(guān)注的心理健康問題主要集中在情緒的管理和與他人的交往方面。另外,學(xué)生對(duì)這種能給予解答的課堂充滿興趣,而且可以得到同輩人的建議,對(duì)學(xué)生來說參與性十分高。大多數(shù)學(xué)生認(rèn)為通過這種討論的方式,可以讓他們發(fā)現(xiàn)很多問題都是這個(gè)年齡共有的問題,因此更容易自我開導(dǎo),反而使一些困惑很輕松地被解決,至少能被自己接受。
(2)文本挖掘的方法可以很好地用于分析心理問題。文本挖掘和大多數(shù)據(jù)挖掘方法一樣,對(duì)數(shù)據(jù)的形式不是很嚴(yán)格,且能挖掘出一些意想不到的信息,這對(duì)在繁雜的心理現(xiàn)象中發(fā)現(xiàn)更多的關(guān)系,是十分有幫助的。
參考文獻(xiàn):
[1] 俞國良,王浩.文化潮流與社會(huì)轉(zhuǎn)型:影響我國青少年心理健康狀況的重要因素及現(xiàn)實(shí)策略[J].西南民族大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2020,41(9):213-219.
[2] 薛為民,陸玉昌.文本挖掘技術(shù)研究[J].北京聯(lián)合大學(xué)學(xué)報(bào)(自然科學(xué)版),2005,19(4):59-63.
[3] 姚麗梅,楊秋娜,繆林.基于新媒體文本挖掘的高校在線教學(xué)輿情事件分析[J].呼倫貝爾學(xué)院學(xué)報(bào),2020,28(5):114-119.
[4] 楊單,程鍵,姚怡琦,等.基于文本挖掘的高校網(wǎng)絡(luò)輿情用戶情感分析研究[J].武漢紡織大學(xué)學(xué)報(bào),2020,33(5):74-80.
[5] 孟令爽.基于文本挖掘技術(shù)的用戶產(chǎn)品評(píng)論研究[D].石家莊:河北經(jīng)貿(mào)大學(xué),2022.
[6] 劉音.基于文本挖掘的網(wǎng)購產(chǎn)品評(píng)論穩(wěn)健情感分類研究[D].南昌:江西財(cái)經(jīng)大學(xué),2021.
[7] 張幸芝,雷潤玲,楊超.文本挖掘——基于ROSTCM和NetDraw的內(nèi)容分析[J].科技文獻(xiàn)信息管理,2017,31(1):17-21,33.
【通聯(lián)編輯:李雅琪】