国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

文本挖掘技術(shù)下大學(xué)生群體心理狀態(tài)研究

2023-12-08 08:39:30西南民族大學(xué)經(jīng)濟學(xué)院孫婷覃繼桃馬潤昕西南民族大學(xué)電子信息學(xué)院吳霞
辦公室業(yè)務(wù) 2023年22期
關(guān)鍵詞:特征詞心理健康文本

文/西南民族大學(xué)經(jīng)濟學(xué)院 孫婷 覃繼桃 馬潤昕;西南民族大學(xué)電子信息學(xué)院 吳霞

一、問題研究

黨的十八大以來,以習(xí)近平同志為核心的黨中央高度重視大學(xué)生心理健康工作。張守連等認(rèn)為掌握大學(xué)生群體的認(rèn)知規(guī)律和心理特征可以提升其思想政治教育獲得感[1]。吳海燕根據(jù)大學(xué)生特殊群體心理特征和行為特征,探討了心理健康教育途徑[2]。李莉等提出探索心理教育創(chuàng)新機制的前提是緊密把握大學(xué)生群體的心理特點[3]。

在對研究大學(xué)生心理健康問題所采用的方法上,王東方等采用問卷和訪談的方法,考察心理體驗評估(CAPE-P8)的效度和信度[4]。白學(xué)軍等對被試進行深度訪談,探索耐挫心理結(jié)構(gòu)的因素構(gòu)成[5]。張迪宇采用癥狀自評量表(SCL-90)、心理健康量表(MHS-CS)評價心理健康狀況[6]。社交媒體的廣泛應(yīng)用為我們了解大學(xué)生心理狀態(tài)提供了新的思路,如可通過文本挖掘網(wǎng)絡(luò)用戶的情感傾向等。從社會心理學(xué)的角度來說,當(dāng)前的學(xué)者側(cè)重于理論研究,對于數(shù)據(jù)分析較少。而大學(xué)生作為使用互聯(lián)網(wǎng)的主流群體,不應(yīng)忽視其在網(wǎng)絡(luò)平臺的發(fā)言等關(guān)鍵信息。

二、研究方法與數(shù)據(jù)來源

文本挖掘是指從大量沒有結(jié)構(gòu)的文本數(shù)據(jù)中抽取所需要的信息或知識,并將其轉(zhuǎn)化為有結(jié)構(gòu)的數(shù)據(jù)的過程。本文采用文本挖掘的方法,從社會心理學(xué)的視角,對大學(xué)生在百度貼吧上發(fā)表的文本數(shù)據(jù)進行文本挖掘,通過文本情感分析將百度貼吧文本情感劃分為積極、消極和中性三種心理情感狀態(tài),從而判斷大學(xué)生群體的心理狀態(tài),并通過構(gòu)建主題模型深入挖掘情感的影響因素。具體文本挖掘流程如圖1所示。

圖1 大學(xué)生情感文本挖掘流程圖

(一)數(shù)據(jù)獲取與預(yù)處理。網(wǎng)絡(luò)爬蟲通過模仿瀏覽器,能夠自動獲取用戶需要的網(wǎng)頁信息。本研究通過python 軟件并采用網(wǎng)絡(luò)爬蟲的方法,獲取了成都市八所高校大學(xué)生在百度貼吧上的網(wǎng)絡(luò)言論共36923 條。爬取到的百度貼吧文本數(shù)據(jù)包含帖子的作者昵稱、內(nèi)容、時間、ID 號、點贊和回復(fù)數(shù)量,未涉及作者個人信息和地理位置等信息,高度重視作者的隱私保護。文本數(shù)據(jù)預(yù)處理:首先使用panda 庫讀取數(shù)據(jù)進行清洗,采用jieba 分詞工具分詞,然后進行詞性標(biāo)注,并刪除無意義且出現(xiàn)頻率高的停用詞,最后進行詞頻統(tǒng)計。

(二)網(wǎng)絡(luò)文本情感分析。使用情感詞典是目前情感挖掘的主要使用方法,通過匹配文本情感詞,將其匯總后進行評分,能得到文本的情感傾向。使用情感詞典的情感分析方法主要有兩種:第一種是基于BosonNLP 情感詞典;第二種是基于知網(wǎng)情感詞典的情感挖掘原理。情感分析研究采用Python 程序和知網(wǎng)情感詞典結(jié)合進行情感挖掘,其分析準(zhǔn)確率達(dá)到90%。本研究采用第二種方法進行情感分析。

(三)情感百度貼吧文本主題挖掘。由于詞云圖無法精準(zhǔn)判斷情感特征詞,為進一步探究大學(xué)生積極與消極兩種情感的影響因素,本文采用了將LDA 主題模型和TF-IDF 算法相結(jié)合的方式深入挖掘積極與消極情感文本的主題及其特征詞。LDA 主題模型是一種可對大量文本主題信息特征進行建模的三層貝葉斯模型,可用于挖掘文本的潛在主題。TF-IDF 算法是一種用于信息檢索與數(shù)據(jù)挖掘的常用加權(quán)技術(shù),由詞頻和逆文檔詞頻兩部分組成。TF-IDF 算法對文本特征詞重要性辨別程度較高,彌補了LDA 主題分布在考慮語義分析時特征詞對描述主題重要性無法判別的缺點。

三、研究情況與分析

(一)情感狀態(tài)分析。通過知網(wǎng)情感詞典的情感挖掘,將從百度貼吧上爬取到的八所高校學(xué)生發(fā)表的36923 條網(wǎng)絡(luò)發(fā)言,分為積極、消極、中性三種情感極性,其中積極性網(wǎng)絡(luò)發(fā)言13437 條,消極性網(wǎng)絡(luò)發(fā)言4569 條,中性網(wǎng)絡(luò)發(fā)言18917 條。高校大學(xué)生在社交媒體上的網(wǎng)絡(luò)發(fā)言以中性為主,占比超過高校大學(xué)生發(fā)言總數(shù)的一半,而積極性網(wǎng)絡(luò)發(fā)言僅占了發(fā)言總數(shù)的36.39%,消極性網(wǎng)絡(luò)發(fā)言占發(fā)言總數(shù)的12.37%。從三種情緒極性占比來看,高校大學(xué)生群體在社交媒體上的積極性網(wǎng)絡(luò)發(fā)言較少,這從一定程度上反映了大多數(shù)高校大學(xué)生群體在某段時間內(nèi)的情感傾向并非完全正能量化。

(二)大學(xué)生心理情緒狀態(tài)的影響因素分析。1.積極文本下的LDA 主題模型分布。從積極文本的LDA 主題模型分布來看,高校大學(xué)生積極情緒的影響因素主要有:(1)集體的友好人際關(guān)系。表1 中的Topic6 和Topic8 反映本科生和研究生以及低年級和高年級學(xué)生之間關(guān)于考研或?qū)W習(xí)經(jīng)驗分享的現(xiàn)象,Topic11 中“感謝”“好心人”等詞反映了老師與同學(xué)、同學(xué)與同學(xué)之間的良好關(guān)系。(2)需求得到滿足。在學(xué)習(xí)上、生活中、個人情感的需求得到滿足可以引發(fā)積極情緒,體現(xiàn)在“學(xué)習(xí)”“淘寶”“吃貨”“表白”等特征詞上。(3)興趣和目標(biāo)。由表1 中Topic12 的特征詞“希望”“興趣”“祝?!钡确从沉藢W(xué)生帶著興趣去完成一件事情或者祝福他人時,會引發(fā)積極情緒。(4)良好的環(huán)境。良好的城市和校園文化氛圍能夠讓人產(chǎn)生積極情緒。表1 的“成都”“學(xué)?!钡忍卣髟~反映了學(xué)生對地區(qū)和學(xué)校的滿意度,在一定程度上引發(fā)了大學(xué)生的積極情緒。

表1 積極情緒文本主題挖掘特征詞

2.消極文本下的LDA 主題模型分布。從消極文本的LDA 主題模型分布來看,高校大學(xué)生消極情緒的影響因素主要有:(1)學(xué)業(yè)和生活壓力。表2 中Topic3描述了學(xué)生參加某些活動、考試、畢業(yè)等事件帶來的壓力。各主題中“考研”“考試”“圖書館”“穿戴”等特征詞反映高校大學(xué)生面臨著學(xué)業(yè)和生活中的壓力,由此引發(fā)消極情緒,部分學(xué)生抗壓能力較弱。(2)就業(yè)壓力。表2 中Topic4 描述了大學(xué)生面臨畢業(yè)后就業(yè)、實習(xí)等各類問題,“難受”“受不了”等特征詞反映了大學(xué)生的感受。社會競爭的激烈和就業(yè)市場的不景氣,導(dǎo)致大學(xué)生就業(yè)壓力越來越大,消極的心理情緒也由此產(chǎn)生。(3)疫情防控。表2 中特征詞“隔離”“學(xué)?!薄盁o聊”反映了大學(xué)生因為疫情防控,導(dǎo)致活動范圍局限于學(xué)校甚至寢室,給生活和學(xué)習(xí)帶來了不便。(4)交際困難。由表2 中Topic2 的“不好”“宿舍”“老師”等特征詞反映高校大學(xué)生在宿舍關(guān)系、師生關(guān)系、同學(xué)關(guān)系的建立與維系上存在一定難度。不良的人際交往會阻礙身心的正常發(fā)展,從而導(dǎo)致消極心理的產(chǎn)生。(5)反詐防騙意識不強。表2 中的Topic4 描述了部分大學(xué)生由于防騙意識弱,導(dǎo)致上當(dāng)受騙,引發(fā)受騙學(xué)生消極情緒。根據(jù)相關(guān)研究顯示,近年我國的大學(xué)生上當(dāng)受騙人數(shù)大幅上漲,對大學(xué)生造成了心理上的傷害和恐慌。

表2 消極情緒文本主題挖掘特征詞

四、結(jié)論與建議

綜上所述,高校大學(xué)生群體發(fā)表在社交媒體上的言論積極性程度不高,帶有消極情緒的網(wǎng)絡(luò)發(fā)言較多,大多數(shù)大學(xué)生群體的情感傾向并非正能量化。

根據(jù)上文結(jié)果分析,為各高校的學(xué)生心理健康教育提出以下建議:第一,高校應(yīng)充分整合心理健康教育資源,將心理健康的理論知識和相關(guān)實踐相結(jié)合,針對大學(xué)生生理、心理發(fā)展趨向,構(gòu)建全方位、多渠道,既分工明確又相互配合的心理健康教育體系。通過心理健康必修課程及思政課程,提升大學(xué)生心理素養(yǎng)和綜合素質(zhì)。第二,疏導(dǎo)學(xué)生學(xué)業(yè)和就業(yè)壓力,積極引導(dǎo)學(xué)生加強抗壓能力,減少因外部環(huán)境變化對自身的影響。學(xué)校應(yīng)通過開展相關(guān)講座、心理輔導(dǎo)課程、班主任一對一談話等措施,疏導(dǎo)學(xué)生壓力,提高學(xué)生自身的抗壓能力。第三,鼓勵學(xué)生加強人際關(guān)系建設(shè)。學(xué)校應(yīng)加大校園文化的宣傳,豐富學(xué)生的校園活動,鼓勵學(xué)生走出寢室,通過參加感興趣的社團或各種各樣的活動、比賽結(jié)交朋友,融入群體,通過積極群體的傳染性提高大學(xué)生心理情緒的積極性。第四,提高學(xué)生防騙意識和能力。各高校應(yīng)積極開展防詐防騙教育,加強防騙宣傳工作,通過宣傳欄、錄制視頻、編排節(jié)目、舉辦講座等方式提升大學(xué)生防騙意識和能力。建立學(xué)生受騙后心理撫慰機制,在學(xué)生被騙后及時進行心理輔導(dǎo),對受騙人的心理狀態(tài)進行監(jiān)測,防止學(xué)生出現(xiàn)心理壓力過重的情況,導(dǎo)致嚴(yán)重的后果。

本研究選擇的目標(biāo)院校在地區(qū)和數(shù)量上有一定的局限,獲取的數(shù)據(jù)僅來源于百度貼吧且數(shù)據(jù)覆蓋面和研究范圍有限,研究結(jié)果的普適性有待進一步考證。以后將繼續(xù)深入挖掘數(shù)據(jù),拓展數(shù)據(jù)來源,優(yōu)化挖掘方法,使研究結(jié)果更準(zhǔn)確。

猜你喜歡
特征詞心理健康文本
心理健康
品牌研究(2022年9期)2022-04-06 02:41:56
心理健康
品牌研究(2022年8期)2022-03-23 06:49:06
心理健康
品牌研究(2022年6期)2022-03-23 05:25:50
心理健康
品牌研究(2022年1期)2022-03-18 02:01:10
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
基于改進TFIDF算法的郵件分類技術(shù)
產(chǎn)品評論文本中特征詞提取及其關(guān)聯(lián)模型構(gòu)建與應(yīng)用
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
面向文本分類的特征詞選取方法研究與改進
炉霍县| 高青县| 德钦县| 平利县| 永州市| 辽阳市| 沈阳市| 香格里拉县| 咸阳市| 连云港市| 镇雄县| 调兵山市| 常山县| 县级市| 商都县| 富锦市| 霍林郭勒市| 武穴市| 福清市| 温州市| 合肥市| 集贤县| 霍林郭勒市| 汪清县| 墨玉县| 秀山| 阳信县| 玉环县| 楚雄市| 开封县| 东丽区| 邵阳市| 乌拉特后旗| 嘉黎县| 镇赉县| 尼木县| 镶黄旗| 广州市| 凭祥市| 忻城县| 松滋市|