国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于微博的福建地區(qū)居民關(guān)于降雨的情感分析

2022-02-15 03:33余安安吳雪菲李棟任雍劉光普
關(guān)鍵詞:降雨福建居民

余安安,吳雪菲,李棟,任雍,劉光普

(1.福建省災(zāi)害天氣重點(diǎn)實(shí)驗(yàn)室,福州 350008;2.福建省大氣探測(cè)技術(shù)保障中心,福州 350008)

0 引言

隨著互聯(lián)網(wǎng)的發(fā)展,微博已成為國(guó)內(nèi)民眾交流信息和表達(dá)情緒的平臺(tái),為了挖掘大眾對(duì)氣象的真實(shí)需求、動(dòng)態(tài)評(píng)估及把握大眾的氣象感知,如何結(jié)合實(shí)際問題將社交媒體數(shù)據(jù)與氣象工作進(jìn)行融合分析成為國(guó)內(nèi)外學(xué)者研究的熱點(diǎn)與難點(diǎn)。氣象微博情感分析是建立在具體氣象情境下的社會(huì)計(jì)算應(yīng)用,已應(yīng)用在臺(tái)風(fēng)災(zāi)情評(píng)估、霧霾輿情分析和氣候舒適度評(píng)價(jià)等多方面研究,有助于推動(dòng)災(zāi)害研究與預(yù)防、輿情控制、環(huán)境保護(hù)等氣象工作的開展。

從自然語(yǔ)言處理的角度出發(fā),氣象微博情感分析是指對(duì)文本的情感傾向進(jìn)行分類,目前的研究主要集中在粗粒度分類上,即采取二元(正向和負(fù)向)或三元(正向、負(fù)向、中性)的分類方法對(duì)情感進(jìn)行分析。如Meng等[1]提出了將多種機(jī)器學(xué)習(xí)模型用于龍卷風(fēng)、颶風(fēng)、洪水、暴雪等天氣現(xiàn)象相關(guān)數(shù)據(jù)的正負(fù)向公眾情緒分析。Yz等[2]和陳齊超等[3]分別使用知網(wǎng)情感詞典和BosonNLP情感詞典對(duì)關(guān)于臺(tái)風(fēng)“利馬奇”及“米克拉”的積極與消極情感進(jìn)行分析。徐曉涵等[4]使用情感詞匯本體庫(kù)分析霧霾下的正負(fù)面情感。劉麗華等通過[5]SnowNLP平臺(tái)對(duì)鹽城623龍卷風(fēng)冰雹輿情的正負(fù)向情感進(jìn)行分析。張巖等[6]利用樸素貝葉斯情感分類方法分析臺(tái)風(fēng)“山竹”發(fā)生時(shí)微博用戶的積極與消極情緒。張峰等[7]利用基于中文語(yǔ)料的ANN方法對(duì)干旱區(qū)景區(qū)氣候條件的感知進(jìn)行分析。但是情感是一種復(fù)雜的態(tài)度體驗(yàn),不僅類型多樣,還可能同時(shí)存在多種類型,僅從二元或三元的角度分析大眾對(duì)氣象的情感過于籠統(tǒng),進(jìn)一步細(xì)化情感為喜、怒、憂等更貼近生活中真實(shí)的情緒類別是必然且必須的。近年來(lái),細(xì)粒度情感分析常用的手段主要有兩種,即機(jī)器學(xué)習(xí)法和語(yǔ)義詞典法?;跈C(jī)器學(xué)習(xí)的情感分析是通過訓(xùn)練數(shù)據(jù)構(gòu)建算法模型實(shí)現(xiàn)的,如Mondher等[8]建立隨機(jī)森林分類器將Twitter數(shù)據(jù)分成7種情感。Mari等[9]使用CNN-EISC模型將Twitter用戶情感分為4類。Jabreel等[10]建立了基于深度學(xué)習(xí)的二元轉(zhuǎn)換系統(tǒng)對(duì)11種情感類型進(jìn)行分析。趙曉芳等[11]通過深度學(xué)習(xí)模型分別計(jì)算文本與繪文字(Emoji)表情的7種情感強(qiáng)度,實(shí)現(xiàn)對(duì)微博語(yǔ)句的7種情感強(qiáng)度檢測(cè)。王儒等[12]試驗(yàn)了深度學(xué)習(xí)的8種模型在細(xì)分8類情感中的效果,并加入詞向量對(duì)模型進(jìn)行了優(yōu)化。然而訓(xùn)練文本選擇的不穩(wěn)定性以及情感標(biāo)注的主觀性會(huì)對(duì)分析結(jié)果造成很大影響,機(jī)器學(xué)習(xí)法在缺乏情感標(biāo)注的氣象領(lǐng)域存在一定局限性。語(yǔ)義詞典法則是通過構(gòu)建情感詞典進(jìn)行分析[13]。語(yǔ)義詞典法因其泛用性較強(qiáng)受到了許多研究者的青睞。馬海等[14]結(jié)合詞典及轉(zhuǎn)折詞、主張?jiān)~的判別將“紅黃藍(lán)幼兒園事件”中的情感分成14類。Schoene等[15]基于普魯契克情感色輪詞典和LDA模型將社交媒體情感分為8類。敦欣卉等[16]在DUTIR的基礎(chǔ)上構(gòu)建疑問詞詞表及表情符號(hào)詞典,對(duì)8類情感進(jìn)行分析并計(jì)算其強(qiáng)度。Loureiro等[17]和Drown[18]均依托加拿大研究中心構(gòu)建的EmoLex詞匯表分別分析了英國(guó)及西班牙公眾關(guān)于氣候變化的8種情緒和活躍用戶關(guān)于全球氣候變暖的4種情緒。細(xì)粒度情感分析技術(shù)得到了一定程度的發(fā)展,但在氣象領(lǐng)域的研究與應(yīng)用還相對(duì)較少。

福建是降雨大省,中國(guó)暴雨高頻區(qū)之一,全省平均年降水量為1 092.2~2 050.3 mm[19],分析福建居民對(duì)降雨的情感有助于氣象部門描述、分析甚至預(yù)測(cè)降雨對(duì)人們認(rèn)知、人際關(guān)系、群體思維等產(chǎn)生的立體效應(yīng)[20],從而使氣象服務(wù)更加精細(xì),進(jìn)一步促進(jìn)人地和諧發(fā)展。因此,本研究在社會(huì)計(jì)算的指導(dǎo)下,嘗試借助DUTIR通用性強(qiáng)的優(yōu)勢(shì)對(duì)“福建降雨”的相關(guān)微博數(shù)據(jù)進(jìn)行細(xì)粒度情感分析,結(jié)合關(guān)鍵詞挖掘技術(shù)進(jìn)一步研究福建地區(qū)居民關(guān)于天氣及氣候方面的情感,使得分析結(jié)果更為具體、有針對(duì)性,為大數(shù)據(jù)背景下氣象工作提供參考[21]。

1 基于微博的福建地區(qū)居民關(guān)于降雨感知的情感分析

圖1 情感分析流程Figure 1 Sentiment analysis flowchart

1.1 情感分析流程

本研究利用福建地區(qū)用戶發(fā)布的關(guān)于降雨的微博數(shù)據(jù),將用戶的情感傾向分為“樂、好、怒、哀、懼、惡、驚”7類,并得到每類情感的情感傾向度。情感分析流程如圖1所示。首先,通過網(wǎng)絡(luò)爬蟲采集原始數(shù)據(jù)。接著進(jìn)行去噪等預(yù)處理,利用DUTIR對(duì)其進(jìn)行細(xì)粒度情感分析。同時(shí)對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行人工標(biāo)注,利用精確率、召回率以及綜合評(píng)價(jià)指標(biāo)對(duì)分析結(jié)果進(jìn)行評(píng)估。此外,為了更深入地分析,利用關(guān)鍵詞挖掘技術(shù)TF-IDF(term frequency-inverse document 53)法對(duì)分詞后的結(jié)果進(jìn)行統(tǒng)計(jì),從而得知用戶關(guān)心內(nèi)容和影響用戶情感的因素。

1.2 研究方法

1.2.1數(shù)據(jù)采集與處理

選取微博范圍。由于時(shí)間久遠(yuǎn)微博刪除等原因,2017年之前關(guān)于福建地區(qū)降雨的微博數(shù)據(jù)量很小,客觀性較弱,因此本研究時(shí)間段選為2017年1月1日至2021年4月15日,數(shù)據(jù)語(yǔ)言為中文,數(shù)據(jù)內(nèi)容包括:1)關(guān)鍵詞為“降雨”、“下雨”或“雨”+“福建”或“福建九市名稱”;2)關(guān)鍵詞為“降雨”、“下雨”或“雨”且定位為福建省內(nèi)區(qū)域。

采集原始數(shù)據(jù)。利用爬蟲技術(shù),獲取微博字段包括用戶名、微博文本信息、轉(zhuǎn)發(fā)數(shù)量、評(píng)論數(shù)量和點(diǎn)贊數(shù)量。

處理原始數(shù)據(jù)。由于本研究是嘗試通過居民的微博描述來(lái)研究,故數(shù)據(jù)清洗時(shí)刪除了政府、企業(yè)、媒體等干擾數(shù)據(jù),也剔除了與研究無(wú)關(guān)的數(shù)據(jù)和重復(fù)數(shù)據(jù)。

1.2.2 大連理工大學(xué)中文情感詞匯本體庫(kù)

中文情感詞匯本體庫(kù)把情感分為7大類(樂、好、怒、哀、懼、惡、驚),21小類。

1.2.3 細(xì)粒度情感分析

本研究將處理后的每條微博看成獨(dú)立語(yǔ)句,進(jìn)行分詞后,依據(jù)中文情感詞匯本體庫(kù),利用公示(1)可以計(jì)算出每類情感的情感傾向度Sj。

(1)

式(1)中:j表示情感傾向,共有7種情感;S為每類情感傾向度;p為情感詞的情感強(qiáng)度;f為情感詞的出現(xiàn)次數(shù);i為語(yǔ)句中j類情感的情感詞個(gè)數(shù)。因此,通過計(jì)算每類情感傾向的情感傾向度Sj,可以通過公式(2)得到每條語(yǔ)句的情感傾向En:

En={j},j為Sjmax對(duì)應(yīng)的情感傾向

(2)

式(2)中:n表示第n條微博。

由于微博屬于社會(huì)化媒體,具有參與、公開、交流等特性,具備轉(zhuǎn)發(fā)、評(píng)論和點(diǎn)贊等功能,因此轉(zhuǎn)發(fā)、評(píng)論和點(diǎn)贊在一定程度上也表達(dá)了該微博的情感,轉(zhuǎn)發(fā)、評(píng)論和點(diǎn)贊數(shù)量也體現(xiàn)了該微博的情感強(qiáng)度。本研究利用加權(quán)賦值法[8],得到每條微博的最終情感傾向度Sn,具體計(jì)算方法如公式(3)所示:

Sn=(1+0.02x+0.1y+0.2z)∑Sj(j∈{樂、好、怒、哀、懼、惡、驚})

(3)

式(3)中:x表示評(píng)論數(shù)量,y表示點(diǎn)贊數(shù)量,z表示轉(zhuǎn)發(fā)數(shù)量。

1.2.4 評(píng)估分析

由于實(shí)驗(yàn)數(shù)據(jù)集的不對(duì)稱性,實(shí)驗(yàn)中不僅采用準(zhǔn)確率(Accuracy)作為評(píng)價(jià)指標(biāo),還采用精確率(Precision)、召回率(Recall)和綜合評(píng)價(jià)指標(biāo)(F1-score)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)估和分析。真正(True Positive,TP)表示將正類預(yù)測(cè)為正類數(shù)量,真負(fù)(True Negative,TN)表示將負(fù)類預(yù)測(cè)為負(fù)類數(shù)量,假正(False Positive,F(xiàn)P)表示將負(fù)類預(yù)測(cè)為正類數(shù)量,假負(fù)(False Negative,F(xiàn)N)表示將正類預(yù)測(cè)為負(fù)類數(shù)量。

準(zhǔn)確率(Accuracy)為:

(4)

精確率(Precision)為:

(5)

召回率(Recall)為:

(6)

綜合評(píng)價(jià)指標(biāo)(F1-score)為:

(7)

式(7)中:F1-score是精確率和召回率的綜合評(píng)價(jià)指標(biāo),F(xiàn)1-score值高,表示分類識(shí)別效果較好。最終評(píng)價(jià)結(jié)果采用宏平均(Macro Average)算法進(jìn)行統(tǒng)計(jì)分析。

(8)

1.2.5 關(guān)鍵詞分析

TF-IDF是評(píng)估某個(gè)詞對(duì)于文件集中某份文件重要程度的方法。詞的重要性與它在文件中出現(xiàn)的次數(shù)成正比,與它在文件集中出現(xiàn)的次數(shù)成反比。

詞頻(Term Frequency,TF)指的是某個(gè)詞在文件中出現(xiàn)的次數(shù),如公式(9)所示:

(9)

逆向文件頻率(Inverse Document Frequency,IDF)表示如果包含詞條w的文件越少,IDF就越大。

(10)

TF-IDFw=TFw×IDFw

(11)

因此,TF-IDF可以過濾常見詞,挖掘關(guān)鍵詞。

2 實(shí)驗(yàn)結(jié)果與分析

2.1 數(shù)據(jù)收集與處理

本研究采用Python語(yǔ)言編程爬取微博數(shù)據(jù),經(jīng)清洗步驟后共獲得4 971條。

圖2 福建地區(qū)居民關(guān)于降雨的情感傾向分析結(jié)果Figure 2 The analysis results of the emotional tendency of residents in Fujian area about rainfall

2.2 實(shí)驗(yàn)結(jié)果與分析

2.2.1 情感傾向及情感傾向度結(jié)果與分析

采用本研究方法進(jìn)行情感分析,得到的情感傾向和7類情感傾向度如圖2、圖3所示。由圖2、圖3可以看出福建地區(qū)居民對(duì)于降雨的情感傾向,其中以“好”最多,占據(jù)39%,同時(shí)表現(xiàn)出的情感傾向度也最強(qiáng)?!昂谩焙汀皹贰惫舱急?5%,“怒”和“驚”所占比重最小,說(shuō)明福建地區(qū)居民對(duì)降雨的情感總體呈正面情緒。情感傾向度最小的是“懼”,說(shuō)明福建地區(qū)居民可能長(zhǎng)期以來(lái)適應(yīng)了降雨環(huán)境,對(duì)降雨“懼”的情感傾向隨之較弱。

由于人的情感復(fù)雜且多變,僅從情感傾向及其強(qiáng)度值進(jìn)行分析有失偏頗。因此,圖4展示了7類情感傾向中每類情感傾向度分布比例。由圖4橫向比較來(lái)看,福建地區(qū)居民對(duì)降雨的情感表現(xiàn)傾向于“驚”“懼”時(shí),所包含的其他情感傾向度較低,且都不包含“怒”,說(shuō)明此時(shí)居民對(duì)降雨的主觀感知比較一致。傾向于“怒”時(shí),居民表達(dá)的其他情感強(qiáng)度強(qiáng)烈,其中“好”的占比較多,呈現(xiàn)兩極分化的趨勢(shì),說(shuō)明福建居民對(duì)降雨表達(dá)“怒”時(shí),情緒比較矛盾。在各種情感傾向中,“好”的情感傾向度占比均不低,說(shuō)明福建居民不論表現(xiàn)為何種情緒,對(duì)降雨都有一定偏愛,或者可能擁有將消極情緒轉(zhuǎn)化為積極情緒的良好心態(tài)。

圖3 福建地區(qū)居民關(guān)于降雨的7類情感傾向度分析結(jié)果Figure 3 The analysis results of the degree of inclination of seven emotions of residents in Fujian area about rainfall

圖4 福建地區(qū)居民關(guān)于降雨的7類情感傾向中每類情感傾向度分布比例Figure 4 The distribution ratio of each type of emotional inclination among the seven types of emotional inclinations of residents in Fujian area about rainfall

從縱向來(lái)看,如圖5所示,將每個(gè)季度的7類情感傾向進(jìn)行比較,發(fā)現(xiàn)情感傾向與季度變化沒有明顯的相關(guān)性,“好”的占比均最多,“怒”和“驚”在各個(gè)季度占比均較小。統(tǒng)計(jì)每個(gè)季度福建地區(qū)居民的情感傾向度平均值表明,情感傾向度隨季度變化波動(dòng)不明顯,波動(dòng)范圍為9.5~10.5,呈現(xiàn)波浪式趨勢(shì),如圖6所示。其中,夏季各類情感的傾向度較為集中,但情感傾向度平均值最低,說(shuō)明在夏季福建居民對(duì)于降雨的情感并不濃烈但豐富,感受較不一致。

圖5 各個(gè)季度福建地區(qū)居民對(duì)于降雨的7類情感傾向分析結(jié)果Figure 5 The analysis results of seven types of emotional tendencies of residents in Fujian area about rainfall in each season

圖6 各個(gè)季度福建地區(qū)居民對(duì)于降雨的平均情感傾向度和7類情感傾向度分析結(jié)果Figure 6 The average emotional inclination of residents in Fujian aera and the analysis results of seven types of emotional inclinations for rainfall in each season

表1 不同分析方法的準(zhǔn)確率及綜合評(píng)價(jià)指標(biāo) Table 1 Accuracy and comprehensive evaluation index of different analysis methods

本研究選取了兩名工作人員對(duì)原始數(shù)據(jù)的情感傾向進(jìn)行人工判斷(兩人判斷結(jié)果不同時(shí),經(jīng)商量后決定最終唯一結(jié)果),以人工標(biāo)注的情感傾向?yàn)闇?zhǔn),將SVM方法、LSTM方法[12]與本研究方法的分析結(jié)果分別與人工標(biāo)注的情感傾向進(jìn)行對(duì)比,得到結(jié)果如表1所示。

表 2 各種情感的精確率、召回率和綜合評(píng)價(jià)指標(biāo) Table 2 Precision rate,recall rate and comprehensive evaluation index of various emotions

由表1可以看出,可能由于SVM的詞向量求平均,詞的順序信息丟失,分類識(shí)別效果差于本研究方法與LSTM。LSTM記憶能力強(qiáng),在文本處理方面表現(xiàn)好。本研究方法準(zhǔn)確率為92.75%,平均綜合評(píng)價(jià)指標(biāo)為68.28%,比CNN高0.32%、2.7%,比LSTM低0.9%、0.81%。雖然本研究方法不是最優(yōu),但本研究方法無(wú)需進(jìn)行模型訓(xùn)練,在實(shí)際氣象應(yīng)用中擁有簡(jiǎn)單便捷、通用性強(qiáng)的優(yōu)勢(shì),同時(shí)也避免了訓(xùn)練文本選擇不當(dāng)對(duì)分類識(shí)別結(jié)果造成的偏差。

由表2可以看出,“怒”“驚”和“其他”的精確率相對(duì)較高,“好”和“哀”的召回率較高,說(shuō)明本研究方法區(qū)別“怒”“驚”和“其他”與其他情感的能力較強(qiáng),對(duì)“好”和“哀”情感的識(shí)別能力較強(qiáng)。綜合來(lái)看,本研究對(duì)“惡”“好”和“哀”情感的分析效果不錯(cuò)。

表3為誤判個(gè)例,圖7為微博數(shù)據(jù)的混淆矩陣。結(jié)合表3和圖7可以看出,“好”和“哀”的精確率較低。出現(xiàn)誤判的原因一方面可能是生活中“樂”和“好”的情感相似處多,容易出現(xiàn)誤判。另一方面可能是基于詞典的情感分析方法的局限性,缺少對(duì)主題的分析,如表3所示,序號(hào)1和3對(duì)主題“降雨”都是“惡”的情感,序號(hào)2對(duì)“降雨”無(wú)情感,但數(shù)據(jù)中存在其他主題的情感詞,因此容易將其他主題的情感誤判成“降雨”的情感。

表 3 誤判個(gè)例Table 3 Examples of misjudgments

圖7 混淆矩陣Figure 7 Confusion Matrix

另外,“怒”和“驚”的召回率較低,如圖7所示。出現(xiàn)誤判的原因一方面可能是情感的相似性,有時(shí)人工也難以分辨“怒”“驚”“惡”。另一方面可能是因?yàn)樵~典情感分析缺少聯(lián)系上下文和思考詞語(yǔ)的深層含義,許多具有反語(yǔ)的數(shù)據(jù)容易被誤判成相反情緒。

表 4 高頻特征詞 Table 4 High-frequency feature word list

2.2.2 關(guān)鍵詞結(jié)果與分析

本研究對(duì)所有數(shù)據(jù)進(jìn)行分詞后,按照出現(xiàn)頻次進(jìn)行排序,并刪除了一些無(wú)意義詞語(yǔ),最終得到頻次前30的特征詞,如表4所示。

圖8 高頻特征詞各類情感傾向度分布比例Figure 8 The distribution ratio of various emotional tendencies of high-frequency feature words

由表4可知,人們關(guān)于降雨提到的內(nèi)容主要包括4個(gè)方面:1)相關(guān)天氣現(xiàn)象,如“臺(tái)風(fēng)”、“打雷”等;2)地點(diǎn)情況,比如各個(gè)城市、南北方、家里等;3)感受情況,比如“冷”“不喜歡”“希望”等;4)社會(huì)活動(dòng)影響情況,比如“展銷會(huì)”、“演唱會(huì)”等。為了進(jìn)一步了解福建地區(qū)居民提到的這些內(nèi)容的情感傾向,本研究將包含高頻詞及具有同一含義的不同表達(dá)詞的微博進(jìn)行情感分析,結(jié)果如圖8所示。由圖8可知,提到高頻詞時(shí)的主要情感是“好”,總體情感較傾向于樂觀。“吹大風(fēng)”和“打雷”沒有“好”的情感,且“懼”的情感占比很大。提到“傘”時(shí),居民情感中“怒”占比最多。“演唱會(huì)”中“哀”的占比較大。

為了進(jìn)一步分析影響居民情感的因素,本研究通過關(guān)鍵詞挖掘的方法分析各種情感的主題表達(dá)。通過計(jì)算每類情感特征詞的TF-IDF值,得到每類情感TF-IDF值排名前10的關(guān)鍵詞,如表5所示。由表5可知,降雨對(duì)居民相關(guān)活動(dòng)影響情況易導(dǎo)致居民表達(dá)“怒”的情感,比如畢業(yè)典禮。降雨時(shí)的天氣現(xiàn)象易使居民表達(dá)“惡”“懼”的情感,比如吹大風(fēng)、打雷等。降雨的時(shí)間易使居民表達(dá)“驚”情感,比如7月、夏天等。降雨所處地點(diǎn)易使居民表達(dá)“樂”與“哀”兩極化情感,比如廈門、窩等。降雨時(shí)的環(huán)境感受易使居民表達(dá)“好”情感,比如涼快、熱等。

3 結(jié)論與展望

本研究針對(duì)人類情感復(fù)雜多樣的特點(diǎn),結(jié)合中文情感詞匯本體庫(kù)對(duì)福建居民關(guān)于降雨的情感進(jìn)行了細(xì)粒度分析。本研究方法準(zhǔn)確率為92.75%,平均綜合評(píng)價(jià)指標(biāo)為68.28%,總體分類效果高于傳統(tǒng)機(jī)器學(xué)習(xí)法SVM,低于神經(jīng)網(wǎng)絡(luò)法LSTM近1%。雖然本研究方法不是最優(yōu),但本研究方法不用針對(duì)特定天氣、氣候情況(如暴雨、臺(tái)風(fēng)、霧霾等)進(jìn)行模型訓(xùn)練,在實(shí)際氣象應(yīng)用中具有簡(jiǎn)單便捷、通用性高的優(yōu)勢(shì),同時(shí)也避免了訓(xùn)練文本選擇不當(dāng)對(duì)分類識(shí)別結(jié)果造成的偏差。

表 5 關(guān)鍵詞Table 5 Keyword List

基于本研究方法,結(jié)合高頻特征詞提取及關(guān)鍵詞挖掘技術(shù),可以得到以下結(jié)論:1)福建地區(qū)居民對(duì)于降雨總體呈現(xiàn)正面情感,情感傾向主要為“好”與“樂”,且情感濃烈。2)福建地區(qū)居民對(duì)降雨的情感是多樣的。福建地區(qū)居民對(duì)降雨雖有一定情感傾向,但呈現(xiàn)的情感較為豐富,經(jīng)常同時(shí)表達(dá)多種情感。3)福建地區(qū)居民對(duì)降雨的情感是比較穩(wěn)定的,各種情感隨時(shí)間變化波動(dòng)較小,與季度變化沒有明顯的相關(guān)性。4)福建地區(qū)居民對(duì)降雨提到較多的內(nèi)容主要包括4個(gè)方面:相關(guān)天氣現(xiàn)象、地點(diǎn)、環(huán)境感受、社會(huì)活動(dòng)影響。影響居民“怒”情感的主要為降雨對(duì)居民社會(huì)活動(dòng)的影響;影響居民“惡”“懼”情感的主要為相關(guān)天氣現(xiàn)象;影響居民“驚”情感主要為降雨時(shí)間;影響居民“樂”與“哀”情感的主要為降雨地點(diǎn);影響居民“好”情感的主要為降雨時(shí)的環(huán)境感受。

利用本研究方法雖能夠分類識(shí)別出福建居民對(duì)降雨的7種不同情感,但仍存在一些不足:1)微博用戶多集中于大中城市年輕人,在年齡和地域上存在分布不均的問題。2)本研究方法對(duì)詞典依賴性強(qiáng),當(dāng)詞典更新速度低于網(wǎng)絡(luò)新語(yǔ)言出現(xiàn)速度時(shí),可能會(huì)對(duì)結(jié)果造成不良影響。3)隱藏情感不易被發(fā)現(xiàn),從而引起結(jié)果偏差。氣象細(xì)粒度情感分析涉及到自然科學(xué)、社會(huì)科學(xué)、計(jì)算機(jī)科學(xué)等多個(gè)領(lǐng)域,而且領(lǐng)域交叉跨度大,本研究只是其中的一小點(diǎn)探索研究,今后可采用多模態(tài)的情感分析方式,結(jié)合多種特征數(shù)據(jù)(包括微博符號(hào)、表情、圖片等數(shù)據(jù)),利用深度學(xué)習(xí)等多種決策融合方法,對(duì)民眾關(guān)于氣候及天氣的情感進(jìn)行分析討論。

猜你喜歡
降雨福建居民
中國(guó)這十年·福建封
那個(gè)夢(mèng)
石器時(shí)代的居民
福建老年大學(xué)之歌
龍王降雨
泥石流
福建醫(yī)改新在哪?
一種船用降雨測(cè)量裝置的實(shí)現(xiàn)
高臺(tái)居民
新源县| 德昌县| 华阴市| 镇坪县| 南充市| 韶山市| 邵阳市| 尚志市| 灌阳县| 阿克陶县| 奉新县| 湘阴县| 竹山县| 信阳市| 莒南县| 宿松县| 海兴县| 临漳县| 曲阳县| 谢通门县| 永德县| 沾化县| 南康市| 太仆寺旗| 天峻县| 佛坪县| 冷水江市| 明光市| 当雄县| 安义县| 德庆县| 赞皇县| 信阳市| 武山县| 平顺县| 阳春市| 澄迈县| 雅安市| 衡南县| 阿城市| 柳林县|