国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于領(lǐng)域情感詞庫(kù)的大氣質(zhì)量感知滿(mǎn)意度研究*

2020-09-24 02:35宋鵬飛張立國(guó)
環(huán)境污染與防治 2020年9期
關(guān)鍵詞:詞庫(kù)詞典副詞

鄭 巖 孫 勇# 季 民 宋鵬飛 張立國(guó)

(1.山東科技大學(xué)測(cè)繪科學(xué)與工程學(xué)院,山東 青島 266590;2.山東省國(guó)土測(cè)繪院,山東 濟(jì)南 250013)

大氣質(zhì)量感知是人通過(guò)主觀的直接感受對(duì)客觀空氣質(zhì)量的反映[1]。公眾對(duì)于大氣質(zhì)量感知的滿(mǎn)意度是政府進(jìn)行大氣污染評(píng)價(jià)的重要依據(jù)。受ZEITHAML[2]提出的消費(fèi)品質(zhì)量感知啟發(fā),許多學(xué)者對(duì)大氣質(zhì)量感知進(jìn)行了研究。張君等[3]通過(guò)大氣質(zhì)量感知研究表明,公眾對(duì)大氣污染的關(guān)注度在不斷提升。張文曉等[4]研究發(fā)現(xiàn),居民收入、人力資本水平、職業(yè)狀況會(huì)對(duì)大氣質(zhì)量感知滿(mǎn)意度產(chǎn)生影響。FEO等[5]研究發(fā)現(xiàn),垃圾處理廠及其產(chǎn)生的氣味對(duì)周邊居民的大氣質(zhì)量感知滿(mǎn)意度產(chǎn)生直接影響。這些研究基本上都采用的是紙質(zhì)調(diào)查問(wèn)卷方式,這種方式研究成本大、覆蓋范圍窄、更新速度慢,不利于進(jìn)行大氣質(zhì)量感知滿(mǎn)意度的動(dòng)態(tài)跟蹤。

隨著網(wǎng)絡(luò)技術(shù)的發(fā)展和普及,公眾更傾向于在網(wǎng)絡(luò)上發(fā)表言論,很多有關(guān)空氣質(zhì)量的投訴和建議平臺(tái)也應(yīng)運(yùn)而生。這些平臺(tái)中的評(píng)論數(shù)量多、更新速度快、覆蓋范圍廣,利用公眾對(duì)于大氣質(zhì)量感知的各種情感色彩和情感傾向性的詞(即情感詞)進(jìn)行情感分析[6-8],可獲得公眾對(duì)于大氣質(zhì)量感知的滿(mǎn)意度。因此,建立公眾對(duì)于大氣質(zhì)量感知的情感詞庫(kù)至關(guān)重要。目前,國(guó)內(nèi)僅有大連理工大學(xué)、臺(tái)灣大學(xué)和知網(wǎng)等的基礎(chǔ)情感詞庫(kù),對(duì)大氣質(zhì)量感知的適用性較差。為此,本研究構(gòu)建了一套完整的大氣質(zhì)量感知領(lǐng)域情感詞庫(kù),基于該領(lǐng)域情感詞庫(kù)分析大氣質(zhì)量感知滿(mǎn)意度,以提高利用網(wǎng)絡(luò)平臺(tái)進(jìn)行大氣質(zhì)量感知滿(mǎn)意度評(píng)價(jià)的精度。

1 方 法

1.1 數(shù)據(jù)搜集

(1) 空氣質(zhì)量投訴網(wǎng)絡(luò)平臺(tái)數(shù)據(jù):來(lái)源于山東省環(huán)境公訴(信訪)平臺(tái)(http://124.128.64.175/tabid/202/Default.aspx)的公眾投訴數(shù)據(jù),主要提取了2011年6月至2018年10月的22 269條投訴數(shù)據(jù)。

(2) 網(wǎng)絡(luò)問(wèn)卷調(diào)查數(shù)據(jù):為更精準(zhǔn)地獲取更多大氣質(zhì)量感知領(lǐng)域情感詞,自主設(shè)計(jì)了網(wǎng)絡(luò)調(diào)查問(wèn)卷(http://123.206.81.238:8008/air/index.html),獲取了2018年12月至2019年2月的719條有效數(shù)據(jù),涵蓋山東省、江蘇省、湖北省、河北省、福建省、北京市和安徽省等地區(qū)。

1.2 基礎(chǔ)情感詞庫(kù)構(gòu)建

基礎(chǔ)情感詞庫(kù)由基礎(chǔ)情感詞典和修飾詞詞典構(gòu)成?;A(chǔ)情感詞典選用的是大連理工大學(xué)信息檢索研究室整理并標(biāo)注的中文情感詞典,包括動(dòng)詞、名詞、形容詞、副詞、網(wǎng)絡(luò)用語(yǔ)和成語(yǔ),每一個(gè)詞語(yǔ)都標(biāo)注了對(duì)應(yīng)的情感極性(中性、褒義和貶義),中性的情感強(qiáng)度為0,褒義和貶義的情感強(qiáng)度分別分為1、3、5、7、9共5個(gè)級(jí)別。修飾詞詞典包括否定詞和程度副詞。其中,程度副詞包括欠、稍、較、很、極其5個(gè)級(jí)別,本研究對(duì)這些程度副詞權(quán)重進(jìn)行了量化賦值,欠為0.6、稍為0.8,較為1.2、很為2.0、極其為3.0。目前,這些程度副詞的權(quán)重量化基本僅憑經(jīng)驗(yàn)賦值。

1.3 領(lǐng)域情感詞典構(gòu)建

以空氣質(zhì)量投訴網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)和網(wǎng)絡(luò)問(wèn)卷調(diào)查數(shù)據(jù)作為原始文本語(yǔ)料,按圖1流程構(gòu)建領(lǐng)域情感詞典。領(lǐng)域情感詞典共包含2 137個(gè)詞語(yǔ),包括詞語(yǔ)及其分類(lèi)、極性和情感強(qiáng)度等注釋。

(1) 分詞處理

本研究采用Jieba分詞工具對(duì)原始文本語(yǔ)料進(jìn)行分詞處理,但其對(duì)專(zhuān)業(yè)領(lǐng)域的新詞識(shí)別精度不高[9-10],因此本研究加入了大氣質(zhì)量感知領(lǐng)域的自定義詞典[11]。

(2) 結(jié)合基礎(chǔ)情感詞典去重

圖1 領(lǐng)域情感詞典的構(gòu)建Fig.1 Construction of domain emotion dictionary

在分詞處理的基礎(chǔ)上,將得到的分詞短語(yǔ)與基礎(chǔ)情感詞典中的詞語(yǔ)進(jìn)行比對(duì),去重后得到候選情感詞。

(3) 選擇與大氣質(zhì)量感知相關(guān)的情感詞

根據(jù)基礎(chǔ)情感詞典中的分類(lèi),分類(lèi)選擇與大氣質(zhì)量感知相關(guān)的情感詞,作為初始領(lǐng)域情感詞(2 072個(gè))。

(4) 補(bǔ)充網(wǎng)絡(luò)搜索領(lǐng)域情感詞

在百度百科中檢索“大氣污染”又獲取大氣質(zhì)量感知領(lǐng)域詞126個(gè),與初始領(lǐng)域情感詞去重后合并,得到最終領(lǐng)域情感詞(2 137個(gè))。

(5) 情感強(qiáng)度標(biāo)注

1.4 大氣質(zhì)量感知滿(mǎn)意度計(jì)算

把領(lǐng)域情感詞典合并到基礎(chǔ)情感詞庫(kù)中就構(gòu)成了領(lǐng)域情感詞庫(kù)。隨機(jī)選取3 000條空氣質(zhì)量投訴網(wǎng)絡(luò)平臺(tái)數(shù)據(jù),利用情感詞庫(kù)進(jìn)行大氣質(zhì)量感知滿(mǎn)意度計(jì)算。首先根據(jù)式(1)計(jì)算第m個(gè)短語(yǔ)的大氣質(zhì)量感知滿(mǎn)意度(E(Pm)),每個(gè)分句的大氣質(zhì)量感知滿(mǎn)意度取該分句中所有短語(yǔ)的大氣質(zhì)量感知滿(mǎn)意度最小值,所有分句大氣質(zhì)量感知滿(mǎn)意度最小值作為整條文本語(yǔ)句的大氣質(zhì)量感知滿(mǎn)意度。

表1 情感強(qiáng)度標(biāo)注準(zhǔn)則

E(Pm)=E(PW)×(-1)q×E(PA)

(1)

式中:E(PW)為某情感詞的情感強(qiáng)度;q為某情感詞的否定詞個(gè)數(shù);E(PA)為程度副詞的權(quán)重。

2 結(jié)果與討論

2.1 計(jì)算精度對(duì)比

將3 000條空氣質(zhì)量投訴網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)利用情感詞庫(kù)計(jì)算得到大氣質(zhì)量感知滿(mǎn)意度,與5人人工標(biāo)注的大氣質(zhì)量感知滿(mǎn)意度平均值進(jìn)行對(duì)比,計(jì)算絕對(duì)誤差絕對(duì)值作為精度判斷依據(jù),結(jié)果如表2所示。本研究設(shè)定絕對(duì)誤差絕對(duì)值≤2為符合精度要求,否者為不符合。由表2可以得出,采用基礎(chǔ)情感詞庫(kù)計(jì)算得到的大氣質(zhì)量感知滿(mǎn)意度符合精度要求的條數(shù)只占33.1%,而利用領(lǐng)域情感詞庫(kù)計(jì)算得到的大氣質(zhì)量感知滿(mǎn)意度符合精度要求的條數(shù)高達(dá)93.9%。由此可見(jiàn),大氣質(zhì)量感知領(lǐng)域情感詞典可為大氣質(zhì)量感知滿(mǎn)意度計(jì)算提供強(qiáng)有力的支撐。

表2 精度對(duì)比結(jié)果

2.2 大氣質(zhì)量感知滿(mǎn)意度分析

利用空氣質(zhì)量投訴網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)采用領(lǐng)域情感詞庫(kù)對(duì)山東省最近1年的投訴數(shù)據(jù)進(jìn)行大氣質(zhì)量感知滿(mǎn)意度計(jì)算,并按地級(jí)市進(jìn)行統(tǒng)計(jì)匯總(見(jiàn)圖2)。

圖2 山東省大氣質(zhì)量感知滿(mǎn)意度Fig.2 Atmospheric quality perception satisfaction of Shandong Province

由圖2可以看到,煙臺(tái)市、濰坊市、臨沂市、青島市4個(gè)地級(jí)市大氣質(zhì)量感知滿(mǎn)意度較差,而威海市和日照市兩個(gè)沿海的地級(jí)市大氣質(zhì)量感知滿(mǎn)意度相對(duì)較好一些。分析山東省各地級(jí)市工業(yè)收入發(fā)現(xiàn),工業(yè)收入排名靠前的城市投訴多,大氣質(zhì)量感知滿(mǎn)意度偏差。

由于空氣質(zhì)量投訴網(wǎng)絡(luò)平臺(tái)數(shù)據(jù)多為負(fù)向情感,具有一定的情感偏向性,為避免這種情感偏向性對(duì)計(jì)算結(jié)果造成的影響,進(jìn)一步選用網(wǎng)絡(luò)問(wèn)卷調(diào)查數(shù)據(jù)對(duì)更多省份(選擇回收數(shù)據(jù)大于10條的省份)進(jìn)行大氣質(zhì)量感知滿(mǎn)意度計(jì)算,結(jié)果如圖3所示。

圖3 其他省份大氣質(zhì)量感知滿(mǎn)意度Fig.3 Atmospheric quality perception satisfaction of other provinces

由圖3可以看到,不同省份表現(xiàn)出不同的大氣質(zhì)量感知滿(mǎn)意度,福建省正向大氣質(zhì)量感知滿(mǎn)意度較高,而江蘇省、湖北省和河北省則具有較強(qiáng)烈的負(fù)向大氣質(zhì)量感知滿(mǎn)意度。總體而言,公眾感知大氣污染越嚴(yán)重,該地區(qū)的整體大氣質(zhì)量越差,說(shuō)明公眾大氣質(zhì)量感知滿(mǎn)意度能夠正確反映區(qū)域的整體大氣質(zhì)量狀況。

3 結(jié) 論

(1) 建立了大氣質(zhì)量感知領(lǐng)域情感詞庫(kù)并用于大氣質(zhì)量感知滿(mǎn)意度計(jì)算,計(jì)算精度高達(dá)93.9%,遠(yuǎn)高于利用基礎(chǔ)情感詞庫(kù)計(jì)算得到的大氣質(zhì)量感知滿(mǎn)意度精度(33.1%),可有效計(jì)算大氣質(zhì)量感知滿(mǎn)意度。

(2) 山東省煙臺(tái)市、濰坊市、臨沂市、青島市4個(gè)地級(jí)市的大氣質(zhì)量感知滿(mǎn)意度較差,而威海市和日照市兩個(gè)沿海的地級(jí)市大氣質(zhì)量感知滿(mǎn)意度相對(duì)較好一些。工業(yè)收入排名靠前的城市投訴較多,大氣質(zhì)量感知滿(mǎn)意度偏差。

(3) 不同省份表現(xiàn)出不同的大氣滿(mǎn)意度,福建省正向大氣質(zhì)量感知滿(mǎn)意度較高,而江蘇省、湖北省和河北省則具有較強(qiáng)烈的負(fù)向大氣質(zhì)量感知滿(mǎn)意度。公眾大氣質(zhì)量感知滿(mǎn)意度能夠正確反映區(qū)域的整體大氣質(zhì)量狀況。

猜你喜歡
詞庫(kù)詞典副詞
韓國(guó)語(yǔ)副詞“?”與漢語(yǔ)副詞“更”“再”的對(duì)應(yīng)
一“吃”多用
米蘭·昆德拉的A-Z詞典(節(jié)選)
米沃什詞典
輸入法詞庫(kù)取證比較研究
短句—副詞+謂語(yǔ)
詞典引發(fā)的政治辯論由來(lái)已久 精讀
輸入法詞庫(kù)乾坤大挪移
漫畫(huà)詞典
副詞和副詞詞組
佛教| 齐河县| 南昌县| 肥东县| 浙江省| 南皮县| 广河县| 辉南县| 璧山县| 仙游县| 红河县| 大兴区| 如东县| 巨野县| 凯里市| 静宁县| 阜宁县| 威海市| 辰溪县| 华蓥市| 禄丰县| 县级市| 广元市| 龙门县| 德化县| 嫩江县| 读书| 化隆| 黄平县| 黄石市| 连山| 鹤峰县| 普兰店市| 师宗县| 平昌县| 阿城市| 双桥区| 邛崃市| 丹棱县| 布拖县| 秦安县|