国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于點(diǎn)評(píng)文本的公園多尺度評(píng)價(jià)體系研究
——以成都市公園為例

2021-02-26 13:07李林東韓龍玫卿粼波計(jì)浩浩
智能城市 2021年2期
關(guān)鍵詞:語(yǔ)句尺度語(yǔ)義

李林東 張 誠(chéng) 韓龍玫 卿粼波 計(jì)浩浩

(1.四川大學(xué)電子信息學(xué)院,四川成都 610065;2.成都市規(guī)劃研究院,四川成都 610041)

1 研究背景

現(xiàn)代城市日益發(fā)展,城市居民對(duì)公共空間尤其是城市公園有了更高的要求。如何準(zhǔn)確評(píng)價(jià)城市公共空間,營(yíng)造品質(zhì)更優(yōu)、城市居民更滿意的城市環(huán)境,成了一個(gè)重要的課題。成都作為“公園城市”首提地,也同樣面臨這一課題。

社交媒體文本數(shù)據(jù)解決了傳統(tǒng)方法無(wú)法適應(yīng)評(píng)價(jià)對(duì)象較多、工作量較大的問(wèn)題,但基于點(diǎn)評(píng)文本的評(píng)價(jià)研究存在對(duì)文本數(shù)據(jù)挖掘不夠深入的問(wèn)題。如王志芳等[1]利用大眾點(diǎn)評(píng)評(píng)論文本對(duì)廣州市公園進(jìn)行的對(duì)比性評(píng)價(jià)研究,趙書(shū)、劉博敏[2]利用大眾點(diǎn)評(píng)評(píng)論文本對(duì)南京主城區(qū)公園的訪客感知研究,龔凱麗、張科偉[3]利用網(wǎng)易云音樂(lè)評(píng)論信息對(duì)歌曲進(jìn)行評(píng)價(jià)研究,這些研究對(duì)文本數(shù)據(jù)的利用都停留在評(píng)論數(shù)量、詞頻、整體情感分析等較為粗淺的層面。用戶評(píng)論往往包含評(píng)論對(duì)象多個(gè)尺度的評(píng)價(jià)要素,對(duì)文本內(nèi)容進(jìn)行多尺度劃分及分析,可以得到更加精細(xì)化的評(píng)價(jià)結(jié)果。

為了實(shí)現(xiàn)對(duì)公園的精細(xì)化評(píng)價(jià),本研究基于點(diǎn)評(píng)文本,選擇成都公園為研究對(duì)象,構(gòu)建了基于關(guān)鍵詞檢索法的情感傾向評(píng)價(jià)體系,將點(diǎn)評(píng)文本精確劃分為交通、美學(xué)、維護(hù)和安全、市場(chǎng)價(jià)值、保護(hù)和繼承等5個(gè)尺度,利用百度情感傾向分析API對(duì)點(diǎn)評(píng)短語(yǔ)句打分,對(duì)公園進(jìn)行相關(guān)尺度的語(yǔ)義網(wǎng)絡(luò)分析,從使用者角度對(duì)公園分尺度做出客觀評(píng)價(jià),為公園城市的建設(shè)提供有力的數(shù)據(jù)支撐。

2 研究對(duì)象與分析工具

2.1 研究對(duì)象

成都作為“公園城市”首提地,具有得天獨(dú)厚的自然資源和人文環(huán)境,各種形式的公園分布在城市的各個(gè)角落,是人們茶余飯后的休息場(chǎng)所,更是成都“慢生活”的主要載體。本研究選擇成都主城區(qū)評(píng)論總數(shù)在500條以上的13個(gè)公園作為研究對(duì)象,獲取其點(diǎn)評(píng)文本。

2.2 數(shù)據(jù)獲取和分析工具選取

本研究采用的點(diǎn)評(píng)文本來(lái)源于大眾點(diǎn)評(píng)上的公園評(píng)價(jià)數(shù)據(jù),其評(píng)論總數(shù)均在500條以上,避免了樣本太少帶來(lái)的分析誤差。

本研究采用以下工具進(jìn)行輔助研究:(1)大型免費(fèi)社會(huì)計(jì)算平臺(tái)ROSTCM6[4-5](語(yǔ)義網(wǎng)絡(luò)分析);(2)中文分詞工具jieba;(3)百度文本情感傾向分析API。

3 研究方法

本研究構(gòu)建了一套完整的公園評(píng)價(jià)體系。首先,關(guān)鍵詞檢索法將點(diǎn)評(píng)文本切割為不同尺度的短語(yǔ)句;然后,通過(guò)百度情感傾向分析API對(duì)短語(yǔ)句進(jìn)行打分;最后,根據(jù)打分結(jié)果對(duì)公園進(jìn)行語(yǔ)義網(wǎng)絡(luò)分析,得到影響公園評(píng)價(jià)的具體要素,通過(guò)多變量線性回歸的方法對(duì)各尺度評(píng)價(jià)的重要程度進(jìn)行評(píng)估。

為了便于說(shuō)明,現(xiàn)將獲取的評(píng)論文本數(shù)據(jù)做層次性的定義和解釋:將數(shù)據(jù)劃分為文檔級(jí)、段落級(jí)、語(yǔ)句級(jí)和詞語(yǔ)級(jí),從大到小的包含關(guān)系,數(shù)據(jù)層次劃分如圖1所示。

圖1 數(shù)據(jù)層次劃分

文檔級(jí):將獲取的評(píng)論數(shù)據(jù)按公園文檔F分類,則各公園的文檔組成所有研究數(shù)據(jù)D={F1,F2,…,Fn};段落級(jí):公園文檔F由諸多用戶評(píng)論組成,把每位用戶的評(píng)論都看成段落P,則所有的用戶評(píng)論構(gòu)成公園文檔F={P1,P2,…,Pn};語(yǔ)句級(jí):段落P由諸多語(yǔ)句S組成,各語(yǔ)句代表訪客對(duì)公園各尺度的評(píng)價(jià),則P={S1,S2,…,Sn};詞語(yǔ)級(jí):一條語(yǔ)句由諸多詞語(yǔ)W組成,則S={W1,W2,…,Wn}。

3.1 基于關(guān)鍵詞檢索法的點(diǎn)評(píng)文本切割分類

用戶評(píng)論內(nèi)容往往包括公園評(píng)價(jià)的多個(gè)方面,本研究通過(guò)基于關(guān)鍵詞檢索的方法分別提取評(píng)論中多方面的內(nèi)容。首先,對(duì)文檔內(nèi)容F進(jìn)行分句,劃分為內(nèi)容單一的語(yǔ)句S;然后,對(duì)語(yǔ)句進(jìn)行分詞;最后,用基于關(guān)鍵詞檢索的方法對(duì)語(yǔ)句進(jìn)行分類。

結(jié)合綠地系統(tǒng)評(píng)價(jià)指標(biāo)[7]和對(duì)評(píng)價(jià)數(shù)據(jù)的詞頻分析,將公園評(píng)價(jià)分為交通、美學(xué)、維護(hù)和安全、市場(chǎng)價(jià)值、保護(hù)和繼承5個(gè)尺度,并從高頻詞中分別找出能代表這5大尺度的詞語(yǔ),如表1所示。

設(shè)計(jì)意圖:通過(guò)討論與交流,學(xué)生逐漸形成基于事實(shí)證據(jù),分析生物規(guī)律,理解生命本質(zhì)的科學(xué)思維。教師充分利用實(shí)驗(yàn)資料,在學(xué)生原有認(rèn)知上挖掘深層知識(shí),初步滲透科學(xué)探究的方法教育。

表1 類別(尺度)詞典

具體檢索方法:對(duì)輸入的已分詞語(yǔ)句逐一檢索每一個(gè)詞,若詞語(yǔ)Wi(i=1,2,3,..,n)存在于類別詞典中,則返回該詞對(duì)應(yīng)的類別,并作為該語(yǔ)句Si(i=1,2,3,..,n)的類別。如果所有詞語(yǔ)都不在類別詞典中,則該語(yǔ)句不歸屬于任何類別。

3.2 基于百度API的點(diǎn)評(píng)文本情感傾向判別

通過(guò)百度情感傾向分析API分析段落和語(yǔ)句,得到段落或語(yǔ)句的評(píng)分,計(jì)算如下:

式中,p——段落或語(yǔ)句情感傾向?yàn)榉e極的置信度,范圍[0,1],計(jì)算得到段落或語(yǔ)句的評(píng)分s,范圍[0,5]。

對(duì)段落的評(píng)分或各類別下各語(yǔ)句的評(píng)分si(i=1,2,3,..,N)求均值,得到公園的總體評(píng)分或該類別的總評(píng)分m:

為了分析公園評(píng)價(jià)的積極因素和消極因素,將語(yǔ)句分為積極和消極兩部分,計(jì)算如下:

式中:c——語(yǔ)句的情感傾向,積極或消極;pos——積極;neg——消極;p——語(yǔ)句情感傾向?yàn)榉e極的置信度。

3.3 基于多變量線性回歸的評(píng)價(jià)尺度重要性判定

將計(jì)算得到的各類別評(píng)分xi(i=1,2,3,4,5)和公園總體評(píng)分y分別作為自變量和因變量,通過(guò)多變量線性回歸的方法求得各類別的權(quán)重wi(i=1,2,3,4,5):

權(quán)重wi越大,對(duì)應(yīng)尺度評(píng)分xi在公園總體評(píng)價(jià)中占比就越大,表明該類別是訪客評(píng)價(jià)公園相對(duì)重要的因素。另外,多變量線性回歸的擬合效果由決定系數(shù)評(píng)估,計(jì)算如下:

式中,fi——模型預(yù)測(cè)值;yi——標(biāo)簽值;-y——平均標(biāo)簽值。決定系數(shù)范圍[0,1],越大表示擬合效果越好。

4 結(jié)果

首先對(duì)公園各尺度的得分和排序進(jìn)行客觀評(píng)價(jià)分析,然后根據(jù)公園本身得分情況和排名情況選取部分公園進(jìn)行語(yǔ)義網(wǎng)絡(luò)分析,討論影響公園評(píng)價(jià)的具體因素所在,最后通過(guò)多變量線性回歸的方法分析各尺度評(píng)價(jià)對(duì)公園總體評(píng)價(jià)的重要程度。

為了進(jìn)一步分析影響公園評(píng)價(jià)的具體要素,對(duì)各尺度文本分別進(jìn)行語(yǔ)義網(wǎng)絡(luò)分析。在語(yǔ)義網(wǎng)絡(luò)中,詞語(yǔ)引出的線段越多,說(shuō)明這個(gè)的詞語(yǔ)的詞頻越高,與中心節(jié)點(diǎn)的距離越近,表示和中心詞語(yǔ)的關(guān)系越緊密[7]。

4.1 公園各尺度得分

根據(jù)式(1)和式(2)計(jì)算公園各尺度的總評(píng)分進(jìn)行排序,得到的結(jié)果如圖2所示。

圖2 各尺度評(píng)分排序

在交通方面,評(píng)分按照交通的便利程度從高到低排序??傮w上,公園交通的便利程度與公園、交通站點(diǎn)(尤其是地鐵站點(diǎn))的聯(lián)系緊密程度強(qiáng)相關(guān),與區(qū)位的關(guān)系相對(duì)較弱。成都的單中心圈層式結(jié)構(gòu)導(dǎo)致市中心地鐵公交的線網(wǎng)密度較高,市中心的公園交通普遍比較便利,如人民公園、百花潭公園、浣花溪公園。但一環(huán)的望江樓公園沒(méi)有緊鄰地鐵,交通評(píng)分只排在中游。較遠(yuǎn)的青龍湖公園因地鐵直達(dá),評(píng)分反而高于望江樓公園。交通語(yǔ)義網(wǎng)絡(luò)對(duì)比如圖3所示。

圖3 交通語(yǔ)義網(wǎng)絡(luò)對(duì)比

由圖3對(duì)比可知,地鐵在青龍湖公園的交通要素中占據(jù)了更加重要的位置。

在美學(xué)方面,根據(jù)表1,評(píng)分依賴于公園訪客的主觀感受和主觀評(píng)價(jià)。各公園都取得了較高的分?jǐn)?shù),但塔子山公園和新華公園相對(duì)偏低。提取兩公園美學(xué)方面的負(fù)面評(píng)價(jià),發(fā)現(xiàn)基本與“特色”一詞相關(guān),占負(fù)面評(píng)價(jià)80%以上,說(shuō)明這兩個(gè)公園在景觀、特色方面的建設(shè)有待加強(qiáng)。

在市場(chǎng)價(jià)值方面,訪客主要關(guān)注消費(fèi)情況,諸如門(mén)票、單車租賃、餐飲等。

消費(fèi)性價(jià)比是公園市場(chǎng)價(jià)值評(píng)分的重要依據(jù),統(tǒng)計(jì)13個(gè)公園市場(chǎng)價(jià)值方面的語(yǔ)義網(wǎng)絡(luò)圖發(fā)現(xiàn)除UPARK公園外訪客評(píng)價(jià)都集中在公園門(mén)票上。其他消費(fèi)也是影響評(píng)價(jià)的關(guān)注點(diǎn)。而UPARK公園與其他公園表現(xiàn)出截然不同的特點(diǎn),UPARK公園是公園和商業(yè)的結(jié)合體,關(guān)注點(diǎn)多為商業(yè)相關(guān)。市場(chǎng)價(jià)值方面語(yǔ)義網(wǎng)絡(luò)對(duì)比如圖4所示。

圖4 市場(chǎng)價(jià)值方面語(yǔ)義網(wǎng)絡(luò)對(duì)比

在維護(hù)和安全方面,主要關(guān)注點(diǎn)在于公園設(shè)施、衛(wèi)生、服務(wù)等。天府芙蓉園和東湖公園排名靠后。天府芙蓉園的消極評(píng)價(jià)主要集中在“設(shè)施”“垃圾”“管理”三個(gè)中心節(jié)點(diǎn)。結(jié)合其子節(jié)點(diǎn)可以看出該公園存在設(shè)施不夠完善且有人為破壞現(xiàn)象,垃圾清理不夠及時(shí),疏于管理等問(wèn)題。右圖中的東湖公園也存在類似的問(wèn)題。維護(hù)和安全消極評(píng)價(jià)語(yǔ)義網(wǎng)絡(luò)如圖5所示。

圖5 維護(hù)和安全消極評(píng)價(jià)語(yǔ)義網(wǎng)絡(luò)

在保護(hù)和繼承上,百花潭公園、人民公園、浣花溪公園、望江樓公園、塔子山公園等具有悠久歷史或由文化古跡區(qū)改造而成的公園以及成都露天音樂(lè)公園、天府芙蓉園、青龍湖公園等建成時(shí)間短但具有現(xiàn)代文化元素或特定文化背景的公園評(píng)分較高。

新華公園保護(hù)和繼承語(yǔ)義網(wǎng)絡(luò)如圖6所示。

圖6 新華公園保護(hù)和繼承語(yǔ)義網(wǎng)絡(luò)

承載一代成都人記憶的新華公園評(píng)分較低,可由圖6的語(yǔ)義網(wǎng)絡(luò)圖中的相關(guān)節(jié)點(diǎn)得到推斷:新華公園和記憶中的印象不符,在隨時(shí)代的發(fā)展中,沒(méi)有將歷史文化元素較好的保護(hù)和繼承下來(lái)。

4.2 評(píng)價(jià)尺度重要性比較

根據(jù)多變量線性回歸方法擬合各尺度評(píng)分與公園總體評(píng)分,擬合效果評(píng)估參數(shù)R2≈0.67,同時(shí)為了分析訪客負(fù)面評(píng)價(jià)的主要關(guān)注點(diǎn),本研究統(tǒng)計(jì)了各尺度差評(píng)數(shù)并以比值方式呈現(xiàn)圖中。

各尺度權(quán)重與各尺度差評(píng)占比如圖7所示。

圖7 各尺度權(quán)重與各尺度差評(píng)數(shù)占比

分析圖7可知,從各尺度權(quán)重來(lái)看,訪客關(guān)注度較高的是公園美學(xué)方面的內(nèi)容,其次是交通、保護(hù)和繼承兩個(gè)方面,較少關(guān)注維護(hù)和安全、市場(chǎng)價(jià)值兩方面;而從各尺度差評(píng)數(shù)比值來(lái)看,訪客對(duì)公園的負(fù)面評(píng)價(jià)主要集中在市場(chǎng)價(jià)值、維護(hù)和安全兩方面。

可能的原因有:訪客對(duì)公園最直觀的感受是對(duì)視覺(jué)元素的感知,其貫穿游覽公園的全過(guò)程,故美學(xué)評(píng)分占據(jù)了總體評(píng)分接近50%。

保護(hù)和繼承這一尺度是對(duì)美學(xué)評(píng)價(jià)的進(jìn)一步評(píng)價(jià),是對(duì)公園歷史底蘊(yùn)、現(xiàn)代文化等自身特色的評(píng)價(jià),因此重要程度排在美學(xué)評(píng)價(jià)之后。

5 結(jié)語(yǔ)

本研究以成都市公園為例,利用點(diǎn)評(píng)數(shù)據(jù),借助百度情感傾向分析API等工具,通過(guò)基于關(guān)鍵詞檢索法的評(píng)價(jià)體系對(duì)公園的交通、美學(xué)、維護(hù)和安全、市場(chǎng)價(jià)值、保護(hù)和繼承等5個(gè)尺度進(jìn)行了分析。該評(píng)價(jià)體系解決了基于點(diǎn)評(píng)文本的研究中對(duì)文本數(shù)據(jù)挖掘不夠深入的問(wèn)題,為利用海量的文本數(shù)據(jù)提供了有效的方法。

研究中也存在諸多有待改進(jìn)和完善之處,主要體現(xiàn)在以下兩點(diǎn):

(1)百度文本情感傾向分析API是通用版本,缺乏對(duì)點(diǎn)評(píng)文本的針對(duì)性分析;

(2)社交媒體數(shù)據(jù)不只包括文本數(shù)據(jù),還包括圖像、打卡、消費(fèi)等數(shù)據(jù),多模態(tài)分析才能更加全面地對(duì)公園進(jìn)行分析評(píng)價(jià)。

猜你喜歡
語(yǔ)句尺度語(yǔ)義
財(cái)產(chǎn)的五大尺度和五重應(yīng)對(duì)
重點(diǎn):語(yǔ)句銜接
語(yǔ)言與語(yǔ)義
宇宙的尺度
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
認(rèn)知范疇模糊與語(yǔ)義模糊
9
如何搞定語(yǔ)句銜接題
語(yǔ)義分析與漢俄副名組合
作文語(yǔ)句實(shí)錄
随州市| 邯郸市| 天峨县| 札达县| 子洲县| 攀枝花市| 霍邱县| 新乐市| 轮台县| 蒙城县| 重庆市| 周口市| 岚皋县| 清苑县| 福安市| 广汉市| 龙门县| 全南县| 潮安县| 益阳市| 错那县| 德昌县| 灌阳县| 鱼台县| 岳池县| 桐庐县| 侯马市| 庆城县| 公安县| 清水河县| 遵化市| 大新县| 昭苏县| 武川县| 合肥市| 安陆市| 顺义区| 凌源市| 土默特右旗| 上犹县| 含山县|