曹佳雨 趙俊
摘要:目前,以微博為主導的網(wǎng)絡媒體平臺已經(jīng)成為民眾信息交流的主要渠道。分析微博相關(guān)評論文本,有利于為醫(yī)療服務管理提供幫助。研究基于新浪微博,挖掘網(wǎng)民對醫(yī)療服務體驗的評價內(nèi)容,進行意見挖掘、情感分析等實證研究,把握和理解網(wǎng)民就診體驗關(guān)注點演變情況,為醫(yī)療機構(gòu)改進就醫(yī)流程、改善就醫(yī)體驗提供參考。
關(guān)鍵詞:微博;用戶評論;觀點發(fā)掘;情感分析
根據(jù)《2020年微博用戶發(fā)展報告》,截至2020年9月,微博月活躍用戶達5.11億,日活躍用戶達224億,廣泛覆蓋全國范圍。伴隨互聯(lián)網(wǎng)高速發(fā)展,微博迅速推廣,越來越多的網(wǎng)民可以借助網(wǎng)絡平臺獲知信息,發(fā)表觀點。微博是一種當下時興的互聯(lián)網(wǎng)社交平臺,具有發(fā)布信息便利性強、閱覽時效性高等優(yōu)點,逐漸成為民眾搜集信息、溝通交流的主要工具。
網(wǎng)絡輿情即指網(wǎng)民對社會環(huán)境中的種種現(xiàn)象和事件表達的態(tài)度、想法、看法、情緒等觀點的總和。針對就醫(yī)體驗相關(guān)網(wǎng)絡文本數(shù)據(jù)進行分析,有利于把握了解網(wǎng)民用戶對于醫(yī)療服務的觀點體驗,有助于醫(yī)療機構(gòu)獲得及時反饋,提高其服務水平。
內(nèi)容情感分析是指通過分析自然語言、計算機語言來挖掘主觀文本包含具有隱藏情感色彩的信息,例如判斷文本內(nèi)容是消極還是積極。文獻研究表明,目前情感分析方法已經(jīng)相對成熟,利用該方法進行研究具有一定的參考價值。
研究框架
數(shù)據(jù)采集
利用網(wǎng)絡爬蟲收集數(shù)據(jù),基于“就診”“就醫(yī)”等關(guān)鍵詞,收集至2021年7月31日的個人用戶原創(chuàng)微博內(nèi)容,包括博主頭像、發(fā)布ID、文本主頁、用戶賬號是否認證、博文獨立網(wǎng)址、發(fā)布日期、發(fā)布媒介、轉(zhuǎn)發(fā)數(shù)量、評論數(shù)量和點贊數(shù)量等信息。
數(shù)據(jù)處理
將原創(chuàng)微博內(nèi)容導入到Excel表格中,按照博主ID、賬號類型、博文網(wǎng)址分類記錄表格管理。根據(jù)研究條件,篩選過濾不符合研究需要的相關(guān)博文。篩選條件包括微博賬號類型為非個人,微博無效內(nèi)容,如廣告、網(wǎng)頁鏈接或與研究主題無關(guān)的微博文本數(shù)據(jù)。使用Jieba分詞組件對文本數(shù)據(jù)進行處理,刪除重復和無關(guān)的文本數(shù)據(jù),參照停用詞表刪除停用詞,基于單詞詞性對每一個被分割出來的關(guān)鍵詞的詞性依次標注記錄。結(jié)合關(guān)鍵詞詞語屬性標注記錄結(jié)果,剔除屬性為助詞、虛詞、連詞、介詞等沒有實際含義的主體詞語和所有的標點、符號,最終獲得每條帶有詞語屬性分類標注的微博內(nèi)容文本主題詞數(shù)據(jù)集合。
觀點發(fā)掘
通過對微博內(nèi)容文本的閱讀可以得出,網(wǎng)民為了表達某些觀點所使用的詞語往往都存在一類能夠涵蓋基本觀點內(nèi)涵的關(guān)鍵詞。因此在本研究中,使用微博文本中出現(xiàn)的關(guān)鍵詞的重要程度作為指標來評價文本內(nèi)容數(shù)據(jù)的主要內(nèi)容。高頻詞是指微博用戶在微博內(nèi)容中頻繁使用出現(xiàn)的詞語或者短語。本文采用文本特征加權(quán)法提取熱點,計算主題詞權(quán)重,過濾低頻詞,提取高頻詞。通過上述方法所提取的意見詞語后,再進行兩次人工鑒別、選擇、過濾提取內(nèi)容觀點,進一步進行聚類分析。情感分析
網(wǎng)友的情緒即是網(wǎng)友在受到外界社會生活刺激從而產(chǎn)生的心理層面的感受,可以分為積極情感、消極情感以及中性情感。本文利用情感分析工具Snow NLP對文本內(nèi)容進行分析,對積極情緒、消極情緒和中性情緒詞語進行分類和計數(shù),最終統(tǒng)計得到網(wǎng)友積極情緒、消極情緒和中性情緒數(shù)量和所占比例。
研究結(jié)果
觀點發(fā)掘
研究共收集4772條微博數(shù)據(jù),最終篩選得到27條有效數(shù)據(jù),處理的可視化詞云圖如下。其中,按Tf—idf值排名前十的熱點詞分別是:“健康、朋友、感染、比較、那個、第一、必須、確診、中醫(yī)、病情”(見圖1)。首先可以看出網(wǎng)民對健康問題的關(guān)注度日漸提高,廣大群眾對健康的需求也成為了一個重要話題;其次,特征詞“朋友”的高頻率說明朋友之間的交流是用戶溝通的主要渠道;“比較、那個、第一”等詞反映出用戶對醫(yī)療機構(gòu)的要求也在逐漸增加,體現(xiàn)人們對醫(yī)療衛(wèi)生資源的多層面需求日益加大;“確診”等詞匯主要與疫情相關(guān),顯示了民眾對當前疫情的重視,以及對疫情期間就醫(yī)行為的關(guān)注;“中醫(yī)”體現(xiàn)了隨著健康素養(yǎng)的增加,民眾對傳統(tǒng)中醫(yī)藥的評價與需求逐漸加大,越來越受到民眾的認可支持;“病情”直觀反映了人們對自身健康安全的關(guān)注,成為人們就醫(yī)治療的主要需求??傮w來說,網(wǎng)民的就醫(yī)體驗與對醫(yī)療保健服務和健康的需求的日益增長相關(guān),主要集中在治療效果、醫(yī)療資源選擇和診療方式等方面,希望獲得更好更優(yōu)質(zhì)的醫(yī)療服務。
情感分析
研究利用情感分析工具Snow NLP對評論文本進行情感分析,計算主題詞情感值,情感值范圍在0~1之間,取值越接近1,表達情感越正向,越接近0表達情感越負面。本文以0.5為分界值,把情感值大于0.5分的劃分為正向情感文本,小于0.5分的視為負向情感文本,其余標記為中性情感文本(見圖2)。分析可見,中性情感最多,共4825條,占48.6%,其次是正向情感,共3143條,占31.6%,負向情感最少,共1963條,僅占19.8%。數(shù)據(jù)顯示大部分網(wǎng)民沒有過多地表達個人情感,對就醫(yī)體驗話題的評論也較為理性。正向情感占比高于負向情感,表明網(wǎng)民就醫(yī)體驗的滿意度較高,結(jié)合評論內(nèi)容可發(fā)現(xiàn)與醫(yī)療服務質(zhì)量高、醫(yī)療服務效果好等原因相關(guān),體現(xiàn)了改善醫(yī)療服務工作的顯著成效。負向情感文本里的關(guān)鍵詞主要包含表達自身消極情緒狀態(tài),如“擔心、緊張、壓抑”等和對就醫(yī)體驗的負面評價,如“無語、一塌糊涂、不好”等,側(cè)面反映目前看病難、看病貴、看病煩等問題仍然存在。
討論
以健康需求為關(guān)注點,未來需要進一步完善需求保障
研究分析可得患者就醫(yī)體驗的變化,這些變化在某種程度上也反映了影響患者在就醫(yī)過程中的主要關(guān)注點。通過熱點圖譜可見患者的健康需求為主要影響因素?;颊邔Ω鞣N醫(yī)療服務的需求是否被滿足與就醫(yī)體驗正相關(guān),醫(yī)療衛(wèi)生等部門機構(gòu)未來應落實“以患者為中心”的服務精神,將服務模式從“能提供什么”轉(zhuǎn)變?yōu)椤靶枰峁┦裁础?,提升服務滿意度。
網(wǎng)民對就醫(yī)服務的情感價值存在提升空間,未來應注重情感支持與人文關(guān)懷
情緒價值對網(wǎng)民就醫(yī)體驗和就醫(yī)行為存在積極影響,當接受醫(yī)療服務時,患者期望獲得更好的情感體驗也演化為健康需求的一部分,即不只是基于業(yè)務關(guān)系的醫(yī)患溝通,更多的是情感上的支持和關(guān)懷。未來應更多地關(guān)注患者就醫(yī)過程中的情感體驗,予以更豐富的情感支持和人文關(guān)懷,從而提升患者的就醫(yī)體驗。
堅持落實分級診療制度,確保能最大限度利用有限的醫(yī)療資源
看病難,主要是因為難以享受優(yōu)質(zhì)的醫(yī)療資源,實施分級診療制度可以有效促進醫(yī)療衛(wèi)生資源的合理配置、基本醫(yī)療衛(wèi)生服務公平化的關(guān)鍵舉措。未來應在深化醫(yī)改的基礎(chǔ)上,明確各層次醫(yī)療機構(gòu)的職能定位,推進不同級別機構(gòu)間的協(xié)同合作,促進形成高效的分級診療模式。
搭建官方信息溝通平臺
做好官方微博等溝通渠道建設(shè),積極接受公眾網(wǎng)民的評論、建議,有利于及時掌握網(wǎng)絡輿情狀況,及時全面了解與醫(yī)療相關(guān)的新聞、熱點動態(tài),有針對性、高效地把握處理網(wǎng)絡輿情的時機,也可以為醫(yī)療機構(gòu)媒體宣傳提供幫助。
做好負面言論的處理工作
積極關(guān)注網(wǎng)民公眾的就醫(yī)需求和情感狀態(tài),結(jié)合微博等網(wǎng)絡平臺,及時對負面消極評論進行澄清回復,對疑問咨詢細心解答,針對發(fā)布不良言論的用戶,采用教育警告等懲罰措施,阻止違法信息的進一步傳播。
建立網(wǎng)絡輿情協(xié)調(diào)管理體系
網(wǎng)絡輿情的處理往往牽涉多方利益的部門系統(tǒng),由于信息溝通不充分、整體
規(guī)劃不合理等問題的出現(xiàn),可能會在處理過程中產(chǎn)生回避推卸責任,導致輿情處理不及時的后果。醫(yī)療機構(gòu)應加強網(wǎng)絡輿情協(xié)調(diào)管理體系的建設(shè),全方位、科學合理整合規(guī)劃資源,使不同機關(guān)部門能夠各司其職、積極處理,體現(xiàn)統(tǒng)籌協(xié)調(diào)能力。
研究借助微博平臺,搜集網(wǎng)民關(guān)于就醫(yī)體驗的博文內(nèi)容,使用Tf—idf算法進行特征降維,Snow NLP分析模塊進行情感分析,繪制微博平臺用戶就醫(yī)體驗熱點圖譜,分析用戶就醫(yī)關(guān)注點和情感體驗,為今后提升醫(yī)療機構(gòu)服務水平提供建議。研究發(fā)現(xiàn),網(wǎng)民就醫(yī)體驗總體較好,患者的健康需求、推薦意愿、醫(yī)療服務質(zhì)量和服務便利可及性是主要的關(guān)注點,看病難、看病貴、看病煩等問題仍是影響患者就醫(yī)體驗的主要因素。未來應進一步完善需求保障,注重情感支持與人文關(guān)懷,堅持推進分級診療制度,提升民眾的就醫(yī)滿意度。此外,本文在研究過程中依然存在一定不足之處:研究僅針對微博用戶數(shù)據(jù)進行分析,數(shù)據(jù)來源渠道相對簡單;并且情感分析只是基于Python的第三方庫,數(shù)據(jù)處理過程也較為簡單。在未來將會基于更多平臺,擴大數(shù)據(jù)樣本的全面性,提高研究結(jié)果的科學性、準確性。
參考文獻:
[1]微博數(shù)據(jù)中心.2020年微博用戶發(fā)展報告[EB/OL].(2021-03- 12)https://data.weibo.com/report/reportDetail?i d=456.
[2]吳鵬,劉恒旺,沈思.基于深度學習和OCC情感規(guī)則的網(wǎng)絡輿情情感識別研究[J].情報學報,2017,36(09):972—980.
[3]趙妍妍,秦兵,劉挺.文本情感分析[J].軟件學報,2010.
[4]左芬.突發(fā)事件網(wǎng)絡輿情的負面效應及其應對研究[D].湖南師范大學.
(作者單位:1.南京醫(yī)科大學醫(yī)政學院
2.南京醫(yī)科大學第一附屬醫(yī)院)