基于證據(jù)推理的醫(yī)療健康網(wǎng)站信息質(zhì)量綜合評價研究*

2020-05-09 00:51:18成全王火秀駢文景

數(shù)字圖書館論壇 2020年4期

成全王火秀駢文景

（福州大學經(jīng)濟與管理學院，福州 350116）

隨著技術的發(fā)展與人們生活水平的提高，人類對自身健康的重視程度越來越高，對健康信息的關注度和需求量也在不斷提高。近年來涌現(xiàn)出越來越多的醫(yī)療健康網(wǎng)站，豐富了人們獲取健康信息的方式，依托互聯(lián)網(wǎng)就可以了解醫(yī)療保健、疾病癥狀等相關醫(yī)療健康知識，受到網(wǎng)民的廣泛使用。CNNIC于2019年2月發(fā)布第43次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》，截至2018年12月，我國網(wǎng)民規(guī)模達到8.29億人，同比2017年12月增長7.38個百分點，普及率近60%，入網(wǎng)的門檻也在逐步降低[1]。Impicciatore等[2]發(fā)現(xiàn)互聯(lián)網(wǎng)健康信息的準確性和完整性存在很大差異，由于互聯(lián)網(wǎng)具有開放性特征，人們在獲取健康信息時無法分辨信息的真假，可能導致人們作出錯誤決策，如轟動一時的“魏則西事件”，就引發(fā)公眾對網(wǎng)絡健康信息的質(zhì)疑。此外，網(wǎng)絡健康信息缺乏相應的審核監(jiān)管制度[3]，當前未有以政府部門或者專業(yè)的醫(yī)學組織為主導研發(fā)的擁有權威性和推廣性的評價準則[4]，又因網(wǎng)絡平臺上廣告遍布、用戶隱私泄露和虛假信息等問題[5]，降低了人們對網(wǎng)絡醫(yī)療健康類信息的信任度。由此可見，如何辨別和選取高質(zhì)量信息以及加強對網(wǎng)絡信息的監(jiān)管，幫助人們更加有效地使用網(wǎng)絡健康信息去解決現(xiàn)實問題已經(jīng)成為的重要研究方向。

1 研究現(xiàn)狀

對于網(wǎng)絡健康信息質(zhì)量問題的研究早已引起信息科學界的高度關注，研究成果異常豐富?？v觀當前學術界對網(wǎng)絡信息質(zhì)量評價的研究成果，主要研究集中在網(wǎng)絡健康信息質(zhì)量的評價指標研究、評價方法與評價工具的應用實證研究等方面。

1.1 網(wǎng)絡健康信息質(zhì)量的評價指標研究

國外關于網(wǎng)絡健康信息質(zhì)量的評價指標研究可追溯到20世紀90年代中期，Elizabeth等[6]通過調(diào)查發(fā)現(xiàn)，影響患者評估在線健康信息的因素中，設計因素（清晰布局、良好導航、互動）約占17%，而內(nèi)容因素（信息內(nèi)容、相關插圖、清晰簡潔語言、討論組等）約占83%。Kim等[7]對已經(jīng)發(fā)表的評估健康網(wǎng)站的標準進行審查，從中提取165條標準，最常用的包括網(wǎng)站的內(nèi)容、設計和美觀、作者、贊助商、權威性、易用性、可訪問性、可用性等。Gretchen等[8]從可訪問性、內(nèi)容質(zhì)量、可讀性方面分別對英語網(wǎng)站和西班牙語網(wǎng)站上有關乳腺癌、抑郁癥、肥胖癥和兒童哮喘的健康信息進行研究，結果發(fā)現(xiàn)用戶很難找到關于健康問題的完整和準確信息，并且可獲得的網(wǎng)絡健康信息也難以理解。國內(nèi)學者趙玉遂等[9]邀請健康教育、健康傳播、公共衛(wèi)生、社會醫(yī)學領域的專家進行兩輪咨詢，經(jīng)討論后形成信息特性、媒體特性、發(fā)布特性3個一級指標，信息可理解性、信息準確性、信息可參考性、信息時效性、信息新穎性、檢索、導航、頁面設計、媒體權威性、編輯權威性、作者權威性等15個二級指標。錢明輝等[5]從權威性、歸因性、全面性等9個維度構建評價指標體系，并結合40個平臺分析歸納在線健康平臺信息質(zhì)量特征。鄧勝利等[10]對國外網(wǎng)絡健康信息質(zhì)量評價的相關研究進行分析，總結出兩種常用的質(zhì)量指標分類：一是基于內(nèi)容評價，包括相關性、及時性、可信度、易讀性；二是基于網(wǎng)站設計評價，包括易用性、可訪問性、美觀性、導航性、交互性、隱私保護。

1.2 網(wǎng)絡健康信息質(zhì)量的評價方法應用與實證研究

國外常用的是通過問卷調(diào)查法、焦點小組、半結構化訪談法對受訪者進行訪談，將獲取的評分采用統(tǒng)計分析方法進行分析。如Sanghee等[11]邀請?zhí)釂栒摺⒔】祬⒖紙D書館館員、護士3類人員對Yahoo! Answer中發(fā)布的400個健康答案進行1～5級評分，研究結果表明健康參考圖書館館員對回答質(zhì)量的評價要低于提問者。Synnot等[12]對網(wǎng)絡多發(fā)性硬化癥使用定性研究設計，邀請51名多發(fā)性硬化癥（Multiple Sclerosis，MS）患者和9名家庭成員參加焦點小組，討論MS患者如何查找、評估和整合治療信息，結果表明患者希望與專業(yè)人員討論信息，并且建議網(wǎng)站應該加強與衛(wèi)生專業(yè)人員溝通交流和信息共享。國內(nèi)學者主要以定性評價法為主，許衛(wèi)衛(wèi)等[13]以心理健康網(wǎng)站為例，依據(jù)參考文獻提出內(nèi)容指標、技術指標、效用指標3個一級指標，采用層次分析法（Analytic Hierarchy Process，AHP）對8個網(wǎng)站進行實證分析，結果表明，對于網(wǎng)絡衛(wèi)生信息資源評價研究，信息內(nèi)容質(zhì)量是最受用戶關注的。鑒于定性評價法主要是由專家或者用戶進行主觀性評價，在一定程度上容易受人為因素的干擾，目前很多學者已經(jīng)從定性分析法轉向定性與定量相結合的綜合評價法。如張玢等[14]對隨機抽取的一篇醫(yī)學信息網(wǎng)頁采用模糊綜合評價法進行判斷，利用模糊數(shù)學工具將難以度量的指標進行量化，使定性和定量分析更好地為資源評價服務。桑運鑫等[15]從用戶角度出發(fā)，利用改進的AHP法和專家聚類法，對網(wǎng)絡社區(qū)信息質(zhì)量指標進行主客觀綜合賦權，然后對Alexa母嬰類中文排名前五的網(wǎng)站信息內(nèi)容進行綜合評價。

綜上所述，現(xiàn)有相關研究成果豐富，但多數(shù)學者的研究對象是針對提供健康信息的平臺進行整體評價，其中就包括平臺本身的特征，且很少有研究從醫(yī)療健康類信息資源模糊性與不確定性的實際特征需求出發(fā)，尋求合適的評價方法與評價模型進行實證性研究。針對上述不足，本研究擬通過文獻調(diào)查法、專家打分法和AHP法，構建醫(yī)療網(wǎng)站信息質(zhì)量評價指標體系和權重，利用實際用戶的問卷調(diào)查數(shù)據(jù)，采用證據(jù)推理理論對指標進行信息融合，解決多屬性決策問題中信息不全的問題，實現(xiàn)對醫(yī)療健康網(wǎng)站信息質(zhì)量的實證研究。

2 醫(yī)療健康網(wǎng)站信息質(zhì)量評價指標體系構建

參照Jim[16]在《網(wǎng)頁評估標準》中對信息質(zhì)量提出的準確性、權威性、時效性和全面性4個標準，本文從在線醫(yī)療健康網(wǎng)站相關文獻中歸納、總結、提煉出信息質(zhì)量方面的主要影響維度，即從信息來源、信息表達、信息內(nèi)容、信息效用4個維度開展研究。

2.1 評價指標的選取

本研究的評價指標體系是在遵循指標構建的五大原則基礎上進行的。借鑒相關研究成果，結合我國現(xiàn)實情況，排除網(wǎng)站設計相關指標得到原始指標，然后邀請從事醫(yī)療健康信息領域的7位專家對原始指標進行咨詢，根據(jù)咨詢結果及時調(diào)整原始指標中不合理的成分，再次匿名發(fā)給各專家詢問，重復步驟直到咨詢結果一致結束，最終得到在線健康信息質(zhì)量評價指標（見表1）。

2.2 評價指標的權重確定

由于AHP法計算過程清晰，可操作性強，因而本研究采用該方法確定各指標權重。通過邀請5位專家，引入李克特五級標度量表對指標的重要性進行比較，然后匯總所有結果，將結果中差異較大的情況反饋給專家進行逐次調(diào)整，直到專家們意見一致，構造出判斷矩陣，計算過程如下所示：①構造判斷矩陣A=（aij）n×n，其中aij表示某個層次因素i和因素j相對于目標重要值；②用求解矩陣特征值的方法解出最大特征值和特征向量，歸一化后的特征向量即為權重；③對判斷矩陣的邏輯性進行一致性檢驗，若CR=CI/RI＜0.1，則該矩陣通過一致性檢驗，認為該矩陣是可接受的。由此得到最終的評價指標權重如表2所示。

表1 醫(yī)療健康網(wǎng)站信息質(zhì)量評價指標

表2 醫(yī)療健康網(wǎng)站信息質(zhì)量評價指標體系

3 醫(yī)療健康網(wǎng)站信息質(zhì)量評價實證研究

3.1 信息源選取

研究以“中風”為檢索詞，在百度、360搜索、必應中進行檢索，選取查詢結果的第1～5頁，剔除無關、貼吧、新聞網(wǎng)站、廣告、視頻、無效等網(wǎng)站，篩選出春雨醫(yī)生、39健康網(wǎng)、飛華健康網(wǎng)、尋醫(yī)問藥網(wǎng)、百度拇指醫(yī)生、快速問醫(yī)生、好大夫在線、丁香醫(yī)生、家庭醫(yī)生在線9家網(wǎng)站，對其信息質(zhì)量進行評價研究。

3.2 數(shù)據(jù)采集

根據(jù)表1的內(nèi)容采用李克特五級評分法設計問卷題項，為了保證問卷的可靠性和有效性，在初次編寫好問卷后先進行預調(diào)查。邀請醫(yī)生、醫(yī)學信息專業(yè)學生、在線醫(yī)療健康網(wǎng)站用戶進行問卷發(fā)放?；厥諉柧頃r向參與者咨詢是否有不理解和概念模糊不明確的問題項，然后根據(jù)預調(diào)查的結果和建議，進一步修改完善形成最終問卷。

正式問卷調(diào)查過程中，將問卷星鏈接分享到朋友圈，通過滾雪球的方式不斷地邀請使用過在線健康網(wǎng)站的人進行填寫，共收回問卷150份，剔除無效問卷，得到有效問卷135份?；厥盏挠行柧碇?，使用人員在各個年齡、性別、職業(yè)、受教育程度均有分布，其中26～40歲，專科及以上學歷，使用目的為醫(yī)療健康知識科普和醫(yī)療信息查詢的人數(shù)占比較大。在量表設計的合理性方面，利用SPSS22對問卷的信效度實施檢驗，結果顯示Cronbach α可信性系數(shù)和KMO系數(shù)分別為0.816和0.834，表明該問卷具有較好的信度和效度。

3.3 評價過程及結果分析

健康信息質(zhì)量評價多使用AHP法、模糊評價法等，這些方法各有優(yōu)缺點，如AHP法結構分明，但在使用9級標度時，容易對中間標度做出混亂的判斷。模糊評價法將定性問題量化，但是當指標數(shù)量較多時，權向量和模糊矩陣不匹配，且這兩種方法都存在信息丟失的問題[25-26]。在線健康信息質(zhì)量需要用戶給予評價，而用戶專業(yè)的局限性和健康信息本身具有不確定性、模糊性，使得需要一種能夠處理不精確、不完備、不完全可靠數(shù)據(jù)的方法[27]，現(xiàn)有的研究表明證據(jù)推理方法在企業(yè)R&D成果驗收[28]、突發(fā)事件預警[29]、學生學習效果[30]等方面取得良好的效果，因此將證據(jù)推理方法引入在線健康信息質(zhì)量評價，以期提高信息質(zhì)量評估結果，擴大證據(jù)推理應用范圍。證據(jù)推理方法以多種先進評價決策理論為基礎，對于評價過程中的信息不確定問題，通過利用模糊規(guī)則對底層指標直接評價，然后利用證據(jù)推理算法對底層指標的評價進行變換處理，以此實現(xiàn)對上一層級的間接評價，最后再利用效用理論將評價結果用效用函數(shù)計算得到，具體實施步驟如下。

假設在醫(yī)療健康網(wǎng)站信息質(zhì)量評價指標中，有一個頂層指標y和其下對應的L個底層指標，評價網(wǎng)站為al（l=1，2，…，M）。指標ei（i=1，2，…，L）對應的權重為ωi，且權重要同時滿足0≤ωi≤1，ω1+ω2+…+ωL=1。

首先，確定指標評價值。設指標ei對應有N個評價等級，βn，i（al）表示網(wǎng)站al在指標i下被評為Hn等級的置信度?？蓪⒃u價等級設定為很好、好、一般、不好、很不好，則對應的效用值分別為1、0.75、0.5、0.25、0。

其次，根據(jù)公式（1）～公式（4），計算4個一級指標下各二級指標的基本概率分配。其中，mn,i（al）表示網(wǎng)站al中已經(jīng)分配的函數(shù)概率；mH,i（al）表示網(wǎng)站al中未分配的函數(shù)概率；表示網(wǎng)站al中指標ei對上層指標只起到部分作用的概率函數(shù)；表示網(wǎng)站al中對指標ei評估的不確定性而分配的概率函數(shù)。

再次，將上述計算得到的二級指標概率分配函數(shù)值，利用遞歸證據(jù)推理迭代法融合第i個和第i+1個指標，得到4個一級指標的基本概率分配，再對一級指標進行融合，得到該網(wǎng)站信息質(zhì)量總的概率分配。根據(jù)該方法得到網(wǎng)站各級指標融合后對應評估等級的置信度函數(shù)值見公式（5）和公式（6）。

最后，利用效用理論，將分布式結果化為具體數(shù)值表示，得到各網(wǎng)站信息質(zhì)量效用值。

通過上述計算步驟，各個醫(yī)療健康網(wǎng)站內(nèi)信息質(zhì)量對應評估等級結果，如表3所示。

醫(yī)療健康網(wǎng)站信息質(zhì)量的效用值計算后按順序從高到低依次排列：尋醫(yī)問藥網(wǎng)（0.749 3）、39健康網(wǎng)（0.743 0）、丁香醫(yī)生（0.742 0）、好大夫在線（0.734 5）、家庭醫(yī)生在線（0.733 0）、快速問醫(yī)生（0.725 4）、飛華健康網(wǎng)（0.715 8）、春雨醫(yī)生（0.707 9）、百度拇指醫(yī)生（0.606 4），健康網(wǎng)站信息質(zhì)量最高的是尋醫(yī)問藥網(wǎng)，最低的是百度拇指醫(yī)生。

鑒于目前沒有統(tǒng)一的排名標準，參考站長之家行業(yè)排名，查詢醫(yī)療健康類網(wǎng)站的排名情況，找出本研究中所提及網(wǎng)站排名如表4所示。

站長之家的排名是從網(wǎng)站結構、頁面布局、點擊量、回訪量、鏈接數(shù)等多個方面的綜合排名，間接地反映了用戶的使用情況。此處，假設用戶使用率與信息滿意度成正相關關系，可對比本研究得出的結果：尋醫(yī)問藥網(wǎng)、39健康網(wǎng)、好大夫在線等均處于排名前列，排名靠后的有飛華健康網(wǎng)、春雨醫(yī)生，在排名上與站長之家排名情況較為一致，因此本文用證據(jù)推理得出的結果有一定程度的參考意義。然而，百度拇指醫(yī)生未收入在站長之家內(nèi)，其排名情況未知，對此向接受問卷調(diào)查的用戶進行咨詢，大部分用戶表示使用過程中發(fā)現(xiàn)其信息生成時間較久，尤其在最新問題模塊沒有及時更新，缺乏對網(wǎng)站維護，時效性方面嚴重不足。

通過上述基于證據(jù)推理的健康網(wǎng)站信息質(zhì)量評價，9家健康網(wǎng)站信息質(zhì)量的一級指標評估值排序情況如圖1所示。

表3 基于證據(jù)推理融合的健康網(wǎng)站信息評價結果

表4 醫(yī)療健康網(wǎng)站排名情況

圖1 醫(yī)療健康網(wǎng)站信息質(zhì)量評價一級指標評估值

可以看出，9家醫(yī)療健康網(wǎng)站信息質(zhì)量從各信息來源、信息表達、信息內(nèi)容及信息效用方面各有優(yōu)劣勢。

（1）信息來源方面。丁香醫(yī)生評估值名列前茅，丁香醫(yī)生使用人數(shù)和信息規(guī)模比較龐大，并且丁香醫(yī)生是專注于為公眾提供醫(yī)學健康內(nèi)容與醫(yī)療健康服務的平臺，其醫(yī)療健康科普文章均由專業(yè)認證的丁香醫(yī)生編輯部編寫，信息來源的專業(yè)性、可靠性和權威性較好，受眾范圍廣泛。

（2）信息表達方面。9家醫(yī)療健康網(wǎng)站之間的差異不大，良好的信息表達可以讓人更好地理解和閱讀，目前基于大眾的醫(yī)療知識水平，各網(wǎng)站都致力于信息表達簡明清晰，使得用戶在閱讀使用健康醫(yī)療信息時，都能很好地獲取醫(yī)學知識和健康信息，以降低大眾對醫(yī)學專業(yè)術語的晦澀感。

（3）信息內(nèi)容方面。尋醫(yī)問藥網(wǎng)評估值最高，百度拇指醫(yī)生評估值最低。尋醫(yī)問藥網(wǎng)是國內(nèi)較早探索和實踐醫(yī)療健康服務的平臺之一，經(jīng)過十幾年的發(fā)展，形成比較完整醫(yī)療產(chǎn)業(yè)，作為“互聯(lián)網(wǎng)+醫(yī)療”的先驅，其信息內(nèi)容的完整性和準確性比較受大家認可。而拇指醫(yī)生是百度官方推出的產(chǎn)品，但因“魏則西事件”爆發(fā)，百度被指責發(fā)布虛假信息和醫(yī)療，誤導公眾和患者，導致公眾對其信任度下滑，引發(fā)信任危機，其醫(yī)療健康信息內(nèi)容的完整性和準確性遭質(zhì)疑。

（4）信息效用方面。丁香醫(yī)生評估值較高，其次是尋醫(yī)問藥網(wǎng)。丁香醫(yī)生是丁香園團隊組織研發(fā)，包含科普文章、健康小組、疾病問答等核心板塊，聚集了200萬名醫(yī)生用戶，推送的健康科普文章經(jīng)過專業(yè)評審，信息效用較高。

4 結論

隨著“互聯(lián)網(wǎng)+醫(yī)療健康”的興起，大眾可以通過互聯(lián)網(wǎng)方便快捷地獲得自己所需的健康信息，但是基于公眾自身的醫(yī)學知識薄弱，網(wǎng)上信息雜亂和監(jiān)管不到位等一系列問題使得一般用戶難以區(qū)分。因此，對醫(yī)療健康網(wǎng)站信息質(zhì)量進行科學評價值得我們關注。對此，本文在前人研究的基礎上，通過歸納整合出醫(yī)療健康信息質(zhì)量評價指標，利用AHP法對評價指標賦權并基于證據(jù)推理理論選取9家健康網(wǎng)站信息質(zhì)量進行綜合評價。該方法的優(yōu)點是保留了原始信息的不確定性，采用證據(jù)組合的算法對具有模糊性以及不確定性的多指標網(wǎng)絡健康信息進行融合，能夠很好地增強判斷的客觀性。而問卷調(diào)查法是獲得數(shù)據(jù)的最常用方法，由被調(diào)查者填寫數(shù)據(jù)，但是有時候被調(diào)查者所處的環(huán)境或者心情并沒有根據(jù)真實情況填寫，就有可能導致問卷調(diào)查的效度和信度低，因此，下一步我們考慮將評價指標盡可能地選擇為可以直接獲取的指標，以減少來自問卷調(diào)查法的偏差，降低主觀性，提高真實性。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡