成全 王火秀 駢文景
(福州大學經(jīng)濟與管理學院,福州 350116)
隨著技術的發(fā)展與人們生活水平的提高,人類對自身健康的重視程度越來越高,對健康信息的關注度和需求量也在不斷提高。近年來涌現(xiàn)出越來越多的醫(yī)療健康網(wǎng)站,豐富了人們獲取健康信息的方式,依托互聯(lián)網(wǎng)就可以了解醫(yī)療保健、疾病癥狀等相關醫(yī)療健康知識,受到網(wǎng)民的廣泛使用。CNNIC于2019年2月發(fā)布第43次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》,截至2018年12月,我國網(wǎng)民規(guī)模達到8.29億人,同比2017年12月增長7.38個百分點,普及率近60%,入網(wǎng)的門檻也在逐步降低[1]。Impicciatore等[2]發(fā)現(xiàn)互聯(lián)網(wǎng)健康信息的準確性和完整性存在很大差異,由于互聯(lián)網(wǎng)具有開放性特征,人們在獲取健康信息時無法分辨信息的真假,可能導致人們作出錯誤決策,如轟動一時的“魏則西事件”,就引發(fā)公眾對網(wǎng)絡健康信息的質(zhì)疑。此外,網(wǎng)絡健康信息缺乏相應的審核監(jiān)管制度[3],當前未有以政府部門或者專業(yè)的醫(yī)學組織為主導研發(fā)的擁有權威性和推廣性的評價準則[4],又因網(wǎng)絡平臺上廣告遍布、用戶隱私泄露和虛假信息等問題[5],降低了人們對網(wǎng)絡醫(yī)療健康類信息的信任度。由此可見,如何辨別和選取高質(zhì)量信息以及加強對網(wǎng)絡信息的監(jiān)管,幫助人們更加有效地使用網(wǎng)絡健康信息去解決現(xiàn)實問題已經(jīng)成為的重要研究方向。
對于網(wǎng)絡健康信息質(zhì)量問題的研究早已引起信息科學界的高度關注,研究成果異常豐富??v觀當前學術界對網(wǎng)絡信息質(zhì)量評價的研究成果,主要研究集中在網(wǎng)絡健康信息質(zhì)量的評價指標研究、評價方法與評價工具的應用實證研究等方面。
國外關于網(wǎng)絡健康信息質(zhì)量的評價指標研究可追溯到20世紀90年代中期,Elizabeth等[6]通過調(diào)查發(fā)現(xiàn),影響患者評估在線健康信息的因素中,設計因素(清晰布局、良好導航、互動)約占17%,而內(nèi)容因素(信息內(nèi)容、相關插圖、清晰簡潔語言、討論組等)約占83%。Kim等[7]對已經(jīng)發(fā)表的評估健康網(wǎng)站的標準進行審查,從中提取165條標準,最常用的包括網(wǎng)站的內(nèi)容、設計和美觀、作者、贊助商、權威性、易用性、可訪問性、可用性等。Gretchen等[8]從可訪問性、內(nèi)容質(zhì)量、可讀性方面分別對英語網(wǎng)站和西班牙語網(wǎng)站上有關乳腺癌、抑郁癥、肥胖癥和兒童哮喘的健康信息進行研究,結果發(fā)現(xiàn)用戶很難找到關于健康問題的完整和準確信息,并且可獲得的網(wǎng)絡健康信息也難以理解。國內(nèi)學者趙玉遂等[9]邀請健康教育、健康傳播、公共衛(wèi)生、社會醫(yī)學領域的專家進行兩輪咨詢,經(jīng)討論后形成信息特性、媒體特性、發(fā)布特性3個一級指標,信息可理解性、信息準確性、信息可參考性、信息時效性、信息新穎性、檢索、導航、頁面設計、媒體權威性、編輯權威性、作者權威性等15個二級指標。錢明輝等[5]從權威性、歸因性、全面性等9個維度構建評價指標體系,并結合40個平臺分析歸納在線健康平臺信息質(zhì)量特征。鄧勝利等[10]對國外網(wǎng)絡健康信息質(zhì)量評價的相關研究進行分析,總結出兩種常用的質(zhì)量指標分類:一是基于內(nèi)容評價,包括相關性、及時性、可信度、易讀性;二是基于網(wǎng)站設計評價,包括易用性、可訪問性、美觀性、導航性、交互性、隱私保護。
國外常用的是通過問卷調(diào)查法、焦點小組、半結構化訪談法對受訪者進行訪談,將獲取的評分采用統(tǒng)計分析方法進行分析。如Sanghee等[11]邀請?zhí)釂栒摺⒔】祬⒖紙D書館館員、護士3類人員對Yahoo! Answer中發(fā)布的400個健康答案進行1~5級評分,研究結果表明健康參考圖書館館員對回答質(zhì)量的評價要低于提問者。Synnot等[12]對網(wǎng)絡多發(fā)性硬化癥使用定性研究設計,邀請51名多發(fā)性硬化癥(Multiple Sclerosis,MS)患者和9名家庭成員參加焦點小組,討論MS患者如何查找、評估和整合治療信息,結果表明患者希望與專業(yè)人員討論信息,并且建議網(wǎng)站應該加強與衛(wèi)生專業(yè)人員溝通交流和信息共享。國內(nèi)學者主要以定性評價法為主,許衛(wèi)衛(wèi)等[13]以心理健康網(wǎng)站為例,依據(jù)參考文獻提出內(nèi)容指標、技術指標、效用指標3個一級指標,采用層次分析法(Analytic Hierarchy Process,AHP)對8個網(wǎng)站進行實證分析,結果表明,對于網(wǎng)絡衛(wèi)生信息資源評價研究,信息內(nèi)容質(zhì)量是最受用戶關注的。鑒于定性評價法主要是由專家或者用戶進行主觀性評價,在一定程度上容易受人為因素的干擾,目前很多學者已經(jīng)從定性分析法轉向定性與定量相結合的綜合評價法。如張玢等[14]對隨機抽取的一篇醫(yī)學信息網(wǎng)頁采用模糊綜合評價法進行判斷,利用模糊數(shù)學工具將難以度量的指標進行量化,使定性和定量分析更好地為資源評價服務。桑運鑫等[15]從用戶角度出發(fā),利用改進的AHP法和專家聚類法,對網(wǎng)絡社區(qū)信息質(zhì)量指標進行主客觀綜合賦權,然后對Alexa母嬰類中文排名前五的網(wǎng)站信息內(nèi)容進行綜合評價。
綜上所述,現(xiàn)有相關研究成果豐富,但多數(shù)學者的研究對象是針對提供健康信息的平臺進行整體評價,其中就包括平臺本身的特征,且很少有研究從醫(yī)療健康類信息資源模糊性與不確定性的實際特征需求出發(fā),尋求合適的評價方法與評價模型進行實證性研究。針對上述不足,本研究擬通過文獻調(diào)查法、專家打分法和AHP法,構建醫(yī)療網(wǎng)站信息質(zhì)量評價指標體系和權重,利用實際用戶的問卷調(diào)查數(shù)據(jù),采用證據(jù)推理理論對指標進行信息融合,解決多屬性決策問題中信息不全的問題,實現(xiàn)對醫(yī)療健康網(wǎng)站信息質(zhì)量的實證研究。
參照Jim[16]在《網(wǎng)頁評估標準》中對信息質(zhì)量提出的準確性、權威性、時效性和全面性4個標準,本文從在線醫(yī)療健康網(wǎng)站相關文獻中歸納、總結、提煉出信息質(zhì)量方面的主要影響維度,即從信息來源、信息表達、信息內(nèi)容、信息效用4個維度開展研究。
本研究的評價指標體系是在遵循指標構建的五大原則基礎上進行的。借鑒相關研究成果,結合我國現(xiàn)實情況,排除網(wǎng)站設計相關指標得到原始指標,然后邀請從事醫(yī)療健康信息領域的7位專家對原始指標進行咨詢,根據(jù)咨詢結果及時調(diào)整原始指標中不合理的成分,再次匿名發(fā)給各專家詢問,重復步驟直到咨詢結果一致結束,最終得到在線健康信息質(zhì)量評價指標(見表1)。
由于AHP法計算過程清晰,可操作性強,因而本研究采用該方法確定各指標權重。通過邀請5位專家,引入李克特五級標度量表對指標的重要性進行比較,然后匯總所有結果,將結果中差異較大的情況反饋給專家進行逐次調(diào)整,直到專家們意見一致,構造出判斷矩陣,計算過程如下所示:①構造判斷矩陣A=(aij)n×n,其中aij表示某個層次因素i和因素j相對于目標重要值;②用求解矩陣特征值的方法解出最大特征值和特征向量,歸一化后的特征向量即為權重;③對判斷矩陣的邏輯性進行一致性檢驗,若CR=CI/RI<0.1,則該矩陣通過一致性檢驗,認為該矩陣是可接受的。由此得到最終的評價指標權重如表2所示。
表1 醫(yī)療健康網(wǎng)站信息質(zhì)量評價指標
表2 醫(yī)療健康網(wǎng)站信息質(zhì)量評價指標體系
研究以“中風”為檢索詞,在百度、360搜索、必應中進行檢索,選取查詢結果的第1~5頁,剔除無關、貼吧、新聞網(wǎng)站、廣告、視頻、無效等網(wǎng)站,篩選出春雨醫(yī)生、39健康網(wǎng)、飛華健康網(wǎng)、尋醫(yī)問藥網(wǎng)、百度拇指醫(yī)生、快速問醫(yī)生、好大夫在線、丁香醫(yī)生、家庭醫(yī)生在線9家網(wǎng)站,對其信息質(zhì)量進行評價研究。
根據(jù)表1的內(nèi)容采用李克特五級評分法設計問卷題項,為了保證問卷的可靠性和有效性,在初次編寫好問卷后先進行預調(diào)查。邀請醫(yī)生、醫(yī)學信息專業(yè)學生、在線醫(yī)療健康網(wǎng)站用戶進行問卷發(fā)放?;厥諉柧頃r向參與者咨詢是否有不理解和概念模糊不明確的問題項,然后根據(jù)預調(diào)查的結果和建議,進一步修改完善形成最終問卷。
正式問卷調(diào)查過程中,將問卷星鏈接分享到朋友圈,通過滾雪球的方式不斷地邀請使用過在線健康網(wǎng)站的人進行填寫,共收回問卷150份,剔除無效問卷,得到有效問卷135份?;厥盏挠行柧碇?,使用人員在各個年齡、性別、職業(yè)、受教育程度均有分布,其中26~40歲,專科及以上學歷,使用目的為醫(yī)療健康知識科普和醫(yī)療信息查詢的人數(shù)占比較大。在量表設計的合理性方面,利用SPSS22對問卷的信效度實施檢驗,結果顯示Cronbach α可信性系數(shù)和KMO系數(shù)分別為0.816和0.834,表明該問卷具有較好的信度和效度。
健康信息質(zhì)量評價多使用AHP法、模糊評價法等,這些方法各有優(yōu)缺點,如AHP法結構分明,但在使用9級標度時,容易對中間標度做出混亂的判斷。模糊評價法將定性問題量化,但是當指標數(shù)量較多時,權向量和模糊矩陣不匹配,且這兩種方法都存在信息丟失的問題[25-26]。在線健康信息質(zhì)量需要用戶給予評價,而用戶專業(yè)的局限性和健康信息本身具有不確定性、模糊性,使得需要一種能夠處理不精確、不完備、不完全可靠數(shù)據(jù)的方法[27],現(xiàn)有的研究表明證據(jù)推理方法在企業(yè)R&D成果驗收[28]、突發(fā)事件預警[29]、學生學習效果[30]等方面取得良好的效果,因此將證據(jù)推理方法引入在線健康信息質(zhì)量評價,以期提高信息質(zhì)量評估結果,擴大證據(jù)推理應用范圍。證據(jù)推理方法以多種先進評價決策理論為基礎,對于評價過程中的信息不確定問題,通過利用模糊規(guī)則對底層指標直接評價,然后利用證據(jù)推理算法對底層指標的評價進行變換處理,以此實現(xiàn)對上一層級的間接評價,最后再利用效用理論將評價結果用效用函數(shù)計算得到,具體實施步驟如下。
假設在醫(yī)療健康網(wǎng)站信息質(zhì)量評價指標中,有一個頂層指標y和其下對應的L個底層指標,評價網(wǎng)站為al(l=1,2,…,M)。指標ei(i=1,2,…,L)對應的權重為ωi,且權重要同時滿足0≤ωi≤1,ω1+ω2+…+ωL=1。
首先,確定指標評價值。設指標ei對應有N個評價等級,βn,i(al)表示網(wǎng)站al在指標i下被評為Hn等級的置信度??蓪⒃u價等級設定為很好、好、一般、不好、很不好,則對應的效用值分別為1、0.75、0.5、0.25、0。
其次,根據(jù)公式(1)~公式(4),計算4個一級指標下各二級指標的基本概率分配。其中,mn,i(al)表示網(wǎng)站al中已經(jīng)分配的函數(shù)概率;mH,i(al)表示網(wǎng)站al中未分配的函數(shù)概率;表示網(wǎng)站al中指標ei對上層指標只起到部分作用的概率函數(shù);表示網(wǎng)站al中對指標ei評估的不確定性而分配的概率函數(shù)。
再次,將上述計算得到的二級指標概率分配函數(shù)值,利用遞歸證據(jù)推理迭代法融合第i個和第i+1個指標,得到4個一級指標的基本概率分配,再對一級指標進行融合,得到該網(wǎng)站信息質(zhì)量總的概率分配。根據(jù)該方法得到網(wǎng)站各級指標融合后對應評估等級的置信度函數(shù)值見公式(5)和公式(6)。
最后,利用效用理論,將分布式結果化為具體數(shù)值表示,得到各網(wǎng)站信息質(zhì)量效用值。
通過上述計算步驟,各個醫(yī)療健康網(wǎng)站內(nèi)信息質(zhì)量對應評估等級結果,如表3所示。
醫(yī)療健康網(wǎng)站信息質(zhì)量的效用值計算后按順序從高到低依次排列:尋醫(yī)問藥網(wǎng)(0.749 3)、39健康網(wǎng)(0.743 0)、丁香醫(yī)生(0.742 0)、好大夫在線(0.734 5)、家庭醫(yī)生在線(0.733 0)、快速問醫(yī)生(0.725 4)、飛華健康網(wǎng)(0.715 8)、春雨醫(yī)生(0.707 9)、百度拇指醫(yī)生(0.606 4),健康網(wǎng)站信息質(zhì)量最高的是尋醫(yī)問藥網(wǎng),最低的是百度拇指醫(yī)生。
鑒于目前沒有統(tǒng)一的排名標準,參考站長之家行業(yè)排名,查詢醫(yī)療健康類網(wǎng)站的排名情況,找出本研究中所提及網(wǎng)站排名如表4所示。
站長之家的排名是從網(wǎng)站結構、頁面布局、點擊量、回訪量、鏈接數(shù)等多個方面的綜合排名,間接地反映了用戶的使用情況。此處,假設用戶使用率與信息滿意度成正相關關系,可對比本研究得出的結果:尋醫(yī)問藥網(wǎng)、39健康網(wǎng)、好大夫在線等均處于排名前列,排名靠后的有飛華健康網(wǎng)、春雨醫(yī)生,在排名上與站長之家排名情況較為一致,因此本文用證據(jù)推理得出的結果有一定程度的參考意義。然而,百度拇指醫(yī)生未收入在站長之家內(nèi),其排名情況未知,對此向接受問卷調(diào)查的用戶進行咨詢,大部分用戶表示使用過程中發(fā)現(xiàn)其信息生成時間較久,尤其在最新問題模塊沒有及時更新,缺乏對網(wǎng)站維護,時效性方面嚴重不足。
通過上述基于證據(jù)推理的健康網(wǎng)站信息質(zhì)量評價,9家健康網(wǎng)站信息質(zhì)量的一級指標評估值排序情況如圖1所示。
表3 基于證據(jù)推理融合的健康網(wǎng)站信息評價結果
表4 醫(yī)療健康網(wǎng)站排名情況
圖1 醫(yī)療健康網(wǎng)站信息質(zhì)量評價一級指標評估值
可以看出,9家醫(yī)療健康網(wǎng)站信息質(zhì)量從各信息來源、信息表達、信息內(nèi)容及信息效用方面各有優(yōu)劣勢。
(1)信息來源方面。丁香醫(yī)生評估值名列前茅,丁香醫(yī)生使用人數(shù)和信息規(guī)模比較龐大,并且丁香醫(yī)生是專注于為公眾提供醫(yī)學健康內(nèi)容與醫(yī)療健康服務的平臺,其醫(yī)療健康科普文章均由專業(yè)認證的丁香醫(yī)生編輯部編寫,信息來源的專業(yè)性、可靠性和權威性較好,受眾范圍廣泛。
(2)信息表達方面。9家醫(yī)療健康網(wǎng)站之間的差異不大,良好的信息表達可以讓人更好地理解和閱讀,目前基于大眾的醫(yī)療知識水平,各網(wǎng)站都致力于信息表達簡明清晰,使得用戶在閱讀使用健康醫(yī)療信息時,都能很好地獲取醫(yī)學知識和健康信息,以降低大眾對醫(yī)學專業(yè)術語的晦澀感。
(3)信息內(nèi)容方面。尋醫(yī)問藥網(wǎng)評估值最高,百度拇指醫(yī)生評估值最低。尋醫(yī)問藥網(wǎng)是國內(nèi)較早探索和實踐醫(yī)療健康服務的平臺之一,經(jīng)過十幾年的發(fā)展,形成比較完整醫(yī)療產(chǎn)業(yè),作為“互聯(lián)網(wǎng)+醫(yī)療”的先驅,其信息內(nèi)容的完整性和準確性比較受大家認可。而拇指醫(yī)生是百度官方推出的產(chǎn)品,但因“魏則西事件”爆發(fā),百度被指責發(fā)布虛假信息和醫(yī)療,誤導公眾和患者,導致公眾對其信任度下滑,引發(fā)信任危機,其醫(yī)療健康信息內(nèi)容的完整性和準確性遭質(zhì)疑。
(4)信息效用方面。丁香醫(yī)生評估值較高,其次是尋醫(yī)問藥網(wǎng)。丁香醫(yī)生是丁香園團隊組織研發(fā),包含科普文章、健康小組、疾病問答等核心板塊,聚集了200萬名醫(yī)生用戶,推送的健康科普文章經(jīng)過專業(yè)評審,信息效用較高。
隨著“互聯(lián)網(wǎng)+醫(yī)療健康”的興起,大眾可以通過互聯(lián)網(wǎng)方便快捷地獲得自己所需的健康信息,但是基于公眾自身的醫(yī)學知識薄弱,網(wǎng)上信息雜亂和監(jiān)管不到位等一系列問題使得一般用戶難以區(qū)分。因此,對醫(yī)療健康網(wǎng)站信息質(zhì)量進行科學評價值得我們關注。對此,本文在前人研究的基礎上,通過歸納整合出醫(yī)療健康信息質(zhì)量評價指標,利用AHP法對評價指標賦權并基于證據(jù)推理理論選取9家健康網(wǎng)站信息質(zhì)量進行綜合評價。該方法的優(yōu)點是保留了原始信息的不確定性,采用證據(jù)組合的算法對具有模糊性以及不確定性的多指標網(wǎng)絡健康信息進行融合,能夠很好地增強判斷的客觀性。而問卷調(diào)查法是獲得數(shù)據(jù)的最常用方法,由被調(diào)查者填寫數(shù)據(jù),但是有時候被調(diào)查者所處的環(huán)境或者心情并沒有根據(jù)真實情況填寫,就有可能導致問卷調(diào)查的效度和信度低,因此,下一步我們考慮將評價指標盡可能地選擇為可以直接獲取的指標,以減少來自問卷調(diào)查法的偏差,降低主觀性,提高真實性。