楊克虎(蘭州大學循證社會科學研究中心)
2020 年10 月,黨的十九屆五中全會審議通過的《中共中央關(guān)于制定國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和二〇三五年遠景目標的建議》明確提出了“構(gòu)建國家科研論文和科技信息高端交流平臺”(以下簡稱“高端交流平臺”)的戰(zhàn)略部署,顯示了黨和國家站在“百年未有之大變局”關(guān)口對我國國家科技創(chuàng)新體系基礎(chǔ)設(shè)施建設(shè)的重視和支持,這一國家戰(zhàn)略也迅速吸引了整個科學界特別是科研管理、信息管理等領(lǐng)域工作者的關(guān)注和討論,可以預見在“十四五”乃至更長一段時間內(nèi)都將成為一個學界持續(xù)關(guān)注與討論的科學問題。
筆者認為,如將以證據(jù)為核心,在過去近30 年間迅猛發(fā)展,已從醫(yī)學領(lǐng)域應(yīng)用到社會科學及實踐決策領(lǐng)域且廣受好評的循證理念和方法,引入到高端交流平臺構(gòu)建這一國家戰(zhàn)略的學術(shù)討論與實踐實施之中,推動國家高端交流平臺從信息平臺走向循證平臺,無疑將會是一個全新的視野。循證平臺顧名思義就是以證據(jù)為核心的技術(shù)平臺,而證據(jù)就是經(jīng)過系統(tǒng)評價、接近事實真相的信息。通俗來說就是經(jīng)過研究后得出的結(jié)論信息。循證平臺與信息平臺的主要區(qū)別就是信息組織與證據(jù)組織的區(qū)別,將國家高端交流平臺建設(shè)為循證平臺,既是一次信息平臺資源組織架構(gòu)的升級重構(gòu),又是一個創(chuàng)新的平臺知識服務(wù)模式的打造,是外在發(fā)展需求及內(nèi)在科學使命驅(qū)動共同的結(jié)果。
首先,將國家高端交流平臺打造為循證平臺有著需求驅(qū)動。據(jù)Web of Science 數(shù)據(jù)庫統(tǒng)計,從2012 年至2021 年(截至2021 年5 月)近10 年間僅中國科研人員發(fā)表SCI 論文的總數(shù)已累計達到339.7 萬篇??蒲姓撐牡脑黾釉跒榭茖W工作者提供了可供選擇的豐富文獻的同時,也對文獻進行有效獲取和科學組織提出了考驗,如何提高文獻信息的檢索效率一直是圖書館、數(shù)據(jù)庫商及相關(guān)從業(yè)者苦思冥想?yún)s又難以完全滿足用戶訴求的問題。不可否認,云計算信息存儲、語義化知識組織,以及核心期刊遴選等極大地提高了用戶的信息獲取體驗, 但當前大數(shù)據(jù)時代困擾用戶的信息數(shù)量龐大、 篩選困難等信息不對稱問題依然存在,如果在國家高端交流平臺的構(gòu)建中不能從整個信息資源的組織模式上進行革新,信息不對稱問題將一直存在,也就難以企及“高端”所對應(yīng)的定位。從信息資源知識化、將知識證據(jù)化無疑就是一個可供選擇的信息組織革新思路。
其次,將國家高端交流平臺打造為循證平臺有著理論支持。目前,學界對國家高端交流平臺的理解較為多樣,但無論如何定義“高端”的廣度和深度,“高端信息交流平臺”都始終是一個信息平臺,其建設(shè)也脫離不了必須考慮信息資源的相關(guān)性和用戶服務(wù)的可及性這兩大績效考量指標。正如Slawson DC等所言,任何信息源的效用都取決于它的相關(guān)性,并隨著準確性提升而倍增,且隨著信息獲取工作量的增加而倍減。因此,國家高端交流平臺構(gòu)建的目標就是高相關(guān)性、高準確度和(用戶的)低工作量。運用證據(jù)質(zhì)量分級理論推動信息資源向證據(jù)資源、從低級別證據(jù)向高級別證據(jù)的轉(zhuǎn)化無疑就能提高平臺的資源相關(guān)性以及服務(wù)可及性。
在循證科學中,以證據(jù)分級思想為基礎(chǔ)的證據(jù)金字塔(見圖1)是用戶(包括決策者或研究者)根據(jù)解決問題的需要,對相關(guān)信息進行匯總分析、研究后所獲得的嚴謹度不同的知識體系。在實踐中用戶可根據(jù)證據(jù)的級別高低分級,將可獲得的最高級別的證據(jù)作為最佳證據(jù);如果最高級別證據(jù)缺失,則采用次之的證據(jù)。由證據(jù)金字塔可見,層級越高的證據(jù)越是應(yīng)用嚴格的方法進行理性分析的成果。 如采用隨機對照試驗(Randomized Controlled Trial,RCT)所取得的結(jié)論定義為高質(zhì)量證據(jù),而對結(jié)論進行系統(tǒng)評價(Systematic Review,SR)所得證據(jù)則為最高質(zhì)量證據(jù)。 然而,由于現(xiàn)實中各種條件的限制,科研論文和科技信息平臺不可能保證其所提供的信息均為高質(zhì)量證據(jù),大量的原始文獻即低級別證據(jù)是證據(jù)體系的最重要組成部分,從低質(zhì)量證據(jù)向高質(zhì)量證據(jù)的轉(zhuǎn)化存在著巨大的發(fā)展空間。
圖1 證據(jù)金字塔[3]
再次,將國家高端交流平臺打造為循證平臺有著實行方法及技術(shù)保障。從已有的方法來看,實現(xiàn)從低質(zhì)量證據(jù)到高質(zhì)量證據(jù)轉(zhuǎn)化并不困難,如對作為低質(zhì)量證據(jù)的原始文獻依據(jù)嚴格的程序進行文獻摘錄、整理匯編以及系統(tǒng)評價等均可轉(zhuǎn)化成為高級證據(jù),如循證醫(yī)學領(lǐng)域的知識服務(wù)系統(tǒng)Clinical Evidence(CE)除提供基本的知識服務(wù)和醫(yī)療知識,以及發(fā)表超出傳統(tǒng)期刊范疇、經(jīng)過同行評議的系統(tǒng)綜述外,也通過全面的文獻證據(jù)搜索與科學評價對最新的預防及治療知識進行匯總進而形成系統(tǒng)綜述和總結(jié)報告,及時對各種預防、治療和干預手段的利弊進行權(quán)威性論述,運用科學方法在實現(xiàn)低級別證據(jù)向高級別證據(jù)轉(zhuǎn)化的同時也向用戶提供了科學決策知識服務(wù)。
當然,海量的原始文獻為國家高端交流循證平臺的構(gòu)建提出了挑戰(zhàn),但現(xiàn)代信息技術(shù)特別是自然語言處理(Nature Language Processing,NLP)技術(shù)的發(fā)展和自動文摘等應(yīng)用場景的出現(xiàn)為這一難題提供了解決方案。如有研究顯示,發(fā)表一篇系統(tǒng)評價平均需花費研究者67.3 周的時間,而Clark通過使用10 余個自然語言處理工具則在兩周內(nèi)完成了液體攝入對尿路感染影響的系統(tǒng)評價,大大縮短了時間周期。 自動文摘處理更是技術(shù)成熟,目前已在Web 搜索、智能問答、輿情監(jiān)督等領(lǐng)域得到廣泛應(yīng)用,面向原始研究文獻的自動文摘更是在技術(shù)迭代、關(guān)鍵技術(shù)研發(fā)方面發(fā)展較快。
最后,將國家高端交流平臺打造為循證平臺可以創(chuàng)新平臺知識服務(wù)模式。 Haynes RB于2001 年提出了一種循證服務(wù)平臺的“4S”模型,其從低到高包含原始研究(Original Studies)、對證據(jù)的系統(tǒng)綜述(Syntheses)、對研究和綜述的摘要(Synopses)以及循證信息系統(tǒng)(Systems)等4 個層次,用戶可以按從高到底的順序進行信息檢索。 2006 年,Haynes RB在“4S”模型的基礎(chǔ)上構(gòu)建了“5S”模型(見圖2),自底向上分別為研究(Studies,原始性研究)、綜述(Syntheses,如Cochrane 系統(tǒng)評價)、摘要(Synopses,單個研究或系統(tǒng)評價的簡短描述)、總結(jié)(Summaries,特定主題的證據(jù)總結(jié))與系統(tǒng)(Systems,個體信息與相關(guān)最佳證據(jù)相結(jié)合的決策支持系統(tǒng))。 不管是4S 模型還是5S 模型,其均有別于當前主要科研論文和科技信息平臺所拘泥于主題、篇名等檢索層面,為用戶的信息獲取提供了一個從高到低的優(yōu)先分級選項。
圖2 循證知識服務(wù)模型[9]
綜上可見,將國家高端交流平臺打造為循證平臺有著從需求驅(qū)動、理論支持及方法技術(shù)保障等有利因素,也能夠創(chuàng)新傳統(tǒng)文獻數(shù)據(jù)庫或知識庫的知識服務(wù)模式。本文僅僅從有利因素、服務(wù)模式等方面提及了一些設(shè)想,在頂層設(shè)計、制度保障、協(xié)同機制等宏觀層面,以及證據(jù)轉(zhuǎn)化方法、技術(shù)實現(xiàn)等微觀層面還有著諸多研究空間,亟待科學共同體給予更多研究及探索。