■張光耀 姜春林 王賢文
大連理工大學科學學與科技管理研究所暨WISE實驗室, 遼寧省大連市甘井子區(qū)凌工路2號 116024
開放獲取(Open Access,OA)是學術(shù)界和出版界為推動科研成果在公共互聯(lián)網(wǎng)免費傳播和獲取而采取的行動,其目的在于促進科學交流,提高科研效率,提升科研成果的公共利用程度。相對于傳統(tǒng)的學術(shù)出版模式,OA論文具有更短的出版周期,減輕了科研機構(gòu)的財政壓力,為科研人員提供了更多獲取學術(shù)資源的機會[1]。從興起到現(xiàn)在,OA運動不斷引起關(guān)注并持續(xù)向縱深發(fā)展,已經(jīng)成為不可阻擋的大趨勢,其意義不僅在于知識的開放和共享,更重要的是它或許將改變科學研究范式和知識交流生態(tài)。歐洲研究理事會和12個國家的主要研究機構(gòu)和資助者于2018年9月啟動了OA出版計劃——Plan S,要求從2020年起,由公共資助的研究產(chǎn)生的科學出版物必須在OA期刊或平臺上發(fā)布。雖然OA促進了科研成果傳播,但是在OA期刊上發(fā)表論文是否存在引用優(yōu)勢仍存在爭議,從而影響了學者向OA期刊投稿的積極性[2]。而且OA直接沖擊到專業(yè)學術(shù)期刊的商業(yè)利益,并會增加版面費從而引起稿源流失,成為出版商推動OA進程的直接阻礙[3]。
已有大量證實OA優(yōu)勢的研究主要基于發(fā)文和引文視角,如Eysenbach[4]對發(fā)表在ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica(PNAS)的OA和非OA論文進行文獻計量分析;Hua等[5]對PubMed腫瘤學引文數(shù)據(jù)進行統(tǒng)計分析;Yan等[6]使用CiteScore作為期刊影響力指標,對OA和非OA期刊的影響力差異進行了檢測。這些研究都在一定程度上證明了OA能加速研究成果的傳播和吸收。國內(nèi)學者如武慶圓[7]采用科學計量學方法對OA期刊的知識交流行為進行分析,以驗證OA期刊知識交流的有效性;陳娟[8]采用引文分析法、多元統(tǒng)計法分析Scopus和Web of Science(WoS)收錄的OA期刊分布情況,發(fā)現(xiàn)Scopus和WoS收錄的各學科OA期刊的影響因子均低于非OA期刊,而OA期刊在影響因子的提升速度上更具有優(yōu)勢。
在OA對知識在地理空間上的擴散和對發(fā)展中國家獲取科學資源的影響的研究上,Evans等[9]使用根據(jù)論文引用建立的數(shù)據(jù)集,測算了OA對低收入國家科學傳播的影響,發(fā)現(xiàn)OA論文對發(fā)展中國家的影響是發(fā)達國家的兩倍。Tang等[10]通過比較OA論文與同一期刊上發(fā)表的非OA論文,測算了OA對JournalCitationReports(JCR)中46種生態(tài)學期刊載文被引頻次的影響,發(fā)現(xiàn)OA論文相對于非OA論文獲得了更多引用,這種引用優(yōu)勢在北美、歐洲、亞洲、非洲和大洋洲的國家均存在。Ezema等[11]以African Journals Online(AJOL)中的65種OA和69種非OA的醫(yī)學健康類期刊為研究對象,對兩類期刊的h指數(shù)、被引頻次、篇均被引頻次進行分析,發(fā)現(xiàn)OA期刊相對于非OA期刊均存在顯著的優(yōu)勢,從而證實OA對非洲的醫(yī)學學術(shù)交流具有重要的影響。
在互聯(lián)網(wǎng)技術(shù)高速發(fā)展的當下,OA呈現(xiàn)出更加旺盛的發(fā)展態(tài)勢,同時,論文使用數(shù)據(jù)和Altermetrics數(shù)據(jù)的開放大大拓展了OA的研究空間,相比于傳統(tǒng)引文數(shù)據(jù)的滯后性,使用數(shù)據(jù)有著即時、量大的特點,而且可以在動態(tài)時間模式下進行對比分析。如Alperin[12]使用SciELO和Altmetric.com中的數(shù)據(jù)構(gòu)建數(shù)據(jù)集,通過測度發(fā)展中國家和地區(qū)的論文覆蓋率來反映Altmetrics在世界范圍的變化情況;Wang等[13]將Altmetrics數(shù)據(jù)進一步拓展到論文使用和社交媒體層面,OA論文具有更高的下載量;王真等[14]跟蹤記錄PLoSBiology和PLoSMedicine2016年11月發(fā)表的38篇研究論文的瀏覽量數(shù)據(jù),利用統(tǒng)計方法探索了PLoS平臺OA學術(shù)論文在網(wǎng)絡媒體中瀏覽量的累積規(guī)律。本研究根據(jù)論文使用數(shù)據(jù),從時間和地理空間視角探索OA的優(yōu)勢,為OA優(yōu)勢提供新的研究視角。
在獲取《新英格蘭醫(yī)學期刊》(TheNewEnglandJournalofMedicine,NEJM)獨特的論文計量數(shù)據(jù)(包括每篇文章每天更新的瀏覽量和地理分布)后,可以從時間和地理空間的角度來審視OA的優(yōu)勢。本研究主要關(guān)注以下兩個問題: (1) 從地理空間角度來看,OA論文的地理分布是否比非OA論文更廣?OA是否會顯著擴大讀者的地域范圍,尤其是能否讓發(fā)展中國家的讀者受益?(2)從時間的角度來看,非OA論文和OA論文的下載量的差距是否隨時間擴大?特別是當論文在發(fā)表6個月后由非OA轉(zhuǎn)為OA,差距是否會縮小?
本研究選取NEJM在2011—2018年間發(fā)表的研究論文(Article)作為研究對象。NEJM是Massachusetts Medical Society出版的醫(yī)學周刊。自1812年創(chuàng)刊以來,它是最有聲望的經(jīng)同行評審的醫(yī)學期刊,也是最早連續(xù)出版的期刊之一。
本研究選取NEJM發(fā)表的論文作為研究對象有以下3個原因:
(1) NEJM提供自2010年7月以來所有文章的Metrics數(shù)據(jù)(圖1),包括瀏覽量(Page Views)、被引頻次(Citations)、媒體報道(Global Media Coverage)、社交媒體(Social Media)。瀏覽量包括數(shù)量和地理分布,因此,可以研究論文在地理維度上的擴散情況。更重要的是,Metrics還通過交互式全球地圖顯示瀏覽量的地理分布,這使得Metrics數(shù)據(jù)非常獨特,可以從空間角度研究OA優(yōu)勢。
(2) 在發(fā)表6個月后,NEJM在nejm.org免費提供所有研究論文的全文,因此,可以從時間角度來評估OA前后論文瀏覽量的變化。
(3) NEJM發(fā)表的論文既包括即時OA論文也包括延時OA論文(延時OA論文是指期刊完全按照傳統(tǒng)出版模式出版后,出版方在一定時間后將期刊發(fā)表的過刊文獻在互聯(lián)網(wǎng)上公開,讀者可以免費獲取,如NEJM在出版6個月后將非OA論文轉(zhuǎn)為OA論文),因此可以對二者進行比較分析。
圖1 NEJM論文的Metrics數(shù)據(jù)頁面(數(shù)據(jù)來源于https:∥www.nejm.org/doi/metrics/10.1056/NEJMoa1714284)
選擇2011年1月6日至2018年12月13日發(fā)表的論文作為研究對象,共獲得2338篇論文,包括135篇即時OA論文和2203篇延時OA論文。本研究收集了每個研究樣本的Metrics數(shù)據(jù),包括瀏覽量及其地理分布數(shù)據(jù)。
對數(shù)據(jù)進行統(tǒng)計分析,從國家分布、瀏覽量變化、即時OA與延時OA對比、即時OA與延時OA論文的日均瀏覽量變化等方面呈現(xiàn)分析結(jié)果。
本研究統(tǒng)計了每個國家對所有論文的瀏覽量,并在表1中列出了瀏覽量最多的前30個國家和地區(qū)。美國以絕對優(yōu)勢位居第一。在30個國家和地區(qū)中,發(fā)達國家與發(fā)展中國家或地區(qū)(在表1中以下劃線標示)的比例為3…2,前10名中只有中國和巴西為發(fā)展中國家。
表1 NEJM論文瀏覽量最高的30個國家和地區(qū)
從所有國家和地區(qū)的論文瀏覽量分布來看,北美、西歐、東亞和大洋洲等經(jīng)濟較為發(fā)達地區(qū)的論文瀏覽量較高,而除巴西以外的南美洲國家和非洲、中亞等發(fā)展中國家和地區(qū)的瀏覽量較低。
2.2.1 瀏覽量統(tǒng)計(絕對值)
根據(jù)發(fā)表年份對2203篇延時OA論文進行分類,并分析論文瀏覽量的國家分布,結(jié)果如圖2所示。美國的數(shù)據(jù)繪制在主(左)軸上,而其他國家的數(shù)據(jù)繪制在次(右)軸上。由圖2可知:美國在所有年份的論文瀏覽量上一直保持絕對領(lǐng)先;中國對發(fā)表在2018年的論文的瀏覽量相對較低,對2015年前發(fā)表的論文的瀏覽量較高,從2011—2015年發(fā)表論文的瀏覽量來看,中國的瀏覽量大幅超過大多數(shù)國家。
發(fā)達國家和發(fā)展中國家的論文瀏覽量的年度分布情況如圖3所示。對于2016—2018年發(fā)表的論文,發(fā)達國家與發(fā)展中國家之間的瀏覽量存在明顯差距,而2011—2014年間的瀏覽量差距明顯小于2015—2017年間的瀏覽量差距。
圖2 前10位國家在不同年份的論文瀏覽量分布
圖3 發(fā)達國家和發(fā)展中國家不同年份的論文瀏覽量分布
2.2.2 瀏覽量統(tǒng)計(相對值)
本研究計算了前10位國家的論文年瀏覽量與所有國家的年瀏覽量之和的比值。在圖4中,美國的數(shù)據(jù)繪制在主(左)軸上,而其他國家的數(shù)據(jù)繪制在次(右)軸上。美國仍在所有年份一直保持著絕對領(lǐng)先的優(yōu)勢,但隨著論文發(fā)表時間的向前推移,美國、日本和加拿大等發(fā)達國家的比例呈現(xiàn)持續(xù)下降趨勢,而中國的比例呈明顯上升趨勢。
圖5所示為發(fā)達國家和發(fā)展中國家瀏覽量相對量的變化。為了更好地顯示和比較瀏覽量絕對值和相對值(比例)的變化趨勢,以淺色標記絕對值(論文瀏覽量),并以深色標記相對值(比例)。相對值的數(shù)據(jù)繪制在主軸上,而絕對值的數(shù)據(jù)繪制在次軸上。對于發(fā)達國家,絕對值的變化趨勢與相對值的變化趨勢有很大的不同。隨著論文發(fā)表時間的向前推移(2018年到2011年),發(fā)達國家的相對值呈明顯下降趨勢,而其他三條曲線的變化趨勢幾乎相同。值得注意的是,發(fā)達國家的瀏覽量占比在所有年份中始終保持在70%以上。
圖4 前10位國家不同年份的論文瀏覽量分布
圖5 發(fā)達國家和發(fā)展中國家在不同年份的瀏覽量分布
2.2.3 國家瀏覽量排名變化
圖6和圖7所示分別為發(fā)達國家與發(fā)展中國家和地區(qū)的瀏覽量排名變化。發(fā)展中國家對2011—2014年發(fā)表論文的瀏覽量排名高于2015—2018年的排名;美國始終排名第1,日本在2011—2014年排名第3,在2015—2018年排名第2,中國在2011—2014年排名第2,但在2015—2018年的排名明顯下降,哥倫比亞2011年排在第12位,但2018年排在第20位。德國、瑞士、荷蘭、以色列和其他發(fā)達國家在2015—2018年的排名均高于其在2011—2014年的排名。
本研究選擇論文瀏覽量、每篇論文的瀏覽國家數(shù)2個指標來比較即時OA和延時OA論文的影響差異。根據(jù)最初的出版模式為即時OA或延時OA,將2338篇論文進行分組。由表2可知,即時OA論文的平均值和中位數(shù)明顯高于延時OA論文,每篇論文的瀏覽國家數(shù)也高于延時OA論文。數(shù)據(jù)不符合正態(tài)分布,因此,使用非參數(shù)檢驗(Wilcoxon檢驗)對即時OA和延時OA的論文瀏覽量和瀏覽國家數(shù)進行檢驗,P值分別為0.003和0.018,可以證明二者的差異具有統(tǒng)計學意義。
圖6 發(fā)達國家的年度瀏覽量排名變動
圖7 發(fā)展中國家和地區(qū)的年度瀏覽量排名變動
表2 即時OA與延時OA的評價指標對比
發(fā)表6個月后論文由非OA轉(zhuǎn)為OA,論文的瀏覽量是否會發(fā)生變化?圖8所示為即時OA、延時OA論文發(fā)表360天內(nèi)的瀏覽量變化情況,其中g(shù)ap為即時OA與延時OA論文的瀏覽量差值。論文發(fā)表2天后達到瀏覽量的峰值,之后不斷降低,但前10天的瀏覽量仍大幅超過其他時間段的瀏覽量,說明論文閱讀集中于發(fā)表最初幾天,即時OA論文的瀏覽峰值和在360天內(nèi)的日瀏覽量均高于延時OA論文,同樣證明了OA的優(yōu)勢。在第1~180天內(nèi),論文瀏覽量呈明顯的下降趨勢,即時OA論文和延時OA論文間的差值也有縮小趨勢,但從第181天開始,延時OA論文出現(xiàn)了小幅波動上升的趨勢,即時OA與延時OA論文間的差距卻并未縮小,說明論文從非OA轉(zhuǎn)為OA確實會增加瀏覽量,但是與此同時,論文瀏覽量的上升幅度較小且瀏覽高峰往往集中于論文發(fā)表的最初幾天,因此,即時OA相比于延時OA更有益于知識傳播。約從第271天起,即時OA與延時OA論文的瀏覽量均呈下降趨勢,且二者差值也在不斷縮小,但此時距離論文發(fā)表將近1年,論文時效性已大大降低。
圖8 論文發(fā)表后360天內(nèi)的瀏覽量變化情況(a)第1~90天;(b)第91~180天;(c)第181~270天;(d)第271~360天
從地理空間角度來看,論文瀏覽量集中在經(jīng)濟發(fā)達地區(qū),來自發(fā)達國家(如歐美地區(qū))的讀者在論文出版后的短時間內(nèi)即可閱讀到新發(fā)表的論文,而來自發(fā)展中國家(如中國)的讀者在獲取科學資源方面存在劣勢,這類讀者往往在論文發(fā)表后較長的一段時間才能獲取相關(guān)論文。與非OA論文相比,OA論文有著更廣泛的讀者,其讀者來自更多國家。從時間角度來看,論文在出版6個月后由非OA轉(zhuǎn)為OA,論文瀏覽量有所增加,但增量較小,即時OA與延時OA的瀏覽量差值也并未縮小,說明雖然延時OA可以使更多讀者受益,但是相比于即時OA仍存在不足。結(jié)合時間和地理空間角度來看,論文瀏覽可能存在從發(fā)達國家向發(fā)展中國家擴散的趨勢,OA擴大了讀者的范圍,并使發(fā)展中國家的學者從中獲益。延時OA雖然在開放運動中邁出了堅實的一步,但其目的仍在于保護期刊利益,如此一來,會在很大程度上影響期刊出版的時效性,從而影響文獻的使用價值,因此,逐漸提高即時OA論文的比例,不斷向即時OA方向努力,對促進學術(shù)資源的傳播和利用有著重要的意義。即時OA是開放運動的最終實現(xiàn)模式,同時也是促進科學知識傳播、提高論文影響力,進而提升期刊影響力的最有利方式。期刊出版機構(gòu)應提高OA意識,充分認識到即時OA對促進科學傳播和學術(shù)交流,以及提高期刊影響力的重要作用,從實踐上促進OA體系完善和健全,更重要的是在實現(xiàn)OA的基礎上進一步實現(xiàn)即時OA。期刊應積極探尋適合自身發(fā)展的OA出版模式,如可通過增值服務、開放倉儲建設費等回收實行OA的成本;在渠道環(huán)節(jié)優(yōu)化期刊網(wǎng)站建設,提高網(wǎng)站的易用性,強化文獻檢索和查詢功能,豐富期刊資源獲取方式,提供在線閱讀、直接下載等論文獲取方式,進一步降低即時OA的門檻。
本研究采用NEJM的論文瀏覽量數(shù)據(jù),從時間和地理空間兩個角度比較了即時OA和延時OA之間的差異,以探索OA的優(yōu)勢。相比于以往采用發(fā)文量和被引頻次研究OA優(yōu)勢的思路,本研究提出了新的研究視角,即利用論文使用數(shù)據(jù)從時間和地理空間的角度分析OA的優(yōu)勢,因此,可以進行以往僅使用發(fā)文量和被引頻次數(shù)據(jù)無法實現(xiàn)的研究。相比于發(fā)文量和被引頻次數(shù)據(jù),論文的使用數(shù)據(jù)具有反應及時、效果立竿見影的特點,如今大量的學術(shù)期刊和學術(shù)資源數(shù)據(jù)庫不斷向公眾開放,這為科研工作者提供了寶貴參考,也為改善期刊發(fā)展、擴大期刊影響力提供了新的思路。本研究同時存在局限,如對NEJM選擇以OA形式進行出版的原因,如公共利益、作者的基金資助等未加以考慮,這使得在混雜因素的排除方面存在一定局限性,這些問題有待在今后的研究中進一步探索。