,, ,
當(dāng)前,越來(lái)越多的專家、學(xué)者意識(shí)到同一期刊中不同論文的影響力存在較大差距,只以期刊影響因子評(píng)價(jià)學(xué)術(shù)論文的質(zhì)量顯得過(guò)于片面。甚至有學(xué)者認(rèn)為論文的被引頻次主要與其內(nèi)容質(zhì)量有關(guān), 而與發(fā)表期刊的影響因子關(guān)系不大[1-2]。而且,科研工作者更關(guān)心的是自己的研究成果被國(guó)內(nèi)外同行的認(rèn)可程度,而非所處文章群的平均學(xué)術(shù)水平。單篇學(xué)術(shù)論文的被引次數(shù)在一定程度上反映了人們對(duì)某項(xiàng)研究工作的關(guān)注程度和重視程度, 體現(xiàn)了該論文在學(xué)術(shù)交流中的作用和地位。因而, 在科研評(píng)價(jià)工作中越來(lái)越傾向于將論文的被引次數(shù)作為衡量論文重要性的客觀指標(biāo)。
基金資助為科學(xué)研究提供了必要的條件,為基礎(chǔ)科學(xué)研究的持續(xù)健康發(fā)展奠定了堅(jiān)實(shí)有效的基礎(chǔ),同時(shí)也提高了科學(xué)工作者解決重大問(wèn)題的能力[3]。與此同時(shí),隨著各國(guó)科技與經(jīng)濟(jì)競(jìng)爭(zhēng)的加劇以及科研資金投入的不斷增大,要求說(shuō)明科研資金使用效益與效率、加強(qiáng)科研經(jīng)費(fèi)的管理以及打擊學(xué)術(shù)腐敗的呼聲日益高漲。這些都使定量研究基金資助對(duì)論文的學(xué)術(shù)水平或?qū)W術(shù)影響力是否更大顯得非常必要。如果采用論文的被引次數(shù)作為論文學(xué)術(shù)質(zhì)量的表征,就需要研究基金資助論文是否比非基金資助論文獲得更高的引用次數(shù)[4-8]。
然而,類似于醫(yī)學(xué)研究中的觀察性數(shù)據(jù),由于沒(méi)有經(jīng)過(guò)隨機(jī)化分組,直接以二分類變量為分組變量,對(duì)兩組數(shù)據(jù)進(jìn)行比較是不具有可比性的。論文的累積被引次數(shù)也受很多因素(如論文發(fā)表時(shí)間)的影響,如果直接對(duì)基金論文和非基金論文的被引次數(shù)進(jìn)行比較而不考慮這些因素的影響,同樣會(huì)造成兩組論文不可比,最終造成研究結(jié)果的失真。傾向指數(shù)法的概念由Rosenbaum和Rubin在1983年首次提出,它是通過(guò)構(gòu)造每個(gè)個(gè)體的傾向指數(shù)得分,然后通過(guò)匹配等方法重新選擇研究樣本,使非隨機(jī)化的數(shù)據(jù)達(dá)到類似隨機(jī)化數(shù)據(jù)的特點(diǎn),又稱為“事后隨機(jī)化”。本文采用傾向指數(shù)法研究基金資助對(duì)學(xué)術(shù)期刊論文的累積被引次數(shù)的影響,同時(shí)為研究期刊論文累積被引次數(shù)的其他影響因素提供參考。
數(shù)據(jù)來(lái)源于“中國(guó)知網(wǎng)”(http://www.edu.cnki.net)的“中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)”,進(jìn)入高級(jí)檢索,跨庫(kù)選擇只選擇“期刊”,檢索項(xiàng)為“關(guān)鍵詞”,檢索詞為“艾滋病”,并且匹配“精確檢索”,以保證檢索到的文獻(xiàn)資料都是關(guān)于艾滋病專題研究的期刊論文,選擇學(xué)科領(lǐng)域“預(yù)防醫(yī)學(xué)與衛(wèi)生學(xué)”。考慮到論文累積被引次數(shù)和發(fā)表時(shí)間的非線性關(guān)系,以及檢索文獻(xiàn)時(shí)2015年以后發(fā)表的論文發(fā)表時(shí)間短、被引少等情況,檢索區(qū)間限定在2010-2014年,共檢索到相關(guān)文獻(xiàn)675篇,除去非期刊論文和影響因子未查到的論文,共624篇。將所有檢索結(jié)果導(dǎo)入Excel進(jìn)行數(shù)據(jù)整理,對(duì)檢索出的文獻(xiàn)按題名、作者等進(jìn)行排序,剔除抄襲和一稿多投的文章。對(duì)入選期刊論文的特征進(jìn)行分析,內(nèi)容包括被引頻次、影響因子、基金項(xiàng)目、第一作者的發(fā)文量、第一作者的h指數(shù)(指其發(fā)表的Np篇論文中有h篇每篇至少被引h次、而其余Np-h篇論文每篇被引均小于或等于h次,h指數(shù)能夠很好的反映一個(gè)人的學(xué)術(shù)水平,h指數(shù)越高,表明發(fā)表論文的質(zhì)量越高[9-10])、期刊是否為中文核心和發(fā)表時(shí)間等。本研究的發(fā)表時(shí)間指下載期刊論文的時(shí)間和期刊論文發(fā)表時(shí)間的時(shí)間間隔,以年為單位。
1.2.1 傾向指數(shù)匹配法
傾向指數(shù)匹配法(Propensity Score Matching)是以處理因素(基金資助)為應(yīng)變量,混雜因素為自變量,建立logistic模型,根據(jù)模型計(jì)算每個(gè)期刊論文的傾向指數(shù)[11]。
傾向指數(shù)的定義:在給定一組協(xié)變量xi條件下,將任意一個(gè)研究對(duì)象分配到處理組或者對(duì)照組的條件概率,第i個(gè)研究對(duì)象被分配到處理組而非對(duì)照組的概率可以表示為:e(xi)=P(zi=1|xi),假定分組變量zi和協(xié)變量xi相互獨(dú)立,則對(duì)任意一個(gè)觀察變量xi[11]:
其中,P被稱為傾向指數(shù)[11]。傾向指數(shù)的主要研究方法包括匹配、分層法和協(xié)變量調(diào)整等。本文采用傾向指數(shù)最近距離匹配法對(duì)組間相同或相近的個(gè)體進(jìn)行配對(duì),并將差值設(shè)定在某個(gè)范圍內(nèi),即為卡鉗匹配[12],該研究中卡鉗值設(shè)置為0.02,匹配比例為1:1。
1.2.2 標(biāo)準(zhǔn)化差異法
傾向指數(shù)匹配法的目的是使非隨機(jī)化的數(shù)據(jù)達(dá)到類似隨機(jī)化數(shù)據(jù)的效果。以往很多研究都是假設(shè)檢驗(yàn)法來(lái)評(píng)價(jià)組間的混雜因素的均衡性,近年來(lái),標(biāo)準(zhǔn)化差異法在傾向指數(shù)的研究中應(yīng)用較多。
連續(xù)性變量的定義是:
分類變量的定義是:
其中,PT和PC分別表示處理組和對(duì)照組中待檢驗(yàn)變量的率。一般認(rèn)為,當(dāng)標(biāo)準(zhǔn)化差異小于10%時(shí),認(rèn)為組間變量的均衡性較好[13]。
1.2.3 分析方法
對(duì)整理的數(shù)據(jù)(基金組和非基金組)分別進(jìn)行基本的統(tǒng)計(jì)描述,定量資料采用兩獨(dú)立樣本u檢驗(yàn),定性資料比較采用兩獨(dú)立樣本χ2檢驗(yàn)。通過(guò)描述分析發(fā)現(xiàn)兩組間協(xié)變量分布不均衡。為了均衡混雜因素采用傾向指數(shù)匹配法,對(duì)匹配后的資料采用假設(shè)檢驗(yàn)法和標(biāo)準(zhǔn)化差異法評(píng)價(jià)組間協(xié)變量是否均衡,并采用配對(duì)t檢驗(yàn)對(duì)基金論文與非基金論文的被引次數(shù)進(jìn)行分析。本文用到的傾向指數(shù)匹配法由自編的R 程序?qū)崿F(xiàn),其他統(tǒng)計(jì)計(jì)算在R統(tǒng)計(jì)軟件以及Excel中進(jìn)行[14-15]。檢驗(yàn)水準(zhǔn)α=0.05。
檢索到相關(guān)文獻(xiàn)675篇,除去非期刊論文和影響影子未查到的論文,共624篇,有效率為92.44%。其中基金論文192篇,占30.77%。所屬期刊影響因子小于0.5的論文所占比例最大,達(dá)到62.66%。作者的發(fā)文量主要是1篇或2篇,作者的h指數(shù)都比較低,論文的零被引率為23.72%,論文的被引次數(shù)為1-5次,被引次數(shù)在16次以上論文只有14篇(僅占2.24%),約有一半的論文作者為1-3個(gè),核心期刊論文所占比例不足25%(表1)。
2.2.1 單篇被引頻次區(qū)間分布情況
由于選擇的文獻(xiàn)發(fā)表時(shí)間較短,624篇被引論文無(wú)論是從基金組還是從非基金組來(lái)看,多數(shù)論文被引次數(shù)均較低(0-5次),基金組單篇被引頻次在16次及以上的論文有6篇(僅占3.12%),非基金組57.41%的論文僅被引用了1-5次,26.16%的論文被引頻次為0,單篇被引頻次在16次及以上的論文有8篇(僅占1.85%)。被引論文分布呈現(xiàn)被引次數(shù)越高,分布篇數(shù)越少;被引次數(shù)越低,分布篇數(shù)越多的特點(diǎn)(表2)。
2.2.2 零被引率情況
2010-2014年基金論文零被引率與非基金論文零被引率的比較見表3。從表3可見,除2012年基金論文零被引率略高于非基金組零被引率外,基金論文零被引率均低于非基金論文零被引率,非基金論文零被引率是逐年增加的,到2014年零被引率達(dá)到60%。
表1 研究對(duì)象基本信息
表2 單篇被引頻次區(qū)間分布
表3 基金論文零被引率與非基金論文零被引率的比較
2.2.3 平均被引次數(shù)分布情況
2010年發(fā)表的論文非基金組獲得了較多的引用,平均被引次數(shù)為4.88,高于基金組的平均被引次數(shù);而其他年份發(fā)表的論文平均被引次數(shù)表現(xiàn)出明顯的規(guī)律性,基金組的平均被引次數(shù)均大于非基金組的平均被引次數(shù),但都呈現(xiàn)逐年遞減趨勢(shì)(圖1)。
圖1 2010-2014年論文平均被引次數(shù)分布
2.3.1 基金論文與非基金論文主要文獻(xiàn)計(jì)量指標(biāo)的均衡性分析
原始資料中入選的協(xié)變量包括影響因子、發(fā)表時(shí)間、作者個(gè)數(shù)、第一作者發(fā)文量、第一作者h(yuǎn)指數(shù)、期刊是否中文核心。采用傾向指數(shù)匹配之前,對(duì)兩組間的協(xié)變量進(jìn)行基本統(tǒng)計(jì)描述與分析,定量資料采用 檢驗(yàn),定性資料采用χ2檢驗(yàn)。所有協(xié)變量中影響因子、作者個(gè)數(shù)、第一作者發(fā)文量、第一作者h(yuǎn)指數(shù)、期刊是否中文核心等變量在兩組間分配不平衡(P<0.05 ),見表4。
2.3.2 用傾向指數(shù)法匹配兩組間協(xié)變量
傾向指數(shù)匹配法通過(guò)構(gòu)建Logistic回歸模型計(jì)算傾向得分進(jìn)行匹配。有研究表明,回歸模型變量選擇的標(biāo)準(zhǔn)應(yīng)該是納入所有與結(jié)果有關(guān)的變量。本文以基金資助為因變量,影響因子(χ1)、是否中文核心(χ2)、作者個(gè)數(shù)(χ3)、第一作者發(fā)文量(χ4)、第一作者h(yuǎn)指數(shù)(χ5)、發(fā)表時(shí)間(χ6)為自變量擬合Logistic回歸模型。得傾向指數(shù)(PS)的計(jì)算公式為:
表4 傾向指數(shù)匹配前主要文獻(xiàn)計(jì)量指標(biāo)分布
以傾向指數(shù)為依據(jù),逐一對(duì)基金論文和非基金論文進(jìn)行卡鉗匹配,共有148對(duì)匹配成功。匹配之后,納入模型的6個(gè)協(xié)變量,用假設(shè)檢驗(yàn)法(配對(duì)t檢驗(yàn))檢驗(yàn)組間的均衡性,得到P值均大于0.05,兩組間差異無(wú)統(tǒng)計(jì)學(xué)意義,說(shuō)明匹配之后兩組間協(xié)變量達(dá)到了均衡??紤]到匹配之后樣本量變小而導(dǎo)致P值增大,為了真實(shí)地表明組間協(xié)變量達(dá)到了均衡,采用標(biāo)準(zhǔn)化差異來(lái)評(píng)價(jià)均衡性,得到標(biāo)準(zhǔn)化差異均小于10%,因此可以認(rèn)為組間變量的均衡性較好(表5)。
表5 傾向指數(shù)匹配后協(xié)變量分布
2.3.3 傾向指數(shù)匹配后對(duì)兩組間的被引情況進(jìn)行分析
對(duì)匹配后的基金論文與非基金論文被引次數(shù)進(jìn)行比較,采用配對(duì)t檢驗(yàn),t統(tǒng)計(jì)量為-0.866,P>0.05,說(shuō)明基金論文與非基金論文被引次數(shù)的差異不具有統(tǒng)計(jì)學(xué)意義(表6)。
表6 傾向指數(shù)匹配后兩組被引次數(shù)的比較
基金資助是科學(xué)研究必要的物質(zhì)條件,在提高創(chuàng)新能力、提高科學(xué)技術(shù)水平和促進(jìn)社會(huì)進(jìn)步等方面起重要作用,為科學(xué)事業(yè)的持續(xù)健康發(fā)展奠定了強(qiáng)大而堅(jiān)實(shí)的基礎(chǔ),同時(shí)也提高了科學(xué)研究解決社會(huì)經(jīng)濟(jì)等重大問(wèn)題的能力[6-8]。本文的結(jié)果說(shuō)明基金資助對(duì)中文預(yù)防醫(yī)學(xué)論文被引次數(shù)的影響無(wú)統(tǒng)計(jì)學(xué)意義。為了使單因素分析結(jié)果更加準(zhǔn)確可靠,本文還同時(shí)采用負(fù)二項(xiàng)回歸模型對(duì)論文被引次數(shù)進(jìn)行多因素分析,結(jié)果同樣表明基金資助對(duì)論文被引次數(shù)的影響無(wú)統(tǒng)計(jì)學(xué)意義[5]。
造成基金論文被引次數(shù)并不比非基金論文高的原因,一方面可能是由于科研工作者為了提高科研成果的顯示度,并不把基金資助課題最核心的論文發(fā)表在國(guó)內(nèi)期刊上[16]。據(jù)文獻(xiàn)報(bào)道,1999-2009年我國(guó)內(nèi)地作者的高影響力論文 (被引用位列各學(xué)科的前 1%) 有4 433篇,其中只有51篇 (1.2%) 在內(nèi)地期刊發(fā)表[17]。論文外流現(xiàn)象不只是在中國(guó)存在,而是一個(gè)世界性的問(wèn)題,這與各國(guó)科學(xué)技術(shù)發(fā)展水平有很大的關(guān)系,但是這種現(xiàn)象嚴(yán)重影響了我國(guó)科技期刊的發(fā)展。另一方面,近年來(lái),學(xué)術(shù)期刊質(zhì)量評(píng)價(jià)體系中將基金論文比作為衡量期刊學(xué)術(shù)水平的重要指標(biāo)[5],尤其是2008年成為中文核心期刊評(píng)價(jià)指標(biāo)之一,造成很多雜志社傾向于發(fā)表標(biāo)注了基金資助的論文,而國(guó)內(nèi)期刊標(biāo)注基金論文會(huì)出現(xiàn)人為操縱的可能[5]。甚至有些作者在標(biāo)注基金項(xiàng)目時(shí),可能是出于結(jié)題或?yàn)橐院笊暾?qǐng)更多基金項(xiàng)目考慮,在發(fā)表醫(yī)學(xué)論文時(shí)多標(biāo)基金資助項(xiàng)目的情況,此行為會(huì)導(dǎo)致基金論文與優(yōu)質(zhì)非基金論文的質(zhì)量不存在明顯差別。
國(guó)家應(yīng)出臺(tái)相關(guān)政策公平對(duì)待國(guó)內(nèi)學(xué)術(shù)期刊論文,采取措施加強(qiáng)引導(dǎo),努力創(chuàng)造條件扶持重點(diǎn)學(xué)科創(chuàng)辦網(wǎng)絡(luò)版期刊,提高國(guó)內(nèi)期刊國(guó)際化水平,創(chuàng)辦國(guó)際化英文刊物,吸引優(yōu)秀科研成果發(fā)表在國(guó)內(nèi)期刊上發(fā)表。在論文出版和獲取方面,降低出版費(fèi)用,在一定程度上實(shí)現(xiàn)論文的開放獲取,提高論文展示度和被引次數(shù)。應(yīng)全方面評(píng)價(jià)科研成果與學(xué)術(shù)期刊,不能過(guò)度依賴影響因子、基金論文比等量化指標(biāo),應(yīng)讓科研評(píng)價(jià)工作回歸到科學(xué)本身上來(lái)。不過(guò)分量化科研成果,而通過(guò)同行評(píng)議與學(xué)術(shù)影響力本身來(lái)評(píng)價(jià)科研工作者、科研成果、學(xué)術(shù)期刊是抑制論文外流最重要的方法,最終推動(dòng)我國(guó)整個(gè)科學(xué)事業(yè)尤其是學(xué)術(shù)期刊的發(fā)展。
在審理論文時(shí),期刊編輯部嚴(yán)格加強(qiáng)對(duì)基金立項(xiàng)書進(jìn)行審核,同時(shí)要求論文作者提供基金項(xiàng)目的所有信息,包括研究方向,期刊社要仔細(xì)核查論文是否符合本課題內(nèi)容,然后決定是否標(biāo)注。審稿是期刊工作中權(quán)威性很強(qiáng)的一項(xiàng)工作,因此雜志社建設(shè)科學(xué)合理的審稿專家隊(duì)伍是非常有必要的。
科研工作者要積極主動(dòng)投身科學(xué)事業(yè),不應(yīng)過(guò)分追求獲得基金資助而忽略了科研工作本身,在現(xiàn)有的科研資源下開拓進(jìn)取、努力創(chuàng)新、堅(jiān)持不懈才能使自己的科研成果真正具有價(jià)值。科研工作者在發(fā)表論文標(biāo)注基金項(xiàng)目時(shí),要恪守科研道德,實(shí)事求是地列出受資助的基金項(xiàng)目,使基金論文比成為一個(gè)更科學(xué)、有效的期刊評(píng)價(jià)指標(biāo)。