■康旭東 徐慶富 張春博
1)大連理工大學(xué)技術(shù)研究開發(fā)院,遼寧省大連市甘井子區(qū)凌工路2號 1160242)大連理工大學(xué)科學(xué)學(xué)與科技管理研究所,遼寧省大連市甘井子區(qū)凌工路2號 116024
繼承性、發(fā)展性和積累性是科學(xué)活動最基本的性質(zhì),幾乎所有的科研成果都是對前人工作的繼承和拓展[1]。這就決定了參閱和引用別人的文獻(xiàn),借助和吸收已有的研究成果是科學(xué)家的基本行為、科學(xué)知識生產(chǎn)的基本過程和科學(xué)研究活動的基本特征,因此在文末著錄參考和引用的文獻(xiàn)已經(jīng)成為學(xué)術(shù)界的基本規(guī)范。參考文獻(xiàn)具有重要意義:對于科學(xué)學(xué)科而言,文章之間的引證關(guān)系體現(xiàn)了科學(xué)主題縱向上知識的繼承與發(fā)展和橫向上學(xué)科間的差異與聯(lián)系;對于科研人員而言,引用前人文獻(xiàn)可以為自己論文提供有說服力的證據(jù),并通過引證關(guān)系將自己嵌入科學(xué)知識網(wǎng)絡(luò);對于科學(xué)研究成果而言,作為其他文章的參考文獻(xiàn),體現(xiàn)了科學(xué)研究成果的價值,而引用其他參考文獻(xiàn),則是通過吸收有價值的知識來提升自身價值。因此參考文獻(xiàn)是論文價值的重要影響因素,是科學(xué)研究的知識基礎(chǔ)。
論文的被引頻次可看作是對論文學(xué)術(shù)價值和影響力的測度[2]。雖然被引頻次存在引用動機(jī)復(fù)雜和時滯性等問題,并且近些年受到新興替代計量學(xué)的挑戰(zhàn),但是鑒于指標(biāo)的客觀性和易獲取性等,被引頻次依然是學(xué)術(shù)界最常用的論文質(zhì)量測度指標(biāo)。閱讀、梳理和總結(jié)高質(zhì)量的參考文獻(xiàn)是科學(xué)研究的基礎(chǔ)性工作,并影響論文的價值,那前人的研究成果在多大程度上影響后來者的研究?更確切地說,參考文獻(xiàn)的各個指標(biāo)與論文被引頻次之間是否存在相關(guān)關(guān)系?假如參考文獻(xiàn)影響論文的被引頻次,那么不同的期刊載體之間,這種影響是否存在差異性?以上問題正是本文的研究內(nèi)容。
在已有的研究成果中,相關(guān)的參考文獻(xiàn)指標(biāo)主要包括參考文獻(xiàn)的數(shù)量、質(zhì)量、時間,以及跨學(xué)科性等。
在數(shù)量方面,簡琳等[3]分析了6個學(xué)科的455篇論文被引的文本因素,發(fā)現(xiàn)參考文獻(xiàn)數(shù)量對英文文獻(xiàn)的被引存在顯著影響;姜磊等[4]以《期刊引證報告》(JournalCitationReports,JCR)中3個學(xué)科的論文為數(shù)據(jù)來源,研究了參考文獻(xiàn)數(shù)量對論文被引頻次的影響,發(fā)現(xiàn)兩者之間的相關(guān)關(guān)系并不顯著;王海濤等[5]則對JCR中2013年影響因子排名前20的經(jīng)濟(jì)類期刊在2011—2014年發(fā)表的論文進(jìn)行回歸模型分析,發(fā)現(xiàn)參考文獻(xiàn)數(shù)量對論文被引頻次具有顯著影響。目前,對參考文獻(xiàn)數(shù)量與論文被引頻次之間是否存在相關(guān)關(guān)系的結(jié)論并不一致,支持兩者存在相關(guān)關(guān)系的學(xué)者認(rèn)為,參考文獻(xiàn)數(shù)量越多,說明作者可能經(jīng)過廣泛的資料收集和前期調(diào)研,有利于提升科研成果的質(zhì)量;而反對者則認(rèn)為參考文獻(xiàn)的數(shù)量與期刊的要求相關(guān),是可操控的,并且有些相關(guān)的參考文獻(xiàn)并沒有被全部列出,兩者存在的相關(guān)關(guān)系不合乎常理?;诖?,提出假設(shè)H1:參考文獻(xiàn)的數(shù)量與論文的被引頻次呈正相關(guān)關(guān)系。
在質(zhì)量方面,目前的研究大多選用參考文獻(xiàn)的被引頻次來表征參考文獻(xiàn)的質(zhì)量。比如Didegah等[6]選取基本科學(xué)指標(biāo)(Essential Science Indicators,ESI)數(shù)據(jù)庫中3個學(xué)科2000—2009年刊載的論文為研究對象,發(fā)現(xiàn)參考文獻(xiàn)的篇均被引頻次與論文被引頻次之間存在顯著的相關(guān)關(guān)系;而Bornmann等[7]借助百分位指標(biāo),分析了生命科學(xué)等4個學(xué)科的1年發(fā)文數(shù)據(jù),驗證了牛頓假說,即高被引論文也更傾向于引用被引頻次較高的參考文獻(xiàn)。一般來說,參考文獻(xiàn)的質(zhì)量越高,說明該項研究建立在較高質(zhì)量的前人研究成果之上,正所謂“站在巨人的肩膀上”,科研的基礎(chǔ)較好,因而有可能產(chǎn)出高質(zhì)量論文。基于此,提出假設(shè)H2:參考文獻(xiàn)的質(zhì)量與論文的被引頻次呈正相關(guān)關(guān)系。
在引用時間方面,早在20世紀(jì)60年代,Price[8]指出不同學(xué)科引用文獻(xiàn)的新舊程度不一樣,并且提出“普賴斯指數(shù)”這一指標(biāo),作為劃分科學(xué)“軟硬程度”的標(biāo)準(zhǔn)。隨著文獻(xiàn)年齡的增長,除特別經(jīng)典的文獻(xiàn)以外,大多數(shù)文獻(xiàn)的研究主題、技術(shù)方法、成果結(jié)論等都變得陳舊過時,逐漸失去利用的價值,因此建立在這些陳舊文獻(xiàn)基礎(chǔ)上的研究成果的質(zhì)量可能也不高,導(dǎo)致論文的被引頻次偏低。Peters等[9]和Onodera等[10]的研究結(jié)果均表明,表征參考文獻(xiàn)新舊程度的一些指標(biāo),比如普賴斯指數(shù)、引用半衰期等,與被引頻次之間存在明顯的相關(guān)關(guān)系,并且參考文獻(xiàn)越老,論文的被引頻次越低?;诖?,提出假設(shè)H3:參考文獻(xiàn)越新,論文的被引頻次越高。
現(xiàn)在的科學(xué)研究正邁入大科學(xué)時代,學(xué)科間的相互交叉和滲透成為發(fā)展趨勢。一篇論文的跨學(xué)科程度可以用論文引用的參考文獻(xiàn)的跨學(xué)科程度來衡量。有關(guān)跨學(xué)科性、學(xué)科交叉的研究一直是文獻(xiàn)計量學(xué)領(lǐng)域的熱點(diǎn),比如Porter等[11]從文獻(xiàn)施引的角度研究了過去30年間跨學(xué)科程度的變化,發(fā)現(xiàn)跨學(xué)科引用的比率一直在增加。那么,論文參考文獻(xiàn)的跨學(xué)科程度與其被引頻次之間是否存在相關(guān)關(guān)系?Lariviere等[12]以Web of Science(WoS)數(shù)據(jù)庫2000年收錄的論文為數(shù)據(jù)來源,采用ESI劃分學(xué)科的標(biāo)準(zhǔn)來研究論文參考文獻(xiàn)的跨學(xué)科程度與其被引頻次之間的關(guān)系,研究結(jié)果表明,參考文獻(xiàn)的跨學(xué)科水平與論文被引頻次之間的關(guān)系因?qū)W科而異,但是所有的學(xué)科都有一個共同特點(diǎn),那些單一學(xué)科和高度跨學(xué)科的論文的被引頻次都不高?;诖?,提出假設(shè)H4:參考文獻(xiàn)的跨學(xué)科程度越高,論文的被引頻次越高。
此外,Didegah等[13]基于參考文獻(xiàn)所在期刊的發(fā)行國家集中度測量了參考文獻(xiàn)的國際化程度,但筆者認(rèn)為該指標(biāo)過于間接,并不能有效表征參考文獻(xiàn)的國際化程度,而且國際合作使得單篇參考文獻(xiàn)的國際度衡量標(biāo)準(zhǔn)存在爭議,所以本研究沒有采取該指標(biāo)。Glanzel等[14]考察了參考文獻(xiàn)中專利文獻(xiàn)等對論文被引頻次的影響,考慮到多數(shù)學(xué)科領(lǐng)域的論文引用專利并非普遍現(xiàn)象,所以本研究也沒考慮該指標(biāo)。
絕大多數(shù)論文被引頻次影響因素的研究都是對某一個或者多個學(xué)科的多種期刊的論文進(jìn)行統(tǒng)一的統(tǒng)計分析或者建立一個回歸模型等,但這種做法并不合理,因為發(fā)表在不同期刊上的論文存在多方面的差異。(1)雖然外在因素可能影響論文的被引頻次,但是被引頻次是由論文的內(nèi)在質(zhì)量決定。而不同等級的期刊對論文的質(zhì)量要求不同,發(fā)表在高等級期刊上的論文往往要經(jīng)過更加嚴(yán)格的同行評議,論文的質(zhì)量和創(chuàng)新性等能夠得到保證,同時為了擴(kuò)大論文影響力和增大論文的可見度,作者會將高質(zhì)量論文投向受關(guān)注程度高、聲譽(yù)好的高等級期刊,因此高等級期刊集中了絕大部分高質(zhì)量論文,這就決定了不同等級期刊上的論文被引頻次可能存在“先天”差異,只有控制期刊這一變量,才能在一定程度上控制論文質(zhì)量這一最重要但是難以測度的因素。(2)不同期刊的排版和印刷方式不同,論文篇幅等指標(biāo)則存在比較大的差異。要想研究各個因素對論文被引頻次的影響,則需要控制期刊這一變量,將期刊作為研究的最小單元來比較同一期刊內(nèi)的論文,而非大多數(shù)研究采用的學(xué)科單元。
綜合以上文獻(xiàn)可以看出,目前學(xué)術(shù)界對于參考文獻(xiàn)各個指標(biāo)與論文被引頻次之間是否存在相關(guān)關(guān)系的研究結(jié)論并不相同,并且大多數(shù)研究都是以學(xué)科為單位,需要對此進(jìn)一步驗證,進(jìn)行以期刊為單位的多期刊間的對比研究;另外,國內(nèi)外大多數(shù)文獻(xiàn)只分析和參考文獻(xiàn)相關(guān)的一兩個指標(biāo),鮮有大數(shù)據(jù)量、系統(tǒng)地研究參考文獻(xiàn)各個指標(biāo)與論文被引頻次之間的關(guān)系,因此本研究具有一定參考意義。
選擇合理的數(shù)據(jù)樣本是研究的重要基礎(chǔ)。本研究的所有數(shù)據(jù)來源于WoS數(shù)據(jù)庫,采用Onodera等[10]遴選學(xué)科的標(biāo)準(zhǔn)。Onodera等[10]選擇了JCR中的6個學(xué)科,鑒于指標(biāo)的易獲取性以及數(shù)據(jù)處理的復(fù)雜性,本研究選擇凝聚態(tài)物理(Condensed Matter Physics)這一學(xué)科。
期刊的選擇標(biāo)準(zhǔn)是期刊應(yīng)當(dāng)僅屬于JCR中的1個學(xué)科,這是由2個原因決定的:(1)期刊所屬的學(xué)科范圍不同(1種期刊可能屬于多個學(xué)科)也會影響論文的被引頻次[15];(2)若1種期刊屬于多個學(xué)科,不方便計算跨學(xué)科性。此外,應(yīng)當(dāng)選擇發(fā)表論文數(shù)量比較大的期刊,以便建立回歸模型。Onodera等[10]只選擇了每個學(xué)科的4種代表性期刊,為了更好地進(jìn)行期刊間的對比,本研究擴(kuò)大了研究范圍,將凝聚態(tài)物理學(xué)科內(nèi)符合上述標(biāo)準(zhǔn)的期刊都挑選出來作為研究對象。
在時間的選定上,既應(yīng)該離現(xiàn)在“充分遠(yuǎn)”,使論文被引頻次達(dá)到比較穩(wěn)定的狀態(tài),也應(yīng)該離現(xiàn)在“足夠近”,以保證研究結(jié)論的時效性[13],因此選擇學(xué)科內(nèi)各期刊的被引頻次基本達(dá)到峰值的年份。當(dāng)然,各期刊的被引頻次達(dá)到峰值所需的時間有所不同,高影響因子的期刊要比低影響因子的期刊更晚達(dá)到引文峰值,因而只能選取各期刊間相對平衡的年份。
根據(jù)以上原則,本研究遴選2013年WoS數(shù)據(jù)庫中凝聚態(tài)物理學(xué)科下的12種期刊刊載的研究論文(Article),相關(guān)信息如表1所示,下載時間為2017年3月31日。
2.2.1因變量
本研究的因變量是論文的被引頻次,論文被引頻次是表征論文質(zhì)量的指標(biāo)。雖然被引頻次并不能完全反映論文質(zhì)量,但是這一指標(biāo)相對而言比較客觀、公正,并且易于獲得,仍是當(dāng)前最普遍的論文質(zhì)量測度指標(biāo)。每篇論文的被引頻次可以直接在WoS中獲取。
表1 12種期刊的名稱、研究論文數(shù)量以及當(dāng)年JCR分區(qū)
2.2.2自變量
(1) 參考文獻(xiàn)的數(shù)量指標(biāo)。每篇論文的參考文獻(xiàn)數(shù)量可以通過WoS數(shù)據(jù)庫直接獲得。
(2) 參考文獻(xiàn)的質(zhì)量指標(biāo)。已有文獻(xiàn)采用的指標(biāo)大多是參考文獻(xiàn)的平均被引頻次,但是平均被引頻次極易受到某些極值的影響,并不能真正反映參考文獻(xiàn)的被引頻次分布情況,因此本研究選用篇均參考文獻(xiàn)被引頻次的中值來表征參考文獻(xiàn)的質(zhì)量。利用自編程序采集每篇參考文獻(xiàn)的被引頻次,數(shù)據(jù)量非常龐大,8847篇論文樣本引用的參考文獻(xiàn)有數(shù)十萬篇。參考文獻(xiàn)的被引頻次理論上應(yīng)當(dāng)在施引論文的具體引用時間采集(論文的發(fā)表時間,甚至是撰寫時間),但是鑒于易獲取性,參考文獻(xiàn)被引頻次的統(tǒng)計時間截至本研究的數(shù)據(jù)采集時間。
(3) 參考文獻(xiàn)的時間指標(biāo)。常用來衡量參考文獻(xiàn)新舊程度的指標(biāo)包括參考文獻(xiàn)的引用半衰期和普賴斯指數(shù)等。參考文獻(xiàn)的引用半衰期是指較新的那一半?yún)⒖嘉墨I(xiàn)距論文發(fā)表時的時間,普賴斯指數(shù)是指最近5年的參考文獻(xiàn)所占的比例,這2個指標(biāo)可以通過Excel和Bibexcel軟件提取。本研究采用普賴斯指數(shù)作為衡量指標(biāo)。
(4) 參考文獻(xiàn)的跨學(xué)科性指標(biāo)。采用JCR的學(xué)科分類來研究參考文獻(xiàn)的跨學(xué)科性,首先從參考文獻(xiàn)中提取所在的期刊,再根據(jù)JCR中期刊的學(xué)科分類確定該參考文獻(xiàn)所屬的學(xué)科,并對其中有更名、分裂或者合并的期刊做出相應(yīng)處理。需要說明的是:①在JCR中,一種期刊可能屬于n(n≥1)個學(xué)科,為了避免引用學(xué)科數(shù)量膨脹,統(tǒng)計學(xué)科數(shù)量時,每個學(xué)科都獲得1/n的權(quán)重,以保證引用學(xué)科數(shù)量與參考文獻(xiàn)數(shù)量相等[16];②參考文獻(xiàn)中有部分文獻(xiàn)未被WoS數(shù)據(jù)庫收錄,例如圖書、專利、網(wǎng)絡(luò)文獻(xiàn)、會議論文和除科學(xué)引文索引(Science Citation Index, SCI)、社會科學(xué)引文索引(Social Science Citation Index, SSCI)、藝術(shù)與人文索引( Arts & Humanities Citation Index, A&HCI)收錄期刊以外的論文等,按照Porter等[17]的建議,測度“跨學(xué)科性”時這部分?jǐn)?shù)據(jù)不列入統(tǒng)計范圍。
跨學(xué)科引證指數(shù)是研究論文跨學(xué)科性常用的指標(biāo)[16],該指標(biāo)將參考文獻(xiàn)分為隸屬本學(xué)科和隸屬其他學(xué)科2類,引用其他學(xué)科論文的數(shù)量占總引用量的比例即為跨學(xué)科引證指數(shù)。但是該指數(shù)無法區(qū)分所涉及的其他學(xué)科數(shù)目的多寡,無法衡量學(xué)科交叉的廣度以及被引頻次在各個學(xué)科中分布的均勻性。為彌補(bǔ)跨學(xué)科引證指數(shù)的不足,采用香農(nóng)(Shannon)指數(shù)[18]來表征論文的跨學(xué)科性,計算公式為
(1)
式中:fShannon為香農(nóng)指數(shù);Pi為參考文獻(xiàn)所隸屬的學(xué)科數(shù)量i占所有學(xué)科總數(shù)N的比例,數(shù)值越大說明跨學(xué)科性越高,所有的Pi值之和為1。
2.2.3控制變量
許多研究證明,除參考文獻(xiàn)以外,其他一些因素也有可能影響論文的被引頻次[13-14]。為了盡可能排除這些因素對本研究的影響,選取了一系列控制變量,包括作者數(shù)量、機(jī)構(gòu)數(shù)量、國家數(shù)量、論文篇幅以及有無基金資助等,其中有無基金資助是引入的虛擬變量。此外作者的科研能力也是影響論文質(zhì)量的重要因素,但是由于本研究的論文樣本數(shù)量太大,和作者科研能力相關(guān)的指標(biāo),例如作者的h指數(shù)、已發(fā)表論文數(shù)量、總被引頻次等極難采集,因此只能放棄這部分?jǐn)?shù)據(jù)。
研究的因變量——論文的被引頻次——為非負(fù)整數(shù),屬于典型的離散型數(shù)據(jù)。對于這類數(shù)據(jù)進(jìn)行一般的線性回歸可能產(chǎn)生有偏和無效的系數(shù),通常采用計數(shù)模型來避免這些問題。典型的計數(shù)模型包括泊松回歸模型和負(fù)二項回歸模型,泊松回歸模型要求因變量的均值與方差相等,當(dāng)方差明顯大于均值,即存在“過度分散”的現(xiàn)象時,考慮使用負(fù)二項回歸模型。此外,當(dāng)數(shù)據(jù)中含有大量0值時,考慮使用零膨脹泊松回歸模型或零膨脹負(fù)二項回歸模型。
在分析各期刊的論文數(shù)據(jù)之前,首先從期刊這一層面研究了期刊等級與期刊內(nèi)論文的參考文獻(xiàn)各個指標(biāo)之間的關(guān)系。圖1所示為各期刊的篇均參考文獻(xiàn)數(shù)量、篇均參考文獻(xiàn)的普賴斯指數(shù)、香農(nóng)指數(shù)和被引頻次中值,橫坐標(biāo)與表1中期刊序號相對應(yīng),體現(xiàn)期刊是按照影響因子從大到小的排序。
由圖1可知,參考文獻(xiàn)的4個指標(biāo)與期刊等級之間并不存在十分顯著的相關(guān)關(guān)系,但是隨著期刊影響因子和JCR分區(qū)的降低,篇均參考文獻(xiàn)數(shù)量、篇均參考文獻(xiàn)被引頻次中值以及篇均普賴斯指數(shù)這3個指標(biāo)大體上呈現(xiàn)遞減趨勢。
PhysicalReviewB是凝聚態(tài)物理學(xué)科的著名期刊,JCR分區(qū)一直處在Q1區(qū),在該研究領(lǐng)域內(nèi)影響力較大,并且該期刊的發(fā)文數(shù)量較大,可以為本研究的模型提供充足的數(shù)據(jù)樣本。下面以PhysicalReviewB2013年刊載的4774篇研究論文為例,詳細(xì)說明實證分析過程。
3.2.1描述性統(tǒng)計與相關(guān)系數(shù)
表2所示為所有變量的描述性統(tǒng)計和相關(guān)系數(shù)。由表2可知,各個變量之間并不存在嚴(yán)格意義上的多重共線性;在實證分析的過程中,進(jìn)一步檢測了方差膨脹因子(Variance Inflation Factor, VIF),發(fā)現(xiàn)最大的VIF不超過3,說明多重共線性在本研究中不顯著,可以將其納入同一回歸模型進(jìn)行實證檢驗。此外,論文被引頻次的方差明顯大于均值,因此需要采用負(fù)二項回歸模型。
3.2.2模型結(jié)果分析
表3所示為模型回歸分析的結(jié)果。模型1為基礎(chǔ)回歸模型,顯示的僅為控制變量對論文被引頻次的影響,模型2~5分別為加入了與參考文獻(xiàn)有關(guān)的4個自變量,模型6則納入了所有自變量。
圖1 12種期刊參考文獻(xiàn)的指標(biāo)。(a)篇均參考文獻(xiàn)數(shù)量;(b)篇均普賴斯指數(shù);(c)篇均香農(nóng)指數(shù);(d)篇均參考文獻(xiàn)被引頻次中值
表2 描述性統(tǒng)計和相關(guān)系數(shù)
注:①虛擬變量未列入表中;②***、**、*分別表示在1%、5%、10%的水平下通過顯著性檢驗,下同。
表3 模型估計結(jié)果
注:括號內(nèi)數(shù)值為標(biāo)準(zhǔn)誤差。
從模型1的估計結(jié)果可以看出,作者數(shù)量和論文篇幅對被引頻次有顯著的正影響,其余控制變量與被引頻次之間的關(guān)系均不顯著。從理論角度分析,作者數(shù)量越多,說明論文越集思廣益,可以為科研項目提供更豐富的研究思想、方法和資源;作者數(shù)量較多也有助于擴(kuò)大論文的影響力,增加論文被引用的可能性。而論文篇幅越長,說明問題可能被討論得越充分,論文含有的信息量越多。這2個變量與被引頻次之間存在正相關(guān)關(guān)系具有其合理性,但是如果需要進(jìn)一步確認(rèn),還需要更多模型間的對比分析。
從模型2~6的估計結(jié)果可以看出,和參考文獻(xiàn)相關(guān)的4個指標(biāo)均與論文的被引頻次存在正相關(guān)關(guān)系,并且都在1%的水平上通過顯著性檢驗,即參考文獻(xiàn)的數(shù)量越多、篇均被引頻次的中值越高、普賴斯指數(shù)和香農(nóng)指數(shù)越大時,論文的被引頻次就越高。特別是普賴斯指數(shù)和香農(nóng)指數(shù)這2個指標(biāo),其相應(yīng)的回歸系數(shù)分別為2.1173和1.0531,影響作用非常大。各個模型的結(jié)果均充分支持了原假設(shè)H1~H4。
只對PhysicalReviewB進(jìn)行回歸分析并不能得到完整的結(jié)論,需要對其余11種期刊逐一進(jìn)行回歸分析。鑒于論文篇幅,這一系列過程不再一一列出,表4所示為各個回歸模型的簡略結(jié)果。
表4 12種期刊回歸模型的簡略結(jié)果
注:①+++、++、+分別表示在1%、5%、10%的顯著性水平下通過檢驗,并且系數(shù)符號為正;②---、--、-分別表示在1%、5%、10%的顯著性水平下通過檢驗,并且系數(shù)符號為負(fù);③空白表示未通過顯著性檢驗。
由表4可知,和參考文獻(xiàn)相關(guān)的4個指標(biāo)與論文被引頻次之間的關(guān)系基本上可以分為3種類型。
(1) 表征參考文獻(xiàn)新舊程度的普賴斯指數(shù),在12種選定期刊中都對被引頻次呈現(xiàn)出正影響,并且基本都在1%的顯著性水平下通過檢驗,即最近5年的參考文獻(xiàn)所占的比例越高,論文的被引頻次就越高,這也與假設(shè)H3相符。參考文獻(xiàn)越新,論文被引頻次越高,這可能是因為:①新文獻(xiàn)在研究技術(shù)、方法以及結(jié)論等方面都比較新穎,有利于產(chǎn)出高質(zhì)量的研究成果;②新文獻(xiàn)所研究的內(nèi)容是新興的熱門領(lǐng)域或者新的學(xué)科增長點(diǎn),其成果極容易受到學(xué)界關(guān)注,這也有可能促使論文的被引頻次增加。
(2) 參考文獻(xiàn)的數(shù)量和表征參考文獻(xiàn)跨學(xué)科性的香農(nóng)指數(shù)在大多數(shù)期刊中都與被引頻次有顯著的正相關(guān)關(guān)系,即參考文獻(xiàn)的數(shù)量越多、跨學(xué)科性越高時,論文的被引頻次就越高,基本符合假設(shè)H1和H4。根據(jù)Haslam等[19]的分析,參考文獻(xiàn)的數(shù)量越多,論文被引頻次越高,這可能是因為:①作者對研究課題做了廣泛而深入的前期了解和準(zhǔn)備,因而提高了科研質(zhì)量;②該領(lǐng)域是一個成熟廣泛、或者眾多科研工作者正在研究的熱點(diǎn)領(lǐng)域,因此論文所涉及的研究成果容易受到其他研究人員的關(guān)注及引用;③參考文獻(xiàn)數(shù)量越多,反映出該研究的綜合性越強(qiáng),先前的眾多研究成果在這里匯總。而參考文獻(xiàn)的跨學(xué)科性越高,論文的被引頻次越高,一方面可能是因為學(xué)科間的交叉融合更容易產(chǎn)生較高質(zhì)量的成果,另一方面也有可能是因為跨學(xué)科的研究容易吸引多個學(xué)科的研究人員的關(guān)注,論文的可見度增加,因而被引用的可能性也得到顯著提高。
(3) 表征參考文獻(xiàn)質(zhì)量的被引頻次中值與論文被引頻次之間的相關(guān)關(guān)系并不明顯。在多數(shù)期刊中,參考文獻(xiàn)被引頻次的中值與論文被引頻次之間不存在相關(guān)關(guān)系,即使在有相關(guān)關(guān)系的期刊中,這種關(guān)系的方向性也并不一致,該結(jié)論與假設(shè)H2并不相符。當(dāng)然這一結(jié)論并不是否定引用前人高質(zhì)量論文的重要性,只是說從整個“大科學(xué)”層面,前人的研究成果很有可能會影響后來者的研究質(zhì)量,但是從單篇論文角度分析,前人的高質(zhì)量論文并不會過多影響施引論文的質(zhì)量。當(dāng)然,這是基于本研究的數(shù)據(jù)而言,高影響力科研成就到底如牛頓所說的“站在巨人肩膀上”,還是像奧爾特加所說的“更多地由科學(xué)大眾推動”,還需要更大范圍數(shù)據(jù)的檢驗。
研究結(jié)果表明,在對期刊影響因子進(jìn)行人為控制(即選擇同一期刊內(nèi)的論文比較)的前提下,在2013年凝聚態(tài)物理學(xué)科領(lǐng)域12種專業(yè)期刊的8847篇研究論文的4個參考文獻(xiàn)指標(biāo)中,12種期刊的普賴斯指數(shù)都與論文被引頻次存在顯著正向相關(guān)關(guān)系,大部分期刊的參考文獻(xiàn)數(shù)量和香農(nóng)指數(shù)則與論文的被引頻次存在顯著的正相關(guān)關(guān)系,而篇均參考文獻(xiàn)的被引頻次中值則與論文被引頻次之間不存在顯著的相關(guān)關(guān)系。
本研究結(jié)論對于科研工作者開展科研活動、撰寫學(xué)術(shù)論文等也具有一定的參考意義:(1)在研究之前,要充分和廣泛地收集已有資料,認(rèn)真閱讀前人文獻(xiàn),從中總結(jié)出有用的結(jié)論、方法等,進(jìn)而制定合理的科研計劃和科研目標(biāo),爭取產(chǎn)出高質(zhì)量的科研成果;(2)要主動出擊,及時地關(guān)注和跟蹤當(dāng)前科技前沿,了解科技熱點(diǎn),學(xué)習(xí)并且使用最新的技術(shù)方法,找準(zhǔn)科研“處女地”;(3)要注重學(xué)科融合和交叉,打破學(xué)科界限,多與其他學(xué)科領(lǐng)域的研究人員交流,注重其他學(xué)科領(lǐng)域研究方法、技術(shù)、結(jié)論等在本領(lǐng)域的應(yīng)用。
當(dāng)然,本研究依然存在需要擴(kuò)展的地方:(1)鑒于某些指標(biāo)獲取和處理的復(fù)雜程度,所選的學(xué)科只有凝聚態(tài)物理,后續(xù)需要改進(jìn)數(shù)據(jù)采集和處理的方法,研究更大的樣本,獲得更為普遍的結(jié)論;(2)參考文獻(xiàn)與論文被引頻次之間的理論關(guān)系和具體機(jī)制上的探討需要進(jìn)一步挖掘。通過較大樣本的回歸模型,驗證了參考文獻(xiàn)的某些指標(biāo)與論文被引頻次確實相關(guān)的結(jié)論;然而這種相關(guān)和影響機(jī)理需要深入探討,不但可以深化二者關(guān)系的理論認(rèn)識,也為更深入的計量實證(例如突破傳統(tǒng)的引文著錄分析,進(jìn)入全文層面的引用內(nèi)容分析,進(jìn)而進(jìn)行微觀知識引用和創(chuàng)新研究)提供參考。
致謝感謝遼寧重大裝備制造協(xié)同創(chuàng)新中心在本研究數(shù)據(jù)來源方面提供的支持。
作者貢獻(xiàn)聲明:
康旭東:完善研究設(shè)計,撰寫論文;
徐慶富:獲取與分析數(shù)據(jù),參與論文的撰寫與修訂;
張春博:提出研究設(shè)計,修改論文。