王凌峰 楊海霞
(桂林電子科技大學商學院 桂林 541004)
1665年以來,期刊一直是最有代表性的論文發(fā)表系統(tǒng)?;ヂ?lián)網(wǎng)時代出現(xiàn)新型論文發(fā)表系統(tǒng),如預印本1.0(典型如arXiv)、類期刊平臺(典型如F1000 Research)以及預印本2.0(典型如中國科技論文在線)[1],但是上述新型論文發(fā)表系統(tǒng)目前尚未能動搖期刊組織論文同行評議的壟斷地位,可預見未來期刊仍將是最主要論文發(fā)表系統(tǒng)。
期刊數(shù)量眾多,不同期刊論文質量存在明顯差異,故有必要進行期刊分區(qū)。一些歐美國家科研管理采用期刊分區(qū),如澳大利亞研究委員會對澳大利亞高校進行學術評估時使用期刊分區(qū)名單[2]。我國目前至少存在7種中文期刊分區(qū)方案,包括中國社會科學院下屬中國社會科學評價研究院發(fā)布的人文社會科學領域期刊分區(qū)(簡稱社科院分區(qū))、北京大學圖書館組織編制的期刊分區(qū)(簡稱北核)、南京大學社會科學評價中心方案(簡稱CSSCI或南核)、中國科技信息研究所、中國科學院文獻情報中心、武漢大學邱均平課題組發(fā)布的RCCSE期刊分區(qū),除此之外尚有一些單學科期刊分區(qū)方案,如2020年中國優(yōu)選法統(tǒng)籌法與經(jīng)濟數(shù)學研究會、中國管理科學與工程學會、中國系統(tǒng)工程學會聯(lián)合發(fā)布的《FMS管理科學高質量期刊推薦列表》將1 135種管理科學與工程領域國內外期刊分成ABCD四區(qū)。
多種期刊分區(qū)方案并存必然導致一些期刊在不同方案中的評價差異較大,本文2021年初開始撰寫時,《現(xiàn)代情報》沒有被北核2017版目錄納入,但南核2019版目錄納入,《運籌與管理》被北核2017版目錄納入,但是在社科院2018版目錄中僅屬于擴展版。此類現(xiàn)象顯然不合理,應發(fā)布統(tǒng)一的期刊分區(qū)方案,主要理由有二:a.從學理角度看,在一段時間內,同一個學科期刊之間的質量差異屬于客觀存在,相對位置穩(wěn)定,不應出現(xiàn)同一本期刊在同一時期的不同期刊分區(qū)方案中評價差異較大情況。b.從科研管理角度看,高校、科研機構在人才引進、職稱評審、研究生獎學金評定、學科評估等多種場合中,需要統(tǒng)一的期刊分區(qū)方案,同一本期刊按照不同分區(qū)方案所屬等級不同,帶來管理困難。
期刊可以從不同角度分區(qū),因此存在多種期刊分區(qū)方案。為統(tǒng)一期刊分區(qū)方案,需要對不同期刊分區(qū)方案合理性進行比較。比較分定性比較與定量比較,本文以期刊各分區(qū)內部論文被引次數(shù)離散系數(shù)為評價指標,對不同期刊分區(qū)方案合理性進行定量比較。
1.1定量比較指標:分區(qū)論文被引次數(shù)離散系數(shù)本文基本思路是:期刊分區(qū)目的是讓論文質量比較接近的多本期刊歸入同一個分區(qū)。論文水平最常見定量指標即論文被引次數(shù)。因此,如果若干期刊論文被引次數(shù)較接近,則應歸入同一個分區(qū)?!罢撐谋灰螖?shù)比較接近”使用數(shù)學語言表達即該分區(qū)期刊發(fā)表論文被引次數(shù)差異小,論文被引次數(shù)差異小即論文被引次數(shù)離散系數(shù)小。
為方便理解,舉例說明:假定有五本期刊A、B、C、D、E,每本期刊發(fā)表論文都是5篇,各論文被引次數(shù)見表1。
表1 五本期刊五篇論文被引次數(shù)
假設五本期刊劃分為兩個分區(qū),則五本期刊有兩種分區(qū)法,即AB、CDE以及ABC、DE。
根據(jù)表1的論文被引次數(shù),分別計算兩種期刊分區(qū)方案中,每個方案分區(qū)的論文被引次數(shù)離散系數(shù)見表2。
表2 示例兩種方案的離散系數(shù)
表2顯示,第一種方案兩個分區(qū)離散系數(shù)之和0.68明顯小于第二種方案兩個分區(qū)離散系數(shù)之和0.95,故第一種分區(qū)合理性更高。
可以將上述步驟用數(shù)學符號表達,但由于步驟清楚也并不復雜,故僅用實例展示。
1.2兩個方案分區(qū)數(shù)不同時的調整規(guī)則對同一組期刊進行分區(qū)時,方案A可能分五個區(qū),而方案B可能分三個區(qū),兩個方案比較合理性時需要調整分區(qū),這里給出兩個調整規(guī)則:a.將分區(qū)數(shù)量較多方案內部的相鄰分區(qū)適當合并。所謂“適當”的具體判斷標準是兩種方案對比分區(qū)內期刊相同率盡可能高。b.采用規(guī)則一調整后,仍然不能確定唯一的分區(qū)調整結果,則選擇調整后各分區(qū)論文被引次數(shù)離散系數(shù)和最小的方式進行調整。
為方便理解,舉例說明:假定10本期刊有A、B兩種分區(qū)方案,方案A分三區(qū),一區(qū)包括編號1、2、3三本期刊,二區(qū)包括編號4、5、6三本期刊,三區(qū)包括編號7、8、9、10四本期刊。方案B分兩區(qū),一區(qū)包括編號1、2、3、4、5五本期刊,二區(qū)包括編號6、7、8、9、10五本期刊。
為對比方案AB,需要將方案A三個區(qū)合并成兩個區(qū)。先采用調整規(guī)則1對三個區(qū)進行合并,具體過程見表3。
表3 方案A兩種合并方式
續(xù)表3 方案A兩種合并方式
表3顯示,方案A一、二區(qū)合并后形成的新分區(qū)期刊相同率高于方案A的二、三區(qū)合后新分區(qū)期刊相同率,因此應選擇方案A的一、二區(qū)合并后再與方案B的一區(qū)、方案A的三區(qū)與方案B的二區(qū)進行比較。
由于規(guī)則1已經(jīng)可以處理該示例,故此處不繼續(xù)使用規(guī)則2。
本文擬定量比較社科院分區(qū)、南核(CSSCI)、“H指數(shù)+剩余影響因子分區(qū)(簡稱HRIF)”三種分區(qū)方案合理性。
HRIF分區(qū)方案是本文一作首次提出的期刊分區(qū)新方案?!笆S嘤绊懸蜃印?(Residual Impact Factor,縮寫RIF)即一本期刊在討論時間窗口內,扣掉H指數(shù)后的其他剩余論文被引次數(shù)除以剩余論文數(shù)量計算得到的影響因子。
2.1 HRIF分區(qū)方案HRIF分區(qū)方案的邏輯起點是:一本期刊發(fā)表的論文中,少數(shù)論文被引次數(shù)大大高于多數(shù)論文被引次數(shù),服從冪分布[3]。由于期刊論文被引次數(shù)的冪分布特點,單獨使用影響因子或者H指數(shù)來評價期刊都可能出現(xiàn)不合理現(xiàn)象。
單獨使用影響因子評價期刊存在“一文拉高全刊影響因子”的MEGA 效應。Tamura Koichiro等人編寫的MEGA軟件被眾多進化生物學研究者使用。2007年Tamura Koichiro等在進化生物學期刊MolecularBiologyandEvolution上發(fā)布MEGA 4版本。2009年該刊影響因子提高到近10,進入進化生物學領域高影響因子期刊行列。隨后兩年MEGA軟件沒有更新,該刊影響因子顯著降低。2011年MEGA 5發(fā)布,該刊影響因子猛增到14.3。如果扣除 MEGA 軟件帶來的被引次數(shù),該刊影響因子會減少一半多。
單獨使用H指數(shù)的弊端在于H指數(shù)只考慮期刊發(fā)表論文中的少部分高被引論文,而漏掉數(shù)量上占多數(shù)的一般論文,可能導致期刊排名虛高。一個具體實例是《教育教學論壇》的谷歌學術發(fā)布H指數(shù)位居中文期刊前列,因為其發(fā)文量很大(近年來每年在五千篇以上),總有若干論文被引次數(shù)高,因此H指數(shù)高。但是,該刊發(fā)文量大,論文平均被引次數(shù)低,表現(xiàn)為影響因子低,該刊在中國知網(wǎng)中文期刊影響因子年報中的相對排位明顯低于其在谷歌學術H指數(shù)中的相對排位。
HRIF分區(qū)同時采用H指數(shù)、剩余影響因子評價期刊,可以消除僅使用H指數(shù)或者影響因子評價期刊時出現(xiàn)的上述不足。
國際慣例通常將一個學科的全部期刊分為四個等級,本文照此。此時HRIF分區(qū)的基本步驟為:a.計算每本期刊過去兩年發(fā)表論文的H指數(shù)。b.計算每本期刊過去兩年發(fā)表論文的RIF剩余影響因子。c.將全部期刊的H指數(shù)和RIF剩余影響因子降序處理后,根據(jù)期刊總數(shù)均分為四段,形成16個方格。H1為H指數(shù)最大一段,RIF1為剩余影響因子最大一段,其余類推。如果需要將期刊分為三個、五個或者其他分區(qū)時,將H指數(shù)、RIF影響因子均分為三、五或者其他等級數(shù)即可。
HRIF分區(qū)的1到4個分區(qū)與16個方格之間的對應關系見圖1。
圖1 HRIF16個方格與四個分區(qū)的對應關系
圖1中符號“×”表示不存在的H指數(shù)與剩余影響因子組合。圖1右下方“×”出現(xiàn)原因是:按照H指數(shù)與RIF剩余影響因子的定義,剩余影響因子必然數(shù)字上小于H指數(shù),不可能出現(xiàn)RIF很大、而H指數(shù)很小的組合。圖1左上方“×”出現(xiàn)原因是:如果一本期刊RIF剩余影響因子很低,意味著該刊多數(shù)論文質量低,由于多數(shù)作者不會將較高質量論文投往多數(shù)論文質量低的期刊,因此RIF剩余影響因子小的期刊,較高質量論文數(shù)量少,則H指數(shù)自然小。
可以看到,HRIF分區(qū)能夠消除單獨采用H指數(shù)或者單獨采用影響因子評價期刊的前述兩種不合理現(xiàn)象。首先,一篇極高引用次數(shù)的論文在計算期刊H指數(shù)時,最多讓該刊H指數(shù)增加1,計算剩余影響因子時會扣除H指數(shù)包含論文的被引次數(shù),故“一文拉高全刊影響因子”的MEGA 效應在HRIF分區(qū)中不會出現(xiàn)。其次,《教育教學論壇》之類H指數(shù)高而剩余影響因子低的期刊在HRIF分區(qū)中落入低分區(qū),而不能進入高分區(qū)。
2.2社科院期刊分區(qū)方案2018年中國社會科學院下屬中國社會科學評價中心發(fā)布《中國人文社會科學期刊 AMI 綜合評價指標體系》,目前為止未更新。其學科分類綜合教育部《學位授予和人才培養(yǎng)學科目錄(2018 年)》、國家標準《學科分類與代碼》(GB/T 13745-2009)及《中國圖書館分類法(第五版)》,分 3 個學科大類、23 個學科類和 33個學科子類。
社科院版分區(qū)方案采用3個一級指標、10個二級指標和 24個三級指標。3個一級指標分別為吸引力、管理力、影響力。吸引力下二級指標包括獲獎狀況、論文狀況、同行評議,管理力下二級指標包括學術不端、編輯隊伍和作者隊伍、制度規(guī)范以及信息化建設,影響力下二級指標包括學術影響力、社會影響力、國際影響力。由于三級指標較多,此處不列,感興趣的讀者可以自行到中國社會科學評價中心官網(wǎng)下載。
社科院版分區(qū)將期刊分為五級——頂級、權威、核心、擴展、入庫。其中“入庫”沒有明確單列為一個等級,但事實上形成一個分區(qū)。
2.3 CSSCI南核分區(qū)方案1998年南京大學組建課題組研制《中文社會科學引文索引》。1999年教育部將該項目列為九五規(guī)劃重大項目。2000年南京大學與香港科技大學聯(lián)合完成《中文社會科學引文索引》數(shù)據(jù)庫[4]。目前國內通稱CSSCI或南核,兩年更新一次。
CSSCI學科分類綜合國家標準《學科分類與代碼 (GBT 13745-2009) 》、國務院學位辦發(fā)布《學位授予和人才培養(yǎng)學科目錄(2011年)》和《國家社會科學基金學科分類目錄》確定。另外根據(jù)我國實際情況設置“高校綜合學報”和“綜合社科期刊”兩個類別。
CSSCI結合定量計量指標與定性專家評價,從大陸出版的2 700余種中文人文社會科學學術期刊中選出500多種期刊作為源刊。來源期刊分為核心版、擴展版兩個等級。
CSSCI指標由4個一級指標和12個二級指標組成。4個一級指標分別為出版規(guī)范(包括政治導向、專業(yè)導向、版本與頻率等二級指標)、形式規(guī)范(包括期刊信息、論文題錄、引文著錄、引用統(tǒng)計等二級指標)、學術影響(包括影響因子、總被引頻次、即年指數(shù)等計量指標)、專家評價(包括網(wǎng)絡評議、學科終審)。
CSSCI來源期刊遴選第一次采用近千名正高專業(yè)技術人員投票方式,后使用他引影響因子、總被引次數(shù)兩個指標排序確定,兩個指標權重為8:2[5]。
以圖書情報學科簡體中文期刊為討論對象,采用前文第1節(jié)提出的方法定量比較第2節(jié)介紹的三種期刊分區(qū)方案優(yōu)劣。
3.1數(shù)據(jù)來源討論期刊取自《中國人文社會科學期刊 AMI 綜合評價報告》(2018年)、南核CSSCI正版與擴展版(2019)兩個分區(qū)方案在圖書情報學科共有的24本期刊。
24本共有期刊論文被引數(shù)據(jù)來自中國知網(wǎng)數(shù)據(jù)庫。討論年限為2019.1.1-2020.12.31。使用爬蟲程序從中國知網(wǎng)抓取24本期刊論文被引次數(shù)。
3.2討論期刊在三個方案各分區(qū)的分布情況24本期刊在三種分區(qū)方案中的分布情況見表4。需要說明的是,2018版社科院分區(qū)將大部分學科的期刊分為頂級、權威、核心、擴展、入庫五個分區(qū),但圖書情報學科沒有頂級和入庫期刊,只有權威、核心、擴展三個分區(qū)。
表4 24本圖情類中文期刊三種規(guī)則分區(qū)結果
3.3三個擬比較方案分區(qū)的統(tǒng)一處理三個方案分區(qū)數(shù)不同,需要根據(jù)前文第1節(jié)規(guī)則統(tǒng)一處理。
社科院分區(qū)與HRIF分區(qū)對比情況是:本文討論的社科院分區(qū)中,圖書情報學科分三個區(qū),而HRIF分區(qū)為四個分區(qū)。根據(jù)前文第1節(jié)規(guī)則,將HRIF分區(qū)2、3區(qū)合并。最終社科院權威期刊與HRIF分區(qū)第1區(qū)對比、社科院核心期刊與HRIF分區(qū)的2、3區(qū)對比、社科院擴展期刊與HRIF分區(qū)的第4區(qū)對比。
CSSCI與HRIF分區(qū)對比情況是:南核只有正版與擴展版兩個區(qū),而HRIF分區(qū)有四個區(qū),按照前文第1節(jié)規(guī)則,HRIF分區(qū)的1、2、3區(qū)合并后與南核正版對比,HRIF分區(qū)的第4區(qū)與南核擴展版對比。
社科院分區(qū)與南核分區(qū)對比情況是:社科院的權威+核心分區(qū)合并后的期刊與南核的正版期刊對比,社科院的擴展版與南核擴展版期刊對比。
按照第1節(jié)步驟得到三個期刊分區(qū)方案兩兩比較結果,分別見表5、表6、表7。
表5顯示,社科院方案與南核的兩個比較分區(qū)離散系數(shù)直到小數(shù)點后第三位方出現(xiàn)不同,差異微小,表明兩個分區(qū)方案合理性相當。
表5 社科院與南核分區(qū)定量比較結果
表6顯示,社科院首尾兩個分區(qū)離散系數(shù)明顯大于HRIF分區(qū)(即0.578>0.305、0.702>0.323),中間分區(qū)社科院離散系數(shù)同樣大于HRIF分區(qū),因此HRIF分區(qū)明顯更合理。
表6 社科院與HRIF分區(qū)定量比較結果
表7顯示,南核正版離散系數(shù)大于HRIF調整后的首個分區(qū)(即0.564>0.491),在擴展版分區(qū)比較上,南核離散系數(shù)是HRIF分區(qū)兩倍多(即0.705>0.323),HRIF分區(qū)明顯更合理。
表7 南核與HRIF分區(qū)比較結果
綜上,采用本文方法,本次討論的24本圖書情報領域中文期刊比較,得出兩點結論:
a.社科院、南核方案整體合理性相當。出現(xiàn)該結果的原因是社科院、南核對比的分組所屬期刊高度一致。從表4中可以看到,社科院的權威+核心分區(qū)合并后的期刊與南核的正版期刊高度一致,18本期刊中僅有1本期刊不一致,即序號18的《圖書館學研究》在南核中屬于正版、在社科院分區(qū)中屬于擴展版,其余17本期刊相同。同樣地,社科院的擴展版與南核擴展版期刊對比,6本期刊中僅1本期刊不同,即序號19的《圖書館》在南核中屬于擴展版、社科院中屬于核心區(qū)。
b.HRIF分區(qū)明顯優(yōu)于社科院、南核方案。出現(xiàn)該結果的原因是HRIF分區(qū)使用H指數(shù)、RIF剩余影響因子分別刻畫期刊論文中的少數(shù)相對高被引論文以及多數(shù)相對低被引論文,充分刻畫期刊論文被引次數(shù)冪分布特征。社科院、南核方案采用的文獻計量指標以影響因子、總被引次數(shù)等總量指標、平均指標為主,對期刊論文被引次數(shù)冪分布特征刻畫相對不足。
目前國內期刊分區(qū)多方案并存,不同方案合理性大小比較成為期刊研究、科研管理研究的一個重要問題。本文對該問題研究有三點貢獻:提出使用論文被引次數(shù)分區(qū)離散系數(shù)大小定量比較不同期刊分區(qū)方案合理性;提出優(yōu)于社科院版分區(qū)、南核分區(qū)的期刊分區(qū)新方案“H指數(shù)+剩余影響因子”HRIF分區(qū)方案;HRIF分區(qū)可以作為不同期刊分區(qū)方案合理性的一個定量比較基準。
下一步研究工作包括:a.采用五年時間窗口計算H指數(shù)與RIF剩余影響因子。高論文被引峰值通常出現(xiàn)在論文發(fā)表后第4~5年[6],所以采用五年時間窗口計算H指數(shù)與RIF剩余影響因子更為合理,只是習慣上以兩年影響因子使用最多,故本文暫時采用兩年影響因子。b.更換指標探討本文方法穩(wěn)健性,如本文采用“論文被引次數(shù)”指標計算分區(qū)論文離散系數(shù),后續(xù)研究可以考慮采用“論文他引次數(shù)”。c.采集更多學科更多期刊數(shù)據(jù)討論。d.將更多期刊分區(qū)方案(如中國科技信息研究所、中國科學院文獻情報中心期刊分區(qū)方案、FMS管理科學期刊分區(qū)方案等)與HRIF分區(qū)進行比較。