王術 葉鷹
摘要 把評價視向由針對學術主體轉向針對學術客體,提出著眼于單篇論著影響力評價的影響矩指標。影響矩M被定義為單篇論著影響學者力A及其影響跨度D的乘積,M越大,影響越大。通過對測算樣本集和校驗樣本集的數(shù)據(jù)分析,顯示影響矩M與總被引C及h指數(shù)的相關系數(shù)都在0.6以上,表明影響矩可以作為測評單篇論著影響力的獨立指標。
關鍵詞 影響矩 影響學者力 論文影響力 單篇論著評價 學術評價指標
1 引言
當對各類學術主體進行評價時,我們已有能用于評價學者、機構、期刊乃至國家等層面的多種指標,其中比較有代表性的如篇均被引、皇冠指數(shù)、觀眾因子、篇均來源歸一化影響等,乃至新興的h指數(shù)、h型指數(shù)、I3、學術跡等。然而,當面對學術客體即針對學術論著本身進行評價時,我們大多采用定性的同行評議判斷優(yōu)劣,能用的定量評價指標很少??墒?,學術論著才是學術評價的終極對象,尤其是單篇論著的學術影響力或學術價值判定構成評判的基石,因為只有在合理評價單篇學術論著的基礎上評價學者、學術團體等的學術貢獻才會有較強說服力。
長期以來,單篇論著的影響力指標通常只是用被引數(shù)C來衡量,h指數(shù)發(fā)現(xiàn)后,舒伯特用施引文獻的h指數(shù)來評價單篇文獻的思想值得借鑒。近年國內外學者還有一些新的提議,例如:鐘文一等提出基于引文系數(shù)的論文影響力評價;韓毅等提出用繼承與擴散、參考文獻與引用文獻的貢獻率(HID)來反映單篇文獻的知識繼承與知識擴散聯(lián)系,但隨著回溯深度的增加,引用或施引的文獻增長過快會難以收斂,導致計算困難,已有研究回溯引文當分母為階乘時級數(shù)比較容易收斂,而當HID為零值或者無窮大時便無法比較;吳勤提出用引證強度來評價單篇論著,但過度排除自引也會引起新的問題,而且期刊量化等級主觀因素很大;沈麗華等提出客觀同行評議法,是用文獻計量方法設定一個范圍值,先篩選一部分文章,再讓專家評審這些文章,將定量和定性分析相結合,這不失為一種好方法,但是操作起來需要專家投入較多時間和精力,不太適合對大量文獻的影響力進行測評。其他通過算法設計用程序計算實現(xiàn)的指標則會以增加計算難度為代價。
為兼顧理論繼承性和計算簡潔性,本文針對單篇論著影響力測度進行如下探討。
2 方法與數(shù)據(jù)
2.1 思想方法
繼承引文分析思想,一篇論著的學術影響首先通過對相關學者的影響而體現(xiàn),其次也表現(xiàn)在影響的時間跨度及引文分布上。由此思考,一篇論著的影響力可考慮以引用該論著的學者數(shù)為基礎,學術論著最直接的影響學者是施引文獻的作者,因此可用施引文獻的作者數(shù)即影響學者力來衡量一篇學術論著的基礎影響力,于是引進定義1:
定義1.影響學者力A:一篇論著的影響學者力是引用該論著的作者總數(shù),也就是該論著影響的學者數(shù),記為A。
這一測度可以有效避免作者自引、團體之間“互惠引用”導致的問題,因為一篇文章無論怎樣自引,其影響學者人數(shù)都不會改變,或者只會增加與其合作者的新的合作者數(shù)量,團體“互惠引用”也不會增加影響學者人數(shù)。
同時,考慮引文分布,設論文發(fā)表tj,年的被引次數(shù)為cj,于是引進定義2:
定義2.影響跨度D:一篇論著的影響跨度D用公式定義為
其中tj,為論文從發(fā)表算起到第j年被引時經(jīng)歷的年數(shù),cj為第j年的被引數(shù),C為被引總數(shù),n為該文發(fā)表時間至今的總年數(shù)。
這樣,可以定義單篇論著的綜合影響測度——影響矩M:
定義3.影響矩M:一篇論著的影響矩M是影響學者力和影響跨度的乘積,用公式定義為
由(式2)定義的測度M有類似物理學中力矩的屬性(量綱為“人·年”):當把A看作“力”,則影響跨度D類似“力臂”,因此,稱M為影響矩,既形象也實在。M越大,影響越大。
影響矩繼承了信息計量學中單指標測度的簡潔與明晰,兼顧了被引數(shù)量的年代分布,可望具有應用推廣價值。
2.2 數(shù)據(jù)說明
本文選用兩個數(shù)據(jù)樣本進行實證研究。
樣本一檢索自Web of Science(WoS),檢索策略:主題=(“h-index”or“h-type index”or“h-likeindex”)or標題=“An index to quantify*”,數(shù)據(jù)庫選擇包括SCI-EXPANDED,SSCI,A&HCI,CP-CI-S,CPCI-SSH,時間限定2005年至今,檢索時間為2014年6月11日。數(shù)據(jù)經(jīng)清洗后得到1244條檢索結果。按照被引次序降序排列,選取被引次數(shù)前50的文獻下載其全部施引文獻記錄,用分析功能進行作者分析,記錄施引數(shù)據(jù),見附表1。
樣本二以沈利華等2012年發(fā)表的《“客觀同行評議”方法探索性研究——一種基于引文分析法的學術論著影響力評價方法》中的數(shù)據(jù)為參照,用檢索策略“作者=(PAN JW)and地址=(Univ Sci&Technol China)”檢索中國科技大學潘建偉院士課題組2008—2012年發(fā)表并收錄在SCI-Expended數(shù)據(jù)庫中的所有論文成果(檢索時間為2014年6月6日),記錄論文52篇,見附表2。
樣本一提供新指標測算樣本,樣本二作為已知定性結果的校驗樣本。
3 結果及分析
3.1 測算樣本
對樣本一施引文獻數(shù)據(jù)集的有關指標進行計算,所得結果如表1所示。
表1中影響學者力A是通過WoS平臺分析功能分析出來的施引文獻中全部施引文獻作者總數(shù);施引h指數(shù)即舒伯特提出的單篇文獻的施引文獻h指數(shù);影響跨度D是用(式1)計算的結果;影響矩M是用(式2)計算的結果;C-r是用被引數(shù)C排序的序次;H-r是用施引h指數(shù)排序的序次;A-r是按照學者影響力排序的序次;M-r是按影響矩排序的序次。
用SPSS軟件分別對表1中C,M,h和C-r,M-r,h-r進行皮爾森相關性分析和斯皮爾曼等級相關性分析,結果見表2。
值得一提的是:依照斯皮爾曼等級相關系數(shù)的概念,用C-r,M-r和h-r相對量值進行相關分析獲得的結果與用C,M和h絕對量值計算的結果一致。C、h、A、M四量的絕對數(shù)值分布圖見圖1。
從圖1中四量曲線的直觀走勢看,影響學者力A與被引數(shù)C維持相似形態(tài),而影響矩M則提供了另一相對不同的評判。
3.2 校驗樣本
以附表2中數(shù)據(jù)計算影響學者力A和影響矩M,并按照影響矩降序排列,得到前10個數(shù)據(jù)見表3。
表3中編號為1、2、3、6、8、7的加粗傾斜體的數(shù)據(jù)與《“客觀同行評議”方法探索性研究——一種基于引文分析法的學術論著影響力評價方法》一文中用同行評議法得出的潘建偉院士前6篇高影響力論文完全相同。而用被引數(shù)C的評價結果不太理想,只能命中4篇;施引h指數(shù)的排序結果靈敏度不高。該檢驗結果提示:影響學者力A和影響矩M都有比被引總數(shù)C和施引h指數(shù)更好的單篇論著影響力評價效果(指與定性評價的一致性和區(qū)分度)。
如果把(式2)寫成函數(shù)形式
M=M(A,D)=A·D(式3)叉影響,而D取決于引文分布,故導致M多變。
4 討論
在表2體現(xiàn)的被引數(shù)C排序的序次C-r、施引h指數(shù)排序的序次h-r和影響矩M排序的序次M-r三者之間的相關性數(shù)據(jù)中,皮爾森相關系數(shù)和斯皮爾曼等級相關系數(shù)的數(shù)值都在0.6以上,表明具有正的強相關,但也有相對獨立性;而由圖1直觀可見影響矩M和被引數(shù)C的區(qū)別巨大。因此,影響矩M具備作為一個獨立評價指標的模樣。
在校驗樣本集中,用影響矩M篩選出的靠前的6篇文獻與用客觀同行評議法選出來的6篇文獻完全相同,表明這一指標能取得定量和定性方法相似的結果,可望具有一定實用性。
固然,任何評價指標都不是完美無缺的,影響矩M相對于總被引C和h指數(shù)等指標而言,數(shù)據(jù)采集難度和計算難度有所增大,希望能回報以提供獨特參考信息的功效。
5 小結
綜上所述,影響矩M可以作為測評單篇論著影響力的參考指標,M越大的論著影響也越大。該指標可望為評價單篇論著提供一個獨特的參考視角,并期望能在應用中進一步發(fā)展和完善。