国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于間接引用機制的科學(xué)文獻被引頻次優(yōu)化模型構(gòu)建與實證研究

2024-12-16 00:00:00劉運梅李冉秦佳佳
數(shù)字圖書館論壇 2024年10期

摘要:為客觀評價科學(xué)文獻的真實影響力、弱化學(xué)術(shù)評價中的馬太效應(yīng)問題,通過降低間接引用關(guān)系的計數(shù)權(quán)重,構(gòu)建科學(xué)文獻被引頻次優(yōu)化模型,提出引用優(yōu)化比例指標,并通過實證研究檢驗該模型的有效性。研究發(fā)現(xiàn):第一,優(yōu)化間接引用頻次權(quán)重后,所得結(jié)果能相對客觀地反映科學(xué)文獻的真實被引情況與真實影響力;第二,該被引頻次優(yōu)化模型可用于識別潛在的高質(zhì)量、高被引論文;第三,該被引頻次優(yōu)化模型能夠在較大程度上緩解學(xué)術(shù)評價中被引的時間累積性和馬太效應(yīng)問題,對年輕文獻具有較高的評價公平性、較好的篩選能力。

關(guān)鍵詞:科學(xué)文獻;間接引用;被引頻次;學(xué)術(shù)評價

中圖分類號:G254 DOI:10.3772/j.issn.1673-2286.2024.10.004

引文格式:劉運梅,李冉,秦佳佳. 基于間接引用機制的科學(xué)文獻被引頻次優(yōu)化模型構(gòu)建與實證研究[J].數(shù)字圖書館論壇,2024,20(10):33-41.

*本研究得到國家自然科學(xué)基金青年項目“基于全文本引文解構(gòu)的引用失范行為識別與生成機理研究”(編號:72304181)、國家智能評價與治理實驗基地2024年創(chuàng)新評價開放基金資助。

科學(xué)文獻是學(xué)者在科技創(chuàng)新活動中的主要產(chǎn)出形式,是反映一個學(xué)科領(lǐng)域基礎(chǔ)研究和應(yīng)用研究的創(chuàng)新成果,同時也是學(xué)者、機構(gòu)、期刊等科學(xué)參與主體學(xué)術(shù)水平與科研能力的重要標志[1]?;诳茖W(xué)文獻間引用、被引關(guān)系建立的引文分析方法揭示了引用的數(shù)量特征與內(nèi)在規(guī)律,已被廣泛應(yīng)用于學(xué)術(shù)評價、科學(xué)前沿探測、學(xué)科知識演化分析等各個研究領(lǐng)域[2-6],并服務(wù)于科技創(chuàng)新的戰(zhàn)略情報研究和科技文獻的情報分析工作。

文獻引用制度中存在著一些不可忽視的重要問題。第一,以引文為基礎(chǔ)的量化評價方法隱含了一個理想化的前提和依據(jù):被引頻次的高低等同于學(xué)術(shù)質(zhì)量或影響力的高低。但是,施引者引用某篇文獻并不一定表示對該文獻學(xué)術(shù)質(zhì)量的認可。第二,論文被引頻次兩極分化嚴重,大量的引用集中在少量的論文上,使得學(xué)術(shù)資源分布極不均衡。那么,是否存在一種隱性的引用機制,導(dǎo)致這樣的分布失衡?積累了較高被引頻次的論文就一定具有極高的學(xué)術(shù)價值嗎?相應(yīng)地,那些低被引,甚至零被引論文毫無學(xué)術(shù)貢獻和影響力嗎?實際上,文獻的引用關(guān)系與引用行為具有高度復(fù)雜性[7-8],一篇論文引用不同參考文獻的目的、動機各不相同,不同論文引用同一篇參考文獻的動機也是各不相同的。因此,有必要追溯以上問題的本源,探究引用形成過程中文獻真實的內(nèi)在價值,對引文影響力形成準確的理解。

隨著國際研究環(huán)境的急速變化、研究水平的不斷提高,科學(xué)家科研成果的產(chǎn)出效率提升,研究文獻的總量也大幅度增加[9]。這給學(xué)者在科學(xué)研究中的文獻調(diào)研與閱讀增加了難度,為引用而引用的現(xiàn)象變得更加普遍,一部分學(xué)者并不是在閱讀、學(xué)習(xí)文后所有參考文獻原文的基礎(chǔ)上對其進行引用。因此,在科學(xué)研究中,通過間接引用行為產(chǎn)生的虛假引文常有存在[10],這些間接引用掩蓋了被引文獻的真實價值,使高被引文獻更容易成為再次被引的對象,而低被引、零被引文獻更容易無人問津。除此之外,間接引用造成引文分析的開展建立在虛假的數(shù)據(jù)資料基礎(chǔ)之上,從而影響期刊評價、論文影響力評價以及人才評估等文獻情報工作的正常開展。以存在間接引用的論文總被引頻次評價科技人才會引發(fā)不良的社會效應(yīng),造成學(xué)術(shù)界不真實的論文引用計數(shù)越來越多[11-12]。因此,優(yōu)化科學(xué)文獻間接引用機制中的被引頻次計數(shù),客觀、公正反映文獻真實的內(nèi)在價值是一項重要且必要的研究工作。

1 相關(guān)研究

引文的影響力評價既可以從定量角度建立被引評價指標,也可以從引用文本的定性角度建立評價方法。在基于引用關(guān)系的定量評價中,Radicchi等[13]構(gòu)建作者引用網(wǎng)絡(luò),根據(jù)PageRank算法獲得了學(xué)者的影響力排序。王菲菲等[14]在互引、共被引、文獻耦合三維引文關(guān)聯(lián)融合視角下,綜合使用社會網(wǎng)絡(luò)分析、主成分分析、熵權(quán)法和天際線算法,建立了學(xué)者引文影響力評價框架。Min等[15]基于Bass擴散模型量化引文擴散機制,提出了Saturation Level指標,用于粗略估計一篇科學(xué)文獻在生命周期的當前階段及未來被引用的潛力。俞立平等[16]從期刊過度自引與人為降低載文量兩個方面入手,對篇均自引率在30%以上、載文量與平均載文量之比低于0.5的期刊的影響因子進行修正,實驗結(jié)果表明該方法能夠有效降低過度自引對被引頻次計數(shù)的影響。綜上,基于被引頻次的相關(guān)研究主要運用數(shù)學(xué)模型、文獻外部特征等建立學(xué)術(shù)評價指標,但仍囿于傳統(tǒng)引文評價的固有缺陷,如引文時間滯后、數(shù)據(jù)方法粗糙、未對施引動機和引用重要性加以區(qū)分等。

從引文內(nèi)容角度,國內(nèi)外相關(guān)的文獻影響力評價研究也已經(jīng)取得一定成果。Bonzi[17]根據(jù)引文文本的表述方式和在施引文獻中出現(xiàn)的次數(shù),判斷被引文獻的影響力程度,發(fā)現(xiàn)大部分被引文獻只被作者簡單提及,對確定施引文獻的主題研究并沒有實質(zhì)貢獻或幫助。Macroberts等[18]比較基因?qū)W領(lǐng)域引文文本與施引文獻、被引文獻的主題相關(guān)性,并將論文的引用劃分為有影響力、無影響力兩類,發(fā)現(xiàn)施引作者會存在一定的隱瞞行為,如以平淡的語言描述對研究過程具有重要作用的文章,以掩蓋被引文獻的真實影響力。Wan等[19]認為科學(xué)文獻中的引文并不同等重要,將引文文本按引用重要性程度分為5個等級,并將其設(shè)為因變量,以引文次數(shù)、位置、間隔發(fā)表時間、平均密度等為自變量進行回歸分析,實證研究證明了引用強度值的有用性。綜上,基于引文內(nèi)容信息如引用位置、引用功能或引用情感等構(gòu)建的學(xué)術(shù)評價方法能夠細粒度區(qū)分引用的重要性,但相關(guān)研究涉及文獻全文內(nèi)容的抽取與計算,模型復(fù)雜度和數(shù)據(jù)處理難度較高,同時引用動機和功能劃分受主觀因素影響較大,因而在學(xué)術(shù)評價實際工作中的實用性與可行性較差。

基于以上研究的優(yōu)勢與不足,本文將從引用結(jié)構(gòu)角度,對不同類型的引用關(guān)系加以區(qū)分,降低間接引用機制產(chǎn)生的引用頻次計數(shù)權(quán)重,構(gòu)建文獻被引頻次優(yōu)化模型,以解決傳統(tǒng)引文評價將所有引用視為等同、數(shù)據(jù)方法粗糙等問題,同時避免引文內(nèi)容評價方法中全文數(shù)據(jù)處理復(fù)雜的問題。此外,提出引用優(yōu)化比例指標,基于實證研究對比間接引用頻次優(yōu)化前、后的計算結(jié)果,評估該優(yōu)化模型的評價效果。

2 基于間接引用機制的被引頻次優(yōu)化模型構(gòu)建

兩級傳播理論是傳播學(xué)四大先驅(qū)之一——美國傳播學(xué)家Lazarsfeld的一大發(fā)現(xiàn),也是大眾傳播研究領(lǐng)域的重要理論基石[20]。該理論將信息傳播過程凝練為兩步:第一步是從信息源,通過大眾媒介傳遞到意見領(lǐng)袖,即信息傳播的第一個階段;第二步是從意見領(lǐng)袖到追隨者的人際傳播,即信息傳播過程的第二個階段。在兩級傳播過程中,意見領(lǐng)袖起著重要的中介作用。大眾傳播和人際傳播在人們的信息獲取和決策中也發(fā)揮著不同的作用[21-22]:大眾傳播影響面廣,在人們的認知階段具有重要作用;人際傳播滲透力強、有針對性,在說服和決策階段人際傳播的影響更顯著,對大眾傳播的信息有進一步的整合作用。

類比兩級傳播理論,科學(xué)文獻間的知識傳播過程中同樣存在兩級傳播機制,如圖1所示。原始文獻A首先將知識直接傳遞給中間文獻B,此為直接傳播階段。追隨文獻C在引用中間文獻B的同時,出于某些主觀上的負面引用動機,如外文文獻閱讀障礙、文獻全文獲取權(quán)限限制、刻意增加參考文獻數(shù)量等,通過中間文獻B中關(guān)于文獻A的引文內(nèi)容信息,不直接閱讀文獻A而對原始文獻A施加引用[23-24],此為間接傳播階段。在基于間接引用結(jié)構(gòu)的知識傳遞過程中,文獻A在發(fā)表后通過直接傳播渠道影響了文獻B的作者,將知識傳遞給文獻B;而文獻B又充當中間人角色,進一步將知識傳遞給追隨文獻C。文獻C同時引用了原始文獻A與中間文獻B。

從文獻的學(xué)術(shù)影響力視角看,正如兩級傳播模型中兩個階段的角色和作用不同,文獻A在文獻B與文獻C的兩次引用中產(chǎn)生的影響力并不能完全等同。文獻B對文獻A的引用屬于文獻A自身影響力產(chǎn)生的直接結(jié)果,而文獻C對文獻A的引用則來自中間文獻B的中介影響力。因此,在由文獻B向文獻C的傳播中,文獻A的影響力減弱。綜上可知,間接引用行為的存在會影響引文數(shù)據(jù)的準確性與真實性,同時也會削弱引文分析作為科學(xué)評價工具的權(quán)威性和可信度。因此,有必要對間接引用結(jié)構(gòu)中由間接引用關(guān)系產(chǎn)生的文獻A的被引頻次進行優(yōu)化,以客觀、公正、真實地反映科學(xué)文獻A的學(xué)術(shù)價值與學(xué)術(shù)影響力。

直接引用、共被引與文獻耦合結(jié)構(gòu)中僅有兩兩文獻間的直接引用關(guān)系,無冗余的間接引用關(guān)系,上述3種引用結(jié)構(gòu)中所有引用均計數(shù)為1,如圖2所示。圖中箭頭方向由施引文獻指向被引文獻,箭頭上數(shù)字表示該引用關(guān)系的引用頻次計數(shù),括號內(nèi)數(shù)字表示該文獻收獲的所有引用頻次計數(shù)。

當文獻之間存在間接引用聯(lián)系時,文獻C對文獻A的引用來自中間文獻B的影響力。此時,文獻A收獲的來自文獻C的間接引用頻次不能記作1,將文獻A產(chǎn)生的間接引用影響力權(quán)重設(shè)置為一半,即0.5,以區(qū)別直接影響力和間接影響力。A、B、C三方文獻的被引頻次計數(shù)如圖3所示,其中虛線表示間接引用關(guān)系。

在間接引用結(jié)構(gòu)的基礎(chǔ)上迭代一層后,共有以下3種引用結(jié)構(gòu),分別為:文獻D引用文獻B、C;文獻D引用文獻A、C;文獻D同時引用文獻A、B、C。按照直接引用與間接引用關(guān)系的被引頻次權(quán)重計數(shù)法,文獻A、B、C、D的被引頻次計數(shù)如圖4所示。

3 基于間接引用機制的被引頻次優(yōu)化實驗

以WoS(Web of Science)數(shù)據(jù)庫為數(shù)據(jù)來源??紤]到學(xué)科差異,根據(jù)WoS學(xué)科分類體系選取醫(yī)學(xué)與生物學(xué)、心理學(xué)、管理學(xué)、化學(xué)、物理學(xué)、數(shù)學(xué)、計算機科學(xué)、圖書情報科學(xué)共8個學(xué)科的數(shù)據(jù)。為保證數(shù)據(jù)樣本多樣性,文獻類型同時包含Article、Review、Proceedings Paper。從以上8個學(xué)科的數(shù)據(jù)樣本中各隨機抽取5篇樣本文獻,共獲取40篇樣本文獻作為被引頻次優(yōu)化模型的評價對象。

確定目標文獻后,獲取樣本文獻對應(yīng)的被引文獻集合、二級被引文獻集合。首先,基于目標文獻與被引文獻集合、被引文獻集合與二級被引文獻的引用關(guān)系,分別建立40篇目標文獻的引文網(wǎng)絡(luò)。其次,根據(jù)式(1)~式(2)計算40篇目標文獻的間接引用頻次計數(shù)Q與直接引用頻次計數(shù)P。最后,將兩方相加,計算優(yōu)化后的被引頻次Nf,以及引用優(yōu)化比例指標R。各項指標計算結(jié)果如表1所示。

4 被引頻次優(yōu)化模型效果評估

4.1 使用數(shù)量與被引頻次優(yōu)化結(jié)果的關(guān)系分析

WoS數(shù)據(jù)庫中論文的使用數(shù)量(Usage)是平臺所有用戶訪問論文全文鏈接或保存記錄的次數(shù),捕獲了用戶試圖獲取全文的各種操作[25-26]。在間接引用結(jié)構(gòu)中,追隨文獻C的作者在未閱讀文獻A原文的情況下,通過中介文獻B的影響力和原文線索對文獻A施加間接引用,這導(dǎo)致文獻A的被引頻次存在冗余的間接引用計數(shù),但并不會對文獻A的使用數(shù)量產(chǎn)生影響。因此,使用數(shù)量指標能夠相對真實地記錄文獻A的被閱讀情況和影響力。為了對比被引頻次優(yōu)化實驗前后的評價效果,分別對優(yōu)化前、后的被引頻次計數(shù)結(jié)果與文獻在WoS中獲得的使用數(shù)量指標進行Pearson相關(guān)性分析[27]。優(yōu)化前被引頻次Nb、優(yōu)化后被引頻次計數(shù)Nf與使用數(shù)量的Pearson相關(guān)系數(shù)計算結(jié)果如表2所示。

表2計算結(jié)果顯示:優(yōu)化前被引頻次Nb、優(yōu)化后被引頻次Nf與使用數(shù)量的相關(guān)系數(shù)分別為0.029、0.072。顯然,在優(yōu)化文獻的間接引用頻次后,文獻的被引頻次計數(shù)與使用數(shù)量的相關(guān)性提高。相比優(yōu)化前未加處理、直接統(tǒng)計的論文被引頻次,通過被引頻次優(yōu)化模型計算的結(jié)果能夠較客觀地反映科學(xué)文獻的真實被引情況和真實影響力。本文建立的被引頻次優(yōu)化方法在一定程度上削弱了科學(xué)工作中文獻間接引用機制帶來的負面影響,在科學(xué)評價與引文分析工作中具有一定的實際應(yīng)用價值。

4.2 ESI高被引論文的被引頻次優(yōu)化結(jié)果分析

通過樣本文獻的引用優(yōu)化比例指標R計算結(jié)果,比較高被引論文與非高被引論文影響力在被引頻次優(yōu)化實驗中的變化。WoS中的高被引論文標識是指同一年同一個ESI學(xué)科中發(fā)表的所有論文按被引頻次由高到低排序,排在前1%的論文。將40篇樣本文獻按8個學(xué)科類別進行分類,并將8個學(xué)科的文獻分別按照引用優(yōu)化比例由小到大排序。表3顯示了每篇論文是否為高被引論文及其對應(yīng)的引用優(yōu)化比例。

根據(jù)統(tǒng)計結(jié)果,與所屬學(xué)科全部樣本文獻相比, ESI前1%高被引論文的引用優(yōu)化比例普遍相對較低。這表明高被引論文中存在的間接引用關(guān)系比較少,高被引論文大部分的被引頻次來自施引文獻真實的、直接的引用。例如,在醫(yī)學(xué)與生物學(xué)、化學(xué)、計算科學(xué)、心理學(xué)等學(xué)科,引用優(yōu)化比例較低的文獻均是ESI前1%的高被引論文。引用優(yōu)化比例越低,優(yōu)化前、后文獻被引頻次的差異越小,也就意味著對應(yīng)文獻的間接引用關(guān)系越少。

ESI前1%高被引論文的低引用優(yōu)化比例驗證了高被引論文多獲得直接的一次引用關(guān)系,而非復(fù)雜的、冗余的多級引用。因此,科學(xué)文獻的質(zhì)量越高,其對應(yīng)的引用關(guān)系越簡單、直接和真實。此外,ESI前1%高被引論文的低引用優(yōu)化比例也表明本文建立的文獻被引頻次優(yōu)化模型能夠用于識別潛在的高質(zhì)量、高被引論文。具體地,在科學(xué)論文獲得一定數(shù)量的引用后,可根據(jù)其引文網(wǎng)絡(luò)進行間接引用頻次優(yōu)化。引用優(yōu)化比例越低,則說明該論文的被引質(zhì)量越好,未來成為高被引論文的潛能越大。

4.3 文獻發(fā)表時間與被引頻次優(yōu)化結(jié)果的關(guān)系分析

為了比較文獻發(fā)表時間對優(yōu)化結(jié)果的影響,根據(jù) 40篇樣本文獻的發(fā)表年份、引用優(yōu)化比例指標計算結(jié)果,構(gòu)建散點圖,如圖5所示。同時,為了進一步細致對比不同優(yōu)化結(jié)果與文獻發(fā)表時間的聯(lián)系,根據(jù)引用優(yōu)化比例計算結(jié)果的分布,將40篇科學(xué)文獻的引用優(yōu)化比例分為[0,0.1)、[0.1,0.2)、[0.2,0.3)、[0.3,0.4)、[0.4,0.5)5個區(qū)間,并統(tǒng)計各個區(qū)間中文獻的發(fā)表時間分布。不同引用優(yōu)化比例區(qū)間對應(yīng)的文獻數(shù)量及發(fā)表年份等信息如表4所示。

在圖5中,根據(jù)樣本文獻的發(fā)表時間與引用優(yōu)化比例構(gòu)建線性趨勢。隨著文獻發(fā)表時間推進,文獻的引用優(yōu)化比例逐漸降低。在2012年以后發(fā)表的文獻形成了一個比較明顯的簇團,引用優(yōu)化比例分布在30%以下。因此,發(fā)表時間越晚的文獻,其引用優(yōu)化比例越低;發(fā)表時間越早的文獻,其對應(yīng)的引用優(yōu)化比例越高。這是由于間接引用關(guān)系的形成至少需要兩次連續(xù)引用——樣本文獻在被施引文獻引用之后、施引文獻繼續(xù)被二級施引文獻引用,這兩次連續(xù)引用需要的時間較長。發(fā)表時間較早的文獻已積累復(fù)雜的引用聯(lián)系,從而產(chǎn)生較多的間接引用關(guān)系。而發(fā)表時間較晚的新文獻還未建立復(fù)雜的間接引用關(guān)系,引用關(guān)系中存在的間接引用頻次較少。

從表4可以看到,引用優(yōu)化比例在0.2以下的文獻均是2015年以后發(fā)表的新文獻。在[0.2,0.3)區(qū)間中,大部分文獻也是發(fā)表于2010年之后。而在[0.3,0.4)和[0.4,0.5)兩個區(qū)間中,2010年之后的新文獻占比驟降,2010年之前發(fā)表的文獻明顯占絕大多數(shù)。相比發(fā)表時間久遠的文獻,發(fā)表時間較晚的新文獻在時間上未能有機會形成較多、較復(fù)雜的引文網(wǎng)絡(luò),大部分獲得無間接聯(lián)系的一次引用關(guān)系,間接引用關(guān)系較少,引用優(yōu)化比例較低。

一篇論文發(fā)表的年份越早,其被引頻次可能越多。在現(xiàn)有的學(xué)術(shù)影響力評價工作中,由于被引頻次的時間累積性問題,一些發(fā)表年份較早、資歷較老的文獻在被引頻次上具有較大的時間累積優(yōu)勢[28-29]。因此,目前大部分的科學(xué)定量評價工作忽略了一些質(zhì)量較高,但受發(fā)表時間影響,未積累足夠被引頻次的年輕文獻。發(fā)表時間較久遠、較經(jīng)典的文獻提供了重要的研究基礎(chǔ),但反映科研新動態(tài)、學(xué)科新進展的年輕文獻的價值仍不可埋沒。科學(xué)研究正是需要通過這些新文獻、新研究來對一個學(xué)科領(lǐng)域進行不斷的探索和突破。因此,文獻發(fā)表時間與引用優(yōu)化比例的負向線性關(guān)系表明本文構(gòu)建的科學(xué)文獻被引頻次優(yōu)化模型能夠在較大程度上過濾掉發(fā)表時間較久遠文獻的間接引用頻次,緩解科學(xué)文獻被引的時間累積性問題和馬太效應(yīng)問題,避免新近發(fā)表文獻在被引頻次計數(shù)中處于劣勢地位,相對較科學(xué)、公正、真實地對不同發(fā)表時間段、不同年齡的科學(xué)文獻進行評價。同時,本文構(gòu)建的被引頻次優(yōu)化模型對高質(zhì)量、年輕的科學(xué)文獻具有較好的篩選能力,評價結(jié)果能夠使高質(zhì)量的新文獻、新成果、新發(fā)現(xiàn)盡快被發(fā)現(xiàn)。

5 結(jié)語

科學(xué)文獻的學(xué)術(shù)影響力反映了一篇論文在學(xué)術(shù)界和同行中的被認可程度,也是學(xué)者、科研機構(gòu)、學(xué)術(shù)期刊等科研主體學(xué)術(shù)水平和科研能力的重要標志。隨著科學(xué)技術(shù)快速發(fā)展,科學(xué)論文的數(shù)量持續(xù)、爆發(fā)式增長,隨之而來的引用不當、引用不規(guī)范問題廣泛出現(xiàn)。如何客觀、合理地評價文獻的學(xué)術(shù)影響力是一個值得深入研究的問題。

本文基于科學(xué)文獻的間接引用機制,將文獻的被引頻次劃分為直接引用頻次與間接引用頻次,并降低間接引用頻次的計數(shù)權(quán)重,構(gòu)建在復(fù)雜引文網(wǎng)絡(luò)中具有普適性的被引頻次優(yōu)化模型。選擇WoS數(shù)據(jù)庫中多個學(xué)科、多種文獻類型的40篇科學(xué)文獻作為實證研究的樣本,指標計算與結(jié)果分析顯示:①通過被引頻次優(yōu)化模型計算的優(yōu)化后被引頻次與使用數(shù)量指標的相關(guān)系數(shù)顯著提高,優(yōu)化后的被引頻次能夠較客觀地反映科學(xué)文獻的真實被引情況和真實影響力;②ESI高被引論文的間接引用關(guān)系較少,其大部分引用為施引文獻真實的、直接的引用,本文建立的被引頻次優(yōu)化模型能夠用于識別潛在的高質(zhì)量、高被引論文;③發(fā)表時間越晚的文獻,引用優(yōu)化比例越低;發(fā)表時間越早的文獻,其對應(yīng)的引用優(yōu)化比例越高。因此,本文構(gòu)建的科學(xué)文獻被引頻次優(yōu)化模型能夠在較大程度上弱化發(fā)表時間較久遠文獻的間接引用關(guān)系的重要性,緩解學(xué)術(shù)影響力評價中的馬太效應(yīng)和時間累積性問題,對高質(zhì)量的、年輕的學(xué)術(shù)成果具有較好的篩選能力。

本研究存在以下不足之處。首先,基于間接引用機制的文獻被引頻次優(yōu)化模型將所有存在冗余關(guān)系的間接引用視為等同,并統(tǒng)一降低其被引頻次的計數(shù)權(quán)重。然而,在實際引用情境中,部分間接引用關(guān)系可能是由文獻A真實影響力產(chǎn)生的,這種情況下降低其權(quán)重有失公正。在未來工作中,將針對不同引用情境對被引頻次優(yōu)化模型進一步精細化。其次,對于單篇科學(xué)文獻的影響力評價工作,還需要不斷地擴大數(shù)據(jù)樣本量來保證研究結(jié)論的全面性,同時還須深入文獻具體的內(nèi)容結(jié)構(gòu)進行文本語義分析,挖掘科學(xué)文獻的潛在價值。

參考文獻

[1] KI E J,PASADEOS Y,ERTEM-ERAY T. The structure and evolution of global public relations:a citation and co-citation analysis 1983–2019[J]. Public Relations Review,2021,47(1):102012.

[2] HUANG Y,BU Y,DING Y,et al. Exploring direct citations between citing publications[J]. Journal of Information Science,2021,47(5):615-626.

[3] SONG Y H,WU L J,MA F. A study of differences between all-author bibliographic coupling analysis and all-author cocitation analysis in detecting the intellectual structure of a discipline[J]. The Journal of Academic Librarianship,2021,47(3):102351.

[4] 溫芳芳. 國際化背景下我國圖書情報學(xué)與世界各國 研究相似性的測度與比較:基于1999—2018年Web of Science論文的耦合分析[J]. 情報學(xué)報,2020,39(7):687-697.

[5] 逯萬輝,譚宗穎. 基于深度學(xué)習(xí)的期刊分群與科學(xué)知識結(jié)構(gòu)測度方法研究[J]. 情報學(xué)報,2020,39(1):38-46.

[6] RIVKIN A. Manuscript referencing errors and their impact on shaping current evidence[J]. American Journal of Pharmaceutical Education,2020,84(7):877-880.

[7] 段慶鋒,潘小換. 文獻相似性對科學(xué)引用偏好的影響實證研究[J]. 圖書情報工作,2018,62(4):97-106.

[8] 劉宇,李武. 引文評價合法性研究:基于引文功能和引用動機研究的綜合考察[J]. 南京大學(xué)學(xué)報(哲學(xué)·人文科學(xué)·社會科學(xué)),2013,50(6):137-148,157.

[9] 衛(wèi)軍朝,蔚海燕. 科學(xué)結(jié)構(gòu)及演化分析方法研究綜述[J]. 圖書與情報,2011(4):48-52.

[10] LIU Y M,CHEN M. Applying text similarity algorithm to analyze the triangular citation behavior of scientists[J]. Applied Soft Computing,2021,107:107362.

[11] FARYS R,WOLBRING T. Matthew effects in science and the serial diffusion of ideas:testing old ideas with new methods[J]. Quantitative Science Studies,2021,2(2):505-526.

[12] 姚建文,黃筱玲,吳麗萍. 論去除論文引用泡沫:基于客觀公正評價科技人才的視角[J]. 情報理論與實踐,2013,36(8):11-14,5.

[13] RADICCHI F,F(xiàn)ORTUNATO S,MARKINES B,et al. Diffusion of scientific credits and the ranking of scientists[J]. Physical Review E,2009,80(5):056103.

[14] 王菲菲,王筱涵,劉揚. 三維引文關(guān)聯(lián)融合視角下的學(xué)者學(xué)術(shù)影響力評價研究:以基因編輯領(lǐng)域為例[J]. 情報學(xué)報,2018,37(6):610-620.

[15] MIN C,DING Y,LI J,et al. Innovation or imitation:the diffusion of citations[J]. Journal of the Association for Information Science and Technology,2018,69(10):1271-1282.

[16] 俞立平,王龍華. 一種基于懲罰函數(shù)的降低影響因子操縱方法:合理影響因子[J]. 情報理論與實踐,2022,45(6):67-73.

[17] BONZI S. Characteristics of a literature as predictors of relatedness between cited and citing works[J]. Journal of the American Society for Information Science,1982,33(4):208-216.

[18] MACROBERTS M H,MACROBERTS B R. Quantitative measures of communication in science:a study of the formal level[J]. Social Studies of Science,1986,16(1):151-172.

[19] WAN X J,LIU F. Are all literature citations equally important?automatic citation strength estimation and its applications[J]. Journal of the Association for Information Science and Technology,2014,65(9):1929-1938.

[20] 羅杰斯. 創(chuàng)新的擴散[M]. 唐興通,鄭常青,張延臣,譯. 北京:電子工業(yè)出版社,2016:323.

[21] 劉強. 傳播學(xué)受眾理論論略[J]. 西北師大學(xué)報(社會科學(xué)版),1997,34(6):97-101.

[22] 張益明. 基于兩級傳播理論的卷煙品牌口碑傳播[J]. 中國煙草學(xué)報,2015,21(1):112-118.

[23] 劉運梅,馬費成. 面向全文本內(nèi)容分析的文獻三角引用現(xiàn)象研究[J]. 中國圖書館學(xué)報,2021,47(3):84-99.

[24] 劉運梅,張帥,司湘云,等. 基于內(nèi)容標注的三角引用動機研究方法探析[J]. 圖書情報工作,2021,65(10):48-55.

[25] 付中靜. WoS數(shù)據(jù)庫收錄論文文獻級別用量指標與被引頻次的相關(guān)性[J]. 中國科技期刊研究,2017,28(1):68-73.

[26] 段鑫龍. Web of Science-5.19更新介紹[EB/OL]. [2024-10-10]. http://v.qq.com/x/page/n0168 gbqol0.html?ptag=biog_ sciencenet_cn.

[27] 蔡智澄,何立民. 相關(guān)性分析原理在圖書情報分析中的應(yīng)用[J].現(xiàn)代情報,2006,26(5):151-152,156.

[28] 韓毅,夏慧. 時間因素視角下科研人員評價的Pt指數(shù)研究[J]. 中國圖書館學(xué)報,2015,41(6):73-85.

[29] 邱均平,繆雯婷. 文獻計量學(xué)在人才評價中應(yīng)用的新探索:以“h指數(shù)”為方法[J]. 評價與管理,2007,5(2):1-5.

作者簡介

劉運梅,女,博士,講師,研究方向:科學(xué)計量與知識發(fā)現(xiàn),E-mail:1972165675@qq.com。

李冉,女,碩士研究生,研究方向:信息計量學(xué)。

秦佳佳,女,碩士研究生,研究方向:信息計量學(xué)。

Construction and Empirical Research of Citation Frequency Optimization Model of Scientific Literature Based on Indirect Citation Mechanism

LIU YunMei LI Ran QIN JiaJia

(School of Cultural Heritage and Information Management, Shanghai University, Shanghai 200444, P. R. China)

Abstract: In order to objectively evaluate the real influence of scientific literature and weaken the Matthew effect in academic evaluation, this paper constructs a citation frequency optimization model of scientific literature by reducing the counting weight of indirect citation relationships, proposes a citation optimization ratio index, and tests the effectiveness of this model through empirical research. The findings are as follows. Firstly, the results after optimizing the indirect citation frequency weights can objectively reflect the real citation and real influence of scientific literature. Secondly, the citation frequency optimization model can be used to identify potentially high-quality and highly cited papers. Thirdly, the citation frequency optimization model can weaken the time accumulation and Matthew effect of citations in academic evaluation to a large extent, and has high evaluation fairness and better screening ability for young literature.

Keywords: Scientific Literature; Indirect Citation; Citation Frequency; Academic Evaluation

(責(zé)任編輯:王瑋)

丹阳市| 定边县| 彩票| 华阴市| 兰考县| 萨迦县| 丰台区| 任丘市| 右玉县| 兴文县| 高清| 滨州市| 新营市| 青河县| 晴隆县| 玉环县| 防城港市| 墨竹工卡县| 舒兰市| 新野县| 蓝田县| 贺州市| 惠东县| 怀集县| 永嘉县| 无为县| 岢岚县| 夏邑县| 宁蒗| 都江堰市| 大足县| 上犹县| 霸州市| 灌阳县| 肃宁县| 南宁市| 康乐县| 界首市| 临清市| 贵阳市| 商水县|