国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

結合全文本分析的論文影響力評價模型研究

2022-03-11 17:08楊思洛聶穎
現(xiàn)代情報 2022年3期
關鍵詞:評價模型

楊思洛 聶穎

關鍵詞:全文本分析;Altmetrics;論文影響力;評價模型

2020年2月,教育部、科技部陸續(xù)下發(fā)《關于規(guī)范高等學校SCI論文相關指標使用 樹立正確評價導向的若干意見》[1]《關于破除科技評價中“唯論文”不良導向的若干措施(試行)》[2]等文件,要求落實“除四唯,破五唯”,體現(xiàn)了國家對科學研究和科技評價的重視。學術論文是科研成果的重要形式,也是科學研究的重要產物;而學術論文評價是學科、期刊、學者等其他層面評價的基礎,科學合理的論文評價能促進科學研究良性循環(huán)與正向發(fā)展[3]。

影響力是論文評價的重要內容,因為論文是一種科學交流的載體和工具,其產生目的是傳播文化與知識并對他人產生作用和影響[4-5]。衡量論文影響力的傳統(tǒng)方法是統(tǒng)計論文被引量,這種方法簡單客觀,但遲滯性強、評價片面且不能排除過度自引等不良情況[6]。為此,學者嘗試修正被引頻次指標,提出了論文h指數(shù)[7]、學術跡[8]、影響矩[9]等評價指標。然而這些評價指標的立足點仍為被引頻次,側重于評價論文產生的學術影響。隨著互聯(lián)網的蓬勃發(fā)展,在線學術交流已成為大勢所趨。多種社交平臺成為學者或普通用戶進行學術交流的重要陣地,Altmetrics[10](替代計量學)由此被提出,其重點在于計量分析論文在社交平臺上的傳播活動,包括轉發(fā)、評論、使用等,有別于傳統(tǒng)的引用與被引。這種方法測度主要是論文在社會層面的影響力,不僅豐富了論文影響力評價的內涵,還為全面評價論文影響力提供了新指標和新途徑[11]。

開放存取運動以及人工智能時代為挖掘、獲取和分析全文本數(shù)據(jù)提供了極大便利。一方面,學界開始重視不同引文存在的實質差異,如不同引文在同一施引文獻中出現(xiàn)的頻次、位置及施引作者表達的情感會有所不同。這種差異反映的是引文對施引文獻的重要程度,體現(xiàn)的是引文的實際學術影響力[12]。另一方面,大眾在社交網絡上討論論文時可能會產生相應的文本內容,如提及論文的評論性文本等。與引文內容相似,分析論文在此類型文本中被提及的具體情況,如發(fā)布者表達的情感、提及論文的動機和位置等,也可以真實反映論文在社會層面產生的影響??偠灾?,全文本分析法打破了同等看待不同引文的傳統(tǒng),超越了傳統(tǒng)的被引頻次和新興的Altmetrics頻次指標等所在的計量分析層面,從內容分析和語義理解入手,深入剖析引文、評論文本等全文本內容,實現(xiàn)了定量與定性的結合,提高了論文評價的深入性、準確性和全面性。

由此可見,論文影響力評價方法已從單一統(tǒng)計被引量發(fā)展成多維度、多數(shù)據(jù)的評價模式。本文擬結合全文本分析,基于引文和Altmetrics構建論文影響力評價模型,并以PLoSMedicine期刊論文為樣本進行實證分析,驗證該評價模型的可用性和有效性,為更加全面、深入和精準評價論文影響力提供新思路。

1相關研究綜述

1.1基于被引頻次的論文影響力評價

GarfieldE[13]在1955年就提出以論文被引頻次來衡量論文的影響力,自此被引頻次成為評價論文影響力的主要指標和客觀方式。然而隨著時代發(fā)展,被引頻次的不足也逐步凸顯。許多學者指出被引頻次存在以下幾個問題:①遲滯性:論文從發(fā)表到實際被引經歷的時間長,不利于新文獻評價[6,14];②片面性:只基于參考文獻列表,未考察參考文獻在施引文獻中的引用強度、位置和情感,不夠深入具體[15];③無法區(qū)分作者的引用動機,如過度自引[5]。

了改善被引頻次指標存在的不足,許多學者開始以引用和被引為基本點提出新評價指標。Hir?schJE提出了綜合考慮發(fā)文量和被引量的h指數(shù)[16]。SchubertA參考h指數(shù)提出了定量評價單篇論文影響力SchubertAh指數(shù),涉及指標有文獻被引量及其施引文獻被引量[7]。王術等和唐繼瑞等先后提出了基于被引頻次的學術跡和影響矩指標,并將其運用至論文影響力評價,有效避免了遲滯性、過度自引等問題[9,17]。諸如此類的修正指標還有基于引文網絡的論文權力指數(shù)[18]、Hi指標[19]等。這些由被引頻次演變而來的評價指標在一定程度上克服了被引頻次的缺點,但實際上這些指標及方法仍未離開計量層面。換而言之,這些研究還未考慮引文內容的差異性及其對評價論文影響力的重要性。

1.2基于Altmetrics的論文影響力評價

在社交網絡時代,Altmetrics指標全面多樣、時效性強、評價覆蓋面廣等優(yōu)勢滿足了論文評價的需求[14]。有關將Altmetrics應用于論文影響力評價的研究主要有以下兩個方面。

1)與傳統(tǒng)評價方法的比較研究。此類實證研究旨在探索Altmetrics指標與被引頻次之間的相關性。大部分結果表明,以Twitter為代表的社交媒體數(shù)據(jù)與被引頻次指標的相關程度普遍不高[20-22];Mendeley讀者數(shù)[23]、論文使用數(shù)則與其為中度相關[24]。但這種相關性也會受樣本數(shù)據(jù)的影響,如MohammadiE等調查發(fā)現(xiàn),人文社會學科論文的Mendeley指標與被引次數(shù)的相關程度并不高[25],而一項以Altmetrics主題論文為樣本的研究則得出兩者為中度相關[26]。因此,在應用過程中需要根據(jù)具體數(shù)據(jù)來分析和選擇可用性強、代表性高的數(shù)據(jù)。

2)與傳統(tǒng)評價方法的融合應用研究。Altmet?rics指標與論文被引量間的弱相關性表明兩者側重維度不同,可相互補充[27]。學者們開始將Altmet?rics融入傳統(tǒng)評價方法以構建新論文影響力評價模型。參與構建的Altmetrics指標和傳統(tǒng)引文指標呈現(xiàn)多樣化,Altmetrics指標有社交媒體數(shù)據(jù)、學術網站論文使用數(shù)據(jù)等;傳統(tǒng)評價指標有被引頻次、h指數(shù)、影響矩等。研究方法主要是通過主成分分析法、模糊層級法等劃分維度或分配指標權重,以不同論文樣本驗證模型適用性[20,28-29]。

基于Altmetrics的論文影響力評價研究考慮了論文在學術界和社會層面的認可和關注,全面反映了論文影響力。然而此種評價模型仍屬于定量評價,未深入分析引文內容或Altmetrics文本內容的性質,有待進一步改進。

1.3基于全文本引文分析的論文影響力評價

全文本引文分析是全文本分析的一部分,其出發(fā)點是引文并非等價[30]。趙蓉英等將全文本引文分析的研究內容分為引用強度、引用位置和引用內容,引用內容包括引用情感和動機兩方面[31]。引用強度、位置和情感的不同,代表引文對施引文獻的作用不同,產生的影響力不同[30,32],對優(yōu)化論文評價方法具有重要意義。筆者將應用全文本引文分析進行論文評價的研究分為3個方面。

一是將被引頻次優(yōu)化為引用強度。DingY等將引用強度定義為CountX,并利用CountX和被引頻次統(tǒng)計出高被引論文,結果存在35%的差異[33]。胡志剛等認為,這種差異在于引用強度能夠有效預測和挖掘潛在高被引論文[34]。劉盛博等提出一種實為引用強度的引文質量評價指標(Q),Q值越大說明引文質量越高[35]。ZhuXD等根據(jù)引用強度對引用進行加權,將h指數(shù)優(yōu)化為評價效果更好的hip指數(shù)[36]。

二是結合引用強度和引用位置。Maricˇic'S等將論文分為引言、方法、結果和總結4個部分并賦予不同權重,將引用位置應用于論文評價[37]。Som?batsompopN等認識到分析引用位置的重要作用,提出引用位置影響因子,即引文在施引文獻的不同位置的引用強度與施引文獻總數(shù)的比值,并將其用于泰國論文質量評價[38]。彭秋茹等統(tǒng)計了57篇被引文獻的引用位置和強度,與F1000評分進行相關性分析,結果表明,在結果部分被引比例越多的論文,越受領域專家歡迎[15]。

三是融合引用情感分析。魏楊燁等從引用強度和引用情感兩個角度對論文進行了新評價,并認為該方法有利于挖掘新興重要文獻[39]。耿樹青等利用層次分析法確定不同引用情感的權重,提出了一種能全面深入評價單篇論文學術影響力的CS指標[3]。姜霖等對引用語句中包含的情感詞進行極性量化,構造了一種細粒度的學術評價指標[40]。

總而言之,基于全文本引文分析的論文影響力評價研究極大改善了傳統(tǒng)指標片面單一的缺陷,實現(xiàn)了更加深入準確的論文學術影響力測度。然而如前文所述,產生于社交網絡時代的Altmetrics也提供了評論或提及論文的文本內容,對其進行分析同屬于全文本分析的范疇,也能提高評價論文社會影響力的深入性和準確性。已有部分學者通過對不同領域論文的有關推文進行文本內容分析并提出以下觀點:①對論文表現(xiàn)出贊同、推薦等正面情感的推文應當獲得更高權重[41];②應忽略無論文實質內容的推文[41];③Altmetrics指標應根據(jù)不同文本內容類型進行權重區(qū)分,如發(fā)布對論文的評價比發(fā)布題錄信息更有價值[42];④發(fā)布者有不同的動機,包括參與討論、實際應用、自我提升、隨意轉發(fā)等[43]。這些觀點表明Altmetrics指標同被引頻次一樣,存在片面性,需要結合內容分析進行深入理解。

目前,結合全文本分析的論文影響力評價研究還較少,大多還停留在改善以被引頻次為基礎的系列指標、結合被引頻次指標和Altmetrics頻次指標,少部分嘗試基于引文內容分析對論文進行評價。因此,本文嘗試結合全文本分析,在被引頻次和Alt?metrics的基礎上,融入由內容分析產生的各種指標,構建出論文影響力評價模型,以期能夠提高論文影響力評價結果的深入性、準確性和全面性。

2論文影響力評價模型構建

本研究提出一種結合全文本分析的論文影響力評價模型,如圖1所示。被引頻次系列指標評價的是論文學術影響力;以Twitter為代表的Altmetrics頻次指標評價的是論文社會影響力。與此對應的論文影響力評價模型,從被引頻次指標延伸至以被引頻次為基礎的系列指標,再擴展到融合Altmetrics指標的綜合評價;評價維度從一維的學術影響力評價遞進到二維的學術影響力和社會影響力綜合評價。而全文本分析作為一種新興的評價方法,既可結合引文內容深入準確反映論文學術影響力,又可結合論文在社交平臺獲得的評論文本,進一步深化論文社會影響力的評價。

因此,本研究的論文影響力評價模型具體以評價論文的學術影響力和社會影響力為目標,在以往的二維評價模型基礎上,繼續(xù)將其拓展為結合全文本分析的論文影響力評價模型:將全文本類指標,包括次數(shù)類、位置類和情感類融入其中,新增對引文內容和Altmetrics文本內容的語法及語義分析,是計量分析與內容分析的結合。其中有關引文計量和內容分析指標可融合論文學術影響力指標,包括引用強度、引用位置和引用情感;有關Altmetrics計量與內容分析的指標可作為論文社會影響力指標,包括提及強度、提及情感,以此實現(xiàn)對論文影響力全面、深入、準確的評價。

2.1論文學術影響力指標

基于全文本分析的學術影響力指標主要融入了次數(shù)類指標、位置類指標和情感類指標,對應引用強度、引用位置和引用情感,從語法和語義兩個層面對引文內容進行分析。

1)引用強度(Nc):筆者以施引文獻為基礎,通過參考文獻列表在正文中定位被引文獻,計算出現(xiàn)總次數(shù)。當被引文獻出現(xiàn)在圖表中,而圖表名稱被多次提及時,引用強度均計為1次。

2)引用位置(Np):Introduction,Data&Meth?ods,Results,Discussion&Conclusion是學術論文的經典結構[15]。筆者基于前期抽取部分文獻試標注的情況,將引用位置劃分為4部分,劃分標準如表1所示。

3)引用情感(Ns):利用機器學習進行情感分類效率高,但學術論文所包含的情感較為隱晦,普通陳述句較多,明確表達情感的語句較少[15],因此該方式的準確性有待提高。在本研究中,筆者通過設定情感判別標準,人工判斷引用語句包含的情感,在一定程度上保證引用情感判別的準確性。判別標準如表2所示。

4)權重分配:本研究直接應用學者彭秋茹等[15]利用層次分析法得到的引用位置和引用情感權重分配結果。學術影響力計算公式如式(1)所示,Wp代表引用位置權重,Ws代表引用情感權重,Nc代表特定引用位置和引用情感對應下的引用強度。

2.2論文社會影響力指標

論文在社交媒體平臺傳播時,會獲得大眾的評論、轉發(fā)和分享,以及媒體或政策文件提及和報道等,其中產生的文本內容可能包含發(fā)布者對論文的評價,可進行情感分析,但這種文本較難劃分統(tǒng)一結構。因此,在本研究中,筆者主要考慮將次數(shù)類指標和情感類指標融入論文社會影響力指標中,對應論文在Altmetrics中的提及強度和提及情感。

1)可用指標篩選:由于部分社交網絡平臺普及性不高,許多指標數(shù)據(jù)較為稀少,不宜參與到評價中[20]。因此,筆者需要利用指標覆蓋率來篩選可用指標,以25%為基準[44],篩選出m個指標A1,…,Am,并計算論文在各指標對應平臺中的總提及強度R。

2)指標權重計算:通過SPSS軟件提供的主成分分析法為m個指標分配權重,進行主成分分析的前提是大部分指標的提及強度相關系數(shù)大于0.3[45]。在此基礎上,利用主成分分析提取出累計貢獻率大于80%的n個主成分:F1,…,F(xiàn)n,對應特征根為λ1,…,λn,總和為λ;以各個指標在各主成分中的載荷Pmn為基礎,通過式(2)和式(3)計算綜合得分系數(shù)和各指標權重[46]。

同時筆者還需要為提及情感分配權重,本研究暫時應用前文的引用情感權重Ws,如表4所示。最后得出基于全文本分析的社會影響力計算公式(4)。Rs代表論文在第m個Altmetrics指標中獲得特定提及情感時對應的提及強度。

3論文影響力評價的應用與結果分析

3.1數(shù)據(jù)獲取及處理

本文選擇的目標論文來源于PLoS平臺的《PLoSMedicine》,是國際上水平較高的生命科學與醫(yī)學領域的期刊。同時,PLoS平臺不僅提供免費全文和論文使用數(shù)據(jù),還鏈接了Altmetrics.com平臺,為筆者獲取數(shù)據(jù)提供了便利。在檢索時,選擇期刊“PLoSMedicine”,發(fā)表時間限定為2019年,檢索時間是2021年1月11日。為保證引文數(shù)據(jù)量,筆者選擇了被引頻次排名前50的文獻,共導出施引文獻信息1042條。同時,筆者還從PLoS平臺獲取了文獻對應的Altmetrics數(shù)據(jù)。楊思洛等人認為,論文社會影響力主要包括科研工作者或大眾通過社交網絡工具對論文的評論與分享、維基百科對論文的使用、新聞媒體對論文的報道以及相關政策文件對論文的提及等[14]。因此,本研究獲取的Altmetrics指標有Twitter、Facebook、Wikipedia、Reddit、NewsOutlets、Blog、PolicySource、VideoUpload、Comment和Google+User,暫未獲取Alt?metrics指標涉及的文本內容。

1)對于全文本引文數(shù)據(jù),筆者通過WOS、GoogleScholar等進行檢索,最終獲取施引文獻全文共1003篇,另有36篇無法獲取全文,1篇注而未引,2篇為更正信息。首先,人工抽取施引文獻中包含被引文獻的語句,共獲得1583條;其次,部分施引文獻類型為非實證類論文,包括綜述、評論型論文,其內部無明確結構,對此,筆者將其引用位置標注為“Others”,權重以均值0.25為計;最后,筆者結合施引文獻全文和引用句中的情感詞,對引用情感進行判斷。在判斷過程中,需要注意情感詞的來源。部分包含明確情感詞的語句是被引文獻中的原句,并不能代表施引作者對被引文獻的情感,筆者將這種情況下的引用語句標注為中性引用。具體實例如表5所示。

2)對于論文Altmetrics指標,通過覆蓋率篩選的指標僅有Twitter、Facebook、NewsOutlets和Blog,其他指標大部分在10%以下,不宜參與評價。Spearman相關性分析的結果表明,4種指標均可參與主成分分析。其中,KMO檢驗系數(shù)為0.615,顯著性概率P值小于0.05,說明4個指標適合做進一步分析。旋轉得出的兩個因子方差總貢獻率為86.24%,符合主成分分析的要求。根據(jù)式(2)~(4)可計算出各指標的綜合得分系數(shù)和權重并構造出論文社會影響力計算公式(5),如下所示:

社會影響力=0.2337Twitter+0.2495Facebook+0.2462NewsOutlets+0.2706Blog(5)

3.2論文評價指標結果分析

1)引用強度分布

從表9可知,被引頻次和引用強度之間存在一定差異。50篇文獻共被引1003次,篇均被引20.06次;引用強度總和為1583次,篇均引用強度為31.66。每篇被引文獻在單篇施引文獻中平均被提及約1.6次,與李錚等的研究結果相似[12]。這說明施引文獻在正文中多次提及同篇參考文獻的現(xiàn)象較為普遍。因此,相比于單純根據(jù)文后參考文獻統(tǒng)計文獻被引頻次,深入文章內部統(tǒng)計文獻出現(xiàn)次數(shù)更能真實反映文獻被引情況,優(yōu)化傳統(tǒng)計量指標[15]。

2)引用位置分布

處在不同位置的引文對施引文獻有不同的作用和貢獻,獲得的學術影響力理應不同。大部分引用語句可根據(jù)實際情況標注為引言、數(shù)據(jù)與方法、結果、結論與討論。這些引用中,在結論與討論部分出現(xiàn)的最多,占比40%;其次是引言部分;占比最少的為結果部分,只有8.96%。作者撰寫學術論文時需要在引言中引用若干文獻以引出問題并對研究現(xiàn)狀進行概述;在數(shù)據(jù)與方法部分,作者通常會使用特定文獻的數(shù)據(jù)、方法;在結果部分,作者主要是對實驗結果進行分析和對比;在結論與討論部分,作者會引用他人研究做進一步論述和展望[12,47]。

3)引用情感分布

引用情感的分布差異代表著不同引文對施引文獻的不同參考價值,可反映引文的不同學術影響力。根據(jù)表11可知,87%的引用為中性引用,只有少部分為正面引用和負面引用。方法部分的正面引用比例最高,論文作者在這部分有時會應用被引文獻中提供的數(shù)據(jù)和方法。其次是引言和結論與討論兩部分,作者通常會在引言中表達對被引文獻的肯定,在結論與討論部分通過比較研究結果,用以支持研究結論。整體來看,施引文獻作者在撰寫論文時措辭較為嚴謹,不會輕易表現(xiàn)出明顯的情感傾向,多是客觀描述被引文獻的研究結果和結論。

4)論文Altmetrics數(shù)據(jù)情況

由指標覆蓋率和均值可看出,所有論文都在Twitter平臺獲得了轉發(fā)或討論;有68%的論文獲得了相關新聞報道;54%的論文在Facebook上得到了關注;42%的論文被博客文章提及或引用。指標覆蓋率初步說明,Twitter平臺上的學術交流活動更為活躍,是一個利于擴大學術論文社會影響的平臺。但從各指標均值和離散程度看,不同論文得到的Twitter用戶關注存在較大差異,獲得的社會影響力也有很大不同。

3.3論文影響力評價結果分析

根據(jù)式(1)和式(5)計算50篇被引文獻的學術影響力和社會影響力得分及排名,結果如表13所示。論文2的學術影響力最大,得分為6.58,其引用強度高達105,篇均被提及約1.9次。社會影響力最大的是論文17,得分為73.06,其中Twitter和Facebook指標值為255和14,是指標最大值,NewsOutlets和Blog指標值為35和5,遠超指標均值,說明該論文在各平臺上都受到了較多關注,社會影響廣泛。

為綜合評價論文影響力,檢驗本評價模型的評價效果,筆者以學術影響力為X軸,社會影響力為Y軸,繪制散點圖。同時以兩個指標均值為劃分標準,將散點圖分為4個區(qū)域,分別代表普通型、明星型、專業(yè)型和名作型的論文類別。從圖2可看出論文分布呈發(fā)散狀,多數(shù)論文集中在兩軸交點區(qū)域,即學術和社會影響力均較低的普通型論文,剩余論文則向周圍擴散分布。明星型、專業(yè)型、名作型和普通型論文的學術影響力平均值為1.28、4.21、3.29和1.23;社會影響力均值為41.99、31.04、10.62和8.77,各類型論文分別占論文總數(shù)的22%、18%、14%和46%。

綜合來看,普通型論文的學術影響力和社會影響力水平均低于其他類型論文的水平,不太受學者和大眾關注。明星型論文的社會影響力要優(yōu)于普通型論文,學術影響力卻較低,原因是能引起大眾廣泛關注和討論的論文一般科普性或應用性較強,能激發(fā)傳播交流的興趣,但相應的學術參考和引用價值就會偏弱[48]。例如代表論文17,篇名為CosteffectivenessofFinancialIncentivesforImprovingDietandHealthThroughMedicareandMedicaid,是關于飲食健康、醫(yī)療保險和補助等一些與大眾生活緊密相關的話題[49]。

對于專業(yè)型論文,其兩個維度的影響力與明星型論文相反。較高的學術影響力在一定程度上代表著較強的專業(yè)性,研究重點很可能是領域的基礎理論或創(chuàng)新成果。對于普通讀者來說,此類論文易讀性較低,導致討論欲望減小,社會影響力也就偏低。例如論文4,篇名為COSMOS-E:GuidanceonConductingSystematicReviewsandMeta-analysesofObservationalStudiesofEtiology,該研究旨在為科研工作者撰寫病原學領域系統(tǒng)性綜述提供步驟指導[50]。論文內容專業(yè)性強且具有高參考價值,但普通讀者很難對此類論文發(fā)表評論和意見。

名作型論文有著高學術影響力和高社會影響力。此類論文不僅是領域研究者關注的焦點,更是大眾討論的熱點。例如論文7,篇名為WomensandGirlsExperiencesofMenstruationinLow-andMiddleincomeCountries:ASystematicReviewandQualita?tiveMeta-synthesis,是一篇關于中低收入國家女性月經情況的定量與定性綜述[51]。一方面,該論文可為學者提供有關問題研究現(xiàn)狀和發(fā)展趨勢;另一方面,女性健康也是大眾關注并可參與討論的話題。

由此來看,本研究提出的論文影響力評價模型在一定程度上可以區(qū)分出不同特點的論文,可以實現(xiàn)對論文的評價,達到與其他評價模型[14]類似的效果,具備可用性和有效性。

3.4與其他評價方法的比較分析

為進一步體現(xiàn)本評價模型的優(yōu)勢,證明其評價論文影響力的全面性、深入性和準確性,筆者將其與被引頻次和引用強度進行了對比研究。從表15可看出,學術影響力與被引頻次和引用強度均為顯著相關,相關系數(shù)分別為0.755和0.951,表明本評價模型中的學術影響力指標在很大程度上能代替被引頻次指標。從數(shù)據(jù)重復率看,被引頻次的重復率為60%,引用強度重復率降為32%,而學術影響力指標僅有18%,說明絕大部分文獻的學術影響力得分互不相同。

圖3直觀展示了這種差異:被引頻次和學術影響力整體趨勢為“由高到低”,但顯然學術影響力的折線更加曲折多變。這種高區(qū)分度得益于該評價模型基于全文本分析引入了引用位置和引用情感兩個指標,并為其設置了權重。因此,學術影響力指標能夠利用權重分配帶來的數(shù)學運算優(yōu)勢,使論文學術影響力評價趨于深入準確,不同論文學術影響力得分更具差異性和區(qū)分度[3]。

圖4顯示引用強度和學術影響力變化曲折且相似,但仍存在細微差異。例如論文4的引用強度為58,但學術影響力比引用強度為87的論文7略高;論文7[51]是一篇系統(tǒng)綜述,多在引言部分被引且獲得的引用情感多為中性。論文4[50]是方法指導型論文,許多施引文獻在方法部分應用了其提出的研究步驟和方法等,該類型的引用情感為正面引用。在方法部分的正面引用代表被引文獻的更高價值和影響,造就了論文4的高學術影響力。因此,不論是對比傳統(tǒng)的被引頻次或是引用強度,基于全文本分析的學術影響力指標不再止步于“數(shù)量”,而是剖析引文“質量”,能更細致深入地反映論文的真實學術影響力。

在顯著性水平α為0.05時,社會影響力指標和被引頻次為弱相關,相關系數(shù)為0.289;與引用強度、學術影響力不存在顯著相關性。這說明一方面,社會影響力指標與被引頻次指標在量化論文影響力時仍存在交叉。若本研究僅選取被引頻次作為學術影響力指標,那么它和社會影響力指標的評價維度會有所重疊,指標就喪失了一定的獨立性和代表性。另一方面,社會影響力指標和學術影響力指標之間關系獨立,能真正實現(xiàn)同時評價論文的學術影響力和社會影響力,達到本研究的目的。由此可見,社會影響力指標會是評價論文影響力的有效補充,本研究提出的評價模型也能夠較好地從學術和社會兩個層面全面反映論文影響力。

4結語

本文構建了一種結合全文本分析的論文影響力評價模型,并通過實證研究證明了該評價模型的適用性,以及評價結果的深入性、準確性和全面性。具體將全文本分析涉及的引用強度、引用位置、引用情感和Altmetrics指標合并且劃分成學術影響力指標和社會影響力指標。隨后以2019年《PLoSMedicine》中被引量前50的文獻及其1003篇施引文獻為研究樣本,描述分析了引用強度、引用位置、引用情感和Altmetrics指標的具體情況,并根據(jù)兩指標得分將論文劃分成了4種各具特點的論文類型,實現(xiàn)了論文的全面綜合評價;最后將評價模型與傳統(tǒng)被引頻次、引用強度等進行對比以及相關性分析,證實了本評價模型的優(yōu)勢所在。

研究結果表明:①單篇文獻在一篇施引文獻平均被提及1.6次,被引頻次已不能很好地反映論文學術影響力。引用行為通常發(fā)生在結論與討論、引言兩個部分。出于撰寫論文的專業(yè)性和嚴謹性,引用情感多為中性,正面引用易出現(xiàn)在應用他人研究方法或比較研究結果的方法和結論與討論兩個部分;②根據(jù)論文在學術和社會層面的影響力得分高低,將論文劃分為明星型、名作型、專業(yè)型和普通型4種類型,有利于領域專家和普通讀者篩選符合閱讀需求的論文,也為挖掘高學術價值和社會影響的論文提供了新路徑;③將引用強度、引用位置和引用情感納入評價模型是對傳統(tǒng)被引頻次指標的改進和完善,很大程度消除了被引頻次指標的片面性。分析引用位置和引用情感使單篇論文對其施引文獻的作用和貢獻更加具象,進而使得評價單篇論文學術影響力更加深入、細致和準確;④為引用位置和引用情感設置相應權重,進一步提高了評價模型的區(qū)分能力,大體消除了被引頻次和引用強度數(shù)值重復率過高的弊端,為更好地評價論文的學術價值和水平提供了參考;⑤評價模型包含的社會影響力指標和學術影響力指標間的關系相互獨立,優(yōu)勢互補,進一步保證了論文影響力評價結果的全面性、深入性和準確性。

本研究提出的評價模型是對已有評價模型的改進,結合了計量分析與內容分析,是定量分析和定性分析的有機融合,符合論文評價方法的發(fā)展趨勢[5]。本研究不足之處主要在于:①內容分析由人工處理,數(shù)據(jù)處理量較小。在后續(xù)研究中,筆者將把研究范圍擴展至多領域、多期刊的文獻,以期得到更具代表性的結論;②本研究獲取的Altmet?rics指標數(shù)據(jù)覆蓋率較低,導致能夠進入評價模型的指標數(shù)量少。今后筆者將嘗試獲取更多平臺的Altmetrics指標,融合成更具代表性的社會影響力指標;③本研究提出的評價模型需要對引文內容和Altmetrics文本內容進行分析,但筆者僅初步獲取分析了引文內容及Altmetrics指標,得出的評價結果和結論還不夠完善。在今后的研究中,筆者將著重分析Altmetrics指標涉及的文本內容,使評價進一步深入和細粒化。

3033500338279

猜你喜歡
評價模型
基于DEA的汽車上市公司相對效益評價
公共圖書館數(shù)字化服務的有效性評價模型
基于學業(yè)質量的增值性評價系統(tǒng)的分析與構建
基于產業(yè)集群的技術創(chuàng)新風險評價模型構建
基于熵權法的西安市外向型經濟發(fā)展綜合評價研究
大學生平時成績動態(tài)評價模型的研究與應用
高校內部財務控制與風險管理評價模型構建及實證研究
鄉(xiāng)村旅游目的地居民低碳意識的調查與實踐研究
我國國有企業(yè)社會責任管理能力評價模型研究
政府公信力的提高與評價實證研究
常德市| 西峡县| 潢川县| 文登市| 宝兴县| 张掖市| 黄骅市| 文昌市| 吴桥县| 平乐县| 沭阳县| 嘉鱼县| 安龙县| 社会| 明光市| 信丰县| 封开县| 修文县| 威信县| 凤庆县| 宁乡县| 赣州市| 阿巴嘎旗| 滨海县| 邵武市| 临江市| 静乐县| 华坪县| 昌乐县| 河北省| 南开区| 都匀市| 大同市| 青铜峡市| 香格里拉县| 南溪县| 星座| 徐水县| 扶余县| 五寨县| 奈曼旗|