国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聚類和關(guān)聯(lián)規(guī)則的Altmetric TOP榜文獻(xiàn)特征分析

2021-09-07 10:42:44邱均平豐鸝萱舒非
現(xiàn)代情報 2021年9期
關(guān)鍵詞:影響力學(xué)者關(guān)聯(lián)

邱均平 豐鸝萱 舒非

DOI:10.3969/j.issn.1008-0821.2021.09.002

[中圖分類號]G250.252 [文獻(xiàn)標(biāo)識碼]A [文章編號]1008-0821(2021)09-0012-10

近年來,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和知識共享趨勢的推動,學(xué)術(shù)評價不再只是依賴傳統(tǒng)學(xué)術(shù)指標(biāo),Altmetrics開始產(chǎn)生,并引起廣泛關(guān)注和利用。2005年,Bollen J等學(xué)者就提出將社交媒體數(shù)據(jù)作為補充性計量指標(biāo),用于期刊影響力評價。Altmetrics最早是由計量學(xué)領(lǐng)域?qū)W者Priem J提出,之后同Taraborelli D等學(xué)者發(fā)表宣言,正式提出Ahmet-rics。

自2010年Altmetrics在境外提出后,我國學(xué)者劉春麗迅速反應(yīng),于2012年將其譯為“選擇性計量學(xué)”,并說明其與網(wǎng)絡(luò)計量學(xué)和傳統(tǒng)科學(xué)評價的差異,以及選擇性計量學(xué)在時效、覆蓋面和科學(xué)交流中的獨特意義;隨后,邱均平等學(xué)者將其譯為替代計量學(xué),闡述其提出過程和研究進(jìn)展;由慶斌等學(xué)者將其譯為補充計量學(xué),對補充計量學(xué)和補充性指標(biāo)作了詳細(xì)介紹。這是目前我國學(xué)者3種主要翻譯形式,許多學(xué)者對其有不同理解,具有代表性的理解就多達(dá)十幾種,但使用較多的是替代計量學(xué)。

目前,關(guān)于Altmetrics的研究主要分為理論、工具、方法及應(yīng)用,理論主要是其概念和問題分析,較多涉及Ahmetrics指標(biāo)與傳統(tǒng)指標(biāo)之間的關(guān)系。例如:Alhoori H等學(xué)者發(fā)現(xiàn)Altmetrics與出版物的數(shù)量、h指數(shù)、被引量之間存在相關(guān)關(guān)系;Eysenbach G等學(xué)者指出Altmetrics指標(biāo)與傳統(tǒng)的引文指標(biāo)呈現(xiàn)弱相關(guān),論文的社會影響力與學(xué)術(shù)影響力之間關(guān)聯(lián)度并不大;王妍等學(xué)者采用Spearman方法嘗試探究學(xué)者被引頻次與Ahmetrics中社會影響力指標(biāo)之間的相關(guān)性,以及各項社會影響力指標(biāo)之間的相關(guān)性。隨后,越來越多的Alt-metrics工具開始出現(xiàn),吳勝男等學(xué)者以目前比較常見的Altmetrics應(yīng)用工具Altmletric.com、Plum Analytics、ImpactStory、PLOS ONE Altmetrics、Readermeter、ScienceCard、PaperCritic以及CitedIn為研究對象,針對每一種工具的功能特征、優(yōu)勢和不足進(jìn)行詳細(xì)的分析和論述。其中,Altmetric.com是一款分析評估單篇論文Altmetrics指標(biāo)的工具,由Digital Science公司開發(fā),該工具綜合計算某一篇學(xué)術(shù)論文在Twitter、Google+、CiteULike、Mendeley、博客以及主流新聞媒體等信息源的引用數(shù)據(jù),Altmetrics指標(biāo)具有多種,一般被學(xué)者分為幾類進(jìn)行研究。例如:Waltman L等學(xué)者對Altmetrics的11個指標(biāo)通過因子分析分為3類。目前,Ahmetrics研究主要方法為社會網(wǎng)絡(luò)分析、數(shù)據(jù)挖掘與分析等,更多應(yīng)用于論文、期刊、機構(gòu)、學(xué)者等各種影響力評價領(lǐng)域,并通過不斷構(gòu)建評價指標(biāo)應(yīng)用到多個領(lǐng)域,王凱利等學(xué)者融合了Alt-metrics和引文分析法構(gòu)建期刊影響力評價體系,并對國際圖情期刊的影響力進(jìn)行分析:Boetto E等學(xué)者發(fā)現(xiàn)傳統(tǒng)引用計數(shù),社交媒體上的引用以及新聞和博客上的提及之間存在適度的相關(guān)性,并且定義一種方法,即綜合影響力得分(CIS),該方法可以協(xié)調(diào)不同的指標(biāo)以提供多維影響力指標(biāo)。另外,關(guān)于Ahmetrics指標(biāo)的研究,更多則是關(guān)于各指標(biāo)之間相關(guān)性,許丹等學(xué)者對比分析SCIE被引頻次、ESI高被引、FS、Ahmetrics各項指標(biāo)之間的關(guān)系;陳勝龍等學(xué)者驗證其與學(xué)者H5指數(shù)間存在顯著相關(guān)性。

大數(shù)據(jù)的迅速發(fā)展,帶動了數(shù)據(jù)挖掘領(lǐng)域的研究,數(shù)據(jù)挖掘領(lǐng)域一般具有C4.5、K-Means、SVM、Apriori等多種具有影響力的算法,可涵蓋分類、聚類、統(tǒng)計學(xué)習(xí)、關(guān)聯(lián)分析和鏈接挖掘,其中關(guān)聯(lián)規(guī)則最早是由Agrawal R等學(xué)者提出,是數(shù)據(jù)挖掘領(lǐng)域的一種方法,可以挖掘數(shù)據(jù)的隱含特征,關(guān)聯(lián)規(guī)則經(jīng)常應(yīng)用于購物籃分析,從而為商品促銷提供參考,基本方法常為Apriori算法,并被許多學(xué)者應(yīng)用于各種領(lǐng)域。例如:游立清等學(xué)者利用此算法提出卷煙物理指標(biāo)關(guān)聯(lián)性的分析方法。目前,關(guān)于關(guān)聯(lián)規(guī)則的研究主要是關(guān)聯(lián)規(guī)則算法創(chuàng)新、關(guān)聯(lián)規(guī)則應(yīng)用等方面,許多學(xué)者提出改進(jìn)算法進(jìn)行有關(guān)應(yīng)用。例如:常見的多最小支持度的關(guān)聯(lián)規(guī)則挖掘、分類關(guān)聯(lián)規(guī)則挖掘等方法,田建勇、徐樾等學(xué)者將改進(jìn)算法應(yīng)用于計算機和動力工程等不同領(lǐng)域。關(guān)聯(lián)規(guī)則應(yīng)用范圍較廣,學(xué)者紛紛創(chuàng)新,廣泛應(yīng)用于多種領(lǐng)域,常見的是應(yīng)用于中醫(yī)藥,探析用藥規(guī)律等問題,申玲玲等學(xué)者針對急性痛風(fēng)性關(guān)節(jié)炎用藥規(guī)律研究。另外多是利用關(guān)聯(lián)規(guī)則進(jìn)行影響因素的相關(guān)研究,曹磊等學(xué)者利用關(guān)聯(lián)規(guī)則對路面損壞狀況影響因素進(jìn)行探討。

綜合來看,Altmetrics相關(guān)研究目前主要集中在與各指標(biāo)進(jìn)行相關(guān)性分析的研究,以及通過指標(biāo)構(gòu)建應(yīng)用于不同領(lǐng)域進(jìn)行評價,關(guān)于高社會影響力論文的論文特征和傳播特征相對較少,聚類分析和關(guān)聯(lián)規(guī)則作為常用方法,但較少結(jié)合應(yīng)用于論文特征方面。因此,本文將Ahmetric TOP榜文獻(xiàn)作為高社會影響力文獻(xiàn),利用頻數(shù)統(tǒng)計與分析探討高社會影響力文獻(xiàn)特征,同時利用聚類與關(guān)聯(lián)規(guī)則進(jìn)行分析,探討不同學(xué)科、國家(地區(qū))、文獻(xiàn)獲取方式、AAS值、被引次數(shù)等方面的傳播渠道特征。

1研究方法與數(shù)據(jù)來源

1.1研究方法

本文采用定性與定量分析的方法,首先從Ah.metric,com得到Ahmetric TOP榜文獻(xiàn),基于所得數(shù)據(jù)進(jìn)行頻數(shù)統(tǒng)計與分析,然后通過K-Means聚類將不同指標(biāo)劃分級別,最后利用基于Apriori算法的關(guān)聯(lián)規(guī)則探討不同被引次數(shù)區(qū)間、AAS值區(qū)間、學(xué)科、國家(地區(qū))和獲取方式的傳播特征。其中關(guān)聯(lián)規(guī)則是常用的數(shù)據(jù)挖掘領(lǐng)域方法,能夠有效挖掘數(shù)據(jù)隱含特征,Apriori算法是一個經(jīng)典的挖掘規(guī)則算法。一般以商品交易為例,假設(shè)被研究對象稱為項(Item),所有項的集合為,={i1,i2,…,im},每條交易ti項對應(yīng)的項的集合為I的子集,I的任何一個子集被稱為項集(Itemset),即X={ij1,ij2,…,ijm},事務(wù)數(shù)據(jù)庫為D={t1,t2,…,tm},每條交易數(shù)據(jù)ti構(gòu)成事務(wù)D,每個項集包含的項的個數(shù)稱為項集的長度,一個長度為k的項集被稱為k項集,一個項集X在數(shù)據(jù)庫D中出現(xiàn)的次數(shù)稱為頻數(shù),記為count(X)。關(guān)聯(lián)規(guī)則需要從數(shù)據(jù)中找出滿足最小支持度和置信度的關(guān)聯(lián)規(guī)則,其中定義如下:

1)支持度(support)。一個項集X的支持度指的是在數(shù)據(jù)集中包含該項集的記錄所占比例。如式(1)所示。若給定一個最小支持度support(min),所得support(X)≥support(min),則X稱為頻繁項集。

support(X)=count(X)/|D} (1)

2)置信度(confidence)。也可稱為可信度,它是針對一條比如X→Y的關(guān)聯(lián)規(guī)則來定義的,指的是包含X的交易中包含Y的比例。即:

cofidence(X=>Y)=|XY|=support(XY)/sup-port(X) (2)

3)增益(lift)。也可稱為提升度,是一個評判關(guān)聯(lián)規(guī)則的重要標(biāo)準(zhǔn),大于1表示具有強關(guān)聯(lián)性,小于1視為無效規(guī)則,等于1則代表相互獨立。即:

lift(X=>Y)=|XY|/|X||Y|=support(XY)/support(X)support(y) (3)

1.2數(shù)據(jù)來源

本文所用源數(shù)據(jù)來自于Altmetric.com官方網(wǎng)站,選擇2015—2020年高社會影響力文獻(xiàn),即榜單前100篇文獻(xiàn),針對Altmetrics指標(biāo)數(shù)據(jù)進(jìn)行下載,除了2018年榜單數(shù)據(jù)下載200篇,其余年份各下載100篇文獻(xiàn),并對缺少的數(shù)據(jù)進(jìn)行查找補充,然后匹配期刊影響因子,去除期刊名稱來源于電子網(wǎng)站、會議等未匹配到影響因子的文獻(xiàn),如來源于arXiv、CHI20:Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems等文獻(xiàn),共得到文獻(xiàn)676篇,同時在谷歌學(xué)術(shù)中查詢被引次數(shù),同時查詢和匹配第一作者的所屬國家(地區(qū)),以及第一作者與第二作者的附屬高校。

2 Altmetric TOP榜文獻(xiàn)整體特征分析

本文從學(xué)科、期刊、獲取方式、第一作者隸屬國家(地區(qū)),以及第一、二作者所屬高校幾個方面對Altmetric TOP榜文獻(xiàn)進(jìn)行特征分析。

2.1學(xué)科分布

對2015—2020年文獻(xiàn)的學(xué)科進(jìn)行整合,選取占比前10名學(xué)科,如表1所示。

可以看出,醫(yī)療健康排名靠前,占比較大,突出了醫(yī)療健康學(xué)科的社會影響力,同時由于新冠疫情的暴發(fā),醫(yī)療健康領(lǐng)域就更加受學(xué)者和大眾的關(guān)注。隨后生物科學(xué)、人類社會研究、地球環(huán)境科學(xué)、物理科學(xué)、歷史與考古學(xué)、地球科學(xué)、信息和計算機科學(xué)等學(xué)科也具有較大影響力和傳播力度,但法律、哲學(xué)與宗教、工程、材料等許多學(xué)科占比較小,需要提高大眾關(guān)注度,努力提高社會影響力,利用大眾易于接受和理解的方式進(jìn)行傳播。

通過計算不同學(xué)科的單篇被引次數(shù)、單篇Alt-metric Attention Score(AAS)和開放或自由獲取的占比,可以看出,信息和計算機科學(xué)單篇被引次數(shù)較大,單篇AAS較大,開放或者自由獲取的比重有待提升。由此可知,信息計算機科學(xué)領(lǐng)域具有較大的社會影響力,其研究文獻(xiàn)也具有較高的學(xué)術(shù)價值。心理學(xué)與認(rèn)知科學(xué)、歷史與考古學(xué)及地球科學(xué)等學(xué)科單篇被引次數(shù)較少,單篇AAS僅有部分差距,也說明了提高社會影響力的同時,應(yīng)該致力于提升文獻(xiàn)質(zhì)量。

不同學(xué)科開放獲取占比有所差異,自然科學(xué)和技術(shù)、醫(yī)藥衛(wèi)生等領(lǐng)域,OA論文的比例最高。在本文所研究Altmetric TOP榜文獻(xiàn)中,即屬于高社會影響力文獻(xiàn),其中醫(yī)藥健康、地球科學(xué)等領(lǐng)域開放或自由獲取占比較大,物理科學(xué)、歷史與考古學(xué)等學(xué)科開放或自由獲取占比較小。總體來看,醫(yī)藥健康領(lǐng)域文獻(xiàn)在高社會影響力文獻(xiàn)占比最大,同時開放或自由獲取占比較大,社會影響力較大。

2.2期刊分布

對高社會影響力論文進(jìn)行匯總排序,部分期刊子刊并未歸類于正刊,即分為不同期刊進(jìn)行整合,同時通過JCR查取2019年各期刊影響因子,所得結(jié)果如表2所示。

由表2可知,《Nature》《Science》《The Lan-cet》《Proceedings of the National Academy of Sci-ences of the United States of America》(PANS)、《New England Journal of Medicine》《Journal Of The American Medical Association》(JAMA)、《British Medical Journal》(BMJ)等排序靠前,其中在不計算子刊情況下,仍占比較大,同時期刊影響因子、單篇被引次數(shù)及單篇AAS較大,具有強大的學(xué)術(shù)價值和社會影響。許多科學(xué)研究領(lǐng)域中,很多最重要、最前沿的研究結(jié)果往往都是以短訊的形式發(fā)表在此期刊上,讀者主要是從事研究工作的科學(xué)家,但雜志前部的文章概括使得一般公眾也能理解雜志內(nèi)最重要的文章?!禢ature》開放獲取比例較小,90.43%屬于付費獲取;《Proceedings of the National Academy of Sciences of the United States of America》(PANS)屬于高社會影響力文獻(xiàn)所占數(shù)量較大的期刊,2019年Top榜單占據(jù)5篇,但2019年期刊影響因子較小,同樣《The Public Library of Science ONE》(PLoS ONE)、《Scientific Repots》《Current Biology》等期刊影響因子較小,也說明了部分期刊社會影響力文獻(xiàn)數(shù)量與影響因子未必成正比關(guān)系,社會影響力較大的文獻(xiàn)數(shù)量占比較大,期刊影響因子不一定較大。綜合來看,《New England Journal of Medicine》《The Lancet》期刊各項指標(biāo)數(shù)據(jù)較大,《The Public Library of Science ONE》(PLoS ONE)期刊各項指標(biāo)數(shù)據(jù)較小。另外,絕大多數(shù)期刊開放(Open Access)或者自由獲取(Free to Read)占比較大,大眾獲取更為容易,同時也更容易得到傳播。

2.3文獻(xiàn)獲取方式情況

在所研究全部文獻(xiàn)中,付費獲取的方式占較大比重,為45.12%,開放獲取的比重僅次于付費獲取,占比38.61%,自由獲取占比最小。開放獲?。∣A)是指學(xué)術(shù)論文發(fā)表后立刻在互聯(lián)網(wǎng)上公開發(fā)布,供讀者免費獲取,可以讓學(xué)術(shù)成果提高傳播力和影響力,為學(xué)者和大眾提供更便捷的知識獲取方式,也增強了知識共享與交流,所以,越來越多的國家(地區(qū))積極促進(jìn)知識開放。通過圖1可以發(fā)現(xiàn),Closed(付費獲?。┍壤鹉杲档?,說明自由和開放獲取方式逐步增加,2020年開放獲取比例得到較大提升,自由獲取有所減少,分別對3種方式作線性預(yù)測可以看出,付費獲取占比呈現(xiàn)下降趨勢,而開放和自由獲取都呈現(xiàn)增長趨勢,進(jìn)一步說明了知識獲取更加服務(wù)大眾,順應(yīng)了知識共享的趨勢。

2.4國家(地區(qū))分布

整合第一作者所屬國家(地區(qū)),并計算出單篇被引次數(shù)、單篇Altmetric Attention Score(AAS),以及各個國家(地區(qū))開放或自由獲取占比,所得結(jié)果部分如表3所示??梢钥闯?,美國所占比例最大,接近一半,同時綜合指標(biāo)都比較突出,說明美國具有較強的學(xué)術(shù)實力和影響力:英國開放或者自由獲取的比例較大,并且單篇被引次數(shù)較大,同樣具有較強影響力。綜合來看,第一作者所屬國籍統(tǒng)計中,美國和英國占比較大,其中美國最多,其他國家(地區(qū))占比較少,需要進(jìn)一步提高社會影響力和傳播能力,把握學(xué)術(shù)界的熱點前沿。

2.5學(xué)校分布

整合第一作者和第二作者的所屬機構(gòu),篩選前兩位作者隸屬于大學(xué)的文獻(xiàn),所得結(jié)果部分如表4所示。文獻(xiàn)第一作者和第二作者對文獻(xiàn)具有較大的貢獻(xiàn),據(jù)此統(tǒng)計,可以進(jìn)一步得出不同高校的學(xué)術(shù)實力??梢钥闯?,哈佛大學(xué)所占比重最大,斯坦福大學(xué)、劍橋大學(xué)、牛津大學(xué)等占比較大,這些大學(xué)都屬于實力較強和知名度較高的院校。

3 Altmetric TOP榜文獻(xiàn)傳播特征分析

利用SPSS軟件對數(shù)據(jù)進(jìn)行K均值聚類.根據(jù)數(shù)據(jù)大小,劃分為A、B、C、D、E 5類,以被引次數(shù)K均值聚類為例,如表5所示,將文獻(xiàn)按照指標(biāo)數(shù)值大小劃分為5類,被引次數(shù)(E)屬于被引次數(shù)較低的區(qū)間,但占比較多,均值為154。其中,E級別占比普遍較大,反映了大多指標(biāo)數(shù)值集中于某一區(qū)間。根據(jù)每篇文獻(xiàn)特征構(gòu)建矩陣,然后利用SPSS MODELER進(jìn)行關(guān)聯(lián)規(guī)則分析,探討各項特征之間的聯(lián)系。Apriori算法是常用于挖掘出數(shù)據(jù)關(guān)聯(lián)規(guī)則的算法,能夠發(fā)現(xiàn)事物數(shù)據(jù)庫中頻繁出現(xiàn)的數(shù)據(jù)集。設(shè)置最小置信度為0.8,最小支持度為0.1,最大前項數(shù)設(shè)為1,選擇增益大于1,最后結(jié)果以置信度排序。

3.1不同被引次數(shù)值區(qū)間下文獻(xiàn)傳播特征分析

以前項為被引次數(shù)進(jìn)行研究,共得到關(guān)聯(lián)規(guī)則9項,如表6所示。可以發(fā)現(xiàn),后項為被引次數(shù)E級,即被引次數(shù)較小,與各項指標(biāo)等級呈現(xiàn)強關(guān)聯(lián),較多指標(biāo)表現(xiàn)為E級,即數(shù)目平均較小的一類,說明了被引次數(shù)較少的文獻(xiàn),微博、谷歌、博客、問答、維基、政策、影片、Reddit提及數(shù)普遍較小,也側(cè)面反映出被引次數(shù)較小,Altmetrics許多指標(biāo)值普遍較小。所研究文獻(xiàn)中,被引次數(shù)和多指標(biāo)值都屬于較小區(qū)間,而被引次數(shù)在A至D類的文獻(xiàn),屬于被引次數(shù)較高文獻(xiàn).與同行評審和推特提及數(shù)E等級呈現(xiàn)關(guān)聯(lián)性。同時可以發(fā)現(xiàn),被引次數(shù)越大,微博、谷歌、問答、維基百科、政策、影視及Reddit提及數(shù)可能越大。

3.2不同AAS區(qū)間下文獻(xiàn)傳播特征分析

以AAS值為對象進(jìn)行研究,共得到關(guān)聯(lián)規(guī)則9項,如表7所示,其中前項分為D和E級別,AAS值聚類均值集(A,B,C,D,E)=(33853,25814,8179,3637,1803),其中E類占比較大。從所得關(guān)聯(lián)規(guī)則可以看出,AAS值聚類級別為D類和E類的文獻(xiàn)特征仍有較大差異,AAS值E類文獻(xiàn),普遍是推特、影視、維基百科、Reddit提及數(shù)較小,而D類文獻(xiàn),普遍是微博、同行評審、問答、政策和谷歌提及數(shù)較小,可以看出,不同AAS值區(qū)間的文獻(xiàn),具有較大的特征差異。同時也可以看出,AAS值越大,文獻(xiàn)推特、影視、維基百科、Reddit提及數(shù)可能越大。

3.3不同國家(地區(qū))的文獻(xiàn)傳播特征分析

在所研究的Altmetric TOP榜文獻(xiàn)中,美國和英國占比較大,以前項為美國和英國,構(gòu)成關(guān)聯(lián)規(guī)則10項,如表8所示,可以看出,第一作者國籍為美國和英國的文獻(xiàn)傳播呈現(xiàn)不同特征,第一作者隸屬于美國的文獻(xiàn),微博、維基、影片、政策和問答提及數(shù)值普遍屬于E類,即屬于較低區(qū)間,而第一作者隸屬于英國的文獻(xiàn),表現(xiàn)為同行評審、推特、谷歌、Reddit和政策提及數(shù)普遍屬于E區(qū)間,除了政策提及數(shù)普遍較少的特征外,其他特征具有較大差異。第一作者隸屬于兩個國家(地區(qū))的文獻(xiàn)屬于E區(qū)的指標(biāo)有很大差異,可以根據(jù)自身特征提高各項指標(biāo)數(shù)值,從而提高社會影響力。

3.4不同期刊的文獻(xiàn)傳播特征分析

《Nature》和《Science》作為國際知名期刊,有著巨大的社會影響力和學(xué)術(shù)價值,同時在Alt-metric TOP榜文獻(xiàn)中,來源期刊為《Nature》和《science》及其子刊的論文占比較大,以兩者為前項,構(gòu)成關(guān)聯(lián)規(guī)則為9項,如表9所示,可以看出兩大期刊論文的特征差異,來源于《Nature》期刊及子刊的文獻(xiàn),與《Science》及其子刊相同的是同行評審和影視提及數(shù)都屬于E類,即數(shù)值區(qū)間屬于最低聚類區(qū)間,但存在部分差異,《Nature》期刊論文表現(xiàn)為谷歌和被引次數(shù)都屬于E類區(qū)間,說明Altmetric TOP榜文獻(xiàn)中,《Nature》期刊及子刊的論文,谷歌和影視提及數(shù)普遍不高,有待加強,而《Science》及其子刊的論文,微博、維基百科和政策提及數(shù)大都呈現(xiàn)出較低的特征。

3.5不同學(xué)科的文獻(xiàn)傳播特征分析

醫(yī)藥健康科學(xué)和生物科學(xué)在所研究文獻(xiàn)中占比較大,同樣以兩者為自變量構(gòu)建關(guān)聯(lián)規(guī)則,所得結(jié)果如表10所示。生物科學(xué)和醫(yī)藥健康科學(xué)都與推特和Reddit提及數(shù)E類具有關(guān)聯(lián)性,有所不同的是生物科學(xué)微博提及數(shù)和AAS值屬于E類,均值為1803,說明了生物科學(xué)領(lǐng)域論文的社會影響力需要進(jìn)一步提升,針對學(xué)科提出正確的方式進(jìn)行傳播。醫(yī)藥健康領(lǐng)域文獻(xiàn)占比較大,微博、推特、維基百科、谷歌、影視、Reddit以及政策提及數(shù)集中屬于E類區(qū)間,不同學(xué)科的文獻(xiàn)傳播渠道有很大差異。

3.6不同獲取方式的文獻(xiàn)傳播特征分析

所研究Altmetric TOP榜文獻(xiàn)中,3種獲取方式的論文傳播特征有較大差異,如表11所示,開放獲?。∣A)的文獻(xiàn)維基百科、影視和政策提及數(shù)為E類,屬于較小區(qū)間,付費獲取文獻(xiàn)則是Twitter Mentions和Reddit Mentions處于較小聚類區(qū)間,自由獲取的文獻(xiàn)微博、谷歌、問答及政策提及數(shù)都較小,不同獲取方式的文獻(xiàn)傳播特征差異明顯,付費獲取的文獻(xiàn)應(yīng)該更注重推特和網(wǎng)站傳播。

4總結(jié)

通過對數(shù)據(jù)的統(tǒng)計與分析,可以發(fā)現(xiàn)AhmetricTOP榜文獻(xiàn)具有以下特征。

4.1文獻(xiàn)整體特征

1)學(xué)科分布情況。醫(yī)藥健康領(lǐng)域占比較大,為41.42%,生物科學(xué)、人類社會、地球環(huán)境科學(xué)、物理科學(xué)、信息與計算機科學(xué)等排名靠前,但總體占比不大,法律、哲學(xué)與宗教、工程、材料等學(xué)科占比過小,這些學(xué)科有待提高社會關(guān)注度與影響力。信息與計算機科學(xué)領(lǐng)域單篇AAS值和被引次數(shù)等總體較大,在學(xué)術(shù)界和社會都有著較大影響力,但開放或自由獲取比例仍有待提高。另外,不同學(xué)科開放獲取占比有所差距,醫(yī)藥健康、地球科學(xué)等領(lǐng)域開放或自由獲取占比較大,物理科學(xué)、歷史與考古學(xué)等學(xué)科開放或自由獲取占比較小。

2)期刊分布情況。期刊子刊并未劃分為主刊,期刊主要來源于《Nature》《Science》《The Lancet》《Proceedings of the National Academy of Sciences of the United States of America》(PANS)、《New Eng-land Journal of Medicine》《Journal of The American Medical Association》(JAMA)、《British Medical Jour-nal》(BMJ)等期刊,其中,《Nature》除去子刊以外,仍占比較大,體現(xiàn)期刊巨大的影響力,但在所研究文獻(xiàn)中,開放或自由獲取占比較小。綜合來看,《New England Journal of Medicine》《The Lan-cet》期刊單篇AAS值、單篇被引次數(shù),開放獲取比例等各項指標(biāo)占比較大,《The Public Library of Science ONE》(PLoS ONE)期刊各項指標(biāo)數(shù)據(jù)較小。一般開放或者自由獲取比例較大,AAS值會較大。

3)獲取方式情況。在所研究文獻(xiàn)中,付費獲取比例仍然較大,占45.12%,開放獲取比例僅次于付費獲取,占比38.61%,自由獲取占比最小。通過線性預(yù)測可以發(fā)現(xiàn),開放和自由獲取比例都呈現(xiàn)增長趨勢,付費獲取呈現(xiàn)下降趨勢,順應(yīng)了知識共享和免費的趨勢。

4)第一作者國家(地區(qū))分布情況。美國占比最大,接近于一半的比例,同時單篇AAS值和單篇被引次數(shù)、開放或者自由獲取比例都較大,第一作者隸屬于英國的占比僅次于美國占比,其他國家(地區(qū))占比較小,需要進(jìn)一步提升影響力和傳播力,把握學(xué)術(shù)前沿。

5)學(xué)校分布情況。以第一作者和第二作者所屬高校進(jìn)行統(tǒng)計,可以發(fā)現(xiàn),哈佛大學(xué)所占比例最大,斯坦福大學(xué)、劍橋大學(xué)、牛津大學(xué)等高校占比位列其后,Altmetric TOP榜文獻(xiàn)第一、二作者較多來自于知名高校。

4.2文獻(xiàn)傳播特征

本文通過構(gòu)建關(guān)聯(lián)規(guī)則發(fā)現(xiàn),不同被引次數(shù)區(qū)間、AAS值區(qū)間、國家(地區(qū))、期刊、學(xué)科和獲取方式下,文獻(xiàn)傳播渠道特征差異明顯,由此可以根據(jù)不同情況,采取一定的措施進(jìn)一步提高文獻(xiàn)影響力。

1)被引次數(shù)較小情況下,Altmetrics多項指標(biāo)處于較小區(qū)間,與微博、谷歌、博客、問答、維基百科、政策、影片、Reddit提及數(shù)E類呈現(xiàn)強關(guān)聯(lián),而被引次數(shù)位于A-D區(qū)間時,僅與推特提及數(shù)處于E類具有強關(guān)聯(lián)規(guī)則??梢钥闯觯灰螖?shù)越小,Altmetrics多項指標(biāo)可能較小,因此,提高文獻(xiàn)質(zhì)量仍是提高影響力的重中之重。

2)AAS值較小時,文獻(xiàn)推特、影視、維基百科、Reddit提及數(shù)值較小,而D類文獻(xiàn),微博、同行評審、問答、政策和谷歌提及數(shù)較小,可以看出不同AAS值的文獻(xiàn)傳播渠道有很大差異。

3)除政策提及數(shù)都較小以外,第一作者隸屬于美國的文獻(xiàn)微博、維基百科、影片和問答提及數(shù)值普遍屬于E區(qū),第一作者隸屬于英國的文獻(xiàn)則是同行評審、推特、谷歌和Reddit提及數(shù)普遍屬于E區(qū),可以看出不同國家(地區(qū)),文獻(xiàn)傳播渠道特征有較大差異。

4)來源于《Nature》及其子刊和《Science》及其子刊的文獻(xiàn)占比較大,除兩者文獻(xiàn)的影視和同行評審提及數(shù)都不高以外,來源于《Nature》期刊的文獻(xiàn),谷歌和影視提及數(shù)普遍較小,而來源于《Science》期刊的文獻(xiàn),微博、維基百科和政策提及數(shù)都較小。

5)醫(yī)藥健康和生物科學(xué)領(lǐng)域文獻(xiàn)占比較大,構(gòu)成關(guān)聯(lián)規(guī)則。生物科學(xué)領(lǐng)域的文獻(xiàn)微博、推特和Reddit提及數(shù)普遍較小,并且AAS值普遍較小,需要進(jìn)一步提高社會影響力,注重微博、推特和Reddit等渠道的傳播。醫(yī)藥健康領(lǐng)域文獻(xiàn)占比較大,但微博、推特、維基百科、谷歌、影視、Red-dit以及政策提及數(shù)所在聚類區(qū)間值較小。

6)開放獲取(OA)的文獻(xiàn)傳播更多的是維基百科、影視和政策提及數(shù)為E類,付費獲取的文獻(xiàn)則是推特和Reddit提及數(shù)處于較小聚類區(qū)間,自由獲取的文獻(xiàn)微博、谷歌、問答及政策提及數(shù)都處于較小區(qū)間,3種文獻(xiàn)獲取方式下,文獻(xiàn)傳播渠道有較大差異。

5結(jié)束語

本文通過頻數(shù)統(tǒng)計分析得到文獻(xiàn)的學(xué)科、期刊、獲取方式、第一作者隸屬國家(地區(qū)),以及第一、二作者隸屬學(xué)校的分布情況,并利用K-Means聚類以及基于Apriori算法的關(guān)聯(lián)規(guī)則對Alt-metric TOP榜文獻(xiàn)進(jìn)行分析,得到不同被引次數(shù)區(qū)間、AAS值區(qū)間、期刊、國家(地區(qū))、學(xué)科和獲取方式情況下,文獻(xiàn)傳播渠道有較大差異。利用聚類和關(guān)聯(lián)規(guī)則分析文獻(xiàn)特征,具有一定的研究意義,并可以進(jìn)一步拓展到挖掘評價指標(biāo),應(yīng)用到更多學(xué)術(shù)影響力的評價中去。

猜你喜歡
影響力學(xué)者關(guān)聯(lián)
學(xué)者介紹
學(xué)者簡介
學(xué)者介紹
“苦”的關(guān)聯(lián)
天才影響力
NBA特刊(2018年14期)2018-08-13 08:51:40
奇趣搭配
黃艷:最深遠(yuǎn)的影響力
智趣
讀者(2017年5期)2017-02-15 18:04:18
學(xué)者介紹
3.15消協(xié)三十年十大影響力事件
库尔勒市| 云和县| 济阳县| 开阳县| 永德县| 绥阳县| 石首市| 疏勒县| 扶沟县| 三河市| 盐源县| 扬中市| 甘孜县| 蛟河市| 海盐县| 大竹县| 宁河县| 鄂尔多斯市| 惠州市| 乐至县| 腾冲县| 谢通门县| 伊金霍洛旗| 锡林郭勒盟| 白山市| 朝阳市| 吉木萨尔县| 冕宁县| 泰宁县| 高台县| 博白县| 陈巴尔虎旗| 同心县| 富蕴县| 信阳市| 子洲县| 太谷县| 宁阳县| 呈贡县| 马公市| 佛坪县|