国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

學術論文接受時間與被引用次數的統(tǒng)計分析

2015-06-23 16:27:56姜興隆
關鍵詞:冪律指數分布線性

姜興隆

(溫州大學物理與電子信息工程學院,浙江溫州 325035)

學術論文接受時間與被引用次數的統(tǒng)計分析

姜興隆

(溫州大學物理與電子信息工程學院,浙江溫州 325035)

論文發(fā)表是一種很重要的人類行為,一直被廣泛關注.對Nature期刊Report欄目所發(fā)表論文的收錄時間和發(fā)表后三年內文章的被引情況進行了統(tǒng)計分析,結果顯示它們都服從指數衰減分布.該結果揭示了論文發(fā)表行為的一個內在規(guī)律,為引文機制的進一步挖掘提供了實證依據.

論文接受時間;被引次數;指數分布

早些時候,由于缺乏統(tǒng)計工具和方法,大量的數據被簡化,人們近似地認為人類行為的發(fā)生時間是統(tǒng)一的.近幾年,由于網絡和計算機技術的飛速發(fā)展,人們能夠探測引文網絡,能夠獲得和處理大量的統(tǒng)計數據[1-5],因此,定量理解人類行為已成為現代科學的中心議題之一.

重尾統(tǒng)計分布普遍存在于自然和社會現象中,科學論文被引所服從的統(tǒng)計分布最著名的就是重尾分布,在這種情況下,有一個相當大的爭論是,引文分布遵循的是對數正態(tài)分布還是冪律分布.文獻[6]通過測量一個非常大且均勻的引文分布數據,認為偏離很大的數據遵循對數正態(tài)分布,且尾布呈偏離向上的分布規(guī)律.關于論文發(fā)表模式的定量研究可以追溯到1926年洛特卡關于科學生產力規(guī)律的開創(chuàng)性研究,他指出科學家發(fā)表論文服從冪律分布,即發(fā)表過k篇論文的科學家人數按照k-γ的規(guī)律減少[7].在洛特卡之后,又有許多科學家對論文的引用模式進行了探討.因為有的引文數據庫是可用的,所以普萊斯[8]討論了引文網,首次證實了引文網的入度和出度都服從冪律分布.此后,出現了很多有關引文網的研究,例如,瑞德納[9]研究了由科學信息研究所按期刊編目分類的783 339篇論文和在20年間發(fā)表在PRD上的24 296篇論文的引文分布,發(fā)現了一篇論文被引用k次的概率,即相應的引文網的入度服從冪律分布.最近,彼得森等[10]開發(fā)了一個科學引文的分布模型,發(fā)現冪律指數分布并不普遍.王大舜等[11]給出了一個單篇論文的引文動力學機理模型,用一個機理模型的個人論文被引用情況,得到了不同期刊的論文被引用的歷史,發(fā)現其分布規(guī)律為單一的曲線,指出所有論文傾向于遵循相同的時間模式.觀察這些模式能夠幫助我們揭開科學影響的基本機制,發(fā)現可能有的潛在的政策含義.

論文發(fā)表是近代人類知識增長的一個不可或缺的重要組成部分.隨著科技的發(fā)展,人類知識的迅速增加,論文的發(fā)表時間與被引用已經成為大多科研工作者所關注的對象.本文將從論文的發(fā)表時間與被引用這兩方面入手,來探討其中存在的某種機制.

1 數據分析

本文的數據來源于Nature期刊Report欄目上發(fā)表的文章.從1997年到2008年12年間收錄的文章中,其中有8 762篇標記了收到時間和同意發(fā)表時間,本文將兩者的時間間隔定義為接受時間τ,并且以天為單位.考慮到科學論文的編輯發(fā)表也屬人類活動,在這種服務系統(tǒng)輸入流中包括遞交論文的排隊過程,在這其中又包括裁判評審、信息修正等一系列過程,最后由編輯委員會驗收.本文對接受時間使用了累積分布:

其中M(τ)為接受時間為τ的論文數量.

2 實證結果

由于論文發(fā)表時的等待時間取決于編輯委員會,所以,本文將注意力集中放在接受時間的統(tǒng)計上.

2.1論文接受時間分布

首先對Nature期刊Report欄目上的論文的接受時間分布進行分析,接受時間見圖1.從圖1中可以看出,接受時間分布在單對數坐標下呈指數衰減分布:

圖1中,τ表示接受時間,以天為單位,M(τ)表示接受時間為τ的論文數量.圖中下垂頭部和尾部,即在很短或很長的時間間隔內發(fā)表的論文數很少,只占總數的32%,所以只取了中間部分.對67≤τ≤400范圍內的數據進行線性擬合得直線,負相關系數R=-0.950 5,直線的斜率為-0.015.

在圖1的插圖中給出了相應的累積分布情況.累積分布進行線性擬合與原始數據進行線性擬合的結構相似,都呈指數衰減分布.可以這樣解釋,接受時間很短和很長的論文數量很少,大多數論文都是按照相對穩(wěn)定的模式被接受的.該結果與當前論文接受時間發(fā)表模式中表現出來的規(guī)律并不相同,例如引文分布的科學出版物是基于兩個相對較大的數據集,瑞德納在PRD與ISI數據集中,發(fā)現出版物的引用呈冪律分布[9].可見,現代文章的發(fā)表模式在不斷改變文章的接受時間.

圖1 論文接受時間的分布

2.2論文被引次數分布

引文網的最大優(yōu)勢在于通過它可以獲得豐富且準確的數據.本文對Nature期刊Report欄目上發(fā)表的具有確切接受時間的論文在發(fā)表后3年內被引的次數進行分析,結果見圖2.

圖2中,橫坐標k表示論文的被引次數,縱坐標N( k)表示k所對應的論文數,對15k219≤≤范圍的數據進行線性擬合得圖中直線.由圖2可以看出,被引次數在37的論文數最大,在這個最大點以后的論文量逐漸減少,由于論文N( k)=1,2,3的被引次數和被引次數在219以后的論文數都很少(被引大于219的論文數只有421篇,大約只占總量的5%),所以可以除去數據中下垂的頭部和尾部,只對中間部分的數據進行線性擬合,結果發(fā)現,在單對數坐標下呈指數衰減分布:

3 總結與討論

本文對Nature期刊Report欄目所發(fā)表論文的接受時間和發(fā)表后三年內文章的被引情況進行了統(tǒng)計分析,結果顯示,論文接受時間服從λ=-0.015的指數分布,論文在發(fā)表后三年內被引次數服從α=-0.017的指數分布.從這兩個結果可以看出,它們呈現出基本相同的分布特征,即都服從指數衰減分布.因此,有理由推測出這些特性可能是論文發(fā)表模式中的共同特性,從這些特性中可以進一步反映出人類在論文發(fā)表的行為中可能暗含某種機制.信息網絡技術還在快速發(fā)展,在信息量足夠多的情況下,可能還會有更豐富的標度特性,這有待于更多的有興趣的學者去進一步挖掘.

圖2 論文3年被引次數分布

致謝:本文得到導師林振權教授的悉心指導,同時也得到了林振權教授的科研補助金的贊助,在此表示致謝.

[1] Johansen A. Probing human response times [J]. Physica A: Statistical Mechanics and its Applications, 2004, 338(1): 286-291.

[2] Barabasi A L. The origin of bursts and heavy tails in human dynamics [J]. Nature, 2005, 435: 207-211.

[3] Oliveira J G, Barabási A L. Human dynamics: Darwin and Einstein correspondence patterns [J]. Nature, 2005, 437: 1251-1251.

[4] Stouffer D B, Malmgren R D, Amaral L A N. Log-normal statistics in e-mail communication patterns [J]. [EB/OL]. [2014-01-08]. http://www.researchgate.net/publication/2175792_Log-normal_statistics_in_e-mail_communication_patterns.

[5] Vázquez A, Oliveira J G, Dezs? Z, et al. Modeling bursts and heavy tails in human dynamics [J]. Physical Review E: statistical, nonlinear, and soft matter physics, 2006, 73(3): 036127.

[6] Golosovsky M, Solomon S. Runaway events dominate the heavy tail of citation distributions [J]. The European Physical Journal Special Topics, 2012, 205(1): 303-311.

[7] Newman M E J. The structure and function of complex networks [J]. Society for Industrial and Applied review, 2003, 45(2): 167-256.

[8] Yu P, Van de Sompel H. Networks of scientific papers [J]. Science, 1965, 169: 510-515.

[9] Redner S. How popular is your paper? An empirical study of the citation distribution [J]. The European Physical Journal B-Condensed Matter and Complex Systems, 1998, 4(2): 131-134.

[10] Peterson G J, Pressé S, Dill K A. Nonuniversal power law scaling in the probability distribution of scientific Citations [J]. Proceedings of the National Academy of Sciences, 2010, 107(37): 16023-16027.

[11] Wang D, Song C, Barabási A L. Quantifying long-term scientific impact [J]. Science, 2013, 342(6154): 127-132.

Statistical Analysis on Accepted Time for Papers and Citation Frequency

JIANG Xinglong
(College of Physics and Electronic Information Engineering, Wenzhou University, Wenzhou, China 325035)

Paper publication has always been widely concerned, which is one of important human behaviors. This paper indicates that the distribution tends to obey the law of exponential decay after statistical analysis on the time of receipt for the papers published in Report Colum from the Journal Nature and the situation of their citations after they were published within three years. This result demonstrates an inherent law for paper publications and thus provides an empirical evidence for the future excavation of the citation mechanism.

Accepted Time For Papers; Citation Frequency; Exponential Distribution

N94

A

1674-3563(2015)01-0059-04

10.3875/j.issn.1674-3563.2015.01.010 本文的PDF文件可以從xuebao.wzu.edu.cn獲得

(編輯:王一芳)

2014-02-28

國家自然科學基金(10875086);國家自然科學基金(11175131)

姜興隆(1987- ),男,吉林扶余人,碩士研究生,研究方向:人類動力學

猜你喜歡
冪律指數分布線性
漸近線性Klein-Gordon-Maxwell系統(tǒng)正解的存在性
線性回歸方程的求解與應用
二階線性微分方程的解法
指數分布抽樣基本定理及在指數分布參數統(tǒng)計推斷中的應用
大學數學(2016年5期)2016-12-19 07:23:07
四川地區(qū)降水冪律指數研究
冪律流底泥的質量輸移和流場
二元Weinman型指數分布隨機變量之和、差、積、商及比率的分布
大學數學(2015年5期)2016-01-28 03:08:03
對抗冪律
基于Fibonacci法求冪律模式流變參數最優(yōu)值
斷塊油氣田(2012年6期)2012-03-25 09:53:59
指數分布與其它分布的關系
白沙| 苍梧县| 吴堡县| 河北省| 卓资县| 崇州市| 安多县| 郧西县| 三河市| 罗甸县| 秦皇岛市| 石首市| 苏尼特左旗| 西丰县| 岗巴县| 崇文区| 徐汇区| 宁乡县| 郁南县| 息烽县| 改则县| 红桥区| 千阳县| 绥宁县| 新巴尔虎右旗| 兴化市| 房产| 桃园县| 托克逊县| 海南省| 泗阳县| 永昌县| 永寿县| 奉贤区| 扎兰屯市| 福泉市| 文安县| 启东市| 普兰店市| 仙游县| 马鞍山市|