国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于ESI的學(xué)科排名預(yù)測方法

2018-03-21 01:11:12,,
關(guān)鍵詞:老化數(shù)量論文

,,

隨著“雙一流”建設(shè)總體方案的提出,高校的學(xué)科發(fā)展成為圖書館服務(wù)的重中之重。加強(qiáng)世界一流大學(xué)和一流學(xué)科的建設(shè)是針對高等教育和科研發(fā)展作出的重大戰(zhàn)略決策,為提升中國高等教育綜合實(shí)力和國際競爭力奠定了長遠(yuǎn)的政策基礎(chǔ)。

在評價(jià)一流大學(xué)和一流學(xué)科時(shí),存在很多評價(jià)體系和評價(jià)方法。其中,基本科學(xué)指標(biāo)數(shù)據(jù)庫(Essential Science Indicators,ESI)[1]是由世界著名的學(xué)術(shù)信息出版機(jī)構(gòu)美國科學(xué)情報(bào)研究所(ISI)于2001年推出的衡量科學(xué)研究績效、跟蹤科學(xué)發(fā)展趨勢的基本分析評價(jià)工具[2],基于ISI的科學(xué)引文數(shù)據(jù)庫(SCI)和Social Science Citation Index(SSCI)收錄了全球12 000多種學(xué)術(shù)期刊的1 000多萬條文獻(xiàn)記錄建立的計(jì)量分析數(shù)據(jù)庫[3],已成為當(dāng)今世界范圍內(nèi)評價(jià)高校、學(xué)術(shù)機(jī)構(gòu)、國家等國際學(xué)術(shù)水平及影響力的重要評價(jià)指標(biāo)工具之一。近年來,由于國家和地區(qū)對科研的重視,科研投入及人才引進(jìn)的力度增大,我國整體的科研水平有了顯著提高,我國入圍ESI前1%的學(xué)科數(shù)量不斷增加和學(xué)科排名也不斷提升。

助力高校學(xué)科發(fā)展是圖書館服務(wù)的重中之重,因此國內(nèi)關(guān)于ESI數(shù)據(jù)庫的研究也逐漸增多。主要分為兩類:一類是利用ESI數(shù)據(jù)對學(xué)科結(jié)構(gòu)[4]和發(fā)展態(tài)勢[5-6]以及高校之間、國家之間學(xué)科的科研能力進(jìn)行對比研究[7],另一類是基于ESI的排名預(yù)測(如董政娥通過引入學(xué)科比重指標(biāo)對進(jìn)入前1%的學(xué)科進(jìn)行預(yù)測[8],秦萍等運(yùn)用灰色理論對南京航空航天大學(xué)的潛力學(xué)科進(jìn)行了預(yù)測[9],管翠中、范愛紅等以清華大學(xué)為例對學(xué)術(shù)機(jī)構(gòu)入圍ESI前1%學(xué)科的時(shí)間進(jìn)行預(yù)測[10])。通過排名預(yù)測可以了解該機(jī)構(gòu)的發(fā)展趨勢,對學(xué)術(shù)機(jī)構(gòu)科學(xué)制定發(fā)展戰(zhàn)略和研究計(jì)劃、合理調(diào)配學(xué)科資源配置、有計(jì)劃地引進(jìn)人才等方面具有重要的指導(dǎo)意義和參考價(jià)值。

本文以ESI中化學(xué)學(xué)科為研究對象,對各機(jī)構(gòu)發(fā)表的論文數(shù)量和文章被引頻次分別構(gòu)建了動(dòng)力學(xué)模型,并對其進(jìn)行擬合,再用擬合結(jié)果計(jì)算各個(gè)機(jī)構(gòu)的總被引頻次,得到ESI排名預(yù)測。通過預(yù)測得到化學(xué)學(xué)科以后各個(gè)時(shí)間點(diǎn)的ESI排名以及單個(gè)科研機(jī)構(gòu)的排名變化。

1 研究方法及模型的建立

1.1 數(shù)據(jù)采集及研究方法

本文通過InCites[11]數(shù)據(jù)庫檢索ESI中化學(xué)學(xué)科發(fā)表的論文數(shù)量和文章被引頻次,將得到的數(shù)據(jù)按年限分類,數(shù)據(jù)采集時(shí)間為2018年1月29日。

本文的預(yù)測方法是根據(jù)各個(gè)機(jī)構(gòu)以往發(fā)表文章的數(shù)量和平均被引頻次的擬合結(jié)果,計(jì)算下一個(gè)時(shí)間點(diǎn)各個(gè)機(jī)構(gòu)的論文數(shù)量和單篇論文的平均被引頻次以及總被引頻次,用總被引頻次作為下一個(gè)時(shí)間點(diǎn)的ESI排名預(yù)測。

設(shè)t年總被引頻次為Q(t),文章發(fā)表數(shù)量為P(t),平均被引頻次為S(t)。其中t表示年份。其關(guān)系可以用如下公式表示:

Q(t)=P(t)S(t)

1.2 發(fā)表文章數(shù)量模型

分別對P(t)和S(t)建立動(dòng)力學(xué)模型[12]。對單個(gè)科研機(jī)構(gòu)發(fā)表文章的數(shù)量,可以通過一個(gè)簡單的動(dòng)力學(xué)模型來描述。文章發(fā)表數(shù)量的增加量與當(dāng)前機(jī)構(gòu)的科研基礎(chǔ)成正比,比例系數(shù)可以用A(t)表示。科研基礎(chǔ)包括科研經(jīng)驗(yàn)、人員經(jīng)驗(yàn)、可使用的儀器、對學(xué)科理解的深度等,因此文章數(shù)量的動(dòng)力學(xué)方程為:

由于單個(gè)機(jī)構(gòu)中各種經(jīng)驗(yàn)和科研實(shí)力的變化是一個(gè)相對緩慢的過程,所以A(t)可以近似為一個(gè)常數(shù),那么方程就可以簡化為:

解上面的方程可以得到一個(gè)簡單的e指數(shù)方程

P(t)=aebt+c

(1)

其中a,b,c是擬合參數(shù),科研機(jī)構(gòu)不同對應(yīng)的參數(shù)也不同。

1.3 論文被引頻次模型

對于論文被引頻次的預(yù)測,也可仿照發(fā)文數(shù)量的模型建立動(dòng)力學(xué)方程。由于論文的被引存在被引頻次隨時(shí)間增加(在發(fā)表之后被認(rèn)可度逐漸增加)和老化(被引頻次逐年減小的過程)的問題[13],因此單篇論文平均被引頻次S(t)分成兩部分:一部分是隨時(shí)間增加的過程,用S1(t)表示;另一部分是隨時(shí)間衰減的過程,用S2(t)表示。用方程來表示單篇平均被引頻次:

S(t)=S1(t)+S2(t)

對被引頻次增加和老化部分分別建立隨時(shí)間變化的動(dòng)力學(xué)模型。由于被引頻次和文章的被認(rèn)可程度有關(guān),可以近似認(rèn)為是成正比的;增加部分S1(t)會(huì)以一定速率向老化部分S2(t)轉(zhuǎn)移,因此對增加部分和老化部分建立動(dòng)力學(xué)模型如下:

式中,k1是增加部分對被引頻次增量的比例系數(shù),k2是老化部分對被引頻次增量的比例系數(shù),k3是由增加部分轉(zhuǎn)移到老化部分的速率。由于被引過程的變化也是一個(gè)比較緩慢的過程,因此忽略比例系數(shù)與時(shí)間的關(guān)系,認(rèn)為它們是常數(shù)。解上面微分方程組可得到S1(t)和S2(t)的解析式:

S2(t)=C1e(k1-k3)t+C2e-k2t

式中C1和C2是常數(shù),是S1(t)和S2(t)之間的約束關(guān)系。

所以論文的單篇平均被引頻次為:

S(t) =S1(t)+S2(t)

從上面公式中可以看出,被引頻次和時(shí)間的關(guān)系是兩個(gè)e指數(shù)的關(guān)系,其它位置都是常數(shù)。因此可以把方程中的常數(shù)簡化,方程就變成如下形式:

S(t)=AeBt+CeDt

(2)

從InCites數(shù)據(jù)庫得到的數(shù)據(jù)是只有最后一次更新時(shí)間的發(fā)表論文的數(shù)量和被引頻次,這對應(yīng)著文獻(xiàn)老化中的共時(shí)老化數(shù)據(jù),所以不能直接得到論文發(fā)表之后的引用量隨時(shí)間的變化,即歷時(shí)老化數(shù)據(jù)。王宏鑫等研究表明,共時(shí)老化數(shù)據(jù)和歷時(shí)老化數(shù)據(jù)都能反映文獻(xiàn)老化的真實(shí)過程[14],因此采用共時(shí)老化數(shù)據(jù)反映文獻(xiàn)老化的過程。

2 排名預(yù)測

ESI排名是根據(jù)各學(xué)術(shù)機(jī)構(gòu)發(fā)表論文的總被引頻次排名的,因此學(xué)科排名預(yù)測是總被引頻次的預(yù)測??偙灰l次的預(yù)測可以從發(fā)表文章數(shù)量的預(yù)測和文章平均被引頻次的預(yù)測兩方面考慮。以化學(xué)學(xué)科為例,從發(fā)表文章數(shù)量和被引頻次兩個(gè)方面預(yù)測ESI中化學(xué)學(xué)科的排名變化。

2.1 發(fā)表文章數(shù)量的擬合

首先從InCites下載1981-2017年各機(jī)構(gòu)發(fā)表化學(xué)學(xué)科文章的數(shù)量,并用公式(1)擬合,擬合結(jié)果如圖1所示。

圖1(a)中的橫軸代表論文發(fā)表的年代,縱軸代表各個(gè)機(jī)構(gòu)論文發(fā)表的數(shù)量。點(diǎn)代表排名前5名的機(jī)構(gòu)各年發(fā)表文章的數(shù)量,實(shí)線是用公式擬合后的結(jié)果,不同顏色代表不同的單位。從圖中可以看出各個(gè)單位的擬合效果都很好。

圖1(b)和(c)分別給出機(jī)構(gòu)排名在101~105和401~405的統(tǒng)計(jì)數(shù)據(jù)和擬合數(shù)據(jù),可以看出各個(gè)階段的擬合結(jié)果都很合理。

為了反映整體的擬合效果,我們采用了數(shù)學(xué)中常用的相關(guān)性分析方法對擬合結(jié)果進(jìn)行評價(jià),即計(jì)算圖中點(diǎn)代表的數(shù)據(jù)和實(shí)線代表的數(shù)據(jù)的相關(guān)系數(shù)。相關(guān)系數(shù)的結(jié)果范圍在0~1之間,越接近1說明擬合效果越好。結(jié)合所有機(jī)構(gòu)的擬合結(jié)果計(jì)算它們的相關(guān)系數(shù),得到相關(guān)系數(shù)的統(tǒng)計(jì)分布如圖1(d)所示。

從圖中可以看出,相關(guān)系數(shù)的結(jié)果大部分都大于0.9,說明擬合效果很好,因此可以用此方法預(yù)測學(xué)術(shù)機(jī)構(gòu)的文章發(fā)表量。但也有很少部分?jǐn)?shù)據(jù)擬合效果很差,這可能是由于一些機(jī)構(gòu)人員變動(dòng)或儀器使用經(jīng)驗(yàn)不穩(wěn)定等因素致使文章數(shù)量的變化不穩(wěn)定,但總體擬合效果較好,因此可以用該方法預(yù)測整體的排名。

2.2 被引頻次的擬合

對于早期文獻(xiàn),由于互聯(lián)網(wǎng)未普及,文獻(xiàn)被引頻次記錄不是很全面,它的動(dòng)力學(xué)過程與互聯(lián)網(wǎng)普及之后的趨勢不同,因此我們選擇近15年的被引數(shù)據(jù)擬合動(dòng)力學(xué)模型參數(shù)。

首先從InCites數(shù)據(jù)庫下載2003-2017年各科研機(jī)構(gòu)化學(xué)學(xué)科發(fā)文被引頻次的數(shù)據(jù),并用公式(2)擬合,擬合結(jié)果如圖2所示。

圖2(a)中橫軸代表文章發(fā)表的年代與2018年的距離,縱軸代表文章平均被引頻次,“點(diǎn)”代表排名前5名的機(jī)構(gòu)各年發(fā)文的平均被引頻次,實(shí)線是用公式(2)擬合后的結(jié)果,不同顏色代表排名不同的機(jī)構(gòu)。從圖中可以看出,各個(gè)機(jī)構(gòu)的平均被引頻次擬合效果都比較好。

圖2(b)和(c)分別給出了機(jī)構(gòu)排名在101~105和401~405的被引頻次及擬合結(jié)果,可以看出各個(gè)階段的擬合結(jié)果都比較合理。為了反映整體的擬合效果,用相關(guān)系數(shù)來評價(jià)擬合結(jié)果。

圖2(d)給出了擬合結(jié)果的相關(guān)系數(shù)的分布,幾乎所有的相關(guān)系數(shù)都超過了0.8,可見數(shù)據(jù)擬合結(jié)果是比較合理的。

圖1 各機(jī)構(gòu)化學(xué)學(xué)科在1981-2017年的發(fā)文數(shù)量及擬合結(jié)果

圖2 各機(jī)構(gòu)化學(xué)學(xué)科在1981-2017年平均被引頻次及擬合結(jié)果

2.3 排名預(yù)測

排名預(yù)測主要根據(jù)擬合的發(fā)文數(shù)量和單篇平均被引頻次,計(jì)算今后10年各個(gè)科研機(jī)構(gòu)排名隨時(shí)間的變化情況。由于ESI排名是每2個(gè)月更新1次,因此本文預(yù)測時(shí)也以2個(gè)月為單位預(yù)測,預(yù)測排名的結(jié)果如圖3所示。

圖3給出了各個(gè)階段各個(gè)機(jī)構(gòu)的排名變化,其中圖3(a)中給出了排名前幾位的排名變化。

本文選擇了幾個(gè)變化趨勢不同的排名變化,從圖3(a)可以看出前5名的位置變化不大,第5名在預(yù)測的10年間排名都無變化(總被引頻次雖然增加,但和其他機(jī)構(gòu)之間的相對排名沒有變化);排名第6的機(jī)構(gòu)在預(yù)測的后幾年排名有明顯下降;排名第15位的機(jī)構(gòu),在預(yù)測的10年間開始穩(wěn)步增加,到最大值后又緩慢下降。

圖3(b)中給出了排名在幾十位的科研機(jī)構(gòu)的排名變化,可以看出大部分排名都保持在一個(gè)比較穩(wěn)定的狀態(tài),但也有變化比較明顯的,如排名第52位的機(jī)構(gòu)在預(yù)測時(shí)間內(nèi)一直處于下降的過程。

圖3(c)和(d)是排名100名和500名左右的機(jī)構(gòu)排名變化,可見每個(gè)階段都有一定的機(jī)構(gòu)有排名的上升和下降。所有機(jī)構(gòu)的被引頻次都在增加,排名的變化主要是由于被引頻次增速快慢不同而引起的。其中第4名的增速最快,主要是因?yàn)槠洮F(xiàn)有的文章發(fā)表速度和被引頻次增加速度在預(yù)測時(shí)間段內(nèi)累積引起的排名變化比較大。

圖3預(yù)測的排名隨時(shí)間的變化

為了便于觀察整體排名效果,選擇排名前3000的科研機(jī)構(gòu)作為研究對象,對每個(gè)科研機(jī)構(gòu)取預(yù)測10年間排名最高和最低的排名為可能的上升和下降區(qū)間,結(jié)果如圖4所示。

圖4中橫坐標(biāo)代表2017年底的機(jī)構(gòu)排名,縱軸代表以后預(yù)測結(jié)果中偏離當(dāng)前排名的量,紅色部分代表該科研機(jī)構(gòu)可能的上升量,綠色代表科研機(jī)構(gòu)可能的下降量。

從圖4可以看出,隨著排名序號(hào)增加,排名的區(qū)間上限值起伏越大,主要是因?yàn)楝F(xiàn)在的預(yù)測方法是用當(dāng)前階段的速度來預(yù)測以后的發(fā)文數(shù)量和被引頻次,所以當(dāng)前有一定上升趨勢的機(jī)構(gòu),在今后的預(yù)測中排名就會(huì)有比較大的上升,此處并未考慮到它可能到達(dá)的飽和上限。

同樣,如果當(dāng)前機(jī)構(gòu)的發(fā)文數(shù)量和被引頻次增加速度較慢,那么隨著預(yù)測時(shí)間的增加,它會(huì)被排名靠后的機(jī)構(gòu)超越,就會(huì)出現(xiàn)下降。

排名靠前的單位,由于其當(dāng)前的被引頻次很高,排名靠后的機(jī)構(gòu)在短時(shí)間內(nèi)即使增速很快也很難超越特別靠前的機(jī)構(gòu)。因此用ESI排名評估機(jī)構(gòu)的科研水平是一個(gè)比較合適的參數(shù),因?yàn)樗茈y從短時(shí)間內(nèi)通過惡意引用來提高自己的排名。由于其穩(wěn)定性,對于新發(fā)展的機(jī)構(gòu)或者剛引進(jìn)新的學(xué)科帶頭人的機(jī)構(gòu),很難從ESI指數(shù)上看到明顯的進(jìn)步。

通過預(yù)測各個(gè)機(jī)構(gòu)的排名,可以得到某機(jī)構(gòu)在當(dāng)前發(fā)展的趨勢下未來的發(fā)展?fàn)顩r,為政策的制定提供指引和方向。

圖4 各科研機(jī)構(gòu)預(yù)測排名變化范圍

圖5顯示了被引頻次和排名序號(hào)的關(guān)系。最低的那條線是當(dāng)前排名的結(jié)果,其他各年的結(jié)果是預(yù)測結(jié)果,可以看出各年的預(yù)測結(jié)果和2017年統(tǒng)計(jì)結(jié)果趨勢一致,表明ESI是一個(gè)穩(wěn)定合理的系統(tǒng)。其分布基本保持不變,用其評價(jià)學(xué)科排名比較科學(xué),同時(shí)也證實(shí)了我們建立的模型是十分合理的,沒有使系統(tǒng)偏離穩(wěn)態(tài)。

圖5 各年被引頻次的預(yù)測結(jié)果

3 誤差分析

以上預(yù)測主要是通過建立發(fā)文數(shù)量和被引頻次的變化動(dòng)力學(xué)模型,然后用擬合的方式得到各個(gè)機(jī)構(gòu)的排名變化預(yù)測。任何數(shù)學(xué)模型都會(huì)有系統(tǒng)誤差(在模型中假設(shè)變化量是一個(gè)常數(shù),并不隨時(shí)間變化,主要指模型考慮不到的部分)或者由于簡化帶來的誤差。這種簡化只是在系統(tǒng)變化比較緩慢時(shí)才成立,本文假設(shè)科研系統(tǒng)的積累變化相對比較緩慢。雖然常數(shù)中包括了很多因素,這些因素都可能有一定的隨機(jī)因素,其變化不一定是對科研有利或者不利,但這些隨機(jī)量的平均值一般會(huì)保持在一個(gè)穩(wěn)定值,尤其是對于一些科研積累很多年的單位,新增的累積變化都比較緩慢。

機(jī)構(gòu)內(nèi)部的快速巨大變化(如學(xué)科帶頭人的引進(jìn)和調(diào)離、與其他學(xué)術(shù)機(jī)構(gòu)之間的合作、引入發(fā)文獎(jiǎng)勵(lì)政策等會(huì)給預(yù)測造成誤差),都會(huì)對論文發(fā)表數(shù)量和被引頻次有影響,而且會(huì)使機(jī)構(gòu)的論文數(shù)量和被引頻次的規(guī)律與之前有較大的差別,會(huì)使本方法預(yù)測的誤差增大。

4 結(jié)語

ESI從各個(gè)角度對國家、地區(qū)的學(xué)科發(fā)展水平及學(xué)術(shù)影響力進(jìn)行了全面的衡量,按總被引頻次的高低給出每個(gè)時(shí)期入圍世界前1%的學(xué)術(shù)機(jī)構(gòu)的排名,對于高校制定學(xué)科發(fā)展政策,衡量與世界一流學(xué)科的差距具有重要意義。僅密切關(guān)注ESI的動(dòng)態(tài)排名是不夠的,還需要深入分析數(shù)據(jù)內(nèi)部潛在的價(jià)值。本文以化學(xué)學(xué)科為例,通過建立模型并擬合數(shù)據(jù),給出今后某個(gè)時(shí)間點(diǎn)各個(gè)機(jī)構(gòu)的排名變化和某科研機(jī)構(gòu)ESI排名隨時(shí)間的變化。此模型具有一定的普適性,可以廣泛用于其他學(xué)科或者科研機(jī)構(gòu)的排名及評價(jià)。通過排名預(yù)測可以發(fā)現(xiàn)一些更有潛力的科研單位,了解某個(gè)學(xué)術(shù)機(jī)構(gòu)的某個(gè)學(xué)科在今后一段時(shí)間內(nèi)與世界一流學(xué)科的差距,以便更合理地制定發(fā)展政策及調(diào)配學(xué)科資源。 但其有效性還有待于后續(xù)的實(shí)證研究,今后可以利用排名數(shù)據(jù)對模型做進(jìn)一步的優(yōu)化,以適應(yīng)對ESI的排名預(yù)測。另外,可以在模型中加入政策決策和基金支持等影響因素,為政策決策和資源分配提供定量的預(yù)期結(jié)果。也可以將此模型應(yīng)用于其他學(xué)科,對比不同學(xué)科的差異,對學(xué)科發(fā)展給出理性的建議。對于擬合數(shù)據(jù),由于使用共時(shí)文獻(xiàn)被引數(shù)據(jù)代替歷時(shí)數(shù)據(jù),可能會(huì)帶來一定的誤差。今后的工作中需定期收集歷時(shí)數(shù)據(jù),對研究模型給予驗(yàn)證和補(bǔ)充。

猜你喜歡
老化數(shù)量論文
延緩大腦老化,要怎樣吃
統(tǒng)一數(shù)量再比較
節(jié)能技術(shù)在開關(guān)電源老化測試中的應(yīng)用
電子制作(2018年10期)2018-08-04 03:24:30
頭發(fā)的數(shù)量
杜絕初春老化肌
Coco薇(2016年2期)2016-03-22 02:40:06
下期論文摘要預(yù)登
下期論文摘要預(yù)登
下期論文摘要預(yù)登
我國博物館數(shù)量達(dá)4510家
2013年5—12月最佳論文
新聞前哨(2014年1期)2014-03-12 22:10:06
通辽市| 夏河县| 永寿县| 积石山| 察哈| 揭阳市| 凤山市| 卢氏县| 任丘市| 南漳县| 平利县| 余姚市| 峡江县| 介休市| 聂荣县| 民丰县| 金山区| 新巴尔虎右旗| 炉霍县| 伽师县| 冕宁县| 永定县| 徐州市| 深水埗区| 独山县| 焦作市| 古交市| 湟中县| 赣榆县| 营山县| 滁州市| 石河子市| 壤塘县| 西充县| 石阡县| 玉树县| 承德县| 土默特右旗| 栖霞市| 定南县| 治多县|