国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

引文視角下的變革性研究早期識別模型構(gòu)建方法與應用

2024-06-03 14:42:47梁國強宋盧睿侯海燕
現(xiàn)代情報 2024年6期
關(guān)鍵詞:引文分析諾貝爾獎

梁國強 宋盧?!『詈Q?/p>

關(guān)鍵詞: 變革性研究; 引文分析; 諾貝爾獎; 科學突破; 早期識別

DOI:10.3969 / j.issn.1008-0821.2024.06.005

〔中圖分類號〕G250 252 〔文獻標識碼〕A 〔文章編號〕1008-0821 (2024) 06-0059-08

“變革性研究” 是徹底改變?nèi)藗儗ΜF(xiàn)有科學的認知, 創(chuàng)造新范式、新領(lǐng)域、引領(lǐng)新前沿的研究。21 世紀以來, 歐美主要發(fā)達國家(地區(qū))大力加強對變革性研究的探索與支持力度, 以繼續(xù)保持在全球范圍內(nèi)的科技領(lǐng)先優(yōu)勢和國際競爭力。近年來,我國也提高了對變革性研究的重視程度, 在一系列文件中明確指出要切實加大對原創(chuàng)性、引領(lǐng)性、變革性創(chuàng)新研究的支持力度[1-2] 。在此背景下, 盡早發(fā)現(xiàn)并識別變革性研究, 對于前瞻部署并搶占國際科技競爭制高點具有重要的戰(zhàn)略意義。

但變革性研究的非線性、偶然性和突變性等特征[3-4] , 使其早期識別成為學界面臨的重大難題?;谧兏镄匝芯吭谝膹V度、強度和速度方面的特征[2] , 本研究以1901—2016 年獲得諾貝爾自然科學獎的關(guān)鍵論文為例, 借助機器學習方法, 構(gòu)建了引文視角下的變革性研究早期識別模型, 并進行應用研究, 為早期識別引領(lǐng)性、前沿性研究成果提供借鑒。

1 文獻綜述

本研究從變革性研究的概念及本質(zhì)、典型特征及理論模型、識別方法3 個方面進行綜述。

1.1 變革性研究的概念及本質(zhì)

變革性研究是以美國國家科學基金會為代表的發(fā)達國家(地區(qū))科技界與科技政策界, 在科學范式理論基礎(chǔ)上, 面對同行評議的保守和固化傾向,力圖在科學研究中有更高突破, 以適應經(jīng)濟社會變革外部壓力和公眾期望的重要理念變化, 是以美國為代表的發(fā)達國家(地區(qū))科學研究結(jié)構(gòu)性改革的重要體現(xiàn)。2007 年, 在《NSF 加強支持變革性研究》的報告中[5] , 美國國家科學委員會認為變革性研究是由有潛力徹底改變對現(xiàn)有科學或工程概念的思想驅(qū)動, 或能夠創(chuàng)造新范式、新領(lǐng)域的研究, 這類研究往往挑戰(zhàn)現(xiàn)有的科學認知或能夠通往科學的新前沿。美國國家基金委作為資助機構(gòu)提出了變革性研究的工作定義: 變革性研究是徹底改變對現(xiàn)有科學、工程概念或教育實踐的認知, 或能夠?qū)е滦路妒?、新科學、新工程產(chǎn)生想法、發(fā)現(xiàn)和工具, 它們挑戰(zhàn)現(xiàn)有認知并通向新的前沿[5] 。變革性研究的提出引發(fā)了美國科技政策界的廣泛討論, 并對歐盟(地區(qū))和我國科技政策產(chǎn)生了重要影響。

TR 的思想源于庫恩科學革命的結(jié)構(gòu)理論, 從庫恩對范式的定義發(fā)現(xiàn), 范式具有3 個特征: 第一,庫恩認為, 范式是得到公認的具體的科學成就, 如著名的科學經(jīng)典。第二, 潛在的新范式具有新穎性特征。庫恩指出, 常規(guī)科學的目的不在于事實或理論的新穎性, 當常規(guī)科學成功時, 也無新穎性的發(fā)現(xiàn)可言。第三, 范式轉(zhuǎn)移就是科學革命。庫恩認為,到了科學團體不再回避破壞現(xiàn)有傳統(tǒng)的反常時期,就開始了非常規(guī)的研究, 最終導致科學共同體做出一系列新的承諾, 建立了一個科學實踐的新基礎(chǔ)。

變革性研究在本質(zhì)上屬于庫恩科學革命的結(jié)構(gòu)中提到的“范式” 的范疇, 二者都具有奠基性的、全新的、反傳統(tǒng)的特點, 但庫恩所指出的“范式”更傾向于哲學范疇內(nèi)較為宏觀的科學概念, 而本文的變革性研究更傾向于相對微觀層面的科學研究成果, 如學術(shù)論文、專著、會議報告、專利等, 顆粒度較“范式” 更細。當這些科學研究成果中蘊藏的重大發(fā)現(xiàn)或發(fā)明能夠挑戰(zhàn)或顛覆某學科領(lǐng)域的傳統(tǒng)研究共識, 并為新的研究領(lǐng)域開辟道路、奠定基礎(chǔ)時, 則可將這些成果視為變革性研究。

1.2 變革性研究的典型特征及理論模型

變革性研究的典型特征是各國(地區(qū))政府及研究人員關(guān)心的重要問題。對基礎(chǔ)研究領(lǐng)域變革性研究的特征, 美國政府認為它具有以下特征: ①由挑戰(zhàn)現(xiàn)狀和顛覆傳統(tǒng)研究范式的想法所驅(qū)動; ②會帶來對傳統(tǒng)科學理解的變革, 甚至是顛覆; ③具有完全不同的研究路徑; ④能夠引領(lǐng)新的科學前沿,開拓新的領(lǐng)域[5] 。它們經(jīng)常是由新方法導致的, 因此一部分變革性研究被認為是冒險的, 而且跨學科研究經(jīng)常導致變革性研究的產(chǎn)生, 但并非全部的跨學科研究都是變革性的。

相關(guān)學者關(guān)于變革性研究的特征也做了諸多努力。例如, Trevors J T 等[6] 認為, 變革性研究具有新穎性、易引發(fā)爭議、發(fā)現(xiàn)新的和未預見的途徑、實現(xiàn)價值、挑戰(zhàn)假設(shè)等特點。杜建等[3] 認為, 變革性研究或革命性科學源自庫恩的科學范式理論, 并認為諾獎成果是變革性研究的代表, 往往容易遭遇延遲承認和低被引, 具有技術(shù)屬性和跨領(lǐng)域擴散特征。Crockett D 等[8] 認為, 從問題識別方面來講, 變革性研究的問題是需要長期的、多觀點、多學科、多文化交叉的觀點來解決的, 需要采用讀者友好的方式以及有影響力的工具對研究成果進行擴散。通過文獻梳理發(fā)現(xiàn), 對變革性研究特征的描述多采用全新的、前所未有的、學科交叉、破膜研究等方法, 而顛覆性和新穎性特征是被學者提及最多的兩個特征。

目前, 對變革性研究的探索尚處于起步階段。一方面, 理論基礎(chǔ)較為薄弱; 另一方面, 針對性的理論模型十分少見。梁國強等[2] 嘗試從引文視角下構(gòu)建了變革性研究的理論模型, 該模型借鑒了科學革命的結(jié)構(gòu)理論和引文分析相關(guān)理論, 認為變革性研究以傳統(tǒng)知識為基礎(chǔ), 可出現(xiàn)于學科領(lǐng)域的非核心地帶, 通過遙遠、稀有游離態(tài)知識的新穎、巧妙組合促進其生成, 而產(chǎn)生早期可能并不會引發(fā)同行的關(guān)注, 甚至因其超前性的研究而招致批判, 一旦其優(yōu)越性展現(xiàn)出來, 就會空前吸引一批堅定的擁護者, 并為后人留下非常多的掃尾工作。

1.3 變革性研究的識別方法

已有研究中關(guān)于變革性研究早期識別相關(guān)指標設(shè)計的探索不多, 基于典型特征或多指標綜合的早期識別模型則更少。與本文較相關(guān)的研究是陳超美等[9] 、Chen C 等[10] 基于結(jié)構(gòu)上和時間上的特征屬性, 以中介中心性和引文突現(xiàn)為基礎(chǔ), 對變革性研究的識別做出了探索, 但該方法的時間窗一般較長,不適于變革性研究的早期識別。另外, 與本文較為相近的早期識別模型構(gòu)建是Small H 等[11] 的研究,他們采用機器學習方法, 借助Scikit-learn 中的回歸模型用以識別學術(shù)文獻中的“科學發(fā)現(xiàn)” (Dis?covery)與“非科學發(fā)現(xiàn)” (Non-discovery), 人工標注科學發(fā)現(xiàn)詞并構(gòu)建科學發(fā)現(xiàn)詞庫, 從而早期識別生物醫(yī)學領(lǐng)域的科學發(fā)現(xiàn)。

目前, 較為常用的早期識別模型構(gòu)建方法有趨勢外推法、因子分析法、回歸分析法、卡爾曼濾波分析法、BP 神經(jīng)網(wǎng)絡(luò)法等。模型構(gòu)建的關(guān)鍵在于賦權(quán), 常用方法有熵值法、主成分分析、因子分析、RSR 秩比、DEA 包絡(luò)分析及基于機器學習的樣本均衡等方法[12] 。熵權(quán)法在綜合考慮各因素提供信息量的基礎(chǔ)上計算綜合指標[13] , 該方法作為一種較為流行的客觀賦權(quán)方法, 廣泛應用于除物理學外的系統(tǒng)科學、控制論、經(jīng)濟管理等多學科領(lǐng)域。關(guān)于該方法在科學計量學領(lǐng)域的應用價值, 俞立平以JCR2017 年經(jīng)濟學領(lǐng)域期刊為例, 對熵權(quán)法、CRIT?IC 法、復相關(guān)系數(shù)法等6 種客觀賦權(quán)方法的評價效果進行了比較, 認為熵權(quán)法更適于同類指標的評價[14] 。

2 數(shù)據(jù)來源與特征抽取

2.1 數(shù)據(jù)來源與預處理

以諾獎?wù)撐臑槔?獲取了公認的變革性研究數(shù)據(jù)集“Prize-winning Paper Records”[15] , 并基于印第安納大學購買的WoS 數(shù)據(jù)庫(時間范圍: 1900—2016 年), 匹配了諾獎?wù)撐牡模祝希?號及引文等信息, 作為變革性研究數(shù)據(jù)集。進一步根據(jù)1 ∶1 的原則選取了與變革性研究發(fā)表在相同年份、相同期刊上的非獲獎?wù)撐淖鳛閷φ战M。最終, 708 篇論文納入變革性研究數(shù)據(jù)集, 596 篇論文納入對照組, 詳見參考文獻[2]。

2.2 特征抽取

模型構(gòu)建的前提是遴選適用的特征指標, 經(jīng)前期調(diào)研, 本文整理了引文視角下常用的特征指標,如表1 和表2 所示。

經(jīng)特征指標遴選[2] , 最終得到變革性研究典型的引文特征指標, 其中, 參考文獻相關(guān)特征指標有普賴斯指數(shù)、參考文獻標準化被引次數(shù)和學科交叉度; 施引文獻相關(guān)特征指標有引文增長率、被引次數(shù)和學科組合系數(shù)。這些特征指標是引文視角下變革性研究所特有的、最典型的指標, 當學術(shù)成果同時滿足上述特征時, 其成果很大可能會成為變革性研究。

3模型構(gòu)建

3.1 模型構(gòu)建方法

目前, 較常用的模型構(gòu)建方法有趨勢外推法、因子分析法、回歸分析法、卡爾曼濾波分析法、BP神經(jīng)網(wǎng)絡(luò)法等[13] 。熵權(quán)法是一種在綜合考慮各因素提供信息量的基礎(chǔ)上計算的綜合指標, 該方法作為一種較為流行的客觀賦權(quán)方法, 廣泛應用于除物理學外的系統(tǒng)科學、控制論、經(jīng)濟管理等多學科領(lǐng)域。因子分析法是對各特征進行賦權(quán)或降維后對新的因子進行賦權(quán)的一種經(jīng)典統(tǒng)計學方法, 而回歸分析法也是解決分類預測問題的重要方法。為比較不同模型的早期識別效果, 本研究將借助熵權(quán)法、因子分析法、回歸分析法分別構(gòu)建變革性研究的早期識別模型。

3.2 早期識別模型構(gòu)建

考慮到不同學科論文的擴散特征[19,22,24] , 本研究將論文發(fā)表后第3 年作為變革性研究識別的早期階段。以變革性研究發(fā)表后第3 年的數(shù)據(jù)為例, 將變革性研究數(shù)據(jù)集整合并打亂順序合成新數(shù)據(jù)集后, 隨機選擇1 000篇納入訓練集, 將剩余99 篇納入測試集。結(jié)果顯示, 基于式(1) 構(gòu)建的早期識別模型測試準確率為80%, 召回率為80%, F 值均為0 8, 且十折交叉驗證結(jié)果顯示模型得分的均值為0.764, 具有較高的穩(wěn)定性。

基于式(2), 本研究對熵權(quán)法下第3 年特征指標的信息熵、信息效用值和權(quán)重進行了計算, 結(jié)果如表3 所示。

基于式(3), 本研究對變革性研究發(fā)表后第3年的數(shù)據(jù)進行了Barltett 球形度檢驗, 結(jié)果顯示,顯著性水平小于0.05(p<0.001), 提示適合進行因子分析。經(jīng)計算, 變革性研究中的6 項指標共提取4 個因子, 旋轉(zhuǎn)后的方差解釋率分別是32.076%、18. 756%、16. 738%、16.725%, 旋轉(zhuǎn)后累積方差解釋率達84.295%, 提示上述4 個因子對信息的保存度較好, 如表4 所示。

4 模型評估

4.1 案例選取

分別以醫(yī)學領(lǐng)域、物理學領(lǐng)域、化學領(lǐng)域的“基因靶標” “磁阻效應” 和“富勒烯” 為例, 對上述3 個早期識別模型的效果進行評估。上述3 個領(lǐng)域均有諾獎得主產(chǎn)生: 基因靶標領(lǐng)域2007 年諾貝爾生理學或醫(yī)學獎得主Capecchi M R 等的關(guān)鍵論文“WOS:A1987K785400017” 發(fā)表于1987 年;磁阻效應領(lǐng)域2007 年諾貝爾物理學獎得主Fert A等的關(guān)鍵論文“WOS:A1988Q948900022” 發(fā)表于1988 年; 富勒烯領(lǐng)域1996 年諾貝爾化學獎得主Kroto H 等的關(guān)鍵論文“WOS:A1985AUD4200071”發(fā)表于1985 年。所有數(shù)據(jù)均源自印第安納大學所購買的WoS 數(shù)據(jù)庫核心合集, 分別選擇1900—2016 年“基因靶標”(Gene Targeting)、“富勒烯”(Fullerene)、“磁阻效應” (Magnetoresistance)領(lǐng)域的論文(Arti?cles or Review)為數(shù)據(jù)集, 表6 顯示了3 個領(lǐng)域數(shù)據(jù)的檢索主題及結(jié)果。

4.2 識別結(jié)果驗證

表7 顯示了不同變革性研究早期識別模型, 在諾獎?wù)撐陌l(fā)表后5 年識別出基因靶標、富勒烯和磁阻效應領(lǐng)域諾獎?wù)撐臍v年的排名情況。從“排名”指標看, 基于回歸分析構(gòu)建的變革性研究早期識別模型的識別效果優(yōu)于其他兩種模型, 識別出諾獎?wù)撐牡呐琶鼮榭壳埃?且在發(fā)表后第3 年即可對諾獎?wù)撐倪M行早期識別; 從“top%” 指標上看, 該模型在發(fā)表后第4 年的識別效果優(yōu)于其他年份。

4.3 早期識別模型的應用

基于回歸分析法的變革性研究早期識別模型識別效果最高, 因此, 本研究將該模型應用于2017年分子生物學(Biochemistry & Molecular Biology)、聚合物科學(Polymer Science)和天體物理學(Astro?physics)領(lǐng)域的研究成果, 該模型識別出的變革型研究如表8 所示。

結(jié)果顯示, 分子生物學領(lǐng)域有3 篇變革性研究, 第一篇由以色列Weizmann 科學研究所和新西蘭Utrecht 大學醫(yī)學中心的Keren-Shaul H 等報道了一種與阿爾茨海默病相關(guān)的新型小膠質(zhì)細胞類型,該文被引525 次; 第二篇由美國埃默里大學醫(yī)學院的Hayek S S 團隊撰寫, 發(fā)現(xiàn)了預測慢性腎臟病發(fā)生和發(fā)展的標記物, 該文被引58 次; 第三篇由美國康涅狄格大學Basuli D 團隊報道, 發(fā)現(xiàn)了卵巢癌在鐵代謝中可表現(xiàn)為針對性改變, 為該病的治療提供了新靶點, 該文被引49 次。聚合物科學領(lǐng)域的3 篇變革性研究中, 第一篇由我國西北大學于游教授團隊發(fā)表, 報道了一種自愈聚二甲基硅氧烷彈性體, 該文被引48 次; 第二篇為香港城市大學AliciaK A 教授團隊發(fā)表, 該研究制備了一種能夠高效處理印染廢水的納米纖維薄膜, 該文被引100 次; 第三篇由上海海事大學范潤華教授團隊發(fā)表的成果,報道了一種可取代周期性超材料的柔性超復合膜,該文被引235 次。天體物理學領(lǐng)域有2 篇變革性研究, 第一篇由美國加州理工學院Abbott B P 教授團隊報道了一種新發(fā)現(xiàn)的由兩個恒星質(zhì)量的黑洞合并產(chǎn)生的引力波, 該文被引446 次; 第二篇由美國約翰霍普金斯大學Ali-Haimoud Y 教授團隊發(fā)表, 探討了宇宙微波背景輻射在增加原始黑洞方面的限制, 該文被引127 次。

5 討論與結(jié)論

早期識別變革性研究, 前瞻培育和早期扶持前沿性、引領(lǐng)性的基礎(chǔ)研究成果, 一直是我國科技部門、基金資助機構(gòu)的重要議題。已有研究常從顛覆性、新穎性、學科交叉性、價值屬性、超前性、爭議性和風險性等切入, 但這些特征的描述僅是針對變革性研究某一方面的表現(xiàn)而言的, 且各項描述存在一定的交叉和重疊, 如超前性、風險性和爭議性,超前性的研究往往會引發(fā)爭議, 并伴有不被同行認可的風險。又如學科交叉性、新穎性等, 學科交叉的研究往往導致新穎的成果產(chǎn)生, 而新穎成果也多源于在學科交叉之處的研究, 這些特征間不存在完備正交的關(guān)系。而且, 單從某一特征入手, 很難形成對變革性研究的全面認識。

本文將上述特征提煉為變革性研究產(chǎn)生前的參考文獻特征和產(chǎn)生后的施引文獻特征, 它們分別體現(xiàn)了變革性研究產(chǎn)生前所依賴的知識基礎(chǔ)的組合特征和產(chǎn)生后新知識在學科中的擴散特征, 更加全面地刻畫了變革性研究的特征。對引文視角下的相關(guān)指標進行遴選的基礎(chǔ)上, 從廣度、強度和速度維度構(gòu)建了變革性研究的識別模型, 經(jīng)模型評估最終選擇早期識別效果最高的模型作為變革性研究的早期識別模型, 并將該模型應用到2017 年分子生物學、聚合物科學和天體物理學領(lǐng)域, 是早期識別變革性研究的一次嘗試, 深化了對變革性研究特征的認識。

變革性研究多源于已有知識的非常規(guī)組合, 是隨著新知識在科學體系中擴散, 影響逐漸增強并最終戰(zhàn)勝傳統(tǒng)范式的學術(shù)成果, 可體現(xiàn)為學術(shù)論文、專著、會議報告、專利等。未來, 本研究將積極整合多源數(shù)據(jù)集, 借助大數(shù)據(jù)優(yōu)勢, 吸收和借鑒動態(tài)時序網(wǎng)絡(luò)、網(wǎng)絡(luò)動力學的一些理念和方法, 深入探究變革性研究的涌現(xiàn)機理和識別手段, 為我國科技部門和基金資助機構(gòu)早期識別變革性研究, 提高科研投入的有效性和經(jīng)費貢獻率、完善資助機制提供, 促進基礎(chǔ)研究領(lǐng)域前沿性、引領(lǐng)性成果的不斷產(chǎn)生和涌現(xiàn)提供借鑒。

猜你喜歡
引文分析諾貝爾獎
搞笑諾貝爾獎
諾貝爾獎知多少
快樂語文(2021年36期)2022-01-18 05:48:38
搞笑諾貝爾獎不是真的在搞笑
學生天地(2017年1期)2017-05-17 05:48:18
用于出版社學術(shù)影響力分析的三類文獻計量指標探討
基于WOS數(shù)據(jù)庫的近十年教育游戲文獻分析
基于引文分析與內(nèi)容分析的專利計量與評價的理論探索
科技視界(2016年23期)2016-11-04 10:01:05
《圖書館》2000—2011高被引論文統(tǒng)計與分析
科技視界(2016年24期)2016-10-11 09:32:50
諾貝爾獎的由來
基于引文分析的科研人員文獻需求研究
科技視界(2016年13期)2016-06-13 23:14:24
中國人力資源管理問題研究進程
軟科學(2015年11期)2015-12-15 03:11:22
都兰县| 绍兴县| 城固县| 会宁县| 车致| 萨嘎县| 利川市| 时尚| 安徽省| 个旧市| 磐石市| 从化市| 合水县| 福建省| 报价| 繁峙县| 栾川县| 安岳县| 吴堡县| 石柱| 西宁市| 阿坝县| 梁平县| 水城县| 连平县| 孟津县| 梨树县| 阿坝| 沅陵县| 舟山市| 禄丰县| 崇明县| 湟源县| 陆河县| 顺义区| 奉新县| 彭山县| 清原| 时尚| 洛浦县| 四平市|