邊文越,李國(guó)鵬,周秋菊,冷伏海
(中國(guó)科學(xué)院科技戰(zhàn)略咨詢研究院,北京 100190)
自2014年起,中國(guó)科學(xué)院(2016年前為文獻(xiàn)情報(bào)中心,2016年至今為科技戰(zhàn)略咨詢研究院與文獻(xiàn)情報(bào)中心)與科睿唯安基于Essential Science Indica‐tors(ESI)數(shù)據(jù)庫(kù)研究前沿?cái)?shù)據(jù),聯(lián)合研制并發(fā)布了《研究前沿》年度報(bào)告,取得了良好的社會(huì)反響。原國(guó)家副主席李源潮在中國(guó)科協(xié)會(huì)議上引用了該報(bào)告結(jié)果[1],《人民日?qǐng)?bào)》[2]、《光明日?qǐng)?bào)》[3]、中央電視臺(tái)[4]、新華社[5]、《華爾街日?qǐng)?bào)》等國(guó)內(nèi)外新聞媒體以及美國(guó)物理聯(lián)合會(huì)、日本科學(xué)技術(shù)振興機(jī)構(gòu)[6]等專業(yè)組織高度關(guān)注報(bào)告內(nèi)容;中國(guó)農(nóng)業(yè)科學(xué)院[7]、中國(guó)工程院[8]紛紛推出本領(lǐng)域的研究前沿報(bào)告,中國(guó)科學(xué)院科技戰(zhàn)略咨詢研究院也再接再厲,研制了《納米研究前沿分析報(bào)告》《全球城市基礎(chǔ)前沿研究監(jiān)測(cè)指數(shù)》等產(chǎn)品[9-10];王小梅[11]、周秋菊[12]、邊文越[13]、白如江[14]、周群[15]、孫震[16]、張迪[17]等對(duì)ESI研究前沿進(jìn)行了深入研究,在《情報(bào)學(xué)報(bào)》《中國(guó)科學(xué)院院刊》等期刊發(fā)表了一系列文章,ESI研究前沿已經(jīng)成為情報(bào)學(xué)界研究熱點(diǎn)。
作為報(bào)告研制團(tuán)隊(duì)成員,本課題組在為《研究前沿》取得的成績(jī)興奮之余,也意識(shí)到有必要就ESI研究前沿的一些基本問(wèn)題進(jìn)行討論,以進(jìn)一步加固其發(fā)展基礎(chǔ)。本文首先討論了ESI研究前沿的一些基本問(wèn)題,然后基于這些討論,設(shè)計(jì)了基于ESI研究前沿的研發(fā)水平比較方法,并進(jìn)行了案例驗(yàn)證。
中文“研究前沿”在英文中實(shí)際對(duì)應(yīng)的是兩個(gè)含義有所區(qū)別的詞組:research frontier和research front。前者多用于自然科學(xué)界,后者多見于情報(bào)學(xué)界[18],而ESI研究前沿使用的是后者。ESI研究前沿基于引用關(guān)系,每個(gè)前沿由一組高被引論文和引用這些論文的相關(guān)論文組成,這些高被引論文的共被引相似度強(qiáng)度位于設(shè)定的閾值之上[19]。ESI研究前沿每?jī)蓚€(gè)月更新一期,每期約1萬(wàn)個(gè)研究前沿。要搞清楚ESI研究前沿的內(nèi)涵,關(guān)鍵是搞清楚re‐search front的準(zhǔn)確含義以及其與research frontier的區(qū)別。
(1)詞義辨析。根據(jù)《韋氏詞典》的解釋,frontier由“地理上的邊界”引申出“認(rèn)知的極限”(the farthermost limits of knowledge or achievement in a particular subject),從而具有“前沿”的含義。美國(guó)科技政策學(xué)家Bush在其著作《科學(xué):無(wú)止境的前沿》(Science:The Endless Frontier)中使用了frontier一詞。front是指“活躍或感興趣的領(lǐng)域”(an area of activity or interest)。雖 然 Price[20]、Small[21]、Garfield[22]等對(duì)research front的定義不同,但都是基于高被引論文。一組被同行大量引用的論文所指向的領(lǐng)域自然是活躍的領(lǐng)域。因此,從詞義上看,情報(bào)學(xué)界使用的research front與自然科學(xué)界使用的research frontier是有區(qū)別的,前者更多地是指向研究熱點(diǎn)。
(2)學(xué)界觀點(diǎn)。在國(guó)內(nèi),無(wú)論是情報(bào)學(xué)界還是自然科學(xué)界,都已經(jīng)注意到了前者所說(shuō)的research front并不是后者所通常理解的“研究前沿”。鄭彥寧等[23]指出,基于引文方法識(shí)別出的research front更趨于熱點(diǎn)而不是前沿[23]。某位長(zhǎng)期從事科技情報(bào)研究的科研人員認(rèn)為,research front翻譯為“研究焦點(diǎn)”也許比“研究前沿”更合適一點(diǎn)。在中文語(yǔ)境中提到前沿,大家通常想到的是少數(shù)尖端研究領(lǐng)域,比如,物質(zhì)結(jié)構(gòu)、宇宙起源、生物演化等,對(duì)應(yīng)的英文是frontier[24]。2015年10月,在《研究前沿2015》發(fā)布會(huì)上,應(yīng)邀出席的某院士當(dāng)場(chǎng)指出,報(bào)告中的“前沿”實(shí)際上是指研究熱點(diǎn)。
(3)案例研究。2005年,《科學(xué)》(Science)雜志為慶祝創(chuàng)刊125周年,提出了125個(gè)科學(xué)問(wèn)題,這些問(wèn)題是科技界公認(rèn)的研究前沿[25]。本文按照《研究前沿》報(bào)告的領(lǐng)域劃分,分別從《科學(xué)》雜志這125個(gè)科學(xué)問(wèn)題和2014—2020年《研究前沿》報(bào)告中選取了一些例子并進(jìn)行對(duì)比。如表1所示,自然科學(xué)界和情報(bào)學(xué)界各自認(rèn)為的研究前沿在方向上是一致的,但情報(bào)學(xué)界的research front更多地表現(xiàn)為實(shí)現(xiàn)自然科學(xué)界research frontier的具體方法和途徑。這符合科學(xué)邏輯。因?yàn)檠芯壳把厥强蒲腥藛T共同的奮斗方向,在致力于解決research frontier的過(guò)程中,形成了一些可行性高、參與程度高的途徑或方法即熱點(diǎn)。這些途徑或方法在引用關(guān)系上體現(xiàn)為一組內(nèi)容關(guān)聯(lián)、頻繁被共同引用的論文及其施引論文,這就是research front。
表1 《科學(xué)》和《研究前沿》中“前沿”對(duì)比
綜上所述,本文認(rèn)為ESIresearch front反映的是研究熱點(diǎn)。鑒于我國(guó)情報(bào)學(xué)界已經(jīng)習(xí)慣將其翻譯成ESI研究前沿,本文仍沿用這一翻譯,但其含義是研究熱點(diǎn)。
采用聚類方法求解出的研究前沿必須具有科學(xué)含義,才具有價(jià)值。通過(guò)連續(xù)7年分析解讀ESI研究前沿,本文認(rèn)為確實(shí)有相當(dāng)多的ESI研究前沿準(zhǔn)確反映了科技界的研究熱點(diǎn),具有很強(qiáng)的分析和研究?jī)r(jià)值。但仍有一部分ESI研究前沿值得商榷,主要有以下三個(gè)方面的原因。
(1)聚類規(guī)模。理論上,一個(gè)ESI研究前沿由一組共被引論文及其施引論文組成。但在實(shí)際分析解讀中,因?yàn)槭┮撐臄?shù)量眾多且主題發(fā)散,所以主要關(guān)注作為基礎(chǔ)的共被引論文。根據(jù)聚類參數(shù)設(shè)計(jì),每個(gè)ESI研究前沿對(duì)應(yīng)一個(gè)由2~50篇論文組成的共被引論文簇。以2018年3月前沿?cái)?shù)據(jù)為例(表2),在全部10143個(gè)前沿中,只包含2或3篇論文的簇多達(dá)6632個(gè),占比65.4%。而依據(jù)多年研究形成的經(jīng)驗(yàn),至少需要4篇論文才能準(zhǔn)確識(shí)別出其共同指向的研究主題,即至少約2/3的ESI研究前沿基本判斷不出主題。組成簇的論文太少不行,而太多也不代表就能識(shí)別出研究主題,這與引用動(dòng)機(jī)有關(guān)。根據(jù)研究經(jīng)驗(yàn),由20~40篇論文組成的簇通常能夠較好地反映研究主題。
表2 ESI研究前沿統(tǒng)計(jì)分析(2018年3月數(shù)據(jù))
(2)引用動(dòng)機(jī)。ESI在對(duì)高被引論文進(jìn)行聚類時(shí),默認(rèn)引用都是合理的科學(xué)行為,是對(duì)已發(fā)表成果的繼承和發(fā)展,但實(shí)際情況要復(fù)雜得多。一方面,存在不合理的引用,突出體現(xiàn)為自引哄抬。少數(shù)ESI研究前沿的共被引論文簇絕大多數(shù)甚至全部由自引論文組成,類型包括自我引用、師生互引、同門互引、夫妻互引、固定合作伙伴互引等。當(dāng)然,不排除其中確實(shí)有優(yōu)秀的研究團(tuán)體,其研究?jī)?nèi)容也具有較高的科學(xué)價(jià)值,但更多的是互相哄抬。另一方面,合理的引用動(dòng)機(jī)也千差萬(wàn)別。同樣引用一篇文獻(xiàn),有人采用前言宏觀介紹,有人借鑒實(shí)驗(yàn)方法,有人關(guān)注結(jié)果討論。這就使得在同一個(gè)共被引論文簇,特別是規(guī)模較大的簇中,可能存在兩個(gè)甚至多個(gè)內(nèi)容關(guān)聯(lián)性不強(qiáng)的研究主題。
(3)科學(xué)價(jià)值。即使研究主題聚焦明確、引用動(dòng)機(jī)科學(xué)合理,一個(gè)ESI研究前沿也不一定合格,因?yàn)樗€必須具有較高的科學(xué)價(jià)值。缺乏科學(xué)價(jià)值主要表現(xiàn)為共被引論文大都來(lái)自科技不發(fā)達(dá)國(guó)家和發(fā)表在低水平期刊。對(duì)于具有全球普適性的自然科學(xué)熱點(diǎn),科技強(qiáng)國(guó)不參與基本不可能;即使是一些區(qū)域性熱點(diǎn),通常也至少有1~2個(gè)科技強(qiáng)國(guó)參與研究。而論文是否發(fā)表在本領(lǐng)域權(quán)威期刊,則反映了同行專家對(duì)研究成果是否認(rèn)可。
綜上所述,本文認(rèn)為一個(gè)ESI研究前沿的共被引論文簇符合研究主題聚焦明確、引用動(dòng)機(jī)科學(xué)合理、科技強(qiáng)國(guó)參與、權(quán)威期刊認(rèn)可這四個(gè)標(biāo)準(zhǔn),該前沿就可被認(rèn)定為是一個(gè)合格的研究前沿。
分析利用ESI研究前沿實(shí)質(zhì)上就是分析利用組成前沿的共被引論文簇和施引論文,前者是重點(diǎn)。本文認(rèn)為,明確共被引論文簇的內(nèi)容屬性是正確使用ESI研究前沿的前提。
ESI數(shù)據(jù)庫(kù)將組成前沿的共被引論文簇稱為“core papers”。根據(jù)《韋氏詞典》的解釋,core的含義為“a central and often foundational part usually distinct from the enveloping part by a difference in na‐ture”,不僅有“中心”的含義,同時(shí)蘊(yùn)含“基礎(chǔ)”的意思。相比于施引論文,共被引論文簇居于引用網(wǎng)絡(luò)的中心,并且構(gòu)成引用網(wǎng)絡(luò)的基礎(chǔ)。因此,Persson[26]認(rèn)為共被引論文簇是引用網(wǎng)絡(luò)的“智力基礎(chǔ)”(intellectual base)。Zhao[27]持相似觀點(diǎn),稱其為“知識(shí)基礎(chǔ)”(knowledge base)?!堆芯壳把亍分饕兄普呃浞Q芯繂T也認(rèn)為是知識(shí)基礎(chǔ)。國(guó)內(nèi)有學(xué)者將core papers翻譯為“核心論文”。根據(jù)《現(xiàn)代漢語(yǔ)詞典》(第七版)的解釋,“核心”是指“主要部分(就事物之間的關(guān)系而言)”,如領(lǐng)導(dǎo)核心、核心小組等。相比于core papers的英文原意,“核心論文”突出了共被引論文簇對(duì)引用網(wǎng)絡(luò),即ESI研究前沿的重要性。本文認(rèn)為,將core papers翻譯為“基礎(chǔ)論文”更好,不僅更貼合其原意,而且更準(zhǔn)確地反映了共被引論文簇的內(nèi)容屬性,具體理由闡述如下。
(1)基礎(chǔ)性不等于重要性。施引論文以共被引論文簇作為其研究基礎(chǔ),因此,基礎(chǔ)性是共被引論文簇的第一性。共被引論文簇頻繁被引用,即頻繁被當(dāng)作研究基礎(chǔ),反映了其重要性。但對(duì)于某個(gè)具體ESI研究前沿,兩者并不一定等價(jià)。例如,某鈉電池研究前沿,其共被引論文簇含有研究鋰電池的論文。鋰與鈉是同族化學(xué)元素,化學(xué)性質(zhì)相似,其研究有借鑒意義。因此,鋰電池研究可以是鈉電池研究的基礎(chǔ),但不能算作后者領(lǐng)域的重要成果。類似的例子在ESI研究前沿中還有很多。
(2)共被引論文簇的重要性不完備。第一,共被引論文簇有時(shí)間限制,要求是之前六年發(fā)表的論文。因此,會(huì)遺漏發(fā)表在六年前的本領(lǐng)域奠基性工作。第二,進(jìn)入共被引論文簇的前提是成為高被引論文,而ESI數(shù)據(jù)庫(kù)的高被引標(biāo)準(zhǔn)是按出版年分別計(jì)算,即發(fā)表越早的論文要求被引次數(shù)越高,發(fā)表越近的論文則要求相對(duì)較低。以2018年3月數(shù)據(jù)為例(表3),47296篇共被引論文發(fā)表時(shí)間從2012年到2017年12月,被引次數(shù)統(tǒng)計(jì)截至2017年12月,最高被引5063次、最低4次。相對(duì)而言,長(zhǎng)時(shí)間積累了較高引用次數(shù)的論文說(shuō)明其經(jīng)過(guò)了時(shí)間檢驗(yàn),其重要性可能性更高;而發(fā)表時(shí)間較近、被引次數(shù)相對(duì)較低的高被引論文,其后續(xù)發(fā)展情況未知,其重要性也打上了問(wèn)號(hào)。第三,ESI數(shù)據(jù)庫(kù)的高被引標(biāo)準(zhǔn)對(duì)綜述和普通論文一視同仁,使得綜述更容易進(jìn)入共被引論文簇。但綜述只是對(duì)前人研究成果的總結(jié)歸納,其對(duì)領(lǐng)域發(fā)展的重要性通常不及原創(chuàng)性論文。第四,共被引論文簇要求高被引論文“共同”被引用強(qiáng)度達(dá)到一定閾值,因此,可能遺漏閾值之下的重要工作??祁Nò补緢?bào)告指出,受聚類方法限制,共被引論文簇一度只利用了43%的高被引論文(目前是99%)[28]。第五,ESI研究前沿存在碎片化特點(diǎn),可能將一個(gè)研究熱點(diǎn)分裂成若干個(gè)。例如,在2018年3月數(shù)據(jù)中,鈣鈦礦太陽(yáng)能電池這一研究熱點(diǎn)被分成20多個(gè)前沿,雖然反映了其不同的研究細(xì)節(jié),但也使任一前沿的共被引論文簇都無(wú)法反映其全貌。
表3 ESI研究前沿共被引論文被引用情況(2018年3月數(shù)據(jù))
明確了共被引論文簇的內(nèi)容屬性,其使用問(wèn)題迎刃而解。作為ESI研究前沿的基礎(chǔ),共被引論文簇可以用于揭示研究熱點(diǎn),但由于其重要性不完備,通常不適合直接用于分析比較各國(guó)研究水平。本文采用“基礎(chǔ)論文”一詞指代ESI研究前沿的共被引論文簇。
構(gòu)建高質(zhì)量的論文分析集合是準(zhǔn)確比較各國(guó)基礎(chǔ)研究水平的前提。Web of Science數(shù)據(jù)庫(kù)雖然論文收錄較全,但論文質(zhì)量參差不齊。ESI數(shù)據(jù)庫(kù)選取了其中top 1%高被引論文。雖然高被引不一定代表高質(zhì)量,但兩者確實(shí)有較大相關(guān)性,因此,高被引論文具有更高的分析價(jià)值。然而ESI數(shù)據(jù)庫(kù)只有22個(gè)學(xué)科分類,若要分析某個(gè)具體前沿領(lǐng)域,則需要費(fèi)時(shí)費(fèi)力地構(gòu)建檢索式。ESI數(shù)據(jù)庫(kù)通過(guò)共被引聚類,每期形成約1萬(wàn)個(gè)研究前沿,相當(dāng)于把高被引論文按照研究主題做了較為細(xì)致的劃分,為前沿?cái)?shù)據(jù)集構(gòu)建與分析提供了很大方便。然而,如上文所述,在形成ESI研究前沿的過(guò)程中,受方法所限存在一些誤差,導(dǎo)致ESI研究前沿并不適合直接用于分析比較各國(guó)研究水平。本文認(rèn)為,應(yīng)該充分利用已形成的分析便利條件即ESI研究前沿,有針對(duì)性地予以彌補(bǔ),設(shè)計(jì)合理的基于ESI研究前沿的研究水平比較方法。重點(diǎn)解決因研究前沿碎片化導(dǎo)致的“只見樹木不見森林”問(wèn)題和因發(fā)表時(shí)間限制、共被引強(qiáng)度要求而導(dǎo)致的重要成果丟失問(wèn)題。對(duì)于高被引標(biāo)準(zhǔn)問(wèn)題,只要不搞國(guó)家、機(jī)構(gòu)、作者發(fā)文量的排名,則影響不大。事實(shí)上,對(duì)于ESI研究前沿這種小樣本數(shù)據(jù),也不應(yīng)該簡(jiǎn)單地根據(jù)發(fā)文量排名,分析比較各國(guó)研究水平。
如圖1所示,本文的設(shè)計(jì)思路是:首先,在ESI研究前沿中找出所有與分析主題相關(guān)的前沿并將其基礎(chǔ)論文合并,即解決研究前沿碎片化問(wèn)題;其次,以合并后的基礎(chǔ)論文為基礎(chǔ),補(bǔ)充前沿發(fā)展歷程中的重要成果,構(gòu)建基本完備的重要成果集合,即解決基礎(chǔ)論文重要性不完備問(wèn)題;最后,以構(gòu)建的重要成果集為基礎(chǔ)進(jìn)行研究水平比較分析。
圖1 基于ESI研究前沿的研究水平比較方法
針對(duì)上述思路,本文擬采用以下方法實(shí)現(xiàn):①根據(jù)分析主題,設(shè)計(jì)構(gòu)造檢索式,在ESI研究前沿“research front name”字段檢索相關(guān)前沿。每個(gè)前沿的research front name由若干個(gè)關(guān)鍵詞組成,這些關(guān)鍵詞可以反映前沿的內(nèi)容和范圍。對(duì)于檢索到前沿,閱讀其基礎(chǔ)論文,剔除不相關(guān)和不合格的前沿,對(duì)剩下的前沿命名并將其基礎(chǔ)論文合并。②以合并后的基礎(chǔ)論文為基礎(chǔ),根據(jù)引用關(guān)系和語(yǔ)義關(guān)系補(bǔ)充前沿發(fā)展過(guò)程中的重要成果。論文通常在引言部分綜述前人的重要成果時(shí)會(huì)使用一些信號(hào)詞,比如,first代表首次提出,to date、current往往緊跟最新進(jìn)展,record、remarkable、形容詞最高級(jí)(如highest、longest)提示重要性高。包含這些詞的句子所引用的參考文獻(xiàn)一般都是值得關(guān)注的重要成果。此外,通過(guò)搜索引擎檢索與分析主題相關(guān)的新聞媒體報(bào)道,防止遺漏重要進(jìn)展,并補(bǔ)充最新進(jìn)展彌補(bǔ)引文的滯后性。③采用知識(shí)元分析方法,比較各國(guó)研究水平[29]。根據(jù)分析主題特點(diǎn),設(shè)計(jì)知識(shí)元組成結(jié)構(gòu),然后從論文和新聞媒體報(bào)道中提取前沿知識(shí)元,并根據(jù)語(yǔ)義把知識(shí)元鏈接形成知識(shí)網(wǎng)絡(luò),進(jìn)而對(duì)前沿發(fā)展趨勢(shì)和各國(guó)研究水平進(jìn)行深入分析和對(duì)比。
本文以鈣鈦礦太陽(yáng)能電池為案例,對(duì)分析框架進(jìn)行驗(yàn)證。使用2018年3月ESI研究前沿?cái)?shù)據(jù),分析時(shí)間截至2017年年底。
鈣鈦礦太陽(yáng)能電池是以鈣鈦礦材料作為吸光層的太陽(yáng)能電池,光電轉(zhuǎn)換效率從2009年首次報(bào)道時(shí)的3.8%,到2018年已經(jīng)突破了23%。2013年,鈣鈦礦太陽(yáng)能電池被《科學(xué)》雜志評(píng)為年度十大突破之一。2016年,鈣鈦礦太陽(yáng)能電池被“世界經(jīng)濟(jì)論壇”評(píng)為當(dāng)年十大新興技術(shù)之一[30]。
首先,以perovskite為關(guān)鍵詞在ESI研究前沿re‐search front name字段中檢索,找到118個(gè)前沿。接著,閱讀每個(gè)前沿的基礎(chǔ)論文,剔除不屬于鈣鈦礦太陽(yáng)能電池領(lǐng)域和不合格的前沿,還剩下20個(gè),對(duì)其命名,分為電池設(shè)計(jì)和基礎(chǔ)研究?jī)深悾ū?)。為比較電池設(shè)計(jì)水平,本文選取電池設(shè)計(jì)類的7個(gè)前沿,將其基礎(chǔ)論文合并。由表4可以看出,雖然理論上ESI研究前沿使用的是之前六年的論文,但具體到某一個(gè)前沿其基礎(chǔ)論文可能并沒有覆蓋那么長(zhǎng)的時(shí)間范圍。而且,即使將電池設(shè)計(jì)類的7個(gè)前沿合并,其56篇基礎(chǔ)論文的發(fā)表時(shí)間范圍為2012年8月至2017年1月,距離當(dāng)期收錄截止時(shí)間2017年12月也還有一段距離。這些都提示了必須補(bǔ)充前沿進(jìn)展和最新成果。
表4 鈣鈦礦太陽(yáng)能電池研究前沿
本文采取由近及遠(yuǎn)的策略,先補(bǔ)充最新成果,再補(bǔ)充前沿發(fā)展歷程中的重要成果。首先,搜索權(quán)威新聞媒體對(duì)鈣鈦礦太陽(yáng)能電池的報(bào)道,補(bǔ)充了2017年的兩篇重要論文和三項(xiàng)重要成果。然后,將這2篇論文和56篇基礎(chǔ)論文合并,通過(guò)逐篇閱讀其引言部分,找到first、recent、to date、record、re‐markable、highest等提示關(guān)鍵成果的詞,并下載對(duì)應(yīng)的參考文獻(xiàn),去除重復(fù)文獻(xiàn),最后合計(jì)得到23篇論文。然而,通過(guò)閱讀這23篇論文發(fā)現(xiàn),其引言部分包括了一些前述58篇論文未提到的重要研究成果,即仍需繼續(xù)上述過(guò)程。為此,本文為這一過(guò)程設(shè)置了終點(diǎn):①回到起點(diǎn),即first所提示的本領(lǐng)域第一篇成果;或者②沒有新的發(fā)現(xiàn),即與已有論文重復(fù);或者③引用的成果的重要性明顯不足。又經(jīng)過(guò)兩輪補(bǔ)充,本文結(jié)束這一過(guò)程,構(gòu)建了由102篇論文和3項(xiàng)媒體報(bào)道成果組成的重要成果集。
本文根據(jù)鈣鈦礦太陽(yáng)能電池的特點(diǎn),設(shè)計(jì)了由名稱、電池組成、性能、來(lái)源四個(gè)基本要素組成的知識(shí)元。其中,“名稱”表示鈣鈦礦太陽(yáng)能電池的具體研究方向。由于經(jīng)過(guò)補(bǔ)充的重要成果集的內(nèi)容范圍已經(jīng)超出了電池設(shè)計(jì)類的七個(gè)前沿,本文對(duì)研究方向重新進(jìn)行了分類和命名,分為正型結(jié)構(gòu)、反型結(jié)構(gòu)、半透明電池、串聯(lián)電池、無(wú)機(jī)鈣鈦礦電池、無(wú)鉛鈣鈦礦電池、大面積、小模塊、大模塊和其他等?!半姵亟M成”表示鈣鈦礦太陽(yáng)能電池正反電極、電子傳輸層、吸光層、空穴傳輸層等部分的組成材料,對(duì)于串聯(lián)電池還包括第二種電池的信息和串聯(lián)方式。“性能”表示用于測(cè)試的電池活性面積,以及在該面積下測(cè)得的光電轉(zhuǎn)換效率、開路電壓、短路電流、填充因子等信息?!皝?lái)源”表示該條知識(shí)元的出處,以Web of Science入藏號(hào)或新聞報(bào)道出處表示,并關(guān)聯(lián)作者、機(jī)構(gòu)、出版時(shí)間等信息。本文通過(guò)人工閱讀的方式,從102篇論文和3項(xiàng)媒體報(bào)道成果中,挖掘出112條知識(shí)元(圖2)。
圖2 鈣鈦礦太陽(yáng)能電池知識(shí)元(部分)
這些知識(shí)元雖然來(lái)自不同論文或媒體報(bào)道,但是彼此之間存在著豐富的語(yǔ)義關(guān)系,可以根據(jù)分析需要有針對(duì)性地組織起來(lái)形成知識(shí)網(wǎng)絡(luò)。本文選取最能反映各國(guó)研發(fā)水平的小面積(約0.1 cm2)太陽(yáng)能電池研究結(jié)果,繪制電池效率提升曲線。如圖3所示,由知識(shí)元串聯(lián)形成的曲線清晰地呈現(xiàn)了電池效率從2009年5月首次報(bào)道時(shí)的3.8%到2017年6月22.1%的快速提升過(guò)程,在這一過(guò)程中做出重要貢獻(xiàn)的機(jī)構(gòu)及機(jī)構(gòu)間的合作與競(jìng)爭(zhēng)情況。由圖3可知,雖然日本在該領(lǐng)域做出奠基性成果,但截至分析時(shí)間鈣鈦礦太陽(yáng)能電池研究水平領(lǐng)先的國(guó)家是韓國(guó)和瑞士。圖3的分析結(jié)果受到領(lǐng)域?qū)<艺J(rèn)可。
圖3 鈣鈦礦太陽(yáng)能電池效率提升曲線
結(jié)合案例驗(yàn)證,對(duì)本文提出的基于ESI研究前沿的研究水平比較方法作以下討論。
(1)補(bǔ)充重要成果的必要性。如圖3所示,在10項(xiàng)里程碑成果中,有6項(xiàng)不在當(dāng)期ESI研究前沿使用的47296篇基礎(chǔ)論文范圍內(nèi)。其中,用圓形實(shí)心點(diǎn)表示的2項(xiàng)成果是由于發(fā)表時(shí)間(2012年前)在當(dāng)期基礎(chǔ)論文收錄時(shí)間范圍外而未被收錄,而用三角形實(shí)心點(diǎn)表示的4項(xiàng)成果的發(fā)表時(shí)間全部在收錄時(shí)間范圍內(nèi),并且被引頻次達(dá)到甚至遠(yuǎn)遠(yuǎn)超過(guò)高被引標(biāo)準(zhǔn)(表5),但仍未被收錄。無(wú)論哪種原因,都說(shuō)明使用ESI研究前沿基礎(chǔ)論文作研究水平分析時(shí),必須補(bǔ)充重要成果,而不能直接將其用于分析。
表5 補(bǔ)充的四項(xiàng)論文與同期基礎(chǔ)論文對(duì)比
(2)補(bǔ)充重要成果的方法。用于比較研究水平的成果,重質(zhì)不重量,如何衡量論文的質(zhì)量成為重要問(wèn)題。如上文所述,單純依靠引用次數(shù)多少判斷研究水平高低并不可靠。本文采取基于引用關(guān)系和語(yǔ)義關(guān)系的遴選方法,實(shí)質(zhì)上是借助專家智慧判斷引用成果的質(zhì)量。當(dāng)作者使用first、to date、cur‐rent、record、remarkable、形容詞最高級(jí)等詞語(yǔ)修飾引用的研究成果時(shí),說(shuō)明該成果值得重視,有必要被補(bǔ)充進(jìn)來(lái)。這種遴選方法既可以降低自引哄抬的影響,又可以通過(guò)直接引用關(guān)系避免“共同”被引用所導(dǎo)致的遺漏,還可以突破ESI數(shù)據(jù)庫(kù)對(duì)基礎(chǔ)論文“之前六年”的時(shí)間限制。
(3)關(guān)于知識(shí)元挖掘方法。本文采取人工方法挖掘知識(shí)元,而未采用機(jī)器挖掘方法。其原因主要在于每條知識(shí)元由多項(xiàng)數(shù)據(jù)組成,這些數(shù)據(jù)不僅分布位置多樣(有的在正文,有的在附件;有的在段落,有的在圖表),而且每一項(xiàng)數(shù)據(jù)可能存在需要分辨的多條記錄,給機(jī)器挖掘造成一定困難。本文認(rèn)為解決這一問(wèn)題既需要探索智能的機(jī)器挖掘方法,更需要發(fā)展高質(zhì)量的本國(guó)期刊。因?yàn)楸疚乃械闹R(shí)元數(shù)據(jù)都是作者在向期刊投稿時(shí)需要明確提供的,哪個(gè)國(guó)家掌握了期刊及其背后的數(shù)據(jù)庫(kù),哪個(gè)國(guó)家就掌握了這些經(jīng)過(guò)語(yǔ)義標(biāo)引的高質(zhì)量數(shù)據(jù),節(jié)省了挖掘成本。因此,在數(shù)據(jù)驅(qū)動(dòng)科研時(shí)代下,我國(guó)必須積極發(fā)展自己的科技期刊,通過(guò)吸引國(guó)內(nèi)外優(yōu)秀論文投稿,積累優(yōu)質(zhì)數(shù)據(jù),為本國(guó)科研服務(wù)。
(4)科研評(píng)價(jià)話語(yǔ)權(quán)。近年來(lái),諸如ESI高被引科學(xué)家、ESI“核心論文”等基于引用次數(shù)的評(píng)價(jià)指標(biāo)頻頻被用于科研評(píng)價(jià)。不可否認(rèn),通過(guò)高被引方法確實(shí)能發(fā)現(xiàn)很多優(yōu)秀的科學(xué)家和研究成果。然而,目前的情況多是把數(shù)據(jù)商提供的分析結(jié)果拿來(lái)就用,缺少深究分析方法和分析結(jié)果是否合理。這相當(dāng)于把我國(guó)科研評(píng)價(jià)話語(yǔ)權(quán)直接交給了外國(guó)商業(yè)公司,不利于我國(guó)科技事業(yè)的健康發(fā)展。本文提出的研究水平比較方法,既充分利用ESI研究前沿,又有針對(duì)性地完善,可以更好地用于科研評(píng)價(jià),有利于把評(píng)價(jià)話語(yǔ)權(quán)牢牢掌握在自己手中。
本文從ESI研究前沿出發(fā),首先討論了前沿內(nèi)涵、合格標(biāo)準(zhǔn)、使用方法等基本問(wèn)題,認(rèn)為ESI研究前沿實(shí)際反映的是當(dāng)今科技界的研究熱點(diǎn),一個(gè)合格的ESI研究前沿需要其基礎(chǔ)論文符合研究主題聚焦明確、引用動(dòng)機(jī)科學(xué)合理、科技強(qiáng)國(guó)參與、權(quán)威期刊認(rèn)可等四個(gè)標(biāo)準(zhǔn),基礎(chǔ)論文可以用于揭示研究熱點(diǎn)但不適合直接用于分析比較各國(guó)的研究水平。其次,基于上述結(jié)論,本文設(shè)計(jì)了基于ESI研究前沿的研究水平比較方法,其核心是構(gòu)建基本完備的重要成果集合并采用知識(shí)元方法分析成果集合、比較各國(guó)研究水平。最后,本文使用鈣鈦礦太陽(yáng)能電池這一研究熱點(diǎn)對(duì)該方法成功進(jìn)行了驗(yàn)證,并結(jié)合驗(yàn)證結(jié)果對(duì)補(bǔ)充重要成果的必要性和補(bǔ)充方法、知識(shí)元挖掘方法和科研評(píng)價(jià)話語(yǔ)權(quán)問(wèn)題進(jìn)行了討論。
按照《孫子兵法》“上兵伐謀”思想,分析比較各國(guó)在某一前沿領(lǐng)域的研究水平,應(yīng)該從戰(zhàn)略規(guī)劃開始,沿著“戰(zhàn)略規(guī)劃—項(xiàng)目部署—基礎(chǔ)研究—成果轉(zhuǎn)化”鏈條進(jìn)行全方位比較。因此,本課題組正在構(gòu)建基于戰(zhàn)略規(guī)劃、項(xiàng)目部署、基礎(chǔ)研究、成果轉(zhuǎn)化等多種數(shù)據(jù)的研究水平分析比較方法,ESI研究前沿在其中將發(fā)揮識(shí)別研究熱點(diǎn)和以其為基礎(chǔ)構(gòu)建基礎(chǔ)研究成果集等重要作用。同時(shí),考慮到各領(lǐng)域科學(xué)研究的不同特點(diǎn)(純理論、應(yīng)用導(dǎo)向等),在方法設(shè)計(jì)和ESI研究前沿使用方面將更加具有針對(duì)性和符合學(xué)科特點(diǎn)。