關(guān)鍵詞: 學(xué)科交叉; 研究前沿; 交叉前沿; 引文—主題識(shí)別方法; 多維測(cè)度指標(biāo)
DOI:10.3969/j.issn.1008-0821.2024.10.003
〔中圖分類號(hào)〕G250. 2 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821 (2024) 10-0027-14
當(dāng)前, 新一輪科技革命加速演進(jìn), 在世界科學(xué)前沿和國(guó)家戰(zhàn)略需求的不斷驅(qū)動(dòng)下, 開展交叉前沿研究, 對(duì)于增強(qiáng)自主創(chuàng)新技術(shù)源頭供給, 實(shí)現(xiàn)關(guān)鍵技術(shù)、前沿技術(shù)、顛覆性技術(shù)的創(chuàng)新至關(guān)重要?!笆奈濉?規(guī)劃[1] 中指出, 要面向世界科技前沿, 加強(qiáng)前沿技術(shù)的多路徑探索, 推動(dòng)基礎(chǔ)學(xué)科的交叉創(chuàng)新,實(shí)施一批具有前瞻性的國(guó)家重大科技項(xiàng)目。黨的二十大報(bào)告[2] 中再一次強(qiáng)調(diào), 要重點(diǎn)布局和建設(shè)一批高水平研究平臺(tái), 尤其是交叉研究基地平臺(tái), 推進(jìn)學(xué)科交叉, 促進(jìn)協(xié)同攻關(guān), 引領(lǐng)創(chuàng)新發(fā)展。
近年來, 在國(guó)家政策支持下, 以基因編輯、納米前沿、類腦研究等為代表的交叉領(lǐng)域研究迸發(fā)出強(qiáng)大的內(nèi)生動(dòng)力, 例如, 在基因編輯領(lǐng)域, 通過生物學(xué)、化學(xué)和計(jì)算機(jī)科學(xué)等多學(xué)科的緊密合作和交叉研究, 促進(jìn)了基因編輯技術(shù)在安全、有效前提下的快速發(fā)展。在宇航研究領(lǐng)域, 通過融合航天工程、機(jī)械工程、材料科學(xué)、自動(dòng)控制、人工智能等多個(gè)學(xué)科領(lǐng)域的知識(shí)和技術(shù), 取得了小天體探測(cè)與開發(fā)的智能柔性附著技術(shù)的重大突破??梢姡?多學(xué)科之間交叉融合不僅催生出新的前沿方向, 也成為基礎(chǔ)學(xué)科創(chuàng)新和重大課題攻關(guān)的重要來源。然而, 在多學(xué)科交叉融合中, 如何判定在什么主題、什么方向產(chǎn)生交叉, 交叉是否孕育出新的研究前沿, 是當(dāng)前情報(bào)科學(xué)研究亟待解決的問題。
在此背景下, 本文圍繞學(xué)科間的交叉前沿識(shí)別,提出基于引文—主題雙重測(cè)度的識(shí)別方法, 擬快速識(shí)別并準(zhǔn)確把握學(xué)科間的交叉主題, 瞄準(zhǔn)交叉前沿領(lǐng)域, 為相關(guān)領(lǐng)域開展科學(xué)決策和科技創(chuàng)新研究提供前沿科技咨詢建議與情報(bào)服務(wù)。
1相關(guān)研究
“學(xué)科交叉” 這一概念最早由美國(guó)哥倫比亞大學(xué)心理學(xué)家Woodworth RS提出, 是指超越一個(gè)已知學(xué)科邊界而進(jìn)行的涉及兩個(gè)或兩個(gè)以上學(xué)科的實(shí)踐活動(dòng)[3] 。在此基礎(chǔ)上, 路甬祥[4] 認(rèn)為, 通過此類交叉活動(dòng)產(chǎn)生的結(jié)果即為新的生長(zhǎng)點(diǎn)、新的研究前沿, 是最有可能產(chǎn)生科學(xué)突破的轉(zhuǎn)折點(diǎn), 開辟出眾多交叉前沿方向和應(yīng)用領(lǐng)域?!把芯壳把亍?是指特定研究領(lǐng)域和特定研究事件中正在興起的、具有發(fā)展?jié)摿Φ摹⑽磥砜赡軙?huì)引起大量關(guān)注的研究主題或研究領(lǐng)域[5] 。目前, 學(xué)術(shù)界對(duì)學(xué)科交叉和研究前沿的概念已基本達(dá)成共識(shí), 但對(duì)于交叉前沿概念尚未統(tǒng)一。
本文在沿用上述概念的基礎(chǔ)上, 認(rèn)為“交叉前沿” 是指兩個(gè)或兩個(gè)以上領(lǐng)域在知識(shí)生產(chǎn)或科學(xué)發(fā)現(xiàn)中產(chǎn)生交叉關(guān)聯(lián)的研究前沿。從研究前沿和交叉前沿的概念上來看, “研究前沿” 是指一個(gè)特定領(lǐng)域內(nèi)最新的、最具前瞻性的研究方向和成果。而“交叉前沿” 則是指通過多個(gè)學(xué)科之間的交叉與融合, 打破學(xué)科的壁壘, 從而探索新的問題、新的方法和新的應(yīng)用領(lǐng)域。從兩者的關(guān)系上來看, 交叉前沿往往會(huì)推動(dòng)研究前沿的拓展和進(jìn)步, 而研究前沿的發(fā)展也可能為交叉前沿提供更多的基礎(chǔ)和機(jī)會(huì)。
在交叉前沿識(shí)別方面, 由于交叉前沿識(shí)別的結(jié)果往往能夠產(chǎn)生較大的社會(huì)經(jīng)濟(jì)效益, 交叉前沿識(shí)別也成為當(dāng)前科技戰(zhàn)略情報(bào)研究的重要內(nèi)容之一,對(duì)于支撐重要領(lǐng)域科研創(chuàng)新的全局性、前瞻性、戰(zhàn)略性的科技戰(zhàn)略情報(bào)服務(wù)具有重要意義。目前, 交叉前沿識(shí)別研究主要從學(xué)科交叉識(shí)別和研究前沿識(shí)別兩個(gè)視角展開。
在學(xué)科交叉識(shí)別研究中, 識(shí)別方法主要分為引文分析方法和內(nèi)容分析方法。引文分析方法是通過文獻(xiàn)外部的引證關(guān)系來反映文獻(xiàn)間的知識(shí)流動(dòng)規(guī)律,它側(cè)重于分析文獻(xiàn)外部的形式特征, 如Chi R B 等[6]對(duì)文獻(xiàn)共被引網(wǎng)絡(luò)進(jìn)行聚類, 利用被引文獻(xiàn)所屬期刊的學(xué)科類別判斷文獻(xiàn)集群的學(xué)科性質(zhì), 并將學(xué)科交叉集群中高被引文獻(xiàn)主題作為學(xué)科交叉主題; 張藝蔓等[7] 將引文耦合轉(zhuǎn)變成學(xué)科耦合, 以表征學(xué)科耦合引文文獻(xiàn)的高頻關(guān)鍵詞作為學(xué)科交叉的研究熱點(diǎn); Hammarfelt B[8] 是通過利用直接引文分析法對(duì)多種期刊在不同時(shí)間段下引文變化情況進(jìn)行統(tǒng)計(jì)分析,并以此衡量期刊文獻(xiàn)的跨學(xué)科情況。但引文分析自身存在一定的局限性, 一方面, 該方法僅用于表征學(xué)科間知識(shí)的擴(kuò)散與交流路徑,是從文獻(xiàn)外部形式特征了解學(xué)科交叉態(tài)勢(shì), 并不能直接識(shí)別出交叉主題;另一方面, 引文關(guān)系形成時(shí)間長(zhǎng),故引文分析具有一定的滯后性, 無法及時(shí)準(zhǔn)確地識(shí)別新興的學(xué)科交叉主題。而內(nèi)容分析法則是對(duì)當(dāng)前的文獻(xiàn)主題進(jìn)行直接計(jì)量與分析, 它更側(cè)重于分析文獻(xiàn)內(nèi)部的形式特征, 但不能很好地體現(xiàn)文獻(xiàn)間知識(shí)流動(dòng)的具體方向, 如Gálvez C[9]以語言學(xué)和新聞傳播學(xué)領(lǐng)域?yàn)槔?通過對(duì)兩學(xué)科關(guān)鍵詞的共現(xiàn)矩陣進(jìn)行主題聚類, 并利用社會(huì)網(wǎng)絡(luò)法分析共詞網(wǎng)絡(luò)的層次結(jié)構(gòu)以探究不同主題間的交叉關(guān)聯(lián); Li M N[10] 提出, 建立共詞分析中高頻詞與突發(fā)詞之間的聯(lián)系, 并將二者結(jié)合到學(xué)科交叉識(shí)別模型中; 韓正琪等[11]則是基于Rao-Stirling 指數(shù)和LDA 模型進(jìn)行領(lǐng)域?qū)W科交叉識(shí)別, 用以發(fā)現(xiàn)學(xué)科交叉點(diǎn)和學(xué)科交叉研究主題。
在研究前沿識(shí)別研究中, 識(shí)別方法主要分為基于定性分析和定量分析的前沿識(shí)別方法, 其中定量分析一直都是學(xué)者們關(guān)注的重點(diǎn), 定量分析法可以分為引文分析法和內(nèi)容分析法。引文分析法是指利用數(shù)理統(tǒng)計(jì)的方法對(duì)論文中引文信息進(jìn)行統(tǒng)計(jì)分析,從而揭示科學(xué)研究的發(fā)展現(xiàn)狀, 如韓濤[12] 提出, 利用不同閾值層面的共被引聚類分析自動(dòng)檢測(cè)方法,以發(fā)現(xiàn)隱形研究前沿知識(shí); Liu J S 等[13] 提出, 基于文獻(xiàn)耦合網(wǎng)絡(luò)來探測(cè)科學(xué)研究前沿及發(fā)展趨勢(shì);Klavans R 等[14] 則認(rèn)為, 直接引文網(wǎng)絡(luò)整體比共被引網(wǎng)絡(luò)具有更高的相似度, 能夠更好地揭示領(lǐng)域研究發(fā)展及研究前沿。內(nèi)容分析法則是從文獻(xiàn)內(nèi)容角度入手, 直接反映學(xué)科領(lǐng)域的新發(fā)展、新思路、新研究, 如Kleinberg J[15] 提出突現(xiàn)詞檢測(cè)算法, 認(rèn)為單位時(shí)間內(nèi)出現(xiàn)頻次的增長(zhǎng)率突然加大的詞對(duì)識(shí)別該領(lǐng)域研究前沿非常重要; 周耀林等[16] 提出共詞分析法和詞頻分析法對(duì)國(guó)際圖情領(lǐng)域大數(shù)據(jù)研究主題方向與演化特征、研究熱點(diǎn)與前沿進(jìn)行剖析;白如江等[17] 綜合運(yùn)用自然語言處理技術(shù)、LDA 主題模型并構(gòu)建主題相似度、主題強(qiáng)度、主題新穎度指標(biāo)識(shí)別未來新興科學(xué)研究前沿; 劉博文等[18] 在LDA主題模型識(shí)別基礎(chǔ)上, 從主題強(qiáng)度、主題新穎性和主題相似度3 個(gè)指標(biāo)探測(cè)出研究前沿主題。通過上述分析可知, 現(xiàn)有研究的前沿主題識(shí)別方法和指標(biāo)測(cè)度通??紤]不夠全面, 僅根據(jù)研究前沿的1 個(gè)或者幾個(gè)特征構(gòu)建指標(biāo)確定前沿主題, 應(yīng)多維度、全方位、系統(tǒng)地考慮前沿主題識(shí)別指標(biāo), 從而優(yōu)化前沿主題識(shí)別效果。
綜上所述,僅從一個(gè)側(cè)面對(duì)交叉前沿進(jìn)行識(shí)別,無法全面揭示交叉前沿。引文分析的識(shí)別方法無法從細(xì)粒度視角揭示交叉前沿主題, 且在引用過程中存在自引差異值和時(shí)滯性等問題。內(nèi)容分析則無法清晰地反映學(xué)科間知識(shí)流動(dòng)的變化。此外, 目前研究中所構(gòu)建的前沿指標(biāo)體系也未能全面地體現(xiàn)前沿主題的特征, 在前沿測(cè)度維度上也亟待完善。
鑒于此,本文在重新定義的交叉前沿概念基礎(chǔ)上, 提出融合引文分析與主題分析的交叉前沿識(shí)別方法, 實(shí)現(xiàn)在充分利用引文分析反映學(xué)科間知識(shí)流動(dòng)的同時(shí), 利用主題分析反映學(xué)科間實(shí)質(zhì)性研究?jī)?nèi)容, 并構(gòu)建多維測(cè)度指標(biāo)體系, 探究更為完整的學(xué)科交叉前沿的整合過程。最后以信息科技與宇航交叉領(lǐng)域?yàn)槔?yàn)證了該方法的有效性和可行性。
2研究思路與方法
2.1研究思路
本文圍繞學(xué)科間的交叉研究, 探索兩個(gè)或兩個(gè)以上學(xué)科領(lǐng)域在知識(shí)生產(chǎn)或科學(xué)發(fā)現(xiàn)中產(chǎn)生交叉關(guān)聯(lián)的研究前沿。具體研究思路如下: 以基礎(chǔ)學(xué)科研究文獻(xiàn)為起點(diǎn), 基于兩學(xué)科的引證關(guān)系和主題聚類獲取兩者在什么主題、什么方向產(chǎn)生交叉。在此基礎(chǔ)上, 利用多維度前沿測(cè)度指標(biāo)判定兩學(xué)科的交叉融合是否催生出了新的研究前沿, 整體研究思路如圖1所示。
2.2研究方法
根據(jù)上述研究思路, 本文提出基于引文—主題雙重測(cè)度的交叉前沿識(shí)別方法, 研究方法框架如圖2所示。以先測(cè)度交叉、后測(cè)度前沿的思路設(shè)計(jì)以下3個(gè)階段, 第一階段:數(shù)據(jù)獲取及數(shù)據(jù)預(yù)處理,獲取兩個(gè)目標(biāo)學(xué)科的文獻(xiàn)資源并進(jìn)行數(shù)據(jù)清洗。第二階段:學(xué)科領(lǐng)域交叉主題識(shí)別與測(cè)度, 采用基于引文—主題的交叉主題識(shí)別方法和雙重測(cè)度指標(biāo)對(duì)目標(biāo)學(xué)科進(jìn)行主題識(shí)別與遴選。第三階段:交叉前沿識(shí)別, 構(gòu)建主題影響力、新穎度、吸引度及熱度的多維測(cè)度指標(biāo)體系, 綜合評(píng)價(jià)各指標(biāo)閾值計(jì)算交叉前沿遴選指標(biāo), 實(shí)現(xiàn)交叉前沿主題的識(shí)別。
2.2.1數(shù)據(jù)獲取及預(yù)處理
1)數(shù)據(jù)獲取
作為科技創(chuàng)新活動(dòng)、創(chuàng)新思想以及交流科學(xué)發(fā)現(xiàn)的重要載體之一, 學(xué)術(shù)論文不僅具備嚴(yán)謹(jǐn)?shù)倪壿嫼途_的數(shù)據(jù), 還蘊(yùn)含了數(shù)量龐大且內(nèi)涵豐富的研究對(duì)象。因此, 在綜合考慮研究數(shù)據(jù)的影響力、新穎性和前瞻性等因素的基礎(chǔ)上, 本文擬從兩個(gè)主要部分獲取目標(biāo)學(xué)科領(lǐng)域的學(xué)術(shù)論文。首先, 從科睿唯安ESI 數(shù)據(jù)庫(kù)中獲?。?學(xué)科領(lǐng)域的高被引研究論文(即同年度同學(xué)科中被引頻次排名前1%的論文),包括論文數(shù)據(jù)項(xiàng)、參考文獻(xiàn)等信息。其次, 從科睿唯安JCR 數(shù)據(jù)庫(kù)中提?。?學(xué)科領(lǐng)域研究期刊以及這些期刊中被引次數(shù)排名前5%的論文。由于在數(shù)據(jù)獲取過程中可能存在某期刊數(shù)據(jù)未收錄于科睿唯安數(shù)據(jù)庫(kù)內(nèi), 因此擬從WOS 數(shù)據(jù)庫(kù)中獲取。
2)數(shù)據(jù)預(yù)處理
在進(jìn)行數(shù)據(jù)存儲(chǔ)與轉(zhuǎn)化的過程中,由于不同語言之間的符號(hào)、字母、數(shù)字等存在著一定程度的差異,不可避免地會(huì)產(chǎn)生重復(fù)項(xiàng)和噪聲數(shù)據(jù), 從而導(dǎo)致原始數(shù)據(jù)的不準(zhǔn)確性和不一致性。因此,為了確保原始數(shù)據(jù)的完整性和有效性,進(jìn)而提高學(xué)科交叉前沿識(shí)別的效率和準(zhǔn)確性, 需要對(duì)研究數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,具體包括以下幾個(gè)步驟:數(shù)據(jù)項(xiàng)提取與規(guī)范化處理、去除論文內(nèi)變異數(shù)據(jù)、重復(fù)項(xiàng)及噪聲數(shù)據(jù)、數(shù)字剔除、過濾停用詞等步驟, 最后將數(shù)據(jù)統(tǒng)一存儲(chǔ)在待處理語料庫(kù)中。
2.2.2基于引文—主題雙重測(cè)度的交叉主題識(shí)別
為了充分揭示學(xué)科間的交叉內(nèi)容與交叉方向,本文提出基于引文—主題雙重測(cè)度的交叉主題識(shí)別方法, 通過引文分析法和主題分析法的結(jié)合將分立的信息進(jìn)行有機(jī)結(jié)合, 挖掘出更豐富的知識(shí)結(jié)構(gòu)和知識(shí)內(nèi)容。該方法主要包括以下3個(gè)步驟: 第一,利用層次聚類算法獲取兩學(xué)科領(lǐng)域研究主題。第二,通過主題相似度計(jì)算和引文矩陣計(jì)算獲取學(xué)科間的主題交叉度和引文交叉度。第三, 以主題交叉度和引文交叉度為基礎(chǔ), 構(gòu)建基于引文—主題的交叉主題測(cè)度指標(biāo)。具體操作流程如圖3所示。
1)基于主題聚類的交叉主題識(shí)別
利用主題聚類算法實(shí)現(xiàn)各學(xué)科領(lǐng)域論文的主題識(shí)別, 旨在實(shí)現(xiàn)細(xì)粒度地解讀學(xué)科交叉的實(shí)質(zhì)性內(nèi)容, 揭示學(xué)科交叉主題的內(nèi)在聯(lián)系。首先, 本文采用層次聚類算法對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行主題識(shí)別。層次聚類算法是聚類分析中最常見的算法之一,它通過逐步合并或切分簇的方式實(shí)現(xiàn)主題聚類[19] 。
6)交叉前沿主題遴選。為了輔助交叉前沿主題的遴選, 將Cross-Topic和Cross-Front 兩個(gè)指標(biāo)進(jìn)行交叉組合, 構(gòu)建戰(zhàn)略坐標(biāo)圖, 如圖4 所示, 其中x軸表示Cross-Topic, y軸表示Cross-Front。由此, 將交叉前沿主題劃分為熱點(diǎn)交叉前沿、新興交叉前沿、潛在交叉前沿以及衰弱交叉前沿4 種類型。
由圖4 所知, 新興交叉前沿主題具有較高的交叉程度和前沿指數(shù), 表明這些主題近期內(nèi)興起并展現(xiàn)出較高的交叉研究熱度; 熱點(diǎn)交叉前沿主題雖交叉程度高, 但前沿指數(shù)較低, 說明這些主題在過去一段時(shí)間內(nèi)已受到廣泛關(guān)注, 并正逐漸走向成熟;潛在交叉前沿主題交叉程度較低但前沿指數(shù)高, 顯示出這些主題具有較大的交叉研究潛力;而衰弱交叉前沿主題則在交叉程度和前沿指數(shù)上均表現(xiàn)不佳,表明這些主題的研究熱度正在減退, 或部分主題突然出現(xiàn), 并未得到學(xué)術(shù)界的重視。
3實(shí)證研究
3.1實(shí)驗(yàn)環(huán)境
1)硬件: Samsung SSD 870,Intel(R)Xeon(R) CPU E5-2678 v3 @ 2.50GHz, GPU: NVIDIATesla K80。
2) 軟件平臺(tái): 矩池云、Excel、Python。
3.2研究數(shù)據(jù)集構(gòu)建與預(yù)處理
自進(jìn)入21世紀(jì)以來, 全球科技創(chuàng)新進(jìn)入空前密集活躍的時(shí)期, 信息科技領(lǐng)域作為創(chuàng)新的高發(fā)地帶, 成為全球各國(guó)(地區(qū))政府、機(jī)構(gòu)、組織創(chuàng)新的競(jìng)爭(zhēng)高地, 是全球研發(fā)投入最集中、與各領(lǐng)域交叉融合最多的領(lǐng)域。與此同時(shí), 宇航領(lǐng)域是當(dāng)今世界最具挑戰(zhàn)性和廣泛帶動(dòng)性的高科技領(lǐng)域之一。近年來, 為解決宇航領(lǐng)域的科學(xué)問題和突破宇航領(lǐng)域的技術(shù)難題, 宇航領(lǐng)域與信息科技領(lǐng)域的交叉融合給兩個(gè)學(xué)科領(lǐng)域帶來了新的內(nèi)生動(dòng)力。因此, 本文以探索信息科技領(lǐng)域中宇航交叉方向?yàn)槔?對(duì)其交叉前沿開展識(shí)別研究。
3.2.1研究數(shù)據(jù)集構(gòu)建
本文采用的數(shù)據(jù)源包括信息科技領(lǐng)域和宇航領(lǐng)域的科技論文數(shù)據(jù), 具體獲取途徑如下:1) 信息科技領(lǐng)域: 首先, 從ESI 數(shù)據(jù)庫(kù)中獲取“Computer Science” 領(lǐng)域2012—2022年所有高被引論文, 共獲取5 256條數(shù)據(jù), 下載時(shí)間為2023年4 月; 其次, 由于該數(shù)據(jù)中不包含各論文參考文獻(xiàn), 因此, 通過Web of Science(WOS)數(shù)據(jù)庫(kù)獲取,檢索式為(WC =(Computer Science, Artificial Intel?ligence) OR WC =(Computer Science, Cybernetics)OR WC = (Computer Science, Hardware & Architec?ture) OR WC=(Computer Science, Information Sys?tems) OR WC=(Computer Science, InterdisciplinaryApplications) OR WC=(Computer Science, SoftwareEngineering) OR WC = (Computer Science, Theory& Methods)), 以2012—2022 年為時(shí)間范圍, 篩選ESI 高水平論文并選擇題名、關(guān)鍵詞、摘要、被引頻次、參考文獻(xiàn)、出版年份等數(shù)據(jù)項(xiàng), 共獲?。?165條數(shù)據(jù); 最后, 以獲取的5 256條數(shù)據(jù)為基準(zhǔn)篩選從WOS數(shù)據(jù)庫(kù)中獲取的數(shù)據(jù), 獲得本文信息科技領(lǐng)域(包含數(shù)據(jù)項(xiàng)參考文獻(xiàn))實(shí)驗(yàn)數(shù)據(jù)為5 256條。
2) 宇航領(lǐng)域: 從JCR 數(shù)據(jù)庫(kù)中獲?。牛危牵桑危牛牛?ING、AEROSPACE 下的34 本期刊, 并在WOS 數(shù)據(jù)庫(kù)獲取宇航領(lǐng)域相關(guān)論文, 檢索式為(WC=(En?gineering, Aerospace)), 以2012—2022 年為時(shí)間范圍, 并按照每年被引次數(shù)倒序排序, 取每年被引次數(shù)前5%的論文, 共獲取數(shù)據(jù)4531條。
3.2.2數(shù)據(jù)預(yù)處理
本文對(duì)上述獲取的數(shù)據(jù)集進(jìn)行統(tǒng)一字母、去除亂碼、題名中數(shù)字剔除、過濾停用詞、刪除無用數(shù)據(jù)項(xiàng)、空缺數(shù)據(jù)項(xiàng)補(bǔ)齊等數(shù)據(jù)梳理工作, 最后共保留信息科技領(lǐng)域5256條數(shù)據(jù)、宇航領(lǐng)域4 531條數(shù)據(jù)、宇航領(lǐng)域34 種期刊, 并且各數(shù)據(jù)項(xiàng)完整。
3.3交叉主題識(shí)別結(jié)果
經(jīng)過上述預(yù)處理工作以后, 本文分別對(duì)信息科技領(lǐng)域和宇航領(lǐng)域進(jìn)行主題識(shí)別, 并通過主題分析法和引文分析法獲得其交叉主題, 最后根據(jù)基于引文—主題的交叉測(cè)度指標(biāo)遴選信息科技領(lǐng)域的交叉主題(宇航交叉方向)。
3.3.1基于層次聚類算法的學(xué)科主題識(shí)別
本文選用“題名” 作為本次實(shí)驗(yàn)的文本語料庫(kù),首先對(duì)信息科技領(lǐng)域和宇航領(lǐng)域進(jìn)行輪廓系數(shù)計(jì)算,獲得合理范圍內(nèi)最佳主題個(gè)數(shù)。其中, 為避免主題數(shù)目過多導(dǎo)致實(shí)驗(yàn)結(jié)果不準(zhǔn)確, 將主題個(gè)數(shù)范圍確定在[1,150]之間。計(jì)算結(jié)果如圖5 所示。
由圖5可以看出, 信息科技領(lǐng)域與宇航領(lǐng)域的最佳主題個(gè)數(shù)分別為149和132。根據(jù)其計(jì)算結(jié)果,分別設(shè)定信息科技領(lǐng)域和宇航領(lǐng)域兩組數(shù)據(jù)集的主題聚類數(shù)為149和132, 利用層次聚類算法實(shí)現(xiàn)兩個(gè)學(xué)科領(lǐng)域的主題識(shí)別, 其結(jié)果如表1和表2所示。
3.3.2基于引文—主題的交叉主題識(shí)別
1) 基于層次聚類的交叉主題識(shí)別結(jié)果
在得到信息科技領(lǐng)域與宇航領(lǐng)域的主題識(shí)別結(jié)果后, 本文根據(jù)2.2.2余弦相似度計(jì)算式(2) 進(jìn)行主題間的相似度計(jì)算, 即主題交叉度, 并取每個(gè)信息科技領(lǐng)域主題與宇航領(lǐng)域主題的最大值, 計(jì)算結(jié)果如表3 所示。
2) 基于引文矩陣的交叉主題識(shí)別結(jié)果
根據(jù)前面數(shù)據(jù)集構(gòu)建的過程, 首先對(duì)信息科技領(lǐng)域所有論文進(jìn)行引文和主題數(shù)據(jù)項(xiàng)的處理。根據(jù)2.2.2提出的基于引文矩陣的交叉主題識(shí)別方法,先構(gòu)建信息科技領(lǐng)域文獻(xiàn)—主題一模矩陣和文獻(xiàn)—引文一模矩陣, 計(jì)算結(jié)果如表4和表5所示。
基于文獻(xiàn)—主題和文獻(xiàn)—引文兩個(gè)一模矩陣,利用Python編碼, 對(duì)文獻(xiàn)—主題一模矩陣進(jìn)行轉(zhuǎn)置運(yùn)算形成主題—文獻(xiàn)一模矩陣, 再將文獻(xiàn)—主題和文獻(xiàn)—引文兩個(gè)矩陣進(jìn)行乘積運(yùn)算, 得到一個(gè)引文—主題二模矩陣, 表示為信息技術(shù)領(lǐng)域中每個(gè)主題所引用宇航領(lǐng)域的各期刊數(shù)目, 部分結(jié)果如表6所示。
最終,根據(jù)該二模矩陣結(jié)果, 計(jì)算信息技術(shù)領(lǐng)域各主題下引用宇航領(lǐng)域論文的總數(shù), 即引文交叉度, 計(jì)算結(jié)果如表7 所示。
3)基于引文—主題的學(xué)科交叉測(cè)度計(jì)算結(jié)果
基于上述獲得的主題交叉度和引文交叉度的計(jì)算結(jié)果, 引用2.2.2構(gòu)建的引文—主題的學(xué)科交叉測(cè)度計(jì)算式(4),計(jì)算信息科技領(lǐng)域各主題Cross-Topici值,根據(jù)其計(jì)算結(jié)果遴選交叉主題, 部分計(jì)算結(jié)果如表8所示。
3.4交叉前沿識(shí)別結(jié)果及分析
根據(jù)學(xué)科領(lǐng)域交叉主題識(shí)別結(jié)果, 遴選交叉前沿主題, 依據(jù)2 2 3 構(gòu)建的多維測(cè)度指標(biāo)體系,對(duì)學(xué)科交叉結(jié)果進(jìn)行主題影響力、新穎度、吸引度和熱度計(jì)算, 并對(duì)指標(biāo)進(jìn)行歸一化處理。同時(shí), 利用CRITIC 法計(jì)算各交叉前沿主題指標(biāo)的權(quán)重, 如表9所示。
計(jì)算交叉前沿遴選指標(biāo)Cross-Front值, 遴選交叉前沿主題, 其結(jié)果如表10 所示。同時(shí), 結(jié)合Cross-Topic 值繪制交叉前沿主題的戰(zhàn)略坐標(biāo)圖, 如圖6 所示。
可以看出, 新興交叉前沿包含CS_3、CS_24、CS_1 等28 個(gè)主題; 熱點(diǎn)交叉前沿包含CS_124、CS_98、CS_91 等42 個(gè)主題; 潛在交叉前沿包含CS_60、CS_11、CS_86 等23 個(gè)主題; 衰弱交叉前沿包含CS_78、CS_47、CS_9 等56 個(gè)主題, 具體主題分類如表11 所示。
1) 新興交叉前沿
該類主題是信息科技領(lǐng)域近段時(shí)期出現(xiàn)并得到廣泛關(guān)注的主題, 并且與宇航領(lǐng)域展開交叉研究。通過對(duì)該類主題對(duì)應(yīng)的主題詞分析發(fā)現(xiàn), 該類主題主要集中于用于圖像檢測(cè)的深度學(xué)習(xí)技術(shù)、多智能體系統(tǒng)一致性跟蹤控制、無人機(jī)無線通信技術(shù), 以及鯨魚、布谷鳥等群體智能優(yōu)化技術(shù)等內(nèi)容的研究上。以主題CS_1為例, 其具體的主題關(guān)鍵詞如表12所示。主題CS_1與宇航領(lǐng)域交叉研究的主要內(nèi)容為將多智能體系統(tǒng)一致性跟蹤控制技術(shù)應(yīng)用于宇航領(lǐng)域研究中飛行器編隊(duì)中的隊(duì)形、飛行器跟蹤的姿態(tài)以及群體集會(huì)中的最終目的地等內(nèi)容。經(jīng)過專家判讀和查閱相關(guān)專業(yè)研究文獻(xiàn)后認(rèn)為智能體系統(tǒng)一致性跟蹤控制技術(shù)的核心是設(shè)計(jì)每個(gè)智能體與其相鄰?fù)ㄐ诺闹悄荏w之間的信息交換規(guī)則, 可助力多顆航天器協(xié)同工作, 共同完成統(tǒng)一任務(wù), 這也是航天器編隊(duì)的本質(zhì)特點(diǎn)。近年來, 國(guó)內(nèi)外將該技術(shù)方法廣泛應(yīng)用于宇航領(lǐng)域研究中, 展示出了巨大的應(yīng)用發(fā)展前景, 是當(dāng)前的一大新興交叉前沿。
2) 熱點(diǎn)交叉前沿
該類主題是信息科技領(lǐng)域過去一段時(shí)間內(nèi)出現(xiàn)并開展研究的主題, 已經(jīng)與宇航領(lǐng)域展開較多的交叉研究。通過對(duì)該類主題詞分析發(fā)現(xiàn), 該類主題主要集中于無線智能通信技術(shù)、面向智能決策的多目標(biāo)優(yōu)化技術(shù)、人工神經(jīng)網(wǎng)絡(luò)和有限元方法等。以主題CS_17為例,其具體的主題關(guān)鍵詞如表13所示。
主題CS_17與宇航領(lǐng)域交叉研究的主要內(nèi)容為面向智能決策的多目標(biāo)優(yōu)化技術(shù), 主要包括在軌對(duì)接與裝配、天體組合運(yùn)行和航天器損傷紅外檢測(cè)等。經(jīng)過專家判讀和查閱相關(guān)專業(yè)研究文獻(xiàn)后, 認(rèn)為面向智能決策的多目標(biāo)優(yōu)化技術(shù)過去一段時(shí)間內(nèi)在宇航領(lǐng)域研究中應(yīng)用頗多, 例如通過設(shè)置任務(wù)優(yōu)先級(jí)融合多目標(biāo)并采用基于主任務(wù)零空間的方法實(shí)現(xiàn)對(duì)碰前軌跡的優(yōu)化、針對(duì)天宮二號(hào)/ 神舟十一號(hào)任務(wù)組合體運(yùn)行與飛船返回要求, 建立多目標(biāo)特征參數(shù)的控制方程等, 其相關(guān)研究已經(jīng)趨于成熟。
3)潛在交叉前沿
該類主題是信息科技領(lǐng)域近段時(shí)間內(nèi)出現(xiàn)并受到廣泛關(guān)注的主題, 但未與宇航領(lǐng)域展開較多的交叉研究,還有較大的交叉研究潛力。通過對(duì)該類主題對(duì)應(yīng)的主題詞分析發(fā)現(xiàn),該類主題主要集中于異構(gòu)云無線接入網(wǎng)絡(luò)技術(shù)、“區(qū)塊鏈+物聯(lián)網(wǎng)” 去中心化技術(shù)、智能邊緣計(jì)算技術(shù)、大規(guī)模的MIMO通信系統(tǒng)等。以主題BFCS_60為例, 其具體的主題關(guān)鍵詞如表14所示。
主題CS_60與宇航領(lǐng)域交叉研究的主要內(nèi)容為將智能邊緣計(jì)算技術(shù)應(yīng)用于地面和空間數(shù)據(jù)分析,該技術(shù)與機(jī)器學(xué)習(xí)相結(jié)合, 通過為連接有限或沒有連接的獨(dú)特站點(diǎn)提供核心功能, 使它們能夠在本地處理和分析數(shù)據(jù)。經(jīng)過專家判讀和查閱相關(guān)專業(yè)研究文獻(xiàn)后認(rèn)為智能邊緣計(jì)算技術(shù)具備較強(qiáng)的星載計(jì)算能力, 未來通信衛(wèi)星結(jié)合邊緣計(jì)算技術(shù)有望突破傳統(tǒng)的“轉(zhuǎn)發(fā)器” 概念, 將部分計(jì)算、存儲(chǔ)、通信、網(wǎng)絡(luò)與感知任務(wù)沉降到衛(wèi)星邊緣完成在軌處理, 實(shí)現(xiàn)通信、計(jì)算有效融合, 有效提高服務(wù)響應(yīng)速度,降低多源數(shù)據(jù)回傳造成的通信壓力, 擺脫對(duì)地面系統(tǒng)依賴。因此, 該技術(shù)方法在宇航領(lǐng)域有較好的發(fā)展前景。
4)衰退交叉前沿
該類主題是信息科技領(lǐng)域過去一段時(shí)間出現(xiàn),并且與宇航領(lǐng)域展開少量研究的交叉主題。通過對(duì)該類主題對(duì)應(yīng)的主題詞分析發(fā)現(xiàn), 該類主題主要集中于無線傳感器網(wǎng)絡(luò)技術(shù)、網(wǎng)絡(luò)功能虛擬化技術(shù)、蜂窩網(wǎng)絡(luò)技術(shù)等。以主題CS_63為例, 其具體的主題關(guān)鍵詞如表15所示。
主題CS_63與宇航領(lǐng)域交叉研究的主要內(nèi)容為將無線傳感器網(wǎng)絡(luò)技術(shù)應(yīng)用于飛行器結(jié)構(gòu)健康監(jiān)測(cè)、航天器控制、衛(wèi)星控制系統(tǒng)、空間環(huán)境檢測(cè)等。經(jīng)過專家判讀和查閱相關(guān)專業(yè)研究文獻(xiàn)后認(rèn)為, 目前無線傳感器網(wǎng)絡(luò)技術(shù)在航天領(lǐng)域的應(yīng)用取得成就的同時(shí)也存在一些局限, 例如, 由于差分衛(wèi)星信號(hào)的傳播距離較短,要求鏈路傳輸質(zhì)量非常高, 這可能會(huì)對(duì)無線傳感器網(wǎng)絡(luò)的應(yīng)用產(chǎn)生限制。同時(shí), 隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷擴(kuò)展, 過去較為成熟的無線傳感器網(wǎng)絡(luò)技術(shù)無法適應(yīng)當(dāng)前宇航領(lǐng)域相關(guān)研究, 需要更深層次的研究與創(chuàng)新。
4結(jié)論
圍繞學(xué)科間的交叉前沿識(shí)別, 本文首先梳理了交叉前沿的相關(guān)概念, 并給出交叉前沿的基本概念和特征。同時(shí), 通過對(duì)學(xué)科交叉和研究前沿的識(shí)別方法進(jìn)行歸納和總結(jié),提出了基于引文—主題雙重測(cè)度的交叉前沿識(shí)別方法, 并選取信息科技領(lǐng)域和宇航領(lǐng)域作為實(shí)證對(duì)象,呈現(xiàn)了以引文分析法和主題分析法相結(jié)合的交叉前沿識(shí)別過程。其中,基于引文—主題的交叉主題識(shí)別方法是在主題層次識(shí)別和構(gòu)建引文矩陣的基礎(chǔ)上進(jìn)行指標(biāo)計(jì)算,該方法不但可以充分地揭示學(xué)科間實(shí)質(zhì)性交叉主題, 更能夠通過引文—主題矩陣反映學(xué)科間知識(shí)流動(dòng)情況。另外,通過構(gòu)建主題新穎度、熱度、吸引度和影響力的多維測(cè)度指標(biāo)體系, 綜合評(píng)價(jià)了學(xué)科交叉主題的前沿程度,并根據(jù)戰(zhàn)略坐標(biāo)圖結(jié)果遴選出新興交叉前沿、熱點(diǎn)交叉前沿、潛在交叉前沿和衰弱交叉前沿主題。
對(duì)信息科技領(lǐng)域(宇航領(lǐng)域交叉方向)進(jìn)行驗(yàn)證的實(shí)驗(yàn)結(jié)果表明,本文提出的學(xué)科間交叉前沿識(shí)別方法可以有效地識(shí)別出蘊(yùn)含在跨學(xué)科交流過程中的交叉主題和交叉前沿,有助于前瞻性分析各學(xué)科領(lǐng)域的知識(shí)交流方向和研究前沿主題, 能夠?yàn)槲覈?guó)宏觀科技戰(zhàn)略決策和領(lǐng)域科技創(chuàng)新提供證據(jù)支持,前沿謀劃重大前沿交叉領(lǐng)域, 突破核心技術(shù)難點(diǎn),在全球創(chuàng)新變局中力爭(zhēng)主動(dòng), 搶占未來科技制高點(diǎn)。