趙 姝 郭雙瑞 褚曉泉 仇 瑜 劉姝伶
(1.智能計(jì)算與信號(hào)處理重點(diǎn)實(shí)驗(yàn)室,安徽合肥 230601;2.安徽大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,安徽合肥 230601;3.安徽省信息材料與智能傳感實(shí)驗(yàn)室,安徽合肥 230601;4.清華大學(xué)計(jì)算機(jī)系,北京 100084;5.北京智譜華章科技有限公司,北京 100084)
自1995年美國(guó)哈佛大學(xué)教授Christensen提出顛覆性技術(shù)(Disruptive Technology)概念[1]以來(lái),引起了科研、產(chǎn)業(yè)等多方討論。顛覆性技術(shù)以其對(duì)市場(chǎng)和科技領(lǐng)域的革命性影響而聞名,通常表現(xiàn)為對(duì)舊技術(shù)的淘汰和新技術(shù)的嶄露頭角,主要的表現(xiàn)方式包括對(duì)已有技術(shù)的突破和由學(xué)科交叉而誕生的具備創(chuàng)新性的技術(shù)。顛覆性技術(shù)的概念在不同學(xué)者和領(lǐng)域有不同解讀。一種觀點(diǎn)是強(qiáng)調(diào)顛覆性技術(shù)改變市場(chǎng)格局,另一種觀點(diǎn)是著重于技術(shù)本身的革新。如智能手機(jī)的崛起淘汰了傳統(tǒng)手機(jī)行業(yè),傳統(tǒng)汽車產(chǎn)業(yè)也面臨混合動(dòng)力的新能源汽車技術(shù)帶來(lái)的挑戰(zhàn)。
鑒于顛覆性技術(shù)對(duì)經(jīng)濟(jì)發(fā)展和國(guó)家競(jìng)爭(zhēng)力產(chǎn)生的重大影響,各國(guó)相繼把培育和支持顛覆性技術(shù)發(fā)展列為戰(zhàn)略重點(diǎn)。美國(guó)在1958年設(shè)立國(guó)防預(yù)先研究計(jì)劃局(DARPA),先后在互聯(lián)網(wǎng)、隱身技術(shù)等領(lǐng)域開(kāi)展顛覆性技術(shù)預(yù)測(cè)和發(fā)展管理[2]。日本內(nèi)閣府與科學(xué)技術(shù)振興機(jī)構(gòu)聯(lián)合推行“顛覆性創(chuàng)新計(jì)劃”(ImPACT)和登月型研發(fā)制度來(lái)找尋顛覆性技術(shù),期望以此對(duì)社會(huì)創(chuàng)新管理體系進(jìn)行根本性變革[3]。在創(chuàng)新驅(qū)動(dòng)的時(shí)代背景下,黨的十九大報(bào)告明確提出,我國(guó)必須加強(qiáng)建設(shè)創(chuàng)新型國(guó)家的進(jìn)程,突出顛覆性技術(shù)創(chuàng)新,將顛覆性技術(shù)研究與發(fā)展作為重點(diǎn)工作研究課題[4]。
由于顛覆性技術(shù)本身具有不確定性、突變性等特點(diǎn),對(duì)其進(jìn)行識(shí)別則要求研究人員對(duì)科學(xué)技術(shù)預(yù)測(cè)方法有透徹的了解,同時(shí)要有相對(duì)應(yīng)領(lǐng)域的知識(shí)儲(chǔ)備。綜合來(lái)看,當(dāng)代技術(shù)創(chuàng)新過(guò)程日益復(fù)雜,各國(guó)相關(guān)部門、各學(xué)科學(xué)者對(duì)顛覆性技術(shù)的識(shí)別面臨諸多挑戰(zhàn)。目前,主流的識(shí)別方法包括專家研判法和模型預(yù)測(cè)法,但它們都存在一定的局限性。專家研判法容易受到主觀因素的干擾,模型預(yù)測(cè)法雖然減少了主觀性,但現(xiàn)有方法的分析維度相對(duì)有限。
專家研判法是一種以專家知識(shí)為基礎(chǔ)的方法,常用方法包括德?tīng)柗品?、技術(shù)路線圖法和情景分析法等。專家咨詢所帶來(lái)的系統(tǒng)性主觀偏見(jiàn),致使這個(gè)方法難以消除這種偏見(jiàn)[5]。模型預(yù)測(cè)法依靠論文、專利等科技大數(shù)據(jù),通過(guò)分析數(shù)據(jù)特征進(jìn)行顛覆性技術(shù)識(shí)別,能夠有效避免主觀因素帶來(lái)的影響,提升識(shí)別過(guò)程的科學(xué)性和可解釋性[6]。但是,現(xiàn)有方法分析維度有限,尚未形成系統(tǒng)的、通用的和可操作性強(qiáng)的面向科技大數(shù)據(jù)的顛覆性技術(shù)識(shí)別方法。因此,辨析顛覆性技術(shù)內(nèi)在含義,把握其本質(zhì)特征,利用科學(xué)的文獻(xiàn)計(jì)量和智能數(shù)據(jù)分析方法,實(shí)現(xiàn)從科技大數(shù)據(jù)中挖掘顛覆性技術(shù),是亟待解決的重點(diǎn)難題。
鑒于此,本文深入分析顛覆性技術(shù)的本質(zhì)特征,構(gòu)建一種多維度識(shí)別算法,以科技大數(shù)據(jù)為基礎(chǔ),實(shí)現(xiàn)對(duì)顛覆性技術(shù)的定量評(píng)估與挖掘。首先,本文總結(jié)現(xiàn)有的顛覆性技術(shù)的識(shí)別方法,厘清現(xiàn)有方法的不足和突破點(diǎn);然后,基于科技文獻(xiàn)的引文構(gòu)建引文網(wǎng)絡(luò),針對(duì)科技引文網(wǎng)絡(luò)的引文結(jié)構(gòu)、時(shí)序化特征、跨領(lǐng)域影響力和技術(shù)時(shí)效性,設(shè)計(jì)技術(shù)突破性、創(chuàng)新性、領(lǐng)域影響力、科技文獻(xiàn)影響力4個(gè)維度的識(shí)別指標(biāo),并采用熵權(quán)法進(jìn)行指標(biāo)計(jì)算結(jié)果融合,實(shí)現(xiàn)面向科技大數(shù)據(jù)的顛覆性技術(shù)多維度識(shí)別算法。本文在兩個(gè)典型領(lǐng)域進(jìn)行實(shí)驗(yàn),驗(yàn)證了此方法的有效性,為科技評(píng)估中顛覆性技術(shù)識(shí)別任務(wù)提供可靠的工具。
截至目前,專家研判法仍是顛覆性技術(shù)識(shí)別研究中普遍使用的方法。在對(duì)具體問(wèn)題的領(lǐng)域現(xiàn)狀進(jìn)行調(diào)研的基礎(chǔ)上,匯集領(lǐng)域權(quán)威專家的力量,以發(fā)放問(wèn)卷、開(kāi)展研討會(huì)等方式進(jìn)行顛覆性技術(shù)的定位和預(yù)測(cè),是面臨宏觀分析需求時(shí)重要的應(yīng)對(duì)方式。德?tīng)柗品ǎ―elphi Method)、技術(shù)路線圖法(Technology Roadmap)和情景分析法(Scenario Analysis)是具有代表性的專家研判方法。
(1)德?tīng)柗品ㄊ且环N典型的方法,以專家意見(jiàn)為基礎(chǔ),首先設(shè)計(jì)技術(shù)領(lǐng)域的調(diào)查問(wèn)卷,然后邀請(qǐng)領(lǐng)域?qū)<疫M(jìn)行回答,意見(jiàn)在多輪征詢中趨于一致,從而決策未來(lái)技術(shù)發(fā)展方向,目前已經(jīng)廣泛應(yīng)用于不同領(lǐng)域的研究中。李曉龍等[7]、但智鋼等[8]以不同領(lǐng)域顛覆性技術(shù)預(yù)測(cè)為研究目標(biāo),分別利用德?tīng)柗品▽?duì)顛覆性技術(shù)進(jìn)行分析;Kostoff等[9]采用德?tīng)柗品ńY(jié)合文本挖掘,將潛在的顛覆性技術(shù)從科技文獻(xiàn)中識(shí)別出來(lái)。從研究結(jié)果可以看出,德?tīng)柗品艹浞掷妙I(lǐng)域權(quán)威專家意見(jiàn),具有較強(qiáng)的說(shuō)服力。但是,這類方法的預(yù)測(cè)結(jié)果完全依賴于專家的主觀意見(jiàn)和知識(shí)經(jīng)驗(yàn),具有很強(qiáng)的主觀性與局限性。
(2)技術(shù)路線圖是一種圖形化、結(jié)構(gòu)清晰的技術(shù)規(guī)劃管理工具,以便實(shí)現(xiàn)技術(shù)規(guī)劃的結(jié)構(gòu)化管理。利用探索技術(shù)、產(chǎn)品和市場(chǎng)之間的動(dòng)態(tài)變化關(guān)系,發(fā)掘關(guān)鍵技術(shù)。技術(shù)路線圖作為有益的工具,能夠幫助學(xué)者探測(cè)技術(shù)性能在時(shí)間演進(jìn)中的變化和躍遷,進(jìn)而識(shí)別顛覆性技術(shù)。Uchihira[10]從技術(shù)的基本特征功能出發(fā),通過(guò)預(yù)測(cè)目標(biāo)市場(chǎng)的延伸功能需求,尋找可以應(yīng)用技術(shù)的基本功能的市場(chǎng)。Momeni等[11]利用技術(shù)路線圖評(píng)估光伏產(chǎn)業(yè)中具有潛力的顛覆性技術(shù),并制定合理的專利發(fā)展路徑。但是,在構(gòu)建技術(shù)路線圖的過(guò)程中需要考慮在技術(shù)、市場(chǎng)、支撐條件等多方面因素,存在不確定性且耗時(shí)耗力,在對(duì)顛覆性技術(shù)進(jìn)行識(shí)別時(shí),結(jié)果的客觀性可能會(huì)受到一些影響。
(3)情景分析法是一種基于對(duì)某種現(xiàn)象或趨勢(shì)進(jìn)行假設(shè)的預(yù)測(cè)方法,可以預(yù)測(cè)未來(lái)可能出現(xiàn)的情況。2014年,《游戲規(guī)則改變者:顛覆性技術(shù)與美國(guó)國(guó)防戰(zhàn)略》報(bào)告由新美國(guó)安全中心發(fā)布,對(duì)未來(lái)可能出現(xiàn)的技術(shù)應(yīng)用情況進(jìn)行情景分析,并研究顛覆性技術(shù)的需求和相對(duì)障礙,以實(shí)現(xiàn)技術(shù)識(shí)別[12]。Schoemaker等[13]認(rèn)為情景規(guī)劃法可以把握技術(shù)與市場(chǎng)之間的動(dòng)態(tài)關(guān)系,預(yù)測(cè)新興技術(shù)趨勢(shì),引導(dǎo)企業(yè)技術(shù)投資。但是,運(yùn)用情景分析法進(jìn)行預(yù)測(cè)需要投入大量時(shí)間和精力獲取外部環(huán)境信息,對(duì)專家的要求較高,實(shí)際應(yīng)用上存在一定的困難。
在人工智能和大數(shù)據(jù)飛速發(fā)展的新時(shí)代,面對(duì)國(guó)家和企業(yè)對(duì)顛覆性技術(shù)預(yù)測(cè)的迫切需求,從科技大數(shù)據(jù)中挖掘潛藏信息,彌補(bǔ)專家研判在科學(xué)性、客觀性方面的不足,已經(jīng)成為科技管理和技術(shù)預(yù)測(cè)的新趨勢(shì)。因此,基于數(shù)據(jù)和模型的預(yù)測(cè)方法已成為這個(gè)領(lǐng)域關(guān)注的重點(diǎn)。
科技數(shù)據(jù),如專利和論文,包含了豐富的技術(shù)信息??茖W(xué)創(chuàng)新思想往往最初通過(guò)科學(xué)論文呈現(xiàn)。將科技大數(shù)據(jù)作為基礎(chǔ),并采用深度學(xué)習(xí)算法挖掘信息,進(jìn)而對(duì)技術(shù)領(lǐng)域進(jìn)行預(yù)測(cè),被認(rèn)為是更客觀的顛覆性技術(shù)識(shí)別方法。目前,常見(jiàn)的方法有主題分析法(Thematic Analysis)、數(shù)據(jù)分析法(Data Analysis)和指標(biāo)評(píng)估法(Index Evaluation)等。
(1)主題分析法是一種用于文本形式的數(shù)據(jù)分析方法,首先對(duì)科技文獻(xiàn)主題概念進(jìn)行提取,然后采用定量方法對(duì)不同的主題進(jìn)行提煉與取舍,從而實(shí)現(xiàn)技術(shù)識(shí)別。石慧等[14]借助多主題融合的思想,對(duì)論文數(shù)據(jù)中主題詞的變更進(jìn)行分析,同時(shí)結(jié)合專利手工代碼的突變監(jiān)測(cè),實(shí)現(xiàn)對(duì)顛覆性技術(shù)的識(shí)別。Momeni等[15]利用主題模型和聚類分析相結(jié)合的方法,對(duì)專利技術(shù)路徑進(jìn)行分析,進(jìn)而實(shí)現(xiàn)對(duì)顛覆性技術(shù)的識(shí)別。Dotsika等[16]利用詞頻網(wǎng)絡(luò)共現(xiàn)分析方法,探究科學(xué)文獻(xiàn)的時(shí)間演化,包括主題和結(jié)構(gòu)的變化。但是,這類方法對(duì)技術(shù)的識(shí)別以主題為單位,實(shí)現(xiàn)了基于數(shù)據(jù)的分析和識(shí)別,適合宏觀的評(píng)估需求,容易在分析過(guò)程中忽略具有發(fā)展?jié)摿Φ募?xì)粒度技術(shù)點(diǎn)。
(2)數(shù)據(jù)分析法是數(shù)據(jù)分析模型的應(yīng)用,也是顛覆性技術(shù)識(shí)別重要方法[17]。黃魯成等[18]在專利分析中嘗試將物種入侵模型應(yīng)用于顛覆性技術(shù)的識(shí)別。Cheng等[19]運(yùn)用SIRS傳染病模型,探究顛覆性技術(shù)的爆發(fā)規(guī)律,并從不同角度分析這個(gè)現(xiàn)象。Adner[20]利用用戶需求構(gòu)建的量化分析模型,識(shí)別顛覆性技術(shù)發(fā)生作用的條件。Sood等[21]提出技術(shù)顛覆性風(fēng)險(xiǎn)模型,利用風(fēng)險(xiǎn)系數(shù)預(yù)測(cè)顛覆性技術(shù)。但是,由于不同領(lǐng)域之間的知識(shí)內(nèi)涵存在差異,很多研究無(wú)法直接應(yīng)用于科技領(lǐng)域,同時(shí)對(duì)于知識(shí)擴(kuò)散的測(cè)度研究較少,所得結(jié)論在指導(dǎo)實(shí)踐方面還有待深入。
(3)指標(biāo)評(píng)估法是對(duì)顛覆性技術(shù)的產(chǎn)生機(jī)理與變革特征進(jìn)行分析,聚焦于技術(shù)的原理性突破、技術(shù)集成與跨領(lǐng)域應(yīng)用。這個(gè)方法以論文、專利等作為數(shù)據(jù)基礎(chǔ),在傳統(tǒng)情報(bào)研究方法的基礎(chǔ)上,建立多種定量指標(biāo)的評(píng)價(jià)機(jī)制來(lái)識(shí)別顛覆性技術(shù),并結(jié)合一定數(shù)量的技術(shù)實(shí)例對(duì)其進(jìn)行驗(yàn)證。Kaplan等[22]、馬榮康等[23]將利用專利被引次數(shù)作為衡量顛覆性技術(shù)的依據(jù)。根據(jù)Martino[24]等的觀點(diǎn),以及褚曉泉等[25]的研究,利用不同的文獻(xiàn)類型可以反映不同的技術(shù)發(fā)展階段,如SCI論文反映技術(shù)研究的基礎(chǔ)階段,EI論文反映技術(shù)研究的應(yīng)用階段,專利數(shù)據(jù)則反映技術(shù)研究的試驗(yàn)發(fā)展階段,從而對(duì)顛覆性技術(shù)繼續(xù)識(shí)別。Park等[26]基于引文網(wǎng)絡(luò)提出的CD指標(biāo)對(duì)顛覆性技術(shù)的突破性進(jìn)行衡量,實(shí)現(xiàn)了從引文網(wǎng)絡(luò)結(jié)構(gòu)層面的顛覆性技術(shù)識(shí)別,被廣泛應(yīng)用于顛覆性技術(shù)分析任務(wù)中,但是這個(gè)指標(biāo)僅能識(shí)別出具有特定引文結(jié)構(gòu)的技術(shù)點(diǎn),缺乏綜合性的評(píng)估,無(wú)法避免識(shí)別結(jié)果的可信度。
雖然利用科技文獻(xiàn)的外部特征可以在一定程度上識(shí)別顛覆性技術(shù),但所識(shí)別出的技術(shù)主題范疇較為廣泛。此外,不同的評(píng)估指標(biāo)和識(shí)別模型從不同的角度和側(cè)重點(diǎn)出發(fā),致使指標(biāo)模型的主觀性較強(qiáng)且缺乏通用性,同時(shí)存在分析維度相對(duì)單一、識(shí)別標(biāo)準(zhǔn)缺少針對(duì)性等不足,現(xiàn)有研究結(jié)論存在局限性。因此,針對(duì)現(xiàn)有方法存在的不足,本文基于顛覆性技術(shù)發(fā)展特征逐一進(jìn)行突破,提出名為MAR-DT的顛覆性技術(shù)識(shí)別框架,結(jié)合大規(guī)模引文網(wǎng)絡(luò),提出技術(shù)突破性、創(chuàng)新性、領(lǐng)域影響力與科技文獻(xiàn)影響力4個(gè)計(jì)量指標(biāo),采用熵權(quán)法進(jìn)行指標(biāo)融合,并通過(guò)實(shí)際數(shù)據(jù)進(jìn)行驗(yàn)證。
在科技領(lǐng)域,顛覆性技術(shù)的特征涵蓋多個(gè)層面,對(duì)學(xué)術(shù)界和產(chǎn)業(yè)界都產(chǎn)生深遠(yuǎn)影響,且在學(xué)術(shù)文獻(xiàn)中得以顯著反映。為了更詳細(xì)地分析這一復(fù)雜主題,本文引入了一個(gè)四維模型,涵蓋技術(shù)的突破性、創(chuàng)新性、領(lǐng)域影響力以及科技文獻(xiàn)影響力。
首先,技術(shù)的突破性特征反映了顛覆性技術(shù)在特定領(lǐng)域取得的顯著進(jìn)展。這不僅包括技術(shù)在該領(lǐng)域的技術(shù)性突破,更關(guān)注其對(duì)傳統(tǒng)技術(shù)或思維范式的激進(jìn)性改變。如技術(shù)的突破性可能表現(xiàn)為對(duì)傳統(tǒng)產(chǎn)業(yè)鏈的顛覆性重構(gòu)。
其次,技術(shù)的創(chuàng)新性特征強(qiáng)調(diào)顛覆性技術(shù)相對(duì)于現(xiàn)有技術(shù)的新穎性和獨(dú)創(chuàng)性。這一維度不僅關(guān)注技術(shù)本身的創(chuàng)新,還考察其在應(yīng)用方面可能呈現(xiàn)的全新思路和獨(dú)特解決方案。如技術(shù)的創(chuàng)新性可能體現(xiàn)在其引入了全新的商業(yè)模式或解決了長(zhǎng)期未解決的問(wèn)題。
再次,技術(shù)的領(lǐng)域影響力特征表示顛覆性技術(shù)對(duì)特定領(lǐng)域的深刻影響程度,包括其應(yīng)用范圍和對(duì)該領(lǐng)域整體的重要性。這一方面可以體現(xiàn)為技術(shù)的廣泛應(yīng)用,另一方面可以體現(xiàn)技術(shù)對(duì)這個(gè)領(lǐng)域未來(lái)發(fā)展方向的引導(dǎo)作用。
最后,科技文獻(xiàn)影響力特征反映了顛覆性技術(shù)在學(xué)術(shù)研究中的知名度和引用情況。高科技文獻(xiàn)影響力通常意味著技術(shù)在學(xué)術(shù)界具有廣泛認(rèn)可和應(yīng)用,為未來(lái)研究提供了堅(jiān)實(shí)的理論基礎(chǔ)。這可以通過(guò)技術(shù)在學(xué)術(shù)期刊中的發(fā)表次數(shù)、被引次數(shù)以及與其他重要文獻(xiàn)的關(guān)聯(lián)性等指標(biāo)來(lái)衡量。
本文提出的顛覆性技術(shù)多維度識(shí)別算法(MAR-DT)可以劃分為4個(gè)關(guān)鍵步驟:①獲取與預(yù)處理科技大數(shù)據(jù);②構(gòu)建領(lǐng)域引文網(wǎng)絡(luò);③構(gòu)建與評(píng)估多維指標(biāo);④識(shí)別顛覆性技術(shù)和量化分析結(jié)果。首先,根據(jù)分析目標(biāo)設(shè)計(jì)文獻(xiàn)檢索策略,在Web of Science(WoS)科技論文數(shù)據(jù)庫(kù)中收集顛覆性技術(shù)識(shí)別候選論文集,進(jìn)行人工篩選和預(yù)處理,構(gòu)建數(shù)據(jù)集;其次,借助數(shù)據(jù)集中引文字段提取節(jié)點(diǎn)集合與邊集合,構(gòu)建領(lǐng)域引文網(wǎng)絡(luò);再次,根據(jù)顛覆性技術(shù)特征構(gòu)建面向技術(shù)突破性、創(chuàng)新性、領(lǐng)域影響力和科技文獻(xiàn)影響力的評(píng)估指標(biāo),基于數(shù)據(jù)和引文網(wǎng)絡(luò)進(jìn)行指標(biāo)計(jì)算并使用熵權(quán)法對(duì)指標(biāo)矩陣進(jìn)行融合計(jì)算,排序得出顛覆性技術(shù)候選清單;最后,從候選技術(shù)清單中分析、篩選得出顛覆性技術(shù)清單。算法總體流程如圖1所示。
為了實(shí)現(xiàn)科技大數(shù)據(jù)分析,本文擬采用WoS為數(shù)據(jù)獲取平臺(tái)。面對(duì)特定的顛覆性技術(shù)分析任務(wù),針對(duì)待分析領(lǐng)域設(shè)定的科學(xué)、全面的檢索策略,利用專業(yè)術(shù)語(yǔ)和專業(yè)的檢索邏輯來(lái)確保原始材料的準(zhǔn)確性。完成檢索后下載原始數(shù)據(jù)關(guān)鍵字段信息。以論文數(shù)據(jù)為例,具體下載字段及其在MAR-DT算法中的作用,具體見(jiàn)表1。
表1 論文數(shù)據(jù)子段說(shuō)明
科技文獻(xiàn)中存在的引證關(guān)系體現(xiàn)著技術(shù)之間的流動(dòng),對(duì)于引文網(wǎng)絡(luò)可以從結(jié)構(gòu)的角度探究技術(shù)影響力,將有助于從網(wǎng)絡(luò)的整體結(jié)構(gòu)中動(dòng)態(tài)地評(píng)價(jià)技術(shù)的重要性,也有助于探究技術(shù)在知識(shí)流動(dòng)網(wǎng)絡(luò)中的作用。本文根據(jù)科技論文數(shù)據(jù)創(chuàng)建節(jié)點(diǎn)集合Vertices=[doi1,doi2,doi3,…,doik]與邊集Edges=[e1,e2,…,el],構(gòu)建大規(guī)??萍嘉墨I(xiàn)引文網(wǎng)絡(luò)G=(V,E)。
2.3.1 技術(shù)突破性指標(biāo)
顛覆性技術(shù)出現(xiàn)后,對(duì)于科技文獻(xiàn)的老化速度具有催化作用,這種現(xiàn)象經(jīng)常在科技文獻(xiàn)的引用關(guān)系中表現(xiàn)出來(lái),當(dāng)具有顛覆性的科技文獻(xiàn)出現(xiàn)后,科研人員對(duì)這個(gè)領(lǐng)域之前傳統(tǒng)方法的關(guān)注度急劇下降,轉(zhuǎn)而開(kāi)始頻繁地引用具有顛覆性意義的科技文獻(xiàn)。
按照技術(shù)創(chuàng)新的方式,顛覆性技術(shù)可以劃分為對(duì)現(xiàn)有技術(shù)的鞏固和對(duì)現(xiàn)有技術(shù)產(chǎn)生沖擊兩種不同的類型。在科技文獻(xiàn)數(shù)據(jù)中的體現(xiàn)是當(dāng)一項(xiàng)技術(shù)以鞏固性技術(shù)的形式出現(xiàn)時(shí),引用文獻(xiàn)通常會(huì)同時(shí)引用相關(guān)領(lǐng)域技術(shù)前輩的研究成果,以進(jìn)行對(duì)比和分析;相反地,當(dāng)一項(xiàng)顛覆性技術(shù)以技術(shù)沖擊的形式出現(xiàn)時(shí),引用文獻(xiàn)對(duì)于相關(guān)領(lǐng)域先前研究的引用將減少。為了度量這個(gè)屬性,本文引入Funk等[27]提出的CD指數(shù)進(jìn)行顛覆性技術(shù)突破性(Breakthrough)的分析,其公式為:
式中,n表示候選文獻(xiàn)的施引文獻(xiàn)數(shù)目;fi、bi用于度量文獻(xiàn)引用情況。技術(shù)突破性指標(biāo)范圍為[-1,1],指標(biāo)值越接近-1,表明這項(xiàng)技術(shù)越具有鞏固性;反之,若突破性指標(biāo)值越接近1,表明此候選文獻(xiàn)的技術(shù)在突破性方面具有越高的水平。引文結(jié)構(gòu)如圖2所示。
圖2 技術(shù)突破性指標(biāo)示意
2.3.2 技術(shù)創(chuàng)新性指標(biāo)
顛覆性技術(shù)具有較高的創(chuàng)新性,發(fā)布后短時(shí)間內(nèi)大概率將受到相關(guān)學(xué)者共同關(guān)注,呈現(xiàn)出快速擴(kuò)張的趨勢(shì),在一定的時(shí)間單元內(nèi)被引數(shù)量會(huì)顯著增加。本文發(fā)現(xiàn)這種短期受到大量關(guān)注的現(xiàn)象可以根據(jù)引文網(wǎng)絡(luò)中在一定時(shí)間內(nèi)文獻(xiàn)被引數(shù)量的變化進(jìn)行衡量,因此針對(duì)顛覆性技術(shù)在問(wèn)世后會(huì)存在短暫的快速關(guān)注期這一現(xiàn)象。本文通過(guò)對(duì)引文數(shù)量的短時(shí)間內(nèi)的變化趨勢(shì)進(jìn)行創(chuàng)新性指標(biāo)設(shè)計(jì),以此解釋顛覆性技術(shù)知識(shí)創(chuàng)新與傳播的動(dòng)態(tài)過(guò)程。創(chuàng)新性(Innovation)的計(jì)算方法為:
式中,cy表示目標(biāo)論文在y年份的被引用次數(shù);cy-cy-1表征候選科技文獻(xiàn)在公開(kāi)發(fā)表后每?jī)赡瓯灰脭?shù)量的差距。技術(shù)創(chuàng)新性指標(biāo)計(jì)算結(jié)果越高,代表技術(shù)在單位時(shí)間內(nèi)的學(xué)術(shù)影響力越大,越具創(chuàng)新性。
2.3.3 領(lǐng)域影響力指標(biāo)
顛覆性技術(shù)存在發(fā)展與完善的過(guò)程,在過(guò)程中會(huì)隨著知識(shí)跨領(lǐng)域的擴(kuò)散,技術(shù)本身的影響逐漸擴(kuò)散到其他領(lǐng)域。本文研究認(rèn)為,顛覆性技術(shù)具有滲透或促進(jìn)其他技術(shù)領(lǐng)域的潛力,對(duì)其他領(lǐng)域技術(shù)產(chǎn)生影響是其重要特征。技術(shù)融合可以使整個(gè)技術(shù)體系及其產(chǎn)品構(gòu)成、性能等取得根本性的突破,技術(shù)融合還可以打破原有的技術(shù)格局,其影響深遠(yuǎn)。因此,本文設(shè)計(jì)了技術(shù)領(lǐng)域影響力這項(xiàng)指標(biāo),定量地評(píng)估顛覆性技術(shù)的跨領(lǐng)域影響力。這項(xiàng)指標(biāo)是利用被引用的科技文獻(xiàn)所屬的技術(shù)領(lǐng)域信息進(jìn)行度量的。技術(shù)影響力(Influence)指標(biāo)表示一篇科技文獻(xiàn)所引用的非原始科技文獻(xiàn)在其技術(shù)領(lǐng)域內(nèi)的影響程度。其計(jì)算公式為:
式中,n表示科技文獻(xiàn)所有施引文獻(xiàn)的數(shù)量;dti表示非原始科技文獻(xiàn)自身領(lǐng)域的數(shù)量;di表示科技文獻(xiàn)所引用的文獻(xiàn)所涉及的技術(shù)領(lǐng)域。指標(biāo)得分越高,這項(xiàng)技術(shù)的技術(shù)影響力越大。
2.3.4 科技文獻(xiàn)影響力指標(biāo)
科技文獻(xiàn)被認(rèn)可的程度能夠在被引用量的變化上體現(xiàn),但一些較新的科技文獻(xiàn)為體現(xiàn)出文獻(xiàn)調(diào)研的全面性,不可避免地引用經(jīng)典的科技文獻(xiàn),對(duì)顛覆性技術(shù)的識(shí)別造成干擾。受到期刊影響因子的啟發(fā),避免將被引用量作為單一的衡量指標(biāo),引入時(shí)間維度的考量,提出技術(shù)即時(shí)影響力的指標(biāo),聚焦于文獻(xiàn)本身的動(dòng)態(tài)性與短時(shí)變化性,對(duì)顛覆性技術(shù)進(jìn)行更細(xì)粒度的評(píng)估。技術(shù)即時(shí)影響力是指一篇科技文獻(xiàn)在其公開(kāi)發(fā)表后當(dāng)年、發(fā)表后第二年以及發(fā)表后第三年的被引用量之和與目標(biāo)科技文獻(xiàn)總被引量之間的比值,以此突出科技文獻(xiàn)的時(shí)效特性。
式中,cy,cy+1和cy+2分別代表目標(biāo)科技文獻(xiàn)在發(fā)表后當(dāng)年、發(fā)表后第二年以及發(fā)表后第三年的被引用量。技術(shù)即時(shí)影響力指標(biāo)得分越高,說(shuō)明此目標(biāo)科技文獻(xiàn)的短時(shí)間技術(shù)影響力越大。
本文為保證所提各項(xiàng)指標(biāo)融合時(shí)權(quán)值的客觀性,運(yùn)用客觀賦值熵權(quán)法對(duì)本文4項(xiàng)評(píng)價(jià)指標(biāo)進(jìn)行了加權(quán)計(jì)算。熵權(quán)法是一種客觀賦權(quán)法,計(jì)算指標(biāo)的信息熵,并根據(jù)各指標(biāo)相對(duì)于整體的動(dòng)態(tài)變化程度對(duì)整個(gè)系統(tǒng)的影響,動(dòng)態(tài)地確定各指標(biāo)的權(quán)重。熵權(quán)法以數(shù)據(jù)的分布為基礎(chǔ),擁有較高的可靠性和準(zhǔn)確性。
顛覆性技術(shù)指標(biāo)矩陣滿足X=其中,xij代表i篇候選科技文獻(xiàn)在第j項(xiàng)評(píng)價(jià)指標(biāo)上的得分值。首先,利用式(5)對(duì)指標(biāo)矩陣進(jìn)行規(guī)格化處理。
式中,max(xj)表示在第j項(xiàng)指標(biāo)上候選文獻(xiàn)的最高得分值;min(xj)表示在第j項(xiàng)指標(biāo)上候選文獻(xiàn)的最低得分值;代表歸一化后的第i篇候選文獻(xiàn)在第j項(xiàng)指標(biāo)上的得分值。
進(jìn)行歸一化后得到的顛覆性技術(shù)指標(biāo)矩陣為:
對(duì)歸一化后的指標(biāo)矩陣進(jìn)行指標(biāo)比重計(jì)算,如式(6)所示。
然后,使用式(7)計(jì)算第j項(xiàng)指標(biāo)的熵值:
利用式(8)對(duì)第j項(xiàng)指標(biāo)的差異系數(shù)進(jìn)行計(jì)算。
式中指標(biāo)的差異系數(shù)越大,對(duì)于最后的顛覆性技術(shù)評(píng)估的影響就越顯著。
最后,利用式(9)對(duì)第j項(xiàng)指標(biāo)的權(quán)重進(jìn)行計(jì)算。
根據(jù)式(9)進(jìn)行權(quán)重計(jì)算,分別得到各指標(biāo)的權(quán)重,并綜合突破性、創(chuàng)新性、技術(shù)影響力以及技術(shù)即時(shí)性指標(biāo),使用式(10)得到最終指標(biāo)值Comprehensive。
式中,xij表示第i篇文獻(xiàn)的第j項(xiàng)指標(biāo)的權(quán)重;wij表示其對(duì)應(yīng)的權(quán)重。對(duì)最終指標(biāo)值Comprehensive進(jìn)行逆序排序,選取排序結(jié)果的前100篇作為顛覆性技術(shù)識(shí)別結(jié)果。
本文采用計(jì)算機(jī)科學(xué)和無(wú)線電通信兩個(gè)領(lǐng)域的科技文獻(xiàn)數(shù)據(jù)進(jìn)行實(shí)證研究,深入分析并識(shí)別其中的潛在的顛覆性技術(shù),探索和揭示這些顛覆性技術(shù)的潛力和影響。同時(shí),本文還將提出相關(guān)領(lǐng)域技術(shù)與產(chǎn)業(yè)發(fā)展方面的戰(zhàn)略思考與建議,為未來(lái)的創(chuàng)新和發(fā)展提供參考與借鑒,以促進(jìn)技術(shù)和產(chǎn)業(yè)的可持續(xù)發(fā)展。
本文采用的計(jì)算機(jī)科學(xué)與無(wú)線電通信領(lǐng)域的科技文獻(xiàn)樣本源于WoS(Web of Science)科技文獻(xiàn)數(shù)據(jù)庫(kù),根據(jù)領(lǐng)域文獻(xiàn)檢索策略,下載WoS類別為計(jì)算機(jī)科學(xué)(Computer Science)與無(wú)線電通信(Telecommunications)領(lǐng)域的科技文獻(xiàn)數(shù)據(jù)(其類型包括Article、Proceedings Paper、Review等),發(fā)表日期范圍限定在1990-2020年,使用DOI號(hào)作為數(shù)字對(duì)象唯一標(biāo)識(shí)符對(duì)數(shù)據(jù)進(jìn)行清洗并去重,最終得到計(jì)算機(jī)科學(xué)領(lǐng)域科技文獻(xiàn)數(shù)據(jù)1 898 805條,無(wú)線電通信領(lǐng)域科技文獻(xiàn)數(shù)據(jù)423 891條。計(jì)算機(jī)科學(xué)與無(wú)線電通信領(lǐng)域論文數(shù)據(jù)年份分布如圖3所示。
圖3 計(jì)算機(jī)科學(xué)與無(wú)線電通信領(lǐng)域論文數(shù)據(jù)年份分布
本文利用提出的方法,將計(jì)算機(jī)科學(xué)領(lǐng)域和無(wú)線電通信領(lǐng)域的科技文獻(xiàn)數(shù)據(jù)的DOI號(hào)作為網(wǎng)絡(luò)節(jié)點(diǎn)標(biāo)識(shí)符,利用引文信息構(gòu)建邊集合,以此搭建大規(guī)??萍嘉墨I(xiàn)引文網(wǎng)絡(luò)。基于引文網(wǎng)絡(luò)分別計(jì)算突破性、創(chuàng)新性、技術(shù)影響力以及科技文獻(xiàn)影響因子指標(biāo),在對(duì)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理后,利用熵權(quán)法計(jì)算各文獻(xiàn)的綜合性指標(biāo)。計(jì)算機(jī)科學(xué)領(lǐng)域和無(wú)線電通信領(lǐng)域文獻(xiàn)綜合指標(biāo)值前20位的排序分別見(jiàn)表2、表3。
表2 計(jì)算機(jī)科學(xué)領(lǐng)域文獻(xiàn)綜合指標(biāo)值排序(Top 20)
表3 無(wú)線電通信領(lǐng)域文獻(xiàn)綜合指標(biāo)值排序(Top 20)
從表2可以看出,計(jì)算機(jī)科學(xué)領(lǐng)域中根據(jù)綜合指標(biāo)值排序的前20篇科技文獻(xiàn)內(nèi)容涉及CNN經(jīng)典框架的AlexNet、Faster-RCNN以及對(duì)Faster-RCNN進(jìn)一步改進(jìn)的Mask R-CNN,同時(shí)包含LSTM、SVM、Random Forest等機(jī)器學(xué)習(xí)經(jīng)典算法,其中來(lái)自美國(guó)的成果高達(dá)12篇,中國(guó)位居第2名。從表3可以看出,無(wú)線電通信領(lǐng)域的5G無(wú)線通信技術(shù)、Internet of Things以及經(jīng)典802.11協(xié)議相關(guān)技術(shù)均在識(shí)別結(jié)果Top 20中。
為了進(jìn)一步分析計(jì)算機(jī)科學(xué)和無(wú)線電通信領(lǐng)域顛覆性技術(shù)的發(fā)展趨勢(shì),本文針對(duì)各領(lǐng)域識(shí)別結(jié)果的Top 100進(jìn)行時(shí)序分析。從圖4a可以看出,計(jì)算機(jī)科學(xué)領(lǐng)域在2002年前后出現(xiàn)了多項(xiàng)顛覆性技術(shù),其中包含NSGA-II遺傳算法、BLEU指標(biāo)、k-anonymity模型、LBP特征提取算法以及SMOTE不平衡數(shù)據(jù)集處理方法等,其中NSGA-II遺傳算法是多目標(biāo)進(jìn)化領(lǐng)域中具有里程碑意義的技術(shù),SMOTE是一種應(yīng)用廣泛的人工合成數(shù)據(jù)的綜合采樣算法。從圖4b可以看出,無(wú)線電通信領(lǐng)域在2014年前后出現(xiàn)多篇顛覆性技術(shù),其中包含對(duì)于5G無(wú)線通信技術(shù)的關(guān)鍵技術(shù)介紹(如多入多出技術(shù)MIMO等)、應(yīng)用的愿景與挑戰(zhàn),符合無(wú)線通信技術(shù)的發(fā)展規(guī)律。由此可以看出,本文提出的框架能夠?qū)τ?jì)算機(jī)科學(xué)領(lǐng)域與無(wú)線電通信領(lǐng)域具有顛覆性的方法或指標(biāo)進(jìn)行識(shí)別。
圖4 計(jì)算機(jī)科學(xué)領(lǐng)域與無(wú)線電通信領(lǐng)域顛覆性技術(shù)年限分布
通過(guò)對(duì)顛覆性技術(shù)所屬國(guó)家進(jìn)行統(tǒng)計(jì)分析,可以在國(guó)家的層面了解這項(xiàng)技術(shù)在國(guó)際上的競(jìng)爭(zhēng)力。因此,本文使用E-charts繪制了國(guó)家力量分布餅狀圖,如圖5所示。美國(guó)作為世界上最具科技創(chuàng)新實(shí)力的國(guó)家,發(fā)布了數(shù)量最多的顛覆性技術(shù)成果。在無(wú)線電通信領(lǐng)域與計(jì)算機(jī)科學(xué)領(lǐng)域所擁有的顛覆性技術(shù)領(lǐng)域處于領(lǐng)先地位。中國(guó)在顛覆性技術(shù)突破方面仍具備較大的提升空間,加強(qiáng)顛覆性技術(shù)的研發(fā)是實(shí)現(xiàn)技術(shù)領(lǐng)跑和維護(hù)領(lǐng)域技術(shù)安全的重要途徑。
圖5 計(jì)算機(jī)科學(xué)領(lǐng)域與無(wú)線電通信領(lǐng)域顛覆性力量分布
本文根據(jù)顛覆性技術(shù)發(fā)展特征、關(guān)聯(lián)科技大數(shù)據(jù)自身時(shí)序信息以及引文結(jié)構(gòu)變化等,提出一種定量化的顛覆性技術(shù)的多維度識(shí)別框架(MRA-DT),綜合考慮突破性、創(chuàng)新性、領(lǐng)域影響力和科技文獻(xiàn)影響力,設(shè)計(jì)了4種不同的顛覆性技術(shù)識(shí)別指標(biāo),利用熵權(quán)法對(duì)顛覆性技術(shù)各特征指標(biāo)進(jìn)行量化測(cè)度,基本實(shí)現(xiàn)了對(duì)論文數(shù)據(jù)的顛覆性技術(shù)細(xì)粒度挖掘,解決了傳統(tǒng)方法在科學(xué)性、可解釋性等方面存在的不足。
為驗(yàn)證此算法的可行性與有效性,本文利用WoS數(shù)據(jù)庫(kù)中在1990-2020年間計(jì)算機(jī)科學(xué)領(lǐng)域和無(wú)線電通信領(lǐng)域的論文數(shù)據(jù)對(duì)此方法開(kāi)展實(shí)證研究。實(shí)證結(jié)果表明,本文提出的顛覆性技術(shù)多維度框架能夠甄別出不同時(shí)期研究領(lǐng)域的代表性成果,達(dá)到預(yù)期的研究目標(biāo)。我國(guó)在計(jì)算機(jī)技術(shù)和無(wú)線電通信方面顛覆性技術(shù)突破仍具較大的提升空間,需要加強(qiáng)關(guān)鍵領(lǐng)域科技研發(fā),在穩(wěn)步發(fā)展過(guò)程中確保國(guó)家科技安全。這個(gè)算法能夠?qū)茖W(xué)文獻(xiàn)領(lǐng)域的顛覆性技術(shù)進(jìn)行識(shí)別,為科研人員和相關(guān)情報(bào)從業(yè)人員以及國(guó)家管理者提供參考與決策依據(jù)。
目前,面向顛覆性技術(shù)的方法主要針對(duì)科技論文開(kāi)展分析,未來(lái)工作將進(jìn)一步優(yōu)化指標(biāo)設(shè)計(jì),考慮科技成果的時(shí)滯性,結(jié)合科技動(dòng)態(tài)資訊、專利數(shù)據(jù)、產(chǎn)業(yè)信息等進(jìn)行輔助分析與驗(yàn)證。