張秀妮 劉武英 武 茜
(1.陜西省科學(xué)技術(shù)情報研究院,陜西西安 710054;2.西安郵電大學(xué),陜西西安 710121)
存儲芯片是全球半導(dǎo)體的主戰(zhàn)場,也是全球半導(dǎo)體超級周期的主抓手,直接影響到產(chǎn)業(yè)和信息安全,全球各個國家都高度重視,而顛覆性技術(shù)帶來的戰(zhàn)略時間窗口期和產(chǎn)業(yè)技術(shù)窗口期是目前各國博弈以及采取其他動作最重要的考慮因素。準(zhǔn)確識別存儲芯片產(chǎn)業(yè)發(fā)展可能的顛覆性技術(shù),是面向世界科技前沿,推動科技創(chuàng)新的先決條件,可以將人、財、物等資源精準(zhǔn)投入到最具有價值的創(chuàng)新科技研究中,這對解決我國產(chǎn)業(yè)的卡脖子技術(shù)起到促進(jìn)作用,對我國信息技術(shù)產(chǎn)業(yè)的創(chuàng)新發(fā)展起到重要的支撐作用,對國家搶占全球前沿科技和新興產(chǎn)業(yè)發(fā)展的戰(zhàn)略制高點(diǎn)具有重要的理論和現(xiàn)實(shí)意義。
顛覆性技術(shù)概念在1995年由Bower和Christense提出,是指一種獨(dú)辟蹊徑的、對已有的傳統(tǒng)技術(shù)或者主流技術(shù)產(chǎn)生顛覆性效果的技術(shù)。顛覆性技術(shù)強(qiáng)調(diào)的是技術(shù)在性能或功能上產(chǎn)生重大突破,并將逐步取代已有技術(shù)。顛覆性技術(shù)主要特征表現(xiàn)在突變性、滲透性、時效性3 個方面。突變性是指顛覆性技術(shù)起源自創(chuàng)新思維,使得原有技術(shù)的發(fā)展軌跡發(fā)生了巨大改變,技術(shù)應(yīng)用領(lǐng)域進(jìn)行了新的拓展,是常識無法預(yù)料的,產(chǎn)生“技術(shù)突襲”的奇效。在性能或功能方面,顛覆性技術(shù)會通過向各個領(lǐng)域的滲透,對新舊組織形態(tài)的轉(zhuǎn)變產(chǎn)生一定影響,最終在新的技術(shù)體系的基礎(chǔ)上形成新的組織形態(tài);某方面基礎(chǔ)研究的突破和滲透可能會促成某些重要技術(shù)的形成和發(fā)展。在當(dāng)今信息爆炸時代,環(huán)境的變化瞬息萬變,技術(shù)的發(fā)展速度日新月異,以指數(shù)級速度在不斷的刷新,原有的主流技術(shù)很難長期保持其壟斷地位,因此顛覆性技術(shù)也具有時效性。
國內(nèi)外的研究人員試圖通過各種方法來識別顛覆性技術(shù)。Vojak等[1]采用技術(shù)路線圖的方法來協(xié)助決策者對顛覆性技術(shù)進(jìn)行識別。Kostoff等[2]在文本挖掘法的基礎(chǔ)上綜合考慮專家意見后識別潛在顛覆性技術(shù)。Sood等[3]在建立樣本外識別模型的基礎(chǔ)上對顛覆性技術(shù)的定義提出7 個假設(shè)。Govindarajan等[4]和Adams等[5]采用一個具有多個評估指標(biāo)的框架進(jìn)行顛覆性技術(shù)識別[6]。Bloodworth等[7]以文獻(xiàn)作為數(shù)據(jù)源,從技術(shù)發(fā)展前沿和技術(shù)性能突破這兩個評價指標(biāo)入手,根據(jù)顛覆性技術(shù)和主流技術(shù)在其屬性集中不同位置的關(guān)鍵屬性特征進(jìn)行顛覆性技術(shù)識別。黃魯成等[8]引入了物種入侵理論模型,通過集對分析方法計算前沿技術(shù)在出現(xiàn)前后其屬性集的相似度,進(jìn)而度量顛覆強(qiáng)度值。蘇敬勤等[9]利用專利數(shù)量時間分布的J型曲線、專利被引數(shù)量時間分布的λ型曲線和專利被引率時間分布的L型曲線來分析顛覆性技術(shù)的演化軌跡。張樞盛等[10]提出了企業(yè)技術(shù)產(chǎn)品的成熟度、市場的成熟度、產(chǎn)業(yè)的標(biāo)準(zhǔn)化、產(chǎn)業(yè)的分工度等顛覆性技術(shù)的評價指標(biāo)。李存斌等[11]從技術(shù)投資、擴(kuò)散和支持3 個方面構(gòu)建了顛覆性技術(shù)的評價指標(biāo)體系。
目前,國內(nèi)外學(xué)者關(guān)于顛覆性技術(shù)識別方法的研究主要有兩個方面:一是從微觀層面技術(shù)屬性出發(fā),以評估科學(xué)技術(shù)的管理與應(yīng)用這一屬性為主的主觀判斷識別法[12];二是以專利數(shù)據(jù)或?qū)W術(shù)論文作為數(shù)據(jù)來源,對技術(shù)本身進(jìn)行探測判斷其是否具有顛覆性特征的量化方法。目前的多數(shù)量化研究方法均停留在采用相對簡單的數(shù)據(jù)統(tǒng)計來描述現(xiàn)象從而識別顛覆性技術(shù),對數(shù)據(jù)質(zhì)量及數(shù)據(jù)反映出的技術(shù)市場化等深層次因素對顛覆性技術(shù)的影響考慮不夠,缺乏采用定性、定量多種方法相結(jié)合的同時考慮數(shù)據(jù)質(zhì)量的顛覆性技術(shù)綜合識別研究,且采用的數(shù)據(jù)源比較單一,往往只采用單一的學(xué)術(shù)論文或者專利文獻(xiàn)開展相關(guān)研究。論文記載著對未解的前沿科學(xué)問題開展研究所取得的最新研究進(jìn)展或創(chuàng)新的知識信息,但缺乏對產(chǎn)業(yè)技術(shù)發(fā)展后期技術(shù)創(chuàng)新活動的相關(guān)研究。專利數(shù)據(jù)記載著技術(shù)發(fā)展過程中發(fā)明創(chuàng)造的軌跡和成果,但缺乏技術(shù)領(lǐng)域的基礎(chǔ)研究相關(guān)的原始理論創(chuàng)新相關(guān)內(nèi)容。顛覆性技術(shù)的特征決定了其識別方法,實(shí)質(zhì)上屬于技術(shù)預(yù)見范疇,目前其識別體系還不夠全面、不夠系統(tǒng),還沒有一個統(tǒng)一的衡量標(biāo)準(zhǔn)。
鑒于此,本文將基于存儲芯片產(chǎn)業(yè),針對目前顛覆性技術(shù)識別方法中數(shù)據(jù)源比較單一的問題,綜合采用會議論文和專利文獻(xiàn)兩種異構(gòu)數(shù)據(jù),擬從學(xué)術(shù)研究和技術(shù)創(chuàng)新兩個維度產(chǎn)生的研究成果來深度挖掘科學(xué)和技術(shù)兩個層面豐富信息;為了充分考慮那些具有顛覆性特征的技術(shù)主題,本文選取了選取論文近3年被引頻次增長率和專利3年引用率指標(biāo)體現(xiàn)技術(shù)時效性的同時兼顧了滲透性;采用關(guān)鍵詞凸現(xiàn)度體現(xiàn)顛覆性技術(shù)的突變性,科學(xué)關(guān)聯(lián)度指標(biāo)著重體現(xiàn)基礎(chǔ)研究對技術(shù)創(chuàng)新的滲透性;針對目前顛覆性技術(shù)識別方法中缺乏考慮數(shù)據(jù)質(zhì)量的定性與定量相結(jié)合動態(tài)評價識別方法的問題,引入關(guān)鍵詞凸現(xiàn)度和專利價值指數(shù)等基于數(shù)據(jù)質(zhì)量的評價指標(biāo),將群決策思想融入層次分析法,采用動態(tài)賦值法優(yōu)化目前顛覆性技術(shù)識別的方法,主觀和客觀方法相結(jié)合使得顛覆性的評價識別更加科學(xué)和全面。
從異構(gòu)數(shù)據(jù)視角出發(fā),本文提出一種定性與定量相結(jié)合的、基于數(shù)據(jù)質(zhì)量的動態(tài)權(quán)重分配評估方法。首先,通過綜合考慮專利的組合規(guī)模、市場范圍以及專利年齡、不同領(lǐng)域引用行為差異等質(zhì)量因素,提供一種更加準(zhǔn)確的專利資產(chǎn)評估算法,突破常規(guī)僅通過專利數(shù)量判斷技術(shù)價值的局限性。其次,將競爭情報分析、專利資產(chǎn)指數(shù)分析、專家意見調(diào)查等方法相結(jié)合,基于專利和論文兩種異構(gòu)數(shù)據(jù)構(gòu)建產(chǎn)業(yè)顛覆性技術(shù)識別模型。最后,設(shè)計一種動態(tài)權(quán)重分配算法為分析指標(biāo)進(jìn)行動態(tài)權(quán)重值分配,經(jīng)過加權(quán)計算后甄別出目標(biāo)領(lǐng)域的顛覆性技術(shù)。本文選取戰(zhàn)略新興產(chǎn)業(yè)中規(guī)模大、創(chuàng)新密集的存儲芯片產(chǎn)業(yè)作為具體研究對象,通過以上方法識別出存儲芯片領(lǐng)域的顛覆性技術(shù),以期為搶占信息技術(shù)發(fā)展高地提供新的借鑒視角?;趧討B(tài)賦值的顛覆性技術(shù)識別方法的整體研究框架如圖1所示。
圖1 產(chǎn)業(yè)顛覆性技術(shù)識別流程
在動態(tài)權(quán)重賦值法中,為了擺脫評估過程的隨機(jī)性以及專家的主觀隨意性等原因?qū)?quán)重的影響,避免確定的權(quán)重與實(shí)際相悖的不足,將群決策的思想融入層次分析法(AHP)[13]。即將專家意見作為對各個指標(biāo)賦權(quán)的主要依據(jù),并根據(jù)評價指標(biāo)之間的相互邏輯關(guān)系逐步調(diào)整各個指標(biāo)的權(quán)重占比,保持動態(tài)賦權(quán),從而改進(jìn)傳統(tǒng)的AHP法并應(yīng)用在顛覆性技術(shù)評價指標(biāo)層次結(jié)構(gòu)模型中確定指標(biāo)權(quán)重。
1.2.1 論文指標(biāo)選取
(1)近3年被引頻次增長率
處于科學(xué)研究初期階段的顛覆性技術(shù),往往采用論文形式作為基礎(chǔ)研究成果呈現(xiàn)出來。這個時期論文的被引用頻率通常會增長,因此可以采用選定技術(shù)領(lǐng)域中論文的近3年被引頻次增長率來反映技術(shù)的基礎(chǔ)研究隨時間的變化情況。論文的被引頻次增長率表示學(xué)者的影響力變化幅度,通過增長率能夠較好地刻畫產(chǎn)出影響力變化情況。增長率可通過式(1)得出。
式中,a為初始年份的被引頻次,b為增長率,x為距離初始年份的年數(shù),f(x)為x時刻論文的被引頻次。
(2)文獻(xiàn)增長率
在科學(xué)研究的初期,顛覆性技術(shù)相關(guān)的專利往往數(shù)量會很少,論文文獻(xiàn)中的技術(shù)指標(biāo)信息雖然沒有專利信息豐富,但作為專利上游的論文的數(shù)量通常會出現(xiàn)較快增長[12],因此也可以采用選定技術(shù)領(lǐng)域的論文文獻(xiàn)增長率來反映技術(shù)的基礎(chǔ)研究隨時間的變化情況。
(3)關(guān)鍵詞凸現(xiàn)度
最直觀的觀察技術(shù)主題變化趨勢的方法就是查看關(guān)鍵詞詞頻隨時間的變化狀況。以詞頻為指標(biāo)可能會過多地關(guān)注基本關(guān)鍵詞,而基本關(guān)鍵詞會在大部分論文中出現(xiàn),應(yīng)該被過濾掉。所以,不能直接引用頻數(shù)這一指標(biāo),而應(yīng)和總的關(guān)鍵詞集聯(lián)系起來,綜合描繪關(guān)鍵詞隨時間的變化程度。由此提出了關(guān)鍵詞凸現(xiàn)度概念,引用了tf-idf指標(biāo)。tf指關(guān)鍵詞的頻次,idf指關(guān)鍵詞在整個數(shù)據(jù)集中的重要程度。
式中,n等于總的文檔數(shù),df(t)是文檔集中包含關(guān)鍵詞的文檔數(shù),從而得到
再將所得的tf-idf向量通過歐幾里得范數(shù)歸一化。
1.2.2 專利指標(biāo)選取
(1)近3年被引用率
在考慮時間因素的基礎(chǔ)上,采用了專利的近3年被引用率這一技術(shù)指標(biāo)。該指標(biāo)是指選定技術(shù)領(lǐng)域或某項(xiàng)技術(shù)的專利數(shù)據(jù)集在其公開年、公開后次年和第3年這3年中的總的被引用量與該技術(shù)公開年當(dāng)年的專利數(shù)量之比[14]。這一指標(biāo)可以從特定角度體現(xiàn)出某項(xiàng)技術(shù)最近的創(chuàng)新性突破和研究水平的發(fā)展情況。
(2)專利價值指數(shù)
根據(jù)Holger 等[15]提出的和國內(nèi)一些學(xué)者加以完善的專利價值指數(shù)分析方法,并結(jié)合馬雨菲等[16]對技術(shù)競爭力的評價研究,確定了4 個對專利進(jìn)行評價的指標(biāo),分別為組合規(guī)模、市場范圍、技術(shù)重要程度和競爭影響力。組合規(guī)模是指特定時間段內(nèi)企業(yè)授權(quán)專利和有效專利的數(shù)量規(guī)模,反映企業(yè)專利組合布局;市場范圍是用于衡量在全球市場內(nèi)某項(xiàng)專利的受保護(hù)程度的指標(biāo);技術(shù)重要程度反映專利的發(fā)展?jié)摿εc質(zhì)量;競爭影響力是測度其可競爭優(yōu)勢的指標(biāo),反映了個別專利技術(shù)的長期競爭優(yōu)勢能力。專利價值指數(shù)的計算方法:首先將某規(guī)模組合專利中個別專利家族的技術(shù)重要程度指標(biāo)值與市場范圍指標(biāo)值相乘,計算出該專利家族的競爭影響力指標(biāo);再計算專利組合包含的所有專利家族的競爭影響力指標(biāo)總和,從而得出該專利組合的專利價值指數(shù)。
(3)科學(xué)關(guān)聯(lián)度
專利對論文的引用可以有效地反映出相關(guān)領(lǐng)域的基礎(chǔ)研究成果對技術(shù)創(chuàng)新的影響,引用了學(xué)術(shù)論文的專利文獻(xiàn),更容易受到后來技術(shù)發(fā)明者的注意,激發(fā)產(chǎn)生新的技術(shù)。科學(xué)關(guān)聯(lián)度(Science Linkage,SL)由計量學(xué)泰斗F.Narin首次提出,指的是專利引用學(xué)術(shù)論文的平均數(shù)量[17],如式(5)所示。
式中,SL代表科學(xué)關(guān)聯(lián)度,PT_num代表專利引用的會議論文數(shù)量,P_num代表專利本身的數(shù)量。科學(xué)關(guān)聯(lián)度可以用來衡量一個國家或地區(qū)或某技術(shù)領(lǐng)域或產(chǎn)業(yè)領(lǐng)域的基礎(chǔ)科學(xué)研究與技術(shù)創(chuàng)新活動之間的相互聯(lián)系,從而用來表征基礎(chǔ)科學(xué)研究給技術(shù)創(chuàng)新活動帶來的影響,進(jìn)一步反映基礎(chǔ)科學(xué)研究活動對技術(shù)創(chuàng)新發(fā)展的效用。該值越大,說明科學(xué)基礎(chǔ)研究對技術(shù)創(chuàng)新發(fā)展的推動作用越大。
基于上述的基本研究框架,將顛覆性技術(shù)識別過程劃分為以下幾個具體步驟。
步驟1:數(shù)據(jù)獲取。選定采用的數(shù)據(jù)庫來源獲取論文和專利數(shù)據(jù),在文獻(xiàn)調(diào)研的基礎(chǔ)上結(jié)合專家意見來確定試檢策略,并通過試檢反復(fù)修正直至檢索出數(shù)據(jù)集合可以全面準(zhǔn)確反映出所選的技術(shù)領(lǐng)域。
步驟2:將所得數(shù)據(jù)進(jìn)行清洗與處理后,采用LDA(Latent Dirichlet Allocation)主題模型對論文和專利的融合數(shù)據(jù)集的標(biāo)題、關(guān)鍵詞和摘要文本進(jìn)行分析,確定備選技術(shù)主題。
步驟3:結(jié)合對技術(shù)領(lǐng)域已有資料的研究和專家意見,不斷調(diào)整和合并技術(shù)主題,篩選出較為理想的顛覆性技術(shù)主題結(jié)果。
步驟4:選用改進(jìn)的層次分析法對篩選出的顛覆性技術(shù)主題進(jìn)行多指標(biāo)動態(tài)綜合評價,根據(jù)綜合重要度值選擇可用于進(jìn)一步進(jìn)行顛覆性技術(shù)點(diǎn)識別的主題。
步驟5:對選定的技術(shù)主題下的關(guān)鍵詞選取閾值不斷調(diào)整,并考慮關(guān)鍵詞凸現(xiàn)度隨年份的變化情況,結(jié)合專家智慧挖掘顛覆性技術(shù)點(diǎn)。
選取在國際上具有很高權(quán)威性的Web of Science數(shù)據(jù)庫中的核心合集中的會議論文和德溫特世界專利索引(DWPI)數(shù)據(jù)庫進(jìn)行數(shù)據(jù)的采集。對于文獻(xiàn)定量分析來說,數(shù)據(jù)的全面和準(zhǔn)確是整個分析的基礎(chǔ),只有當(dāng)所采用的數(shù)據(jù)集能夠涵蓋研究領(lǐng)域該類數(shù)據(jù)的主體且可反映出研究領(lǐng)域的最主要問題時,后續(xù)的分析研究才有現(xiàn)實(shí)意義。在充分了解存儲芯片領(lǐng)域概況的基礎(chǔ)上,本著兼顧數(shù)據(jù)的查全率和查準(zhǔn)率的原則,選取檢索詞并組配檢索式,優(yōu)化確定了以下存儲芯片領(lǐng)域檢索策略。
論文數(shù)據(jù)庫檢索式是:主題=“memory chip” or “NAND Flash” or RAM or “Flash Memory” or EEPROM or DRAM or ROM or “Random Access Memory” or “Read Only Memory” or “NOR Flash” or DDR or SDRAM or“synchronous dynamic random-access memory” or NVDIMM;標(biāo)題=“storage cell” OR “memory location” OR “bank bit” OR “memory cell” OR“memory unit” OR “store location” OR “storage location” OR “store cell” OR “bit cell” OR “Storage Unit”。把這兩個檢索式合并之后進(jìn)行研究方向和學(xué)科的篩選得出最終數(shù)據(jù)集。
專利數(shù)據(jù)庫檢索式是:德溫特標(biāo)題TID=(“DDR” OR “SDRAM” OR “synchronous dynamic random access memory” OR “NVDIMM” OR“storage cell” OR “memory location” OR “bank bit” OR “memory cell” OR “memory unit” OR“store location” OR “storage location” OR “store cell” OR “bit cell” OR “Storage Unit” OR “memory chip” OR “NAND Flash” OR “RAM” OR “Flash Memory” OR “EEPROM” OR “DRAM” OR ROM or “Random Access Memory” or “Read Only Memory” or “NOR Flash”) AND 全部文本字段ALLD=(chip)。
檢索的時間跨度為2011—2020年,共獲取了15 062 篇會議論文和26 175 個DWPI專利同族。
將獲取的論文和專利數(shù)據(jù)導(dǎo)入DDA(Derwent Data Analyzer)文本挖掘軟件中,采用其數(shù)據(jù)統(tǒng)計和分析等功能模塊輔助構(gòu)建文獻(xiàn)數(shù)量—時間矩陣,從而得到論文和專利數(shù)量隨年份的變化趨勢情況,如圖2所示。
從圖2可以看出,自2011年起,存儲芯片領(lǐng)域的論文數(shù)量呈現(xiàn)穩(wěn)步上升的趨勢,2020年的數(shù)量可能由于專利公開以及會議論文的滯后性,造成數(shù)據(jù)的不準(zhǔn)確,不具有實(shí)質(zhì)性參考意義。其中,2011年之前會議論文增長相較于專利數(shù)量的增長較為緩慢,說明國內(nèi)外學(xué)者對存儲芯片領(lǐng)域的關(guān)注度保持在一定水平,變化不大。專利數(shù)量增長的速率大于會議論文,一直呈直線增長,在2018年較上年略有下降,但整體規(guī)律未變,說明近年來存儲芯片領(lǐng)域技術(shù)的研發(fā)以及創(chuàng)新應(yīng)用活動十分活躍,技術(shù)迭代更新迅速。專利的申請在某種意義上象征著技術(shù)所具有的商業(yè)前景和商業(yè)價值。技術(shù)通常是在前期科學(xué)理論研究積累的基礎(chǔ)上,當(dāng)該理論研究較為成熟的時候,被市場大規(guī)模應(yīng)用,并進(jìn)一步推動著技術(shù)的迭代式創(chuàng)新發(fā)展,這也說明儲存芯片是一個持續(xù)飛速發(fā)展的技術(shù)領(lǐng)域。為了從宏觀上了解會議論文和專利數(shù)據(jù),下面對會議論文和專利數(shù)據(jù)分別進(jìn)行數(shù)據(jù)概況分析。
圖2 存儲芯片領(lǐng)域的論文與專利數(shù)量年度分布
將每一年的論文和專利歸為一組,對標(biāo)題、關(guān)鍵詞和摘要文本建立數(shù)據(jù)集,對文本內(nèi)容進(jìn)行分詞、去除停用詞和數(shù)字、同義詞合并等處理,采取TF-IDF算法進(jìn)行文本處理,提煉出具有價值、高頻的技術(shù)特征詞32 914 個,為LDA模型分析作準(zhǔn)備。
將會議論文和專利文獻(xiàn)結(jié)合起來,利用pyLDAvis工具包及困惑度指標(biāo)確定主題數(shù),在采用LDA主題聚類模型識別技術(shù)主題的同時結(jié)合 N-gram方法提取詞組用來確定技術(shù)主題名稱。在技術(shù)主題聚類時,首先設(shè)定每個技術(shù)主題聚簇個數(shù)為10 個,再分析聚類結(jié)果輸出的每個聚簇下的高頻詞,去除主題詞頻高不能反映實(shí)質(zhì)內(nèi)容的詞匯之后,通過關(guān)鍵詞共現(xiàn)分析,查看相似的可以歸為一類的關(guān)鍵詞,構(gòu)成一個技術(shù)主題。根據(jù)這些關(guān)鍵詞確定各個技術(shù)主題的名稱。但這些技術(shù)主題可能出現(xiàn)顆粒度不一致的問題,或各個技術(shù)主題之間的關(guān)鍵詞相似度較高,需要根據(jù)各個技術(shù)主題的內(nèi)涵結(jié)合已有技術(shù)領(lǐng)域背景資料對現(xiàn)有的技術(shù)主題進(jìn)行調(diào)整和合并,最終確定技術(shù)主題個數(shù)為5 個(圖3),通過不斷調(diào)整閾值,將每個主題篩選后的結(jié)果控制在30 個關(guān)鍵詞左右。這里的閾值設(shè)置就是在最高的tf-idf值的基礎(chǔ)上,不斷下調(diào),最后得到理想的結(jié)果。
圖3 存儲芯片領(lǐng)域確定的5 個技術(shù)主題的Top 10 關(guān)鍵詞
將以上5 個主題與其對應(yīng)的論文和專利數(shù)據(jù)進(jìn)行匹配,形成5 個主題的子數(shù)據(jù)集,然后對每個子數(shù)據(jù)集的各項(xiàng)指標(biāo)進(jìn)行測算,最終根據(jù)子數(shù)據(jù)集的各項(xiàng)指標(biāo)結(jié)果采用動態(tài)賦值法進(jìn)行評價。論文和專利數(shù)據(jù)與各主題的匹配方法為:通過確認(rèn)LDA算法生成的詞頻矩陣中每個記錄對應(yīng)每個主題最高的概率(即每一行的最大值)來確定該記錄歸屬的主題。因?yàn)槭且愿哳l詞聚類得到的主題,高頻詞又是一篇文章濃縮出來的最有價值的詞,可以近似認(rèn)為一篇論文或?qū)@麑?yīng)的高頻詞即為這個論文或?qū)@胍磉_(dá)的主題,因此找到高頻詞對應(yīng)的主題即為這篇論文或?qū)@闹黝}。根據(jù)文檔對應(yīng)主題的概率分布情況,進(jìn)行各個主題的指標(biāo)計算。
5 個主題對應(yīng)的評價指標(biāo)生成的主題—評價指標(biāo)矩陣如表1所示。
表1 存儲芯片技術(shù)領(lǐng)域各主題的評價指標(biāo)矩陣
通過改進(jìn)的層次分析法對備選的顛覆性技術(shù)主題進(jìn)行多指標(biāo)動態(tài)綜合評價分析[18]。
2.5.1 建立層次結(jié)構(gòu)模型
首先繪出層次結(jié)構(gòu)圖,共分為決策目標(biāo)、考慮的決策準(zhǔn)則因素和決策對象3 層[19]。選取了論文近3年被引頻次增長率、論文的文獻(xiàn)增長率、論文關(guān)鍵詞凸現(xiàn)度、專利近3年引用率、專利價值指數(shù)和科學(xué)關(guān)聯(lián)度6 個指標(biāo)。具體結(jié)構(gòu)如圖4所示。
圖4 評價模型的層次結(jié)構(gòu)
2.5.2 分層構(gòu)造判斷矩陣
多層次的評價指標(biāo)體系一般具有比較復(fù)雜的結(jié)構(gòu),各個評價指標(biāo)對應(yīng)的權(quán)重確定是個難點(diǎn)也是關(guān)鍵點(diǎn),采用兩兩比較評價因子的重要性來確定權(quán)重的方法比一次性確定所有因子的權(quán)重更加容易把握。因此,沒有把所有因子放在一起進(jìn)行比較,而是因子之間兩兩相互比較。對比時采用相對尺度,以盡可能降低性質(zhì)不同的因子之間相互比較的難度,來提高準(zhǔn)確度。
對于n個因子而言,可得兩兩相較的判斷矩陣A(正交矩陣):
滿足:
由專家對準(zhǔn)則層內(nèi)6 個評價指標(biāo)的兩兩相對重要性進(jìn)行打分,其相對重要性的比例標(biāo)度取值范圍為1 至9 之間[20]。根據(jù)專家打分結(jié)果整理分析出判斷矩陣結(jié)果如表2所示。
表2 顛覆性技術(shù)識別評價指標(biāo)重要性的判斷矩陣
將每個備選的顛覆性技術(shù)主題計算得到的指標(biāo)矩陣輸出,作為各個備選技術(shù)對每個準(zhǔn)則的判斷矩陣。如各技術(shù)主題的專利近3年引用率指標(biāo)矩陣如表3所示。
表3 各主題的專利近三年引用率指標(biāo)矩陣
2.5.3 計算權(quán)重
將顛覆性技術(shù)識別評價指標(biāo)重要性的判斷矩陣A的各行向量采用方根法幾何平均后進(jìn)行歸一化,得到各評價指標(biāo)的權(quán)重和特征向量W。
權(quán)重向量W =(W1,W2,…,Wn)T可直接由式(8)得出:
2.5.4 一致性檢驗(yàn)
若矩陣A是一致矩陣,那么A的最大特征值所對應(yīng)的特征向量即準(zhǔn)確地對應(yīng)于權(quán)重向量W,AW=λmaxW。采用求和法計算判斷矩陣權(quán)向量的過程中,首先將矩陣按列歸一化,然后將歸一化后的元素按行相加,最后將得到的每一行的和向量進(jìn)行歸一化即得權(quán)重。由于在實(shí)際應(yīng)用中,判斷矩陣A一般不可能是一致矩陣,因此要進(jìn)行一致性檢驗(yàn),檢查該方法得到的權(quán)重向量是否有效。計算一致性指標(biāo)其中n代表的是判斷矩陣的階數(shù)。
圖5 所有指標(biāo)特征向量計算截圖
將得到的5 個技術(shù)主題的特征向量與6 個指標(biāo)的權(quán)重向量相乘,即可計算每個技術(shù)主題的綜合重要度,如表4所示。從表4可以看出,對于5 個備選的顛覆性技術(shù)主題,Topic 1 的綜合重要度值最高,為0.229 017 09,該主題代表的是直插式內(nèi)存模塊等。綜合重要度值較高的是Topic 4,為0.210 814 61,該主題代表的是生物電子學(xué),即仿生電子元器件。其次是Topic 2,代表的是存儲介質(zhì)的創(chuàng)新。為了進(jìn)一步挖掘在這3 個技術(shù)主題下的顛覆性技術(shù)研究方向,不斷調(diào)整技術(shù)主題下關(guān)鍵詞選取的閾值,并且考慮關(guān)鍵詞突現(xiàn)值隨著年份的變化情況,對技術(shù)方向進(jìn)行解讀。同時咨詢專家意見,選取顛覆性技術(shù)方向。
表4 各技術(shù)主題的綜合重要度計算結(jié)果
顛覆性技術(shù)主題1:新型非易失性存儲器技術(shù)。這種技術(shù)讓儲存器比SRAM、DRAM、FLASH等傳統(tǒng)技術(shù)更快,能耗更低,效率更高[21],典型的運(yùn)用場景是新興的物聯(lián)網(wǎng)領(lǐng)域。RRAM的凸現(xiàn)度從2011年開始逐步增長,并保持上升趨勢。RRAM(Resistive random-access memory,縮寫為RRAM 或ReRAM)是可變電阻式存儲器,是新型非易失性存儲器的一種,具有低能耗、數(shù)據(jù)耐久度高、每次寫入或存儲的數(shù)據(jù)單位小等特點(diǎn)。而這恰好是即將到來的物聯(lián)網(wǎng)所需要的,其電壓較低,所消耗的電力也比較少,且RRAM寫入信息的速度比NAND閃存這種非易失性存儲器快1 萬倍,因此在這個信息化數(shù)字化高速發(fā)展時代,可變電阻式存儲器絕對是一個不可或缺的存在[22]。與RRAM隨年代變化趨勢類似的還有相變化存儲器(PCM),同樣是一種非易失性存儲器設(shè)備,是未來可能取代閃存的技術(shù)之一。
顛覆性技術(shù)主題2:磁阻式隨機(jī)存取存儲器(MRAM)。MRAM這個關(guān)鍵詞從2015年突然出現(xiàn)并且其凸現(xiàn)度居于較高位置,如圖6所示。關(guān)鍵詞前綴stt,代表了自旋轉(zhuǎn)移矩(Spin-transfer torque),是可用于翻轉(zhuǎn)磁阻式隨機(jī)存取內(nèi)存中的有源元件[23]。
圖6 突出MRAM的凸現(xiàn)詞可視化
顛覆性技術(shù)主題3:仿生電子元器件。2019年新出現(xiàn)了多個關(guān)鍵詞,其中有3 個詞與深度學(xué)習(xí)相關(guān),它們?yōu)閐eep learning,machine learning,neural network。通過文獻(xiàn)回溯研究發(fā)現(xiàn),涉及存儲芯片在深度學(xué)習(xí)中的運(yùn)用相關(guān)研究,如存儲芯片如何加速神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度等。神經(jīng)網(wǎng)絡(luò)上億的參數(shù)需要更快的存取數(shù)據(jù)、壓縮計算、矩陣運(yùn)算等,而這都需要存儲芯片幫忙。還有一個關(guān)鍵詞仿神經(jīng)計算機(jī)(neuromorphic computer),也是最近比較火熱的概念,也是AI的進(jìn)一步展望。一些存儲芯片,如憶阻器,特別適合實(shí)現(xiàn)人工神經(jīng)網(wǎng)絡(luò)[24]。根據(jù)電氣特性,尋找與人腦突觸特性類似的儲存器,最后構(gòu)建完整的神經(jīng)網(wǎng)絡(luò)。這也許是2017年、2018年出現(xiàn)憶阻器這一關(guān)鍵詞出現(xiàn)的原因。
以上識別出的顛覆性技術(shù)方向,最晚也在2008年就開始進(jìn)行研究,但往往只有在技術(shù)與應(yīng)用互相推進(jìn)下才能促進(jìn)顛覆性技術(shù)的產(chǎn)生,如BP神經(jīng)網(wǎng)絡(luò)這一概念很早就出現(xiàn),但只有足夠的算力才能推進(jìn)這一技術(shù)的爆發(fā)。
本文通過分析會議論文和專利數(shù)據(jù)中顛覆性技術(shù)可能體現(xiàn)出來的特征,在考慮專利價值、關(guān)鍵詞凸現(xiàn)度、學(xué)科關(guān)聯(lián)、專利與論文之間的引用關(guān)系等因素的基礎(chǔ)上,提出了一種基于數(shù)據(jù)質(zhì)量的動態(tài)權(quán)重分配評估方法,構(gòu)建了定性和定量相結(jié)合的“顛覆性技術(shù)識別模型”,對存儲芯片領(lǐng)域的顛覆性技術(shù)進(jìn)行識別?;诖鎯π酒I(lǐng)域的專利和論文兩種異構(gòu)數(shù)據(jù),通過LDA方法初步確定主題數(shù)量,在此基礎(chǔ)上綜合考慮數(shù)據(jù)的質(zhì)量和數(shù)量選取了6 個技術(shù)指標(biāo),并通過動態(tài)賦值評價的方法確定各技術(shù)的優(yōu)先級,最終結(jié)合專家智慧和結(jié)果解讀識別出了存儲芯片領(lǐng)域的顛覆性技術(shù)方向。
(1)在文獻(xiàn)計量分析需要兼顧文獻(xiàn)質(zhì)量對研究結(jié)果的影響。在文獻(xiàn)計量分析中,如果僅僅考慮數(shù)據(jù)的規(guī)模往往會造成數(shù)據(jù)分析結(jié)果的偏差,因?yàn)楦哔|(zhì)量的數(shù)據(jù)才是反映主題深層次含義的最佳載體。因此,在數(shù)據(jù)分析中可以兼顧文獻(xiàn)質(zhì)量,引入關(guān)鍵詞凸現(xiàn)度和綜合組合規(guī)模、市場范圍、技術(shù)重要程度3個維度的專利價值指數(shù)進(jìn)行指標(biāo)體系的構(gòu)建。
(2)主客觀結(jié)合的動態(tài)賦值法可以應(yīng)用于顛覆性技術(shù)識別中。主客觀結(jié)合的動態(tài)賦值法將動態(tài)權(quán)重評價模型與主客觀賦權(quán)法的優(yōu)缺點(diǎn)相互彌補(bǔ),既避免了單獨(dú)采用某一種方法的片面性,又綜合了兩種方法的優(yōu)勢;在考慮指標(biāo)實(shí)際意義的同時實(shí)現(xiàn)了客觀評價,同時也使得評價模型的可擴(kuò)展性得到了增強(qiáng),可以應(yīng)用在顛覆性技術(shù)識別中。
(3)關(guān)鍵詞解讀結(jié)合專家智慧識別出存儲芯片領(lǐng)域潛在的顛覆性技術(shù)。其突破點(diǎn)為:①新型非易失性存儲器技術(shù):可變電阻式存儲器(RRAM)、相變化存儲器(PCM);②磁阻式隨機(jī)存取存儲器(MRAM);③仿生電子元器件、仿神經(jīng)計算機(jī)。
在研究過程中還存在一些不足和可以改進(jìn)的地方,如在指標(biāo)選取方面,對于“近3年被引頻次增長率”指標(biāo),可以進(jìn)一步改進(jìn)其計算方法,確定每一篇論文在每一年的被引頻次,并賦予各年對應(yīng)的權(quán)重,以加權(quán)平均的方式進(jìn)一步計算。還可以進(jìn)一步研究引進(jìn)學(xué)科融合性的度量、其他學(xué)科引用率等其他指標(biāo)是否能起到優(yōu)化結(jié)果的作用,最終在多個指標(biāo)之間進(jìn)行取舍。在數(shù)據(jù)源方面,下一步可以豐富數(shù)據(jù)來源的類型,將科技報告、網(wǎng)絡(luò)數(shù)據(jù)等添加到數(shù)據(jù)源中,多角度更加全面地識別顛覆性技術(shù)。