国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于創(chuàng)新網(wǎng)絡(luò)社區(qū)主題發(fā)現(xiàn)和S 曲線的技術(shù)預(yù)測

2021-05-08 11:09宋儉寧宋天華
關(guān)鍵詞:雜交專利曲線

李 蕾,宋儉寧,宋天華*

(1.哈爾濱工業(yè)大學(xué)圖書館,哈爾濱 150090;2.東北農(nóng)業(yè)大學(xué),哈爾濱 150038)

1 引言

技術(shù)預(yù)測對于企業(yè)、行業(yè)和國家調(diào)整技術(shù)方向,瞄準(zhǔn)技術(shù)競爭制高點,以及制定技術(shù)戰(zhàn)略和技術(shù)規(guī)劃具有重要意義。國內(nèi)外對技術(shù)預(yù)測的研究,應(yīng)用的方法主要有德爾菲法、專家咨詢法、頭腦風(fēng)暴法、需求分析法、關(guān)鍵技術(shù)選擇法、趨勢外推法、文本挖掘法、層次分析法、專利分析法、STEEP(社會、技術(shù)、經(jīng)濟(jì)、環(huán)境、政治)分析法、SWOT(優(yōu)勢、劣勢、機(jī)會、挑戰(zhàn))分析法、決策樹法、實地考察法、技術(shù)路線圖等[1]。日本在第八次產(chǎn)業(yè)技術(shù)預(yù)測中,出現(xiàn)了引文預(yù)測法,它利用科技論文的引文數(shù)據(jù),通過統(tǒng)計方法處理后進(jìn)行預(yù)測[2]。同樣,對技術(shù)預(yù)測的分類也有很多種,如MARIANO 把技術(shù)預(yù)測方法分為探索性方法和規(guī)范性方法[3],探索性方法是根據(jù)目前的情況推斷未來發(fā)展,而規(guī)范性方法是依據(jù)未來的光景反推目前的做法。PORTER 等在1991 年把技術(shù)預(yù)測方法分為直接法、相關(guān)法和結(jié)構(gòu)法[4],但是流傳比較廣,比較被認(rèn)可的是還是PORTER 等[5]根據(jù)第一屆塞維利亞技術(shù)未來分析研討會[6]提出“九類-51 種方法體系”基礎(chǔ)上,提出的“13 大類-48 種未來技術(shù)分析方法”,如表1所示。

綜觀各類學(xué)者的觀點,多是根據(jù)各自需要執(zhí)其一種方法或多種方法展開技術(shù)預(yù)測研究。自從2000 年之后,多方法融合以及大數(shù)據(jù)已經(jīng)成為技術(shù)預(yù)測研究的主流。

專利是描述與刻畫技術(shù)創(chuàng)新的一個成熟和客觀的指標(biāo)。專利的專利引文是對其技術(shù)的發(fā)展和應(yīng)用,引文越多,則表明該專利的影響力越大,技術(shù)擴(kuò)散的越好[7]。最早提出專利引證概念的是在1949 年[8,9],但是直到2000 年之后,隨著專利電子數(shù)據(jù)庫的陸續(xù)建立,專利引文的研究才逐漸發(fā)展起來。DAIM 等用專利計量方法設(shè)計了預(yù)測技術(shù)創(chuàng)新的方法[10]。LAI 等用專利共引方法建立了一個新的專利分類系統(tǒng),便于進(jìn)行研發(fā)規(guī)劃、技術(shù)定位、專利戰(zhàn)略的決策和技術(shù)預(yù)測[11]。YOUTIE 等利用專利與專利引文探索納米技術(shù)的技術(shù)性質(zhì),以界定其是否為通用目的技術(shù)General Purpose Technology(GPT),以了解技術(shù)的長期遠(yuǎn)景[12]。一些學(xué)者研究了如何通過專利地圖為技術(shù)創(chuàng)新尋求機(jī)會以制訂新的技術(shù)創(chuàng)新戰(zhàn)略[13,14]。另外還有運用專利分析方法預(yù)測技術(shù)發(fā)展路徑[15]。李婧等對PEM 燃料電池專利引用情況進(jìn)行實證分析,從核心技術(shù)、技術(shù)趨勢、競爭對手、專利引證率方面闡述了專利引文在技術(shù)競爭力研究中的重要作用[16]。康宇航等初步研究了技術(shù)跟蹤的結(jié)構(gòu)和過程,設(shè)計了基于專利引文的技術(shù)跟蹤工具,為技術(shù)的發(fā)展戰(zhàn)略提供決策支持[17]。

表1 PORTER 等13 大類—48 種技術(shù)未來分析方法Table 1 Future analysis methods of 13 categories including PORTER-48 kinds of technology

CHANG 等利用專利引文網(wǎng)絡(luò)的分析方法探索了商業(yè)分類方法的擴(kuò)散規(guī)律。他們認(rèn)為在眾多技術(shù)預(yù)測指標(biāo)中,專利和專利引用是重要的指標(biāo)[7]。WARTBURG利用多級專利引文分析,測量創(chuàng)新的過程,指出單級專利引文分析不足以揭示技術(shù)發(fā)展具體路徑,應(yīng)該依據(jù)文獻(xiàn)耦合、共引、直接引用和間接引文等方法進(jìn)行技術(shù)路徑分析[18]。HUANG 等利用專利及專利引文研究了2003 年納米技術(shù)的最新發(fā)展,從國家、機(jī)構(gòu)和技術(shù)領(lǐng)域的角度展示了納米技術(shù)的最新進(jìn)展,用引文網(wǎng)絡(luò)揭示了技術(shù)擴(kuò)散[19]。MINA 等通過專利引文網(wǎng)絡(luò)和縱向路徑方法研究了藥品技術(shù)創(chuàng)新知識的涌現(xiàn)、成長和轉(zhuǎn)變[20]。

王宏起運用專利共現(xiàn)網(wǎng)絡(luò)和Katz 鏈路預(yù)測方法,對未來技術(shù)融合方向進(jìn)行預(yù)測[21]。史璇等綜合了文本挖掘、網(wǎng)絡(luò)分析、文獻(xiàn)計量和專利分析方法,提出一套預(yù)測燃料電池技術(shù)機(jī)會的預(yù)測方法,預(yù)測技術(shù)領(lǐng)域創(chuàng)新機(jī)會、識別可能應(yīng)用的行業(yè)和商業(yè)領(lǐng)域的發(fā)展趨勢[22]。覃興等結(jié)合專利網(wǎng)絡(luò)及專利地圖方法,提出專利地圖分析技術(shù)預(yù)測分析框架,對電力電纜的技術(shù)發(fā)展路線做出預(yù)測[23]。吳穎文等基于專利共現(xiàn)網(wǎng)絡(luò)和回歸分析,對未來可能涌現(xiàn)的共性技術(shù)進(jìn)行了預(yù)測[24]。CIGDEM 通過語義網(wǎng)絡(luò)預(yù)測技術(shù)創(chuàng)新的發(fā)展階段,揭示創(chuàng)新的動態(tài)演化[25]。

對專利網(wǎng)絡(luò)開展預(yù)測研究比較多的是創(chuàng)新路徑的預(yù)測研究,如VERSPAGEN 研究了燃料電池與數(shù)據(jù)通信標(biāo)準(zhǔn)技術(shù)演化,繪制出完整的技術(shù)路徑與專利引文網(wǎng)絡(luò)圖譜,認(rèn)為它們的技術(shù)彈道具有選擇性的和累積性的特質(zhì),在不同聚集水平上是非線性發(fā)展,并揭示了網(wǎng)絡(luò)中的重要技術(shù)(節(jié)點)和技術(shù)演化路徑[26,27]。結(jié)合傳統(tǒng)技術(shù)預(yù)測方法和語義挖掘技術(shù),研究與評價技術(shù)的創(chuàng)新路徑[28]、技術(shù)主路徑的演化與預(yù)測[29]、技術(shù)研究方向的識別[30]、技術(shù)涌現(xiàn)的早期識別[31]和對技術(shù)創(chuàng)新路徑的揭示[32]。還有用技術(shù)演化路徑預(yù)測納米制藥技術(shù)的發(fā)展[33],預(yù)測太陽能電池技術(shù)路徑的發(fā)展[34],激光加工技術(shù)的發(fā)展[35],3D 打印技術(shù)的發(fā)展和演變等[36]。楊中楷等探索了不同技術(shù)領(lǐng)域間的專利知識流動的宏觀網(wǎng)絡(luò)特征,并揭示技術(shù)的演進(jìn)路徑[37,38]。蔡力偉等一些學(xué)者運用專利文獻(xiàn)和復(fù)雜網(wǎng)絡(luò)方法,對技術(shù)機(jī)會開展了鏈接預(yù)測[39-41]。

應(yīng)用專利網(wǎng)絡(luò)對技術(shù)發(fā)展趨勢預(yù)測一直是研究熱點。HEON 等利用社會網(wǎng)絡(luò)分析方法預(yù)測了制藥設(shè)備的核心技術(shù)[42]。李佳佳等比較了局部離群因子算法和社會網(wǎng)絡(luò)分析方法,在中國風(fēng)能領(lǐng)域做了技術(shù)預(yù)測,結(jié)論基本是一致的[43]。YOU 等基于專利引文網(wǎng)絡(luò),對相干光發(fā)生器的技術(shù)發(fā)展趨勢進(jìn)行了預(yù)測[44]。周源等綜合了文獻(xiàn)計量、主題模型、社會網(wǎng)絡(luò)分析等方法,研究技術(shù)的演進(jìn)趨勢[45]。廖嶺等運用文本挖掘和主路徑分析方法,開展了技術(shù)發(fā)展趨勢的實證研究[46]。高建等綜合TRIZ 理論與邏輯曲線方法,預(yù)測了破胎器新技術(shù)可能出現(xiàn)的時機(jī)和發(fā)展趨勢[47]。一些學(xué)者,如文雄輝[48]和錢嬌等[49]基于SAO 鏈文本結(jié)構(gòu)模式揭示專利的文本語義,對比專利間技術(shù)相似度,構(gòu)建專利網(wǎng)絡(luò),分析技術(shù)創(chuàng)新的演化路徑,并結(jié)合TRIZ 理論預(yù)測技術(shù)的未來發(fā)展趨勢。張振剛等[50]基于聚類方法建立知識網(wǎng)絡(luò),用以預(yù)測未來熱點技術(shù)和技術(shù)的發(fā)展趨勢。WEN 結(jié)合專利網(wǎng)絡(luò)地圖和SAO 語義分析方法,對產(chǎn)業(yè)機(jī)器人的技術(shù)演化和發(fā)展趨勢進(jìn)行了預(yù)測[51]。尹忠博等[52]全面總結(jié)了基于數(shù)據(jù)的技術(shù)預(yù)測現(xiàn)狀和發(fā)展趨勢。

上述研究表明,利用專利或?qū)@牡难芯糠椒?,能揭示技術(shù)的涌現(xiàn)、成長、轉(zhuǎn)變、擴(kuò)散和演化,也可以跟蹤技術(shù)發(fā)展和技術(shù)預(yù)測。

雖然國內(nèi)外對于技術(shù)未來和技術(shù)預(yù)測的研究有很多,基于專利引文研究技術(shù)演化脈絡(luò)以及技術(shù)未來發(fā)展趨勢的研究也不少。但是,這些研究或者是針對特定技術(shù)領(lǐng)域的微觀分析,如路徑識別、鏈路預(yù)測和機(jī)會識別等;或者是對特定技術(shù)的宏觀研究,如技術(shù)演進(jìn)圖、未來技術(shù)機(jī)會和空白技術(shù)等,但很少有中觀視角對技術(shù)預(yù)測的研究。本文則是從中觀技術(shù)創(chuàng)新社區(qū)視角展開技術(shù)預(yù)測研究,綜合運用專利引文網(wǎng)絡(luò)、網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)、文本主題分類和S-曲線等方法,提出從中觀視角研究技術(shù)未來發(fā)展的一套方法。

2 研究方法與數(shù)據(jù)

本文綜合運用專利引文理論、網(wǎng)絡(luò)拓?fù)浜蛣討B(tài)演化理論、網(wǎng)絡(luò)社區(qū)偵測方法、語義主題分類和S-logistic曲線預(yù)測模型,對專利與專利之間通過引用關(guān)系形成的、以專利技術(shù)為節(jié)點、它們之間的引用關(guān)系為邊的技術(shù)創(chuàng)新網(wǎng)絡(luò)的技術(shù)創(chuàng)新進(jìn)行數(shù)據(jù)挖掘和發(fā)展預(yù)測,以把握技術(shù)的發(fā)展進(jìn)程和方向。

本文實證數(shù)據(jù)為雜交水稻育種的專利及其引文數(shù)據(jù),數(shù)據(jù)來源于德溫特專利數(shù)據(jù)庫。數(shù)據(jù)獲取方法是,確定“hybrid rice”為檢索詞,選取的檢索項是主題途徑,它包括專利題名與專利文摘,時間跨度是55 年,既從1963—2018 年。最后共得到922 件雜交水稻專利,專利引文565 件。從整體發(fā)展曲線(圖1)和專利主題分析,雜交水稻技術(shù)的發(fā)展經(jīng)歷了3 個階段。第一個階段,1963—2001 年前后,在這個階段,雜交水稻從萌芽、起步、迅速發(fā)展,逐漸發(fā)展成為相對完整的水稻培育技術(shù)領(lǐng)域,專利文獻(xiàn)主題比較多樣。第二階段,2002—2014 年前后,這個階段雜交水稻可能開始向一些特殊品性方向迅猛發(fā)展,專利主題中的如超高產(chǎn)量、高品質(zhì)、高抗病性等頻次增加較快。第三階段,2014 年到現(xiàn)在,雜交水稻進(jìn)入技術(shù)相對成熟階段,一些具備特殊品性的雜交水稻育種技術(shù)開始接近成熟。

圖1 雜交水稻技術(shù)發(fā)展Fig.1 Growth of hybrid rice

2.1 最大分割主題分類法

網(wǎng)絡(luò)社區(qū)(Network Community)主要是指網(wǎng)絡(luò)中的子網(wǎng)絡(luò),子網(wǎng)絡(luò)中的節(jié)點相互連接比較緊密,而子網(wǎng)絡(luò)中的節(jié)點與外面的節(jié)點連接比較少或者沒有連接[53]。網(wǎng)絡(luò)社區(qū)的偵測主要是基于網(wǎng)絡(luò)中節(jié)點的連接性進(jìn)行聚類分區(qū)的方法。具體地說,就是要抽取網(wǎng)絡(luò)中的重要模塊。網(wǎng)絡(luò)社區(qū)的發(fā)現(xiàn)對于預(yù)測網(wǎng)絡(luò)成長過程中涌現(xiàn)的重要的、關(guān)鍵的性質(zhì)具有重大意義。一些社區(qū)發(fā)現(xiàn)的算法已經(jīng)發(fā)展起來,如主要應(yīng)用于大規(guī)模物理網(wǎng)絡(luò)的層次的GN 算法(Girvan and Newman's Divisive Algorithm)[54]、K-近鄰算法(Kernighan-Lin)[55]、用于社區(qū)圖劃分的譜方法(Spectral Methods)[56,57]、貪婪算法(Newman's Greedy Optimization of Modularity)[58]和應(yīng)用于多水平網(wǎng)絡(luò)劃分的馬爾可夫聚類算法(Markov Clustering)[59,60]等。

本文采用的數(shù)據(jù)為文本數(shù)據(jù),數(shù)據(jù)有約1 500 個樣本量,對數(shù)據(jù)的語義理解比較容易處理。網(wǎng)絡(luò)中還存在一些孤立點也可能對技術(shù)的發(fā)展具有作用,而且這些創(chuàng)新的孤立,有可能是數(shù)據(jù)系統(tǒng)規(guī)范要求造成的,如中國專利不要求必須標(biāo)注引文。因此,忽略了孤立點,也可能造成數(shù)據(jù)不完整。但上述提到的那些算法都不適合這些孤立點的社區(qū)劃分。為避免了上述情況發(fā)生,有必要采用新的方法,本文主要是基于獨立創(chuàng)新的技術(shù)主題,比較它們與網(wǎng)絡(luò)中有連接的技術(shù)創(chuàng)新社區(qū)的主題,按照匹配原則歸屬它們的社區(qū)劃分。

本文設(shè)計的社區(qū)發(fā)現(xiàn)方法命名為最大分割主題分類法,分為網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)與主題分類兩個步驟。

(1)網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)。對數(shù)據(jù)集生成的技術(shù)創(chuàng)新網(wǎng)絡(luò)直接進(jìn)行分割,規(guī)則是最大化節(jié)點的鏈接,其定義為:如果在子網(wǎng)絡(luò)中,節(jié)點之間存在連接,而這些節(jié)點與子網(wǎng)絡(luò)外的節(jié)點不存在連接,則該子網(wǎng)絡(luò)為網(wǎng)絡(luò)中的一個網(wǎng)絡(luò)社區(qū)Ni。

(2)文本挖掘與主題分類。首先對網(wǎng)絡(luò)社區(qū)(N1,N2,…,Ni)進(jìn)行文本挖掘與語義分析,利用詞頻分析和Wordnet 專業(yè)詞典提取反映每個社區(qū)創(chuàng)新技術(shù)主題的高頻核心關(guān)鍵詞Kn,建立每個網(wǎng)絡(luò)創(chuàng)新社區(qū)的主題關(guān)鍵詞集{Knj}。然后,抽取并建立反映每個孤立點主題的高頻核心關(guān)鍵詞集{Kiso},比較每個孤立點的關(guān)鍵詞集{Kiso}與每個創(chuàng)新社區(qū)的關(guān)鍵詞集{Knj}的匹配度Mi,如果Mi≥60%,則孤立點i 歸入網(wǎng)絡(luò)創(chuàng)新社區(qū)Ni,如果Mi=0,則孤立點i 不屬于任何網(wǎng)絡(luò)社區(qū)。這樣就保證了再網(wǎng)絡(luò)社區(qū)數(shù)據(jù)盡可能完備的情況下,對技術(shù)創(chuàng)新的發(fā)展趨勢進(jìn)行預(yù)測。

2.2 成長曲線預(yù)測模型

S-logistic 曲線模型也叫S-曲線模型,是生物學(xué)家VERHULST 在1845 年研究人口增長時建立和發(fā)展起來的[61]。S-曲線模型廣泛應(yīng)用在經(jīng)濟(jì)、政治、人口統(tǒng)計、化學(xué)、植物增長動態(tài)、昆蟲生態(tài)和森林增長等領(lǐng)域。S-曲線模型如下:

其中,Yt和t 分別代表S-曲線發(fā)展變量和時間變量,a 和b 是模型參數(shù),決定著曲線的形狀與位置,而k 是一個代表當(dāng)t 達(dá)到極限時Yt極限固定值。每個S-曲線都有3 個階段:萌芽期、成長期和成熟期,如圖2所示。

I、II 和III 分別代表萌芽期,成長期和成熟期。也有的S-曲線模型分為4 個階段,在成熟期之后,還有衰退期。本文的研究重點是探討技術(shù)的前3 個成長階段,而對技術(shù)衰退期不做深入探討。

圖2 S-曲線模型Fig.2 S-curve model

技術(shù)生命周期理論已經(jīng)被廣泛的接受和采用,它反映了技術(shù)成長最主要的特征,比較符合技術(shù)的成長演化形態(tài)。一般地情況下,技術(shù)周期分為4 個階段,初始階段、發(fā)展階段、成熟階段和成熟后階段。而體現(xiàn)技術(shù)生命周期的技術(shù)成長曲線與S 曲線比較相似,因此用S-曲線模型預(yù)測技術(shù)的發(fā)展趨勢是可行的,也是適合的。當(dāng)然存在著技術(shù)突變和其它變化,可能會產(chǎn)生一個升級的S-曲線或其他成長曲線模型,那么,可以先擬合出最優(yōu)符合成長曲線,然后運用該曲線模型進(jìn)行預(yù)測。本文對于技術(shù)發(fā)展趨勢的研究正是基于技術(shù)周期理論的前提條件,對代表技術(shù)創(chuàng)新的專利歷史數(shù)據(jù)進(jìn)行分析,最后選用了最符合雜交水稻社區(qū)成長的S-曲線模型外推出技術(shù)的發(fā)展趨勢。整個預(yù)測過程如圖3 所示。

圖3 技術(shù)創(chuàng)新發(fā)展趨勢預(yù)測過程Fig.3 Forecasting process of developing trend for technology innovation

3 實證研究

3.1 專利引文技術(shù)創(chuàng)新網(wǎng)絡(luò)的社區(qū)偵測

接下來,利用雜交水稻專利及其引文數(shù)據(jù),通過引用關(guān)系生成雜交水稻專利引文技術(shù)創(chuàng)新網(wǎng)絡(luò)。然后利用本文設(shè)計的社區(qū)分割分類方法對網(wǎng)絡(luò)進(jìn)行社區(qū)發(fā)現(xiàn)與劃分,劃分出雜交水稻的技術(shù)創(chuàng)新社區(qū)。

3.1.1 專利引文技術(shù)創(chuàng)新網(wǎng)絡(luò)的社區(qū)分割

首先通過專利、專利引文以及它們之間的引用關(guān)系,生成包含922 雜交水稻專利和565 件專利引文的雜交水稻技術(shù)創(chuàng)新網(wǎng)絡(luò)。然后用前面設(shè)計的最大分割主題分類法對該網(wǎng)絡(luò)進(jìn)行社區(qū)探測。約簡去比較小的創(chuàng)新網(wǎng)絡(luò)社區(qū)之后,得到3 個創(chuàng)新社區(qū)的網(wǎng)絡(luò)圖,如圖4 所示。最早形成的也是最大的社區(qū)是第一個創(chuàng)新社區(qū)(圖中左邊紅色圓點形狀節(jié)點的子網(wǎng)絡(luò)),該社區(qū)由654 件專利互相連接而成,通過文本挖掘與人工判別,其主要研究方向是具有“高產(chǎn)量高抵抗力”特點的雜交水稻技術(shù)。圖中右上(綠色方塊形狀節(jié)點的子網(wǎng)絡(luò))的是第二個創(chuàng)新社區(qū),該社區(qū)有300 件連接的專利,同樣的文本挖掘與識別方法,判定該創(chuàng)新社區(qū)的特點是培育具有“高品質(zhì)高抵抗力”種子的雜交水稻技術(shù)。最下方的(蘭色三角形節(jié)點的子網(wǎng)絡(luò))是第三個創(chuàng)新社區(qū),該社區(qū)的主要創(chuàng)新特點是,估測與區(qū)別與雜交水稻有很大關(guān)系的能育性基因的技術(shù)。第三個創(chuàng)新社區(qū)的規(guī)模和發(fā)展速度上都比較低,數(shù)據(jù)量滿足不了預(yù)測的規(guī)模要求,而且從2005 年之后,數(shù)據(jù)出現(xiàn)了中斷,無法進(jìn)行預(yù)測。因此,我們主要對第一和第二技術(shù)創(chuàng)新社區(qū)進(jìn)行實證研究。

3.1.2 專利引文技術(shù)創(chuàng)新網(wǎng)絡(luò)社區(qū)的主題分類

對孤立專利的社區(qū)劃分要通過前面設(shè)計的最大分割主題分類法的第二步——主題分類分析來完成。具體是通過對專利數(shù)據(jù)的文本分析,主要包括專利名稱與專利摘要的文本主題分析與詞頻分析,運用成熟的詞頻分析軟件“英語詞頻分析器”和Wordnet 語義詞典,經(jīng)過分析、清洗、分類等提取出代表各技術(shù)創(chuàng)新社區(qū)的高頻主題關(guān)鍵詞,形成社區(qū)主題詞集。第一創(chuàng)新社區(qū)主要的研究方向是培育具有“高產(chǎn)量高抗性”的雜交水稻種子技術(shù),其漢英對照的主題詞集合如表2所示。

第二創(chuàng)新社區(qū)主要的研究方向是培育具有“高品質(zhì)高抗性”的雜交水稻種子技術(shù)。它漢英對照的主題詞集合如表3 所示。

圖4 雜交水稻主要的技術(shù)創(chuàng)新社區(qū)Fig.4 The main innovation communities of hybrid rice

表2 雜交水稻第一創(chuàng)新社區(qū)主題詞集Table 2 Subject words set of the first innovation community for hybrid rice

表3 雜交水稻第二創(chuàng)新社區(qū)主題詞集Table 3 Subject words set of the second innovation community for hybrid rice

孤立創(chuàng)新的主題分析與匹配,首先對每個孤立專利(主要是題名與文摘)進(jìn)行文本語義分析和詞頻分析,提取出每件專利的主題詞集,這些主題詞匯也是由代表每件專利主題的高頻關(guān)鍵詞組成。之后,把每件孤立專利的主題詞集與每個創(chuàng)新社區(qū)的主題詞集進(jìn)行語義分析與匹配,根據(jù)每件專利主題與每個創(chuàng)新社區(qū)主題的相似度確定每件孤立專利的所屬創(chuàng)新社區(qū)。如果{主題詞集}孤立x 與{主題詞集}第n 社區(qū)的匹配度達(dá)到60%以上,則孤立點x 歸入第n 創(chuàng)新社區(qū),否則,不歸入任何創(chuàng)新社區(qū)。主題分析與匹配的結(jié)果是,235 件孤立專利歸屬到第一創(chuàng)新社區(qū),49 件孤立專利歸屬到第二創(chuàng)新社區(qū),還有28 件孤立專利沒有歸屬到任何創(chuàng)新社區(qū)。下面將是根據(jù)雜交水稻創(chuàng)新社區(qū)的時間序列發(fā)展來預(yù)測創(chuàng)新的發(fā)展趨勢。

3.1.3 技術(shù)創(chuàng)新發(fā)展趨勢預(yù)測

首先,根據(jù)雜交水稻創(chuàng)新社區(qū),對創(chuàng)新社區(qū)的專利數(shù)據(jù)進(jìn)行最優(yōu)模型擬合,然后按最優(yōu)模型外推,進(jìn)而預(yù)測技術(shù)創(chuàng)新社區(qū)的未來發(fā)展趨勢。由于第三個創(chuàng)新社區(qū)樣本量比較小,而且在2005 年之后,數(shù)據(jù)出現(xiàn)中斷,因此不能產(chǎn)生預(yù)測結(jié)果。所以本文只對雜交水稻第一和第二個創(chuàng)新社區(qū)發(fā)展趨勢進(jìn)行分析與預(yù)測。

采用的數(shù)據(jù)是每個雜交水稻技術(shù)創(chuàng)新社區(qū)的年代累積專利數(shù),確定擬合的最優(yōu)模型是S-曲線模型,因此采用該模型進(jìn)行預(yù)測。S 曲線外推預(yù)測首先要擬合創(chuàng)新社區(qū)的成長模型,確定社區(qū)成長曲線的飽和點(Saturation)、反曲時間點(Midpoint)和成長時間(Growthtime)3 項參數(shù)。之后,把累積專利數(shù)據(jù)輸入,按照確定的預(yù)測模型參數(shù),推測出創(chuàng)新社區(qū)的發(fā)展趨勢。預(yù)測模型的3 項參數(shù)的意義如下。

(1)飽和點(Saturation):指在雜交水稻技術(shù)創(chuàng)新主題社區(qū)中產(chǎn)生的最大專利數(shù),也是技術(shù)發(fā)展到成熟階段專利累積數(shù)量的極值點。

(2)反曲時間點(Midpoint):是S-曲線二次微分值為0 的點,曲線形狀在反曲時間點由上凸轉(zhuǎn)變?yōu)橄峦?,專利累積增長速率由正數(shù)轉(zhuǎn)為負(fù)數(shù),由增加轉(zhuǎn)為減少。

(3)成長時間(Growthtime):指專利累積成長從飽和值的10%數(shù)量開始,至飽和值的90%數(shù)量為止所需的時間。

首先,對每個創(chuàng)新社區(qū)的專利年代累積數(shù)據(jù)進(jìn)行曲線擬合。雜交水稻第一技術(shù)創(chuàng)新社區(qū)最優(yōu)的擬合曲線符合S-曲線分布。雜交水稻第一創(chuàng)新社區(qū)的累積成長曲線(圖中方塊連線)與最優(yōu)擬合曲線(圖中紅線)如圖5 所示。

圖5 雜交水稻第一創(chuàng)新社區(qū)成長曲線Fig.5 Growth curve of the first innovation community for hybrid rice

第一創(chuàng)新社區(qū)成長的最優(yōu)擬合曲線模型為Slogistic分布,模型具體形式如方程(2):

由擬合模型得出累積專利數(shù)的飽和值為1 863,根據(jù)這個計算出來的最優(yōu)飽和值,輸入第一創(chuàng)新社區(qū)年代累積專利數(shù)據(jù),調(diào)節(jié)S-曲線至收斂到最大置信區(qū)間,最后得出預(yù)測曲線(圖6)。

圖6 雜交水稻育種技術(shù)第一創(chuàng)新社區(qū)發(fā)展趨勢Fig.6 Developing trend of the first innovation community for hybrid rice

預(yù)測的S-曲線如圖6 所示,由預(yù)測曲線可知,雜交水稻第一主題創(chuàng)新社區(qū)成長的反曲時間點(圖中三角塊形狀點)大約為2021.2 年,估算的10%~90%的成長時間1973—2043 年共70 年,而接近90%成長飽和點即接近技術(shù)成熟(圖中平行四邊形點)的時間約為2047—2050 年左右,飽和點專利累積件數(shù)就是前面擬合模型給出的飽和點數(shù)值,為1 863 件。

之后對雜交水稻第二技術(shù)創(chuàng)新社區(qū)發(fā)展進(jìn)行預(yù)測。首先依據(jù)雜交水稻第二創(chuàng)新社區(qū)的累積增長數(shù)據(jù)擬合出最優(yōu)曲線,其數(shù)據(jù)線與擬合曲線如圖7 所示。

圖中黑色方塊形狀連線為數(shù)據(jù)線,紅色實線為擬合曲線。雜交水稻第二技術(shù)創(chuàng)新社區(qū)很好地符合S 曲線分布,具體擬合曲線模型如方程(3):

圖7 雜交水稻第二創(chuàng)新社區(qū)成長曲線Fig.7 Growth curve of the second innovation community for hybrid rice

從模型中得出飽和點為294。根據(jù)飽和點數(shù)值294,調(diào)節(jié)S-曲線模型曲線,使置信區(qū)間最大,非置信區(qū)間最小(原方差最?。瑥亩玫阶顑?yōu)化的預(yù)測擬合曲線,結(jié)果如圖8 所示。

圖8 雜交水稻第二創(chuàng)新社區(qū)發(fā)展趨勢Fig.8 Development trend of the second innovation community for hybrid rice

由圖8 的最優(yōu)S-曲線可知,雜交水稻第二主題創(chuàng)新社區(qū)成長的反曲時間點(圖中紅色圓點)約為2008.2 年,估算的10%~90%的成長時間(1996—2016年)為20 年,而接近90%成長飽和點即接近技術(shù)成熟(圖中紅色方塊點)的時間約為2022—2024 年左右,飽和點專利累積件數(shù)就是前面擬合模型給出的飽和點數(shù)值,為294 件。

4 討論與結(jié)論

4.1 對技術(shù)創(chuàng)新研究的啟示

技術(shù)創(chuàng)新是比較難度量與刻畫的。由于專利及其引文能很好地度量與刻畫技術(shù)創(chuàng)新,自從電子專利數(shù)據(jù)庫的大量出現(xiàn)之后,基于專利及其引文研究技術(shù)創(chuàng)新成為一個主要的技術(shù)創(chuàng)新研究流派。又由于專利制度在世界各國的普及發(fā)展,專利化的技術(shù)創(chuàng)新就已經(jīng)占據(jù)技術(shù)創(chuàng)新主要的地位。因此,用專利及其引文刻畫與度量技術(shù)創(chuàng)新是合適的。

本文提出了從專利引文技術(shù)創(chuàng)新網(wǎng)絡(luò)社區(qū)中觀視角,預(yù)測技術(shù)發(fā)展趨勢的方法。技術(shù)創(chuàng)新是一個系統(tǒng),只有包含專利引文和網(wǎng)絡(luò)中孤立創(chuàng)新點的專利網(wǎng)路,才是更完整的,預(yù)測的結(jié)果才能貼近實際。本文從理論上完善了用專利文獻(xiàn)數(shù)據(jù)預(yù)測技術(shù)創(chuàng)新的方法,提出了從復(fù)雜系統(tǒng)角度預(yù)測中觀技術(shù)發(fā)展趨勢的專利文獻(xiàn)數(shù)據(jù)預(yù)測方法,使得其他學(xué)者或者任何人都可以在此理論方法的指導(dǎo)下,對其他的技術(shù)創(chuàng)新領(lǐng)域進(jìn)行發(fā)展趨勢預(yù)測。

本文發(fā)展了一個社區(qū)偵測方法。主要是融合了網(wǎng)絡(luò)連接、模塊社區(qū)劃分等傳統(tǒng)社區(qū)偵測理論與文本主題挖掘理論,建立了新的社區(qū)偵測方法。社區(qū)劃分最合理的方法是從節(jié)點與網(wǎng)絡(luò)模塊的語義主題給予劃分。但是,這種方法同時帶來了計算上的復(fù)雜,在計算多數(shù)大型復(fù)雜網(wǎng)絡(luò)的時候會使計算成本高到無法承擔(dān)的地步。所以,在低成本語義挖掘方法出現(xiàn)之前,這種方法無法利用,更無法普及。另一方面,傳統(tǒng)通過網(wǎng)絡(luò)連接性和模塊性劃分社區(qū)的方法卻遺漏了網(wǎng)絡(luò)中的孤立點,而這些孤立點有可能是下次鏈接發(fā)生的起點,也可能由于數(shù)據(jù)結(jié)構(gòu)規(guī)范引發(fā)的。因此,本文考慮了社區(qū)偵測方法的兩難限制,融合了傳統(tǒng)社區(qū)劃分與主題語義分析方法,在盡量不增加計算成本的前提下,提高社區(qū)偵測的準(zhǔn)確性,并包含對孤立點的劃分。這種社區(qū)偵測方法是融合兩種思想的初步嘗試,為進(jìn)一步的研究探索指明了方向。

本文超越了整體宏觀預(yù)測技術(shù)發(fā)展趨勢的限制,從中觀的技術(shù)創(chuàng)新社區(qū)角度,建立了預(yù)測技術(shù)創(chuàng)新中觀社區(qū)發(fā)展趨勢的方法。充分地利用復(fù)雜網(wǎng)絡(luò)的拓?fù)涮卣鳌饕巧鐓^(qū)拓?fù)浣Y(jié)構(gòu)特性進(jìn)行技術(shù)發(fā)展預(yù)測,使得預(yù)測的視角更加細(xì)微、更加具體,但又不失系統(tǒng)性。對于今后利用專利法預(yù)測技術(shù)中觀發(fā)展趨勢,提供了一定的借鑒。

4.2 對實證技術(shù)領(lǐng)域的建議

目前,高抗性高產(chǎn)量的雜交水稻育種技術(shù)處于快速成長的轉(zhuǎn)折階段,在現(xiàn)有技術(shù)條件下,下一階段的發(fā)展速度將逐漸減低,大約將在2047—2050 年左右發(fā)展成熟;而高品質(zhì)高抗性的雜交水稻育種技術(shù)目前處于成長階段的后期,接近技術(shù)成熟的階段,大約將在2022—2024 年間技術(shù)發(fā)展成熟。

從本文預(yù)測的結(jié)果看,現(xiàn)有技術(shù)條件下,雜交水稻第一創(chuàng)新社區(qū)處于快速發(fā)展的中期,也是發(fā)展的轉(zhuǎn)折階段。在此階段,該領(lǐng)域雜交水稻育種技術(shù)的研究者,應(yīng)該從兩個方面加強(qiáng)研究行為。第一,對現(xiàn)有育種技術(shù)的集成和改進(jìn)完善。因為該技術(shù)創(chuàng)新社區(qū)處于技術(shù)發(fā)展中期階段,因此還會有近20 年左右的快速發(fā)展時期。在此階段,該領(lǐng)域的研究者應(yīng)該不斷地加強(qiáng)研究,對現(xiàn)有技術(shù)不斷地完善,不斷地綜合集成現(xiàn)有各種技術(shù),使高產(chǎn)量高抗性的雜交水稻育種技術(shù)發(fā)展完善,盡可能搶占技術(shù)競爭的制高點。第二,瞄準(zhǔn)未來雜交水稻育種高地,研發(fā)與儲備下一代雜交水稻育種技術(shù)。由于技術(shù)周期規(guī)律的作用,如果沒有突破性技術(shù)的產(chǎn)生,只對現(xiàn)有技術(shù)修補(bǔ)與集成的話,那么20年之后技術(shù)發(fā)展成熟的時候,也會遇到技術(shù)發(fā)展瓶頸。而按照技術(shù)生命周期理論,突破性技術(shù)的更新?lián)Q代能改變技術(shù)生命周期曲線和發(fā)展周期,從而使技術(shù)創(chuàng)新進(jìn)入更高層次的技術(shù)成長周期曲線上,使得技術(shù)在更高層次上發(fā)展。由于育種技術(shù)的周期比較長,以及未來技術(shù)突破過程中可能遇到各種技術(shù)難題,因此,應(yīng)該盡早開始新一代高產(chǎn)量高抗性雜交水稻育種技術(shù)的研發(fā)。

從本文的預(yù)測結(jié)果看,雜交水稻第二創(chuàng)新社區(qū)已經(jīng)處于技術(shù)發(fā)展的后期,接近技術(shù)發(fā)展頂峰。在該階段,該領(lǐng)域的研究者沒有太多選擇,除了用很少的一部分精力完善現(xiàn)有技術(shù),保持該技術(shù)創(chuàng)新領(lǐng)域的領(lǐng)先外,應(yīng)該轉(zhuǎn)變研究方向爭取取得突破性技術(shù)創(chuàng)新。只有這樣,才可能在未來的雜交水稻育種技術(shù)的競爭中占有一席之地。

猜你喜歡
雜交專利曲線
未來訪談:出版的第二增長曲線在哪里?
雜交水稻“泰豐A”高產(chǎn)又好吃
山西落葉松雜交良種逾10萬畝
袁隆平:雜交水稻之父
幸福曲線
夢寐以求的S曲線
雜交牛
曲線的華麗贊美詩
2007年上半年專利授權(quán)狀況統(tǒng)計
江城| 千阳县| 修水县| 京山县| 当阳市| 西林县| 武夷山市| 安远县| 邯郸县| 郸城县| 合水县| 南昌市| 石阡县| 乌鲁木齐市| 宁阳县| 新泰市| 荣昌县| 惠来县| 南川市| 那坡县| 沂水县| 盱眙县| 额尔古纳市| 内乡县| 娄底市| 烟台市| 信丰县| 东光县| 沾益县| 昌宁县| 友谊县| 松桃| 安化县| 鄂托克旗| 略阳县| 黔江区| 汝城县| 出国| 昌江| 呼玛县| 新民市|