国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

專利視角下智能網(wǎng)聯(lián)汽車技術(shù)主題識別與演化研究

2024-06-25 09:31:22戚湧孫嘉燁
科技創(chuàng)業(yè)月刊 2024年6期
關(guān)鍵詞:智能網(wǎng)聯(lián)汽車

戚湧 孫嘉燁

摘要摘?要:全球汽車行業(yè)正在經(jīng)歷巨大變革,電動化、智能化和網(wǎng)聯(lián)化將成為未來汽車技術(shù)發(fā)展的潮流。智能網(wǎng)聯(lián)汽車是國家重點發(fā)展的戰(zhàn)略性新興產(chǎn)業(yè),將汽車、電子和信息技術(shù)深度融合在一起,對于推進我國制造強國和網(wǎng)絡(luò)強國建設(shè)具有重大意義。如何用科學(xué)方法來識別智能網(wǎng)聯(lián)汽車領(lǐng)域技術(shù)主題,指導(dǎo)智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)技術(shù)選擇,給出相應(yīng)的政策建議,具有重要的學(xué)術(shù)價值與應(yīng)用前景。首先總結(jié)歸納了國內(nèi)外的相關(guān)研究,闡述了技術(shù)主題識別、技術(shù)演化的理論基礎(chǔ),并構(gòu)建相應(yīng)的研究模型與框架;然后對智能網(wǎng)聯(lián)汽車專利數(shù)據(jù)進行檢索分析,再利用LDA模型完成相關(guān)專利文獻的主題識別,并在此基礎(chǔ)上構(gòu)建HMM模型分析相應(yīng)技術(shù)主題的演化關(guān)系;最后得出該領(lǐng)域技術(shù)主題的演化路徑及規(guī)律。針對智能網(wǎng)聯(lián)汽車領(lǐng)域共識別出20個技術(shù)主題,并以此構(gòu)建技術(shù)主題演化關(guān)系有向網(wǎng)絡(luò)圖,可為相關(guān)企業(yè)及研發(fā)機構(gòu)提供決策參考。

關(guān)鍵詞關(guān)鍵詞:技術(shù)主題識別;技術(shù)演化;智能網(wǎng)聯(lián)汽車;專利文獻

中圖分類號中圖分類號:U495;G255.53

文獻標識碼:A

DOIdoi:10.3969/j.issn.1672-2272.202401053

英文標題Research on the Theme Identification and Evolution of Intelligent Connected Vehicle Technology from the Perspective of Patents

Qi Yong, Sun Jiaye

(Nanjing University of Science and Technology of Intellectual Property, Nanjing 210094,China)

英文摘要Abstract:As the era progresses, the global automotive industry is experiencing significant transformations, with electrification, intelligence, and connectivity emerging as future trends in automotive technology. Intelligent connected vehicles, as a key strategic emerging industry, amalgamate automotive, electronic, and information technologies, playing a crucial role in promoting Chinas ambitions to become a powerhouse in manufacturing and networking. This area also represents a significant aspect of technological research. Thus, applying scientific methods to identify technological themes in the intelligent connected vehicle sector, guiding the industrys technological decisions, and providing relevant policy recommendations hold substantial academic and practical value. This paper begins by summarizing relevant domestic and international research, elucidating the theoretical underpinnings of technology theme identification and evolution, and establishing the corresponding research models and frameworks. It then analyzes intelligent connected vehicle patent data, employs the LDA model for theme identification in related patent literature, and constructs an HMM model to examine the evolutionary relationships of these technology themes. The study ultimately delineates the evolutionary trajectory and patterns of technological themes in this field. In the realm of intelligent connected vehicles, 20 technical themes were identified, and a directed network graph depicting the evolution of these themes was created. This provides strategic guidance and support for relevant enterprises and research and development institutions.

英文關(guān)鍵詞Key Words:Technical Subject Identification; Technological Evolution; Intelligent Connected Vehicles; Patent Documents

隨著時代的發(fā)展,全球汽車行業(yè)正在經(jīng)歷巨大變革,電動化、智能化和網(wǎng)聯(lián)化正成為未來汽車技術(shù)發(fā)展的潮流。智能網(wǎng)聯(lián)汽車結(jié)合了傳統(tǒng)汽車和網(wǎng)聯(lián)汽車技術(shù)的優(yōu)勢,是一種跨越汽車、通信和安全技術(shù)領(lǐng)域的創(chuàng)新型產(chǎn)品,具有廣泛的應(yīng)用前景。作為汽車、電子、信息、交通等領(lǐng)域深度融合的戰(zhàn)略新興產(chǎn)業(yè),智能網(wǎng)聯(lián)汽車將在未來的技術(shù)革命和工業(yè)轉(zhuǎn)型中扮演關(guān)鍵角色,對于推進我國制造強國和網(wǎng)絡(luò)強國建設(shè)具有重大意義。準確把握相關(guān)技術(shù)領(lǐng)域中的核心技術(shù)或技術(shù)體系,能夠有效獲得競爭優(yōu)勢與市場價值,而這些通常蘊藏于專利、研發(fā)成果、專有技術(shù)之中[1]。如何對智能網(wǎng)聯(lián)汽車領(lǐng)域內(nèi)眾多類型的技術(shù)成果進行技術(shù)的有效識別和分析,已經(jīng)成為當下研究的重點。

專利文獻作為技術(shù)創(chuàng)新過程中一種獨特的產(chǎn)物,承載著專業(yè)技術(shù)領(lǐng)域的技術(shù)要點與技術(shù)內(nèi)容信息,其內(nèi)容詳實準確且具有一定的長期性、廣泛性和趨前性[2],可以提供有價值的信息并有助于了解技術(shù)創(chuàng)新中的核心內(nèi)容,能夠有效反映應(yīng)用研究與應(yīng)用創(chuàng)新。專利數(shù)據(jù)包含結(jié)構(gòu)化和非結(jié)構(gòu)化兩個部分,并且文獻數(shù)量龐大,需要選擇科學(xué)合理的研究方法和分析框架。技術(shù)主題作為技術(shù)文獻的主旨和核心,具有一定的代表性,其演變也遵循著一定的內(nèi)在規(guī)律[3]。通過對專利文獻信息的分析與挖掘,識別智能網(wǎng)聯(lián)汽車領(lǐng)域的技術(shù)主題,在此基礎(chǔ)上分析這些技術(shù)主題的發(fā)展狀態(tài)和演變趨勢,進而指導(dǎo)智能網(wǎng)聯(lián)汽車相關(guān)產(chǎn)業(yè)的技術(shù)選擇,實現(xiàn)智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)層面技術(shù)預(yù)見,具有重要的研究意義。

1?相關(guān)研究

1.1?技術(shù)識別

目前,國內(nèi)外很多學(xué)者針對不同技術(shù)領(lǐng)域開展了各種技術(shù)類型的識別研究,比較常見的是通過構(gòu)建相應(yīng)的指標體系并基于專家經(jīng)驗來完成技術(shù)的識別。

李政等[4]通過使用尖點型突變方程,建立能夠預(yù)測關(guān)鍵技術(shù)的模型,從而實現(xiàn)對關(guān)鍵技術(shù)的識別和預(yù)見。Porter等[5]通過建立一個指標體系,從燃料電池等領(lǐng)域的專利文摘集合中篩選出關(guān)鍵技術(shù)主題。Lee等[6]建立多指標體系,納入了正向引用、先驗信息和專利家族成員數(shù)等指標,來確定關(guān)鍵技術(shù)。楊大飛等[7]通過構(gòu)建核心技術(shù):“三力”模型,建立核心技術(shù)識別指標體系和識別模型,并基于OLED平板顯示產(chǎn)業(yè)進行實證研究。此類方法受到一定程度上主觀因素的影響,而且比較依賴于相關(guān)方面的專家資源。為了降低此類影響,一些學(xué)者選擇基于圖與網(wǎng)絡(luò)分析的方法,從技術(shù)關(guān)聯(lián)的視角完成技術(shù)識別,比如Peng等[8]通過使用英文專利數(shù)據(jù)庫,獲取GPS技術(shù)方面的專利信息,并將這些信息與社會網(wǎng)絡(luò)相結(jié)合,構(gòu)建引文網(wǎng)絡(luò)以識別共性技術(shù)。李瑞茜和陳向東[9]通過建立非對稱的技術(shù)知識傳遞網(wǎng)絡(luò)研究有效發(fā)明專利之間的相似性,并通過分析這些相似性來確定技術(shù)之間的相互作用,從而識別出核心技術(shù)。紀亞琨等[10]基于專利網(wǎng)絡(luò)視角,構(gòu)建“領(lǐng)域-發(fā)明-主題”多層分析結(jié)構(gòu)模型以識別潛在顛覆性技術(shù),并以自動駕駛領(lǐng)域為例驗證了模型的可行性和有效性。也有一些學(xué)者是在以上研究的基礎(chǔ)上,通過文本分析進一步獲取相關(guān)技術(shù),比如張維沖等[11]以區(qū)塊鏈為例,面向多種不同科技文獻提出基于摘要的主題解析方法,獲取主題詞并進行數(shù)據(jù)融合與主題關(guān)聯(lián)分析。馬永紅等[12]以專利文獻為基礎(chǔ),結(jié)合LDA算法完成主題聚類,通過技術(shù)的共現(xiàn)率來分析技術(shù)主題的共性,并利用社會網(wǎng)絡(luò)分析方法來確定關(guān)鍵技術(shù)。呂鯤等[13]通過區(qū)塊鏈金融的專利數(shù)據(jù),利用組合分詞方法和LDA模型識別關(guān)鍵技術(shù)主題,并根據(jù)產(chǎn)業(yè)關(guān)鍵技術(shù)特征衡量出區(qū)塊鏈金融領(lǐng)域內(nèi)關(guān)鍵技術(shù)。從上述相關(guān)研究中可以看出,多數(shù)學(xué)者基于專利數(shù)據(jù)展開分析,將多種理論和研究方法相結(jié)合,并通過構(gòu)建相應(yīng)的模型以實現(xiàn)不同研究領(lǐng)域的技術(shù)識別。近些年為了避免相關(guān)領(lǐng)域?qū)<屹Y源獲取不便的情況,以客觀定量分析的方法成為主流,非常具有參考價值。因此,本研究擬選取目前有關(guān)技術(shù)識別中較為常用的文本分析的相關(guān)方法,在此基礎(chǔ)上加以改進,選取智能網(wǎng)聯(lián)汽這一領(lǐng)域?qū)崿F(xiàn)技術(shù)主題的識別。

1.2?技術(shù)演化

關(guān)于技術(shù)演化,國內(nèi)外學(xué)者從多個視角利用不同方法進行了分析論證。大多數(shù)學(xué)者從專利視角出發(fā),通過構(gòu)建相應(yīng)的引文網(wǎng)絡(luò)展開分析,如Oh等[14]基于專利網(wǎng)絡(luò)的動態(tài)特征,構(gòu)建了引用專利關(guān)系網(wǎng)絡(luò),利用 USPTO專利數(shù)據(jù)對其特征進行研究,可知穩(wěn)健技術(shù)趨勢計算的結(jié)論與技術(shù)發(fā)展的歷史趨勢基本一致。Yoon & Magee[15]利用專利文獻及引用關(guān)系對技術(shù)發(fā)展趨勢進行了分析,結(jié)果顯示,對技術(shù)發(fā)展的規(guī)劃與評價有一定的參考價值。楊武等[16]以專利家族為研究視角,闡述技術(shù)路徑動態(tài)演化過程中的路徑依賴以及受到的干擾,并提出一種修正技術(shù)演化主路徑的新思路。一些學(xué)者在此基礎(chǔ)上結(jié)合語義文本挖掘進行相關(guān)研究,比如李欣等[17]針對目前在新興技術(shù)演化軌跡研究中存在的不足,提出了基于SAO結(jié)構(gòu)語義挖掘的新興技術(shù)演化軌跡分析方法。周源等[18]利用科技文獻的文本與引用信息,構(gòu)建引用網(wǎng)絡(luò)來進行拓撲聚類,以主題聚類結(jié)果為基礎(chǔ),結(jié)合各時段網(wǎng)絡(luò)社區(qū)之間的關(guān)聯(lián),對技術(shù)演化路徑進行分析。李子彪和張莉[19]借助LDA模型全面挖掘鋼鐵材料領(lǐng)域技術(shù)主題,深入考慮主題在強度、內(nèi)容方面的動態(tài)演化過程,并結(jié)合我國工業(yè)化發(fā)展階段繪制相關(guān)路線圖。儲節(jié)旺等[20]利用專利分析方法與主題模型繪制了顛覆性技術(shù)整體演化的路徑,以把握技術(shù)發(fā)展整體態(tài)勢。伊惠芳等[21]以融入主題生命周期和技術(shù)熵要素的分析方法來探析石墨烯技術(shù)演化路徑,從技術(shù)主題狀態(tài)、主題演化強度變化及主題內(nèi)容3個維度進行全面分析。李乾瑞等[22]以顛覆性技術(shù)為研究對象,引入主題-時序分析和專利引文網(wǎng)絡(luò)分析,提出了基于突變-融合視角的顛覆性技術(shù)主題演化分析模型。以上專家學(xué)者在針對技術(shù)演化和發(fā)展趨勢的研究中,以圖與網(wǎng)絡(luò)分析為基礎(chǔ)的相關(guān)研究方法已經(jīng)成為主流,但針對技術(shù)主題演化的內(nèi)涵與本質(zhì)的相關(guān)探討較少。因此本文在考量前文技術(shù)識別的相關(guān)研究方法后,將主題模型與圖與網(wǎng)絡(luò)分析的方法相結(jié)合,對智能網(wǎng)聯(lián)汽車技術(shù)演化進行分析,根據(jù)智能網(wǎng)聯(lián)汽車技術(shù)領(lǐng)域特點融入技術(shù)主題的演化內(nèi)涵,以此發(fā)掘技術(shù)演化路徑。

2?模型構(gòu)建

本文將隱含狄利克雷分布(LDA)和隱馬爾可夫過程(HMM)相結(jié)合,提出一種基于LDA-HMM的智能網(wǎng)聯(lián)汽車技術(shù)主題識別和演化研究分析模型。通過 LDA主題模型對專利文獻數(shù)據(jù)進行主題建模,訓(xùn)練模型生成技術(shù)主題,避免了人工標注法引起的效率和精度問題;在此基礎(chǔ)上結(jié)合技術(shù)主題演化內(nèi)涵與本質(zhì),引入包含雙重隨機過程的隱馬爾可夫模型,結(jié)合智能網(wǎng)聯(lián)汽車技術(shù)領(lǐng)域特點,通過隱馬爾可夫模型進行相關(guān)參數(shù)估計,繪制相應(yīng)網(wǎng)絡(luò)有向圖。以此完成智能網(wǎng)聯(lián)汽車技術(shù)主題識別和演化研究,挖掘技術(shù)主題的演化路徑。

2.1?技術(shù)主題識別部分

LDA主題模型是一種詞袋模型,利用隱含狄利克雷分布描述文檔的生成,基于詞語共現(xiàn)概率最大化以完成詞語聚類,能夠有效提取文檔的隱含主題。在LDA主題模型中,設(shè)定專利文獻內(nèi)隱含的技術(shù)主題服從分布:

Dirθm|α=Г(∑Kk=1αk∏Kk=1Гαk∏Kk=1θαk-1mk(1)

其中,θmk表示專利文獻m在技術(shù)主題k中的分布。對每個技術(shù)主題k生成主題詞項分布Φk~Dir(β),對于每篇專利文獻m,所生成的主題詞分布θm~Dir(а)。對每篇專利文獻中第n個詞項生成主題項zmn~Multinomial(θm)和詞項 wmn~Multinomial(ΦZmn),LDA模型可以表述為:

pw,z|α,β=pw|z,βpz|α=∏Kk=1Δnk+βΔβ∏Mm=1Δnm+αΔα

(2)

在“文檔—主題—詞匯”這一路徑下,LDA根據(jù)主題個數(shù)k,在k條路徑下進行吉布斯采樣(Gibbs Sampling),具體概率如下:

pzi=k|zi,w∝nkm,i+αk∑Kk=1nlm,i+αk.ntk,i+βt∑Vt=1nlk,i+βt(3)

LDA模型的核心是要準確合理地設(shè)置文本集合中的隱含的主題數(shù),因為 LDA算法本身無法自主生成最優(yōu)的主題數(shù)目,所以擬通過對構(gòu)造完成后的模型進行評價來選擇最優(yōu)的主題數(shù)量。相關(guān)研究中,以困惑度作為判斷主題數(shù)的標準[23],困惑度一般被用來衡量概率模型中的預(yù)測值和樣本之間的匹配情況,困惑度越小,匹配精度就會越高,從而可以對各種模型進行對比評價。在語言模型中,該方法主要涉及整句或文本的概率分布,越是專業(yè)化的語義庫所呈現(xiàn)出的困惑度就越小。而且,LDA模型算法不能根據(jù)詞語實際意義進行聚類,其主要是根據(jù)詞語聚類或共現(xiàn)關(guān)系來判斷詞語之間的親疏程度。所以,本文選擇在困惑度相關(guān)方法的基礎(chǔ)上,結(jié)合主題詞分布關(guān)系和經(jīng)驗法則,對最優(yōu)主題數(shù)的選取進行綜合判別分析,具體如下。

2.1.1?困惑度判別

在LDA主題模型中,通常采用困惑度這一指標去選定合適主題數(shù)。在一般情況下,隨著技術(shù)主題數(shù)目的增多,其所對應(yīng)的困惑度降低,困惑度的數(shù)值可以看作是文本中每個詞語所分得的似然值,在詞語分布概率中:

pw=∫θ∏Nn=1∑kZn=1pwn|zn;βpzn|θpθ;αdθ(4)

式中,p(θ; α)是Dirichlet分布,p(zn | θ)是含有參數(shù)θ的多項式,p(wn | zn; β)是詞的概率分布多項式。該模型的k維Dirichlet參數(shù)α=(α1, … , αk)以及矩陣β。

將困惑度模型公式化:

perplexityDtest=exp-∑mlogpwm∑mwm|(5)

將其代入得:

Dtest=exp-∑mlog∫θ∏Nn=1∑kZn=1pwn|zn;βpzn|θpθ;αdθ∑mwm|(6)

以此可知任意主題數(shù)量所對應(yīng)的困惑度值。

2.1.2?主題詞分布關(guān)系判別

選取合適的技術(shù)主題數(shù)并可視化后,能夠發(fā)現(xiàn)主題詞間距分布情況均勻、間距疏松、相互覆蓋程度較小。主題詞間距參考了Sievert等[24]的研究,將主題詞距離函數(shù)設(shè)為:

r(w,k|λ)=λlogkw)+(1-λ)logkwpw(7)

此式中λ是主題k中主題詞w的權(quán)重值。

2.1.3?綜合判別

本文擬將困惑度判別與主題詞分布關(guān)系判別法則的優(yōu)點結(jié)合起來,因此采用以下方法:選擇具有低困惑度的技術(shù)主題數(shù)目作為參數(shù),并利用這些參數(shù)分別計算主題詞間距,并將其可視化表示為主題詞間距圖,并結(jié)合以往經(jīng)驗判斷中的“手肘法”來選取最優(yōu)主題數(shù)k。

2.2?技術(shù)主題演化部分

在本文中,將相關(guān)領(lǐng)域技術(shù)主題的演變歸因于兩個方面:一是先前研發(fā)所獲得的成果潛移默化地啟發(fā)并支持新創(chuàng)意、新技術(shù)的出現(xiàn);二是在第一種情形的基礎(chǔ)上,隨著客觀研發(fā)環(huán)境的改變,研發(fā)創(chuàng)新主體改變期望而影響到所產(chǎn)生的研發(fā)成果,專利文獻作為研究成果的載體而顯現(xiàn)。在此引入隱馬爾可夫模型,探究相關(guān)領(lǐng)域技術(shù)的發(fā)展歷程。將隱馬爾可夫模型中的隱藏狀態(tài)轉(zhuǎn)移關(guān)系、觀測樣本與各個狀態(tài)之間的概率映射關(guān)系(混淆關(guān)系),與領(lǐng)域技術(shù)主題識別結(jié)果、各個技術(shù)主題在專利文獻中的分布一一對應(yīng),通過確定隱藏的技術(shù)主題間的轉(zhuǎn)移關(guān)系矩陣,從而推斷出技術(shù)主題的演變方式。根據(jù)這一思路,技術(shù)主題的演變與隱馬爾可夫模型之間存在的對應(yīng)關(guān)系具體如圖1所示。

根據(jù)上述思想,通過構(gòu)建相應(yīng)的隱馬爾可夫模型λ=[π,A,B],表現(xiàn)技術(shù)主題與專利文獻的關(guān)聯(lián)模式,具體如下:

(1)隱馬爾可夫狀態(tài)序列集合。

S=S1,S2,…,SN-1,SN(8)

在本文中,N是LDA模型聚類的主題數(shù),且這些狀態(tài)Si對應(yīng)了LDA主題聚類結(jié)果中的每個技術(shù)主題,他們是隱藏且無法被觀測到的。

(2)隱馬爾可夫可觀測狀態(tài)序列集合。

O=O1,O2,…,OM-1,OM9

在本文中,M是專利文獻類型數(shù),在此與技術(shù)主題數(shù)目相對應(yīng),指代了特定技術(shù)主題所對應(yīng)的專利文獻數(shù)占整個技術(shù)領(lǐng)域?qū)@麛?shù)的比重,它們可直接觀測。

(3)狀態(tài)轉(zhuǎn)移概率分布A。

在隱馬爾可夫模型中,各個狀態(tài)間轉(zhuǎn)換的概率,記為矩陣A=aij,其中aij表示在任意時刻t,若狀態(tài)為Si,則在下一時刻(t+1)的狀態(tài)為Sj的概率,在本文中矩陣A指代了研發(fā)過程中,研發(fā)主題從狀態(tài)Si轉(zhuǎn)移到Sj的概率,可以表示為:

aij=PSj|Si,1≤i,j≤N10

aij≥0∑Nj=1aij=111

(4)輸出觀測概率B。

根據(jù)當前狀態(tài)獲得各個觀測值的概率,記為矩陣B=bij,其中bij表示在任意時刻t,若狀態(tài)為Si則觀測值為Oj被獲取的概率,在本文中指的是歷年技術(shù)主題相關(guān)專利文獻占比,可以表示為:

bij=POi|Sj,1≤i≤M,1≤j≤N12

(5)初始狀態(tài)概率π。

模型中隱藏狀態(tài)在初始時刻出現(xiàn)的概率,記為π=π1,π2,…πN-1,πN,πi表示出現(xiàn)狀態(tài)Si的概率,本文通過LDA主題識別后,將各個技術(shù)主題中主題詞共現(xiàn)數(shù)的歸一化矩陣作為πi的初始迭代值。

(6)Baum-Welch算法。

為探索研究領(lǐng)域的技術(shù)演化機理,即對應(yīng)了隱馬爾可夫模型的參數(shù)估計問題,所以用Baum-Welch算法來實現(xiàn)這一過程,具體如下:

輸入:觀測數(shù)據(jù)Ob=Ob1,Ob2,…,Obt

輸出:隱馬爾可夫模型參數(shù)

①初始化。

對n=0,選取aij0,bij0,πi0,得到模型λ0=(A0,B0,π0)

②遞推,對n=1,2,……,

an+1ij=∑T-1t=1ξti,j∑T=1t=1γti13

bn+1ij=∑Tt=1γtjIObt=vj∑Tt=1γtj14

πn+1i=γ1i15

③終止,得到模型參數(shù)λ(n+1)=(A(n+1),B(n+1),π(n+1))

3?實證分析

3.1?專利數(shù)據(jù)獲取

本文選取“南京理工大學(xué)知識產(chǎn)權(quán)大數(shù)據(jù)平臺”對智能網(wǎng)聯(lián)汽車專利數(shù)據(jù)進行檢索分析,為全面獲取智能網(wǎng)聯(lián)汽車相關(guān)專利數(shù)據(jù),制定了相應(yīng)的檢索策略。首先,根據(jù)智能網(wǎng)聯(lián)汽車的技術(shù)架構(gòu)進行技術(shù)分解;其次,確定檢索要素以及檢索范圍,在本文中主要選取的檢索要素是“關(guān)鍵詞”和“分類號”,檢索范圍是“標題名稱”“摘要”;最后,構(gòu)建專利檢索表達式,在構(gòu)建過程中需要不斷的閱讀專利文獻,增添關(guān)鍵詞,同時排除雜質(zhì)因素,確定適合的檢索式。

綜上所述,構(gòu)建專利檢索表達式:(名稱,摘要+=(智能網(wǎng)聯(lián)汽車 OR (車聯(lián)網(wǎng) OR 自動駕駛 OR 無人駕駛 OR 傳感器 OR 控制器 OR 圖像 OR 檢測 OR 采集 OR 安全 OR 通信) AND 汽車)) AND (分類號=(G02C21 OR G08G1 OR G05D1 OR H04L29 OR H04N7 OR B60R16 OR E04H6 OR B62D5 OR G06K9 OR G06F17 OR G01C21 OR H04W04)) AND 申請日=(20140101 to 20221231)。依據(jù)所構(gòu)建的專利檢索式進行相關(guān)專利檢索,在排除重復(fù)和信息不完整的專利后,共獲得智能網(wǎng)聯(lián)汽車相關(guān)專利18 759項。

3.2?智能網(wǎng)聯(lián)汽車技術(shù)主題識別

本文選取“智能網(wǎng)聯(lián)汽車”專利數(shù)據(jù)中的摘要進行相關(guān)研究,構(gòu)建相應(yīng)的LDA主題模型。因為所選取的數(shù)據(jù)庫對智能網(wǎng)聯(lián)汽車進行了專題優(yōu)化,所以參考其中的關(guān)鍵詞作為補充詞典,并根據(jù)專利文本的特殊性建立停用詞表,添加諸如“具有”“一類”“本實用新型”“本發(fā)明”“提出”“形成”“進行”“申請”等詞語,上述詞典的完善能夠使得技術(shù)主題的識別結(jié)果更加準確合理。

在確認智能網(wǎng)聯(lián)汽車技術(shù)主題的數(shù)目時,首先計算了1-25個主題數(shù)時的困惑度,并繪制“主題數(shù)—困惑度”函數(shù)圖像,如圖2所示。

又選取主題數(shù)16、18、21、22這幾個點分別繪制主題詞距離圖,如圖3所示。

根據(jù)主題詞距離圖與“主題數(shù)—困惑度”的關(guān)系函數(shù)圖,并結(jié)合“手肘法”這一經(jīng)驗法則,可以判斷最優(yōu)的主題數(shù)在15~23之間,因此需要對主題數(shù)15~23之間的函數(shù)圖像進行局部放大,具體結(jié)果如圖4所示。

繪制主題數(shù)為20的主題詞距離圖,如圖5所示。

綜上,當相關(guān)專利文獻的主題聚類結(jié)果為20時,符合困惑度較低而且主題詞間距適中,所以本文選取的智能網(wǎng)聯(lián)車輛的技術(shù)主題數(shù)為20個,利用Python中的Sklearn庫獲取各主題相關(guān)專利,并導(dǎo)出關(guān)鍵主題詞,因篇幅所限,在此僅列出各個技術(shù)主題中前6個關(guān)鍵詞。將主題聚類結(jié)果與《智能網(wǎng)聯(lián)汽車技術(shù)路線圖2.0》研究報告對照,可知這些主題之間的技術(shù)領(lǐng)域界限清楚,分類效果理想。為方便指代,本文將各個主題進行編號并命名,具體如表1所示。

基于上述結(jié)果,繪制各個技術(shù)主題所對應(yīng)的專利數(shù)據(jù)分布直方圖,具體如圖6所示。

可以看出,智能網(wǎng)聯(lián)汽車領(lǐng)域內(nèi)各個技術(shù)主題所對應(yīng)的專利數(shù)量各有差異,其中安全限位裝置、立體車庫、車載終端等技術(shù)主題具有較多的專利數(shù)量,表明該領(lǐng)域內(nèi)的相應(yīng)配套設(shè)施設(shè)備以及安全問題正在受到廣泛關(guān)注,而技術(shù)主題中智能遙控、車載中控系統(tǒng)、電驅(qū)系統(tǒng)等專利數(shù)量較少,但這不能直接表明它們沒有受到關(guān)注或者不重要,也可能是由于存在技術(shù)壁壘或者技術(shù)已經(jīng)趨于成熟。

3.3?智能網(wǎng)聯(lián)汽車技術(shù)主題演化

主題間之間主題詞越相似,主題間出現(xiàn)混淆或轉(zhuǎn)移概率越高[25]。在本研究中使用主題詞共現(xiàn)分析方法,根據(jù)從智能網(wǎng)聯(lián)汽車的主題識別結(jié)果,提取每一個技術(shù)主題中出現(xiàn)概率最高的前40個關(guān)鍵詞,然后統(tǒng)計每兩個技術(shù)主題之間關(guān)鍵詞的共現(xiàn)數(shù)量,以此來衡量這些技術(shù)主題值間相似的程度,各技術(shù)主題之間共現(xiàn)關(guān)鍵詞數(shù)量分布情況具體如圖7所示。

由圖7可知,對角線上的主題詞共現(xiàn)數(shù)都是40,這是因為在先前LDA模型的參數(shù)設(shè)定上,每一技術(shù)主題均提取各自概率最高前40個關(guān)鍵詞。去除對角線以后,其他數(shù)據(jù)也有一定差異,在主題1(車載終端)和主題6(移動通訊)之間共現(xiàn)詞數(shù)最多,達到了16個,從主題相關(guān)技術(shù)研發(fā)視角來看,兩個技術(shù)主題的確具有很強的技術(shù)聯(lián)系,也有一些技術(shù)主題間共現(xiàn)詞數(shù)在10個以上,這說明他們在技術(shù)上也有較強的關(guān)聯(lián)性。在整個圖中有51對技術(shù)主題之間共現(xiàn)詞數(shù)量在2個以下,這證明了多數(shù)技術(shù)主題之間的相似程度較低,也從側(cè)面驗證了先前所構(gòu)建的 LDA 模型中一系列參數(shù)設(shè)定是合理的,主題識別結(jié)果的準確性較高。

將主題詞共現(xiàn)數(shù)進行歸一化處理,所獲得的共現(xiàn)詞數(shù)矩陣,作為HMM模型的初始混淆矩陣及轉(zhuǎn)移矩陣,具體如表2所示,因篇幅所限,表中省略了部分主題間的轉(zhuǎn)移/混淆關(guān)系。

導(dǎo)入本文構(gòu)建的技術(shù)主題演化隱馬爾可夫模型中,利用 Baum-Welch算法訓(xùn)練HMM模型,獲得最優(yōu)轉(zhuǎn)移矩陣。其中在Baum-Welch算法中,由于智能網(wǎng)聯(lián)汽車是近些年才受到關(guān)注,所以針對模型中的觀測序列Ob=(Ob1,Ob2,…,Obt)采用了“訓(xùn)練—測試”的方式。在訓(xùn)練數(shù)據(jù)中生成了200條數(shù)據(jù),每條數(shù)據(jù)包含100個觀測樣本,在測試數(shù)據(jù)中生成30條數(shù)據(jù)以及相應(yīng)的100個觀測樣本,經(jīng)過50輪迭代后,以完成對所構(gòu)建的隱馬爾可夫模型的最優(yōu)參數(shù)估計。具體如表3所示,由于篇幅有限,表中略去部分主題間的轉(zhuǎn)移關(guān)系。

在宏觀研發(fā)的進程中,轉(zhuǎn)移矩陣體現(xiàn)出技術(shù)主題發(fā)生轉(zhuǎn)變的可能性,即對應(yīng)了本文研究中智能網(wǎng)聯(lián)汽車領(lǐng)域內(nèi)技術(shù)主題之間隱藏的相互轉(zhuǎn)移關(guān)系,為了更直觀地表現(xiàn)這一對應(yīng)關(guān)系,本文利用上述矩陣數(shù)據(jù)繪制熱度圖,如圖8所示。

總體上看,最優(yōu)轉(zhuǎn)移矩陣熱度圖中深色區(qū)域占多數(shù),這表明大部分技術(shù)主題都有發(fā)生轉(zhuǎn)移的傾向。從單一技術(shù)主題的角度來看,主題間研發(fā)的轉(zhuǎn)移傾向具有不同的特點。為了進一步獲取智能網(wǎng)聯(lián)汽車領(lǐng)域內(nèi)技術(shù)主題演化關(guān)系,提取了轉(zhuǎn)移概率大于8.5%的技術(shù)主題,利用Ucinet軟件建立一個轉(zhuǎn)移關(guān)系網(wǎng)絡(luò)有向圖來表示技術(shù)主題的演化路徑,具體如圖9所示,其中箭頭方向代表轉(zhuǎn)移方向,線條粗細代表轉(zhuǎn)移概率。

從圖9可以看出,在智能網(wǎng)聯(lián)汽車領(lǐng)域內(nèi)技術(shù)主題的演化中,主要的技術(shù)主題節(jié)點有:智能泊車、汽車傳動系統(tǒng)、微控制單元等,這些技術(shù)主題流入比重很高,是智能網(wǎng)聯(lián)汽車領(lǐng)域內(nèi)的核心技術(shù)。而且,從圖9中可以找出多條技術(shù)主題的演化路徑,主要的有:“汽車監(jiān)測診斷技術(shù)→智能泊車→車聯(lián)網(wǎng)→汽車傳動系統(tǒng)→危險態(tài)勢預(yù)警→車載智能空調(diào)→自動駕駛輔助”“車載智能空調(diào)→總線記錄儀器→汽車傳動系統(tǒng)→微控制單元→車聯(lián)網(wǎng)→智能決策→安全限位裝置”等技術(shù)演化方式,這一過程體現(xiàn)出智能網(wǎng)聯(lián)汽車相關(guān)技術(shù)研究開發(fā)方向上的轉(zhuǎn)變趨勢。

其中,技術(shù)主題演化中保持自身研發(fā)方向能力較強的主題包括:自動駕駛輔助(0.566)、微控制單元(0.205)、高壓電池(0.182)、安全限位裝置(0.162)等,這些技術(shù)主題在演化過程中一直保持著較高的熱度,是智能網(wǎng)聯(lián)汽車相關(guān)研發(fā)過程中的熱門技術(shù)節(jié)點。此外,技術(shù)主題演化過程中轉(zhuǎn)移流失比重最大的主題是“圖像處理”,其主要流向總線記錄儀、微控制單元、汽車傳動系統(tǒng)等方面,這是由于圖像處理技術(shù)的數(shù)字化、集成化的趨勢,這一功能的實現(xiàn)需要依賴上述技術(shù)的輔助,所以這一特定領(lǐng)域內(nèi)的演化表現(xiàn)顯著。

4?結(jié)論與展望

本文將LDA與HMM相結(jié)合,基于專利數(shù)據(jù)對智能網(wǎng)聯(lián)汽車領(lǐng)域進行分析研究。利用LDA對智能網(wǎng)聯(lián)汽車進行技術(shù)主題識別,將該領(lǐng)域劃分為20個技術(shù)主題,并在此基礎(chǔ)上引入HMM模型,將技術(shù)研發(fā)與隱馬爾可夫過程相結(jié)合,從中分析智能網(wǎng)聯(lián)汽車技術(shù)主題演化路徑與規(guī)律。本文所識別出的技術(shù)主題是該領(lǐng)域內(nèi)重要研發(fā)方向,是未來技術(shù)創(chuàng)新和產(chǎn)品競爭的重點,所構(gòu)建的技術(shù)主題演化關(guān)系網(wǎng)絡(luò)能夠為相關(guān)企業(yè)及研發(fā)機構(gòu)了解該領(lǐng)域內(nèi)的技術(shù)研發(fā)趨勢,提供研發(fā)決策方向,把握機會形成優(yōu)勢,節(jié)約資源,降低研發(fā)成本。該模型方法實現(xiàn)了無需專家經(jīng)驗的專利數(shù)據(jù)高效無監(jiān)督聚類,能夠快速有效地挖掘其中隱含的技術(shù)主題信息,獲得關(guān)鍵的技術(shù)節(jié)點及技術(shù)演化趨勢,為專利計量提供新的途徑,也可以應(yīng)用于其他技術(shù)領(lǐng)域。

但本研究也存在一定局限,一是在數(shù)據(jù)獲取方面,僅對本國專利文獻這單一維度進行采集,未來可以擴大文獻收集范圍,加入國內(nèi)外的期刊論文和外國的專利數(shù)據(jù),通過不同來源不同類別數(shù)據(jù)的采集和分析,完成更加嚴謹全面的智能網(wǎng)聯(lián)汽車技術(shù)主題相關(guān)研究;二是針對隱馬爾可夫模型中的混淆關(guān)系,即技術(shù)主題所對應(yīng)的相關(guān)專利文獻類型,可以進一步展開研究,選取適當?shù)姆椒ǘ糠治銎渲兴鶎?yīng)的關(guān)系,比如可以借助PageRank算法確定領(lǐng)域內(nèi)的關(guān)鍵技術(shù)主題。

參考文獻參考文獻:

[1]?韓志華. 核心專利判別的綜合指標體系研究[J]. 中國外資,2010(4): 193-196.

[2]?林巖. 基于專利數(shù)據(jù)的知識計量研究評述[J]. 科技管理研究,2008(9): 91-93.

[3]?楊恒,王曰芬,張露. 基于核心專利技術(shù)主題識別與演化分析的技術(shù)預(yù)測[J].情報雜志,2022,41(7): 49-56.

[4]?李政,羅暉,李正風(fēng),等. 基于突變理論的科技評價方法初探[J]. 科研管理,2017,38(s1): 193-200.

[5]?PORTER A L, GARNER J, CARLEY S F, et al. Emergence scoring to identify frontier R&D topics and key players[J]. Technological Forecasting and Social Change, 2019,146:628-643.

[6]?LEE C, KWON O, KIM M, et al. Early identification of emerging technologies: a machine learning approach using multiple patent indicators[J]. Technological Forecasting and Social Change, 2018, 127(Feb): 291-303.

[7]?楊大飛,楊武,田雪姣,等.基于專利數(shù)據(jù)的核心技術(shù)識別模型構(gòu)建及實證研究[J]. 情報雜志,2021,40(2): 47-54.

[8]?PENG Z, YANJUN Y, LIXUE S. Recognition and evolution of generic technology in GPS industry and its enlightenment: based on patent analysis[J]. Technology Economics, 2016(12): 60-75,89.

[9]?李瑞茜,陳向東. 基于專利共類的關(guān)鍵技術(shù)識別及技術(shù)發(fā)展模式研究[J]. 情報學(xué)報,2018,37(5): 495-502.

[10]?紀亞琨,余翔,張奔,等. 專利網(wǎng)絡(luò)視角下的潛在顛覆性技術(shù)識別——以自動駕駛領(lǐng)域為例[J]. 情報雜志,2022,41(12): 46-50,139.

[11]?張維沖,王芳,趙洪. 多源信息融合用于新興技術(shù)發(fā)展趨勢識別——以區(qū)塊鏈為例[J]. 情報學(xué)報,2019,38(11): 1166-1176.

[12]?馬永紅,孔令凱,林超然,等. 基于專利挖掘的關(guān)鍵共性技術(shù)識別研究[J]. 情報學(xué)報,2020,39(10): 1093-1103.

[13]?呂鯤,陳簫羽,靖繼鵬. 基于組合分詞方法和LDA模型的區(qū)塊鏈金融產(chǎn)業(yè)關(guān)鍵技術(shù)識別研究[J]. 圖書情報工作,2022,66(19): 110-121.

[14]?OH G, KIM H-Y, PARK A. Analysis of technological innovation based on citation information[J]. Quality & Quantity, 2017, 51(3SI): 1065-1091.

[15]?YOON B, MAGEE C L. Exploring technology opportunities by visualizing patent information based on generative topographic mapping and link prediction[J]. Technological Forecasting and Social Change, 2018, 132: 105-117.

[16]?楊武,陳培,GAD DAVID. 光刻機產(chǎn)業(yè)技術(shù)擴散與技術(shù)動態(tài)演化——對“卡脖子”技術(shù)的啟示[J]. 中國科技論壇,2022(9): 73-84.

[17]?李欣,謝前前,黃魯成,等.基于SAO結(jié)構(gòu)語義挖掘的新興技術(shù)演化軌跡研究[J]. 科學(xué)學(xué)與科學(xué)技術(shù)管理,2018,39(1): 17-31.

[18]?周源,杜俊飛,劉宇飛,等. 基于引用網(wǎng)絡(luò)和文本挖掘的技術(shù)演化路徑識別[J]. 情報雜志,2018,37(10): 76-81.

[19]?李子彪,張莉. 基于LDA模型的鋼鐵材料專利技術(shù)主題演化研究[J]. 科技管理研究,2020,40(24): 175-183.

[20]?儲節(jié)旺,李佳軒,安怡然. 基于專利分析的顛覆性技術(shù)演化與預(yù)測研究——以量子信息技術(shù)為例[J]. 科技進步與對策,2023,40(22):130-140.

[21]?伊惠芳,吳紅,李昌,等.基于主題生命周期與技術(shù)熵的石墨烯技術(shù)主題演化研究[J]. 情報雜志,2019,38(2): 64-70.

[22]?李乾瑞,郭俊芳,黃穎,等. 基于突變-融合視角的顛覆性技術(shù)主題演化研究[J]. 科學(xué)學(xué)研究,2021,39(12): 2129-2139.

[23]?BLEI D M. Probabilistic topic models[J]. Communications of the ACM, 2012, 55(4): 77-84.

[24]?SIEVERT C, SHIRLEY K. LDAvis: a method for visualizing and interpreting topics[M]. Baltimore: Association for Computational Linguistics,2014.

[25]?林超然. 基于專利數(shù)據(jù)挖掘的關(guān)鍵共性技術(shù)識別及預(yù)測研究——以3D打印為例[D]. 哈爾濱: 哈爾濱工程大學(xué),2020.

責(zé)任編輯(責(zé)任編輯:吳?漢)

猜你喜歡
智能網(wǎng)聯(lián)汽車
智能網(wǎng)聯(lián)汽車信息安全風(fēng)控系統(tǒng)研究
基于Elman神經(jīng)網(wǎng)絡(luò)的GNSS/INS全域高精度定位方法
細聊新興互聯(lián)網(wǎng)造車的成敗是非
關(guān)于智能網(wǎng)聯(lián)汽車公共道路測試的研究
智富時代(2019年5期)2019-07-05 18:43:32
基于加速度計的智能網(wǎng)聯(lián)汽車駕駛行為建模方法
移動通信(2019年3期)2019-06-27 00:01:54
基于加速度計的智能網(wǎng)聯(lián)汽車駕駛行為建模方法
移動通信(2019年4期)2019-06-25 01:53:30
淺談智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)投資基金的風(fēng)險控制
商情(2018年25期)2018-07-08 14:16:14
我國智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)的發(fā)展困境與應(yīng)對策略
基于攻擊樹的智能網(wǎng)聯(lián)汽車滲透測試方法
國內(nèi)外智能網(wǎng)聯(lián)汽車測試場地發(fā)展分析
科技視界(2017年29期)2018-01-18 06:10:26
儋州市| 会宁县| 长岛县| 若羌县| 大埔县| 乡宁县| 武宣县| 朝阳县| 射洪县| 西丰县| 灵宝市| 昭觉县| 和静县| 疏附县| 北辰区| 西丰县| 乾安县| 鞍山市| 大兴区| 安塞县| 会同县| 南安市| 三明市| 吉安县| 长海县| 敦煌市| 阳西县| 临西县| 黄冈市| 浑源县| 咸阳市| 七台河市| 昌都县| 铜陵市| 德庆县| 镇原县| 屯留县| 建瓯市| 文成县| 鹤岗市| 临夏县|