国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

生成式人工智能領(lǐng)先企業(yè)專利布局實(shí)證分析

2025-03-16 00:00:00高山行王慧楊張博
科技進(jìn)步與對(duì)策 2025年4期
關(guān)鍵詞:復(fù)雜網(wǎng)絡(luò)生成式人工智能

收稿日期:2023-08-01" 修回日期:2023-11-03

基金項(xiàng)目:國(guó)家社會(huì)科學(xué)基金重點(diǎn)項(xiàng)目(20AGL004);國(guó)家自然科學(xué)基金面上項(xiàng)目(72372127);中央高?;究蒲袠I(yè)務(wù)費(fèi)(人文社科類)專項(xiàng)(SK2023039)

作者簡(jiǎn)介:高山行(1963-),男,陜西興平人,博士,西安交通大學(xué)管理學(xué)院教授、博士生導(dǎo)師,研究方向?yàn)榧夹g(shù)創(chuàng)新、戰(zhàn)略管理;王慧(1990-),女,山西運(yùn)城人,西安交通大學(xué)管理學(xué)院博士研究生,研究方向?yàn)榧夹g(shù)創(chuàng)新、社會(huì)網(wǎng)絡(luò)分析;楊張博(1986-),男,山西運(yùn)城人,博士,西安交通大學(xué)人文社會(huì)科學(xué)學(xué)院教授、博士生導(dǎo)師,研究方向?yàn)榧夹g(shù)創(chuàng)新、社會(huì)網(wǎng)絡(luò)分析。本文通訊作者:楊張博。

摘 要:生成式人工智能(AIGC)技術(shù)對(duì)經(jīng)濟(jì)社會(huì)發(fā)展帶來(lái)巨大挑戰(zhàn),現(xiàn)有研究多從技術(shù)規(guī)制、發(fā)展歷程等方面展開(kāi),較少對(duì)AIGC領(lǐng)先企業(yè)專利布局進(jìn)行深入分析。選取美國(guó)AIGC領(lǐng)域領(lǐng)先的14家初創(chuàng)公司和4家科技巨頭,基于復(fù)雜網(wǎng)絡(luò)分析方法和機(jī)器學(xué)習(xí)的K均值聚類算法,利用專利IPC信息構(gòu)建專利知識(shí)網(wǎng)絡(luò)。研究發(fā)現(xiàn),美國(guó)AIGC領(lǐng)先企業(yè)的專利布局聚焦于電數(shù)字?jǐn)?shù)據(jù)處理、圖形數(shù)據(jù)讀取及呈現(xiàn)等技術(shù)領(lǐng)域;從專利布局知識(shí)寬度、知識(shí)深度、知識(shí)緊密程度、知識(shí)分離程度和知識(shí)一致性程度進(jìn)行聚類,企業(yè)可分為三類,即專業(yè)玩家、大廠/領(lǐng)先者和創(chuàng)新者。同時(shí),識(shí)別不同企業(yè)的核心知識(shí)領(lǐng)域和橋接知識(shí)領(lǐng)域,最后從算法、算力和數(shù)據(jù)方面為我國(guó)發(fā)展AIGC產(chǎn)業(yè)提出政策建議。

關(guān)鍵詞:生成式人工智能;AIGC;復(fù)雜網(wǎng)絡(luò);專利布局;K均值聚類

DOI:10.6049/kjjbydc.H202308003

"""":

中圖分類號(hào):G306

文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1001-7348(2025)04-0055-12

0 引言

2022年11月,OpenAI公司發(fā)布ChatGPT,在全球范圍內(nèi)引起廣泛關(guān)注和討論。ChatGPT僅用2個(gè)月就實(shí)現(xiàn)用戶數(shù)量過(guò)億,而此前用戶破億最快的是抖音(TikTok),用時(shí)9個(gè)月。ChatGPT具有強(qiáng)大的對(duì)話能力和生成能力,能夠?yàn)橛脩籼峁└鞣N主題的相關(guān)信息和答案,是生成式人工智能(Artificial Intelligence Generated Contents, AIGC)在文本領(lǐng)域的實(shí)際應(yīng)用。

AIGC是指通過(guò)人工智能生成內(nèi)容,即用戶輸入一段文字,AIGC能夠給出相應(yīng)回答,包括文本、圖像、音頻、視頻、代碼等。AIGC技術(shù)的核心是利用深度學(xué)習(xí)模型,實(shí)現(xiàn)內(nèi)容創(chuàng)造、跨模態(tài)融合等[1]。

從產(chǎn)業(yè)層面來(lái)看,AIGC產(chǎn)業(yè)具有鮮明的科學(xué)驅(qū)動(dòng)(Science-Based)和技術(shù)驅(qū)動(dòng)(Technology-Based)特征。專利作為知識(shí)和技術(shù)的重要載體,在AIGC領(lǐng)域有著舉足輕重的作用。作為科技創(chuàng)新型企業(yè),AIGC公司普遍以專利、版權(quán)手段為核心,積極布局,綜合利用多種方式保護(hù)其知識(shí)產(chǎn)權(quán)[2]?,F(xiàn)有專利布局研究主要包括技術(shù)領(lǐng)域分析、專利地圖繪制、專利申請(qǐng)及許可策略等,對(duì)AIGC領(lǐng)先企業(yè)專利布局的研究亟待深入。

世界各國(guó)及主要經(jīng)濟(jì)體都在人工智能方面作出重大戰(zhàn)略部署。美國(guó)擁有全球最多的AI初創(chuàng)企業(yè),占全球AI初創(chuàng)公司的40.6%;中國(guó)緊隨其后,占18.2%[3]。伴隨著AIGC技術(shù)和產(chǎn)品的井噴式發(fā)展,人工智能作為引領(lǐng)未來(lái)的戰(zhàn)略性技術(shù),在新一輪科技革命和產(chǎn)業(yè)變革中再次成為重要驅(qū)動(dòng)力量。然而,目前有關(guān)AIGC的研究大多從技術(shù)本身、發(fā)展歷程、制度規(guī)制等方面進(jìn)行闡述[4-6],對(duì)于AIGC產(chǎn)業(yè)進(jìn)行實(shí)證分析的研究較少。因此,針對(duì)領(lǐng)先AIGC企業(yè)專利布局的分析有待加強(qiáng),以助力本土企業(yè)及時(shí)洞悉領(lǐng)先企業(yè)技術(shù)專利戰(zhàn)略,為我國(guó)制定AIGC產(chǎn)業(yè)政策提供重要參考。

本文選取18家美國(guó)主要AIGC領(lǐng)先企業(yè)的專利布局進(jìn)行分析,通過(guò)構(gòu)建基于國(guó)際專利分類表(International Patent Classification, IPC)的專利布局網(wǎng)絡(luò),利用復(fù)雜網(wǎng)絡(luò)分析方法對(duì)領(lǐng)先企業(yè)專利知識(shí)領(lǐng)域進(jìn)行研究,基于專利布局知識(shí)深度、寬度、緊密程度、分離程度等指標(biāo),識(shí)別各企業(yè)核心知識(shí)領(lǐng)域和橋接知識(shí)領(lǐng)域。其次,通過(guò)機(jī)器學(xué)習(xí)的K均值(K-means)聚類算法對(duì)企業(yè)專利布局進(jìn)行分類比較,進(jìn)一步挖掘?qū)@麅?nèi)在價(jià)值,分析和總結(jié)不同類型AIGC企業(yè),全面刻畫(huà)美國(guó)AIGC領(lǐng)先企業(yè)的技術(shù)版圖,為我國(guó)AIGC行業(yè)的技術(shù)創(chuàng)新和深入發(fā)展提供啟示。

1 文獻(xiàn)回顧

1.1 生成式人工智能產(chǎn)業(yè)發(fā)展

生成式人工智能(AIGC)是指依靠AI大模型和AI算力訓(xùn)練生成內(nèi)容(中國(guó)信通院,2022),即AI通過(guò)對(duì)數(shù)據(jù)分析進(jìn)行再創(chuàng)作,進(jìn)而生成新數(shù)據(jù),比如一篇文章、一幅畫(huà)、一段視頻等。因此,AIGC不只是依靠AI分擔(dān)或輔助工作,而是一種全新的創(chuàng)作或生產(chǎn)方式,即人工智能在大模型技術(shù)加持下,通過(guò)獨(dú)立學(xué)習(xí)和大量訓(xùn)練,實(shí)現(xiàn)對(duì)多模態(tài)內(nèi)容的理解和認(rèn)知[4]。

盡管AIGC大多由初創(chuàng)公司進(jìn)行開(kāi)發(fā),但依然需要科技巨頭和風(fēng)險(xiǎn)投資基金的深度參與。絕大部分AIGC公司都與學(xué)術(shù)界聯(lián)系緊密,主要由初創(chuàng)公司和學(xué)術(shù)型公司構(gòu)成中堅(jiān)力量,由科技巨頭進(jìn)行投資。以目前公認(rèn)的AIGC領(lǐng)域領(lǐng)先的3家實(shí)驗(yàn)室OpenAI、DeepMind和FAIR為例,3家公司都屬于純AI研究實(shí)驗(yàn)室,背后分別倚靠微軟、谷歌和Meta(Facebook)3家科技巨頭,合作方式無(wú)一例外地是科技巨頭提供數(shù)據(jù)、軟硬件和資金等支持,3家公司則負(fù)責(zé)開(kāi)發(fā)人工智能算法等應(yīng)用層技術(shù)。

與國(guó)外科技巨頭投資初創(chuàng)公司的模式不同,中國(guó)國(guó)內(nèi)的AIGC項(xiàng)目大多由大型科技公司自行研發(fā)并搭建自己的AI生態(tài)系統(tǒng)。如騰訊、百度等科技公司,都基于自身技術(shù)優(yōu)勢(shì),開(kāi)展AIGC技術(shù)研究。騰訊的AI實(shí)驗(yàn)室基礎(chǔ)研究方向包括計(jì)算機(jī)視覺(jué)、語(yǔ)音技術(shù)、自然語(yǔ)言處理和機(jī)器學(xué)習(xí),使用場(chǎng)景包括游戲、數(shù)字人、內(nèi)容和社交AI等,技術(shù)成果已被微信、QQ、QQ音樂(lè)等上百個(gè)騰訊產(chǎn)品使用。百度作為國(guó)內(nèi)首先投入AI研發(fā)的企業(yè),率先推出覆蓋全場(chǎng)景的大模型——文心大模型,包括自然語(yǔ)言處理、視覺(jué)、跨模態(tài)和生物計(jì)算四大行業(yè)模型。華為的HiAI能力開(kāi)放平臺(tái)則充分發(fā)揮自身硬件優(yōu)勢(shì),搭建了包含芯片能力、應(yīng)用能力和服務(wù)能力于一體的智能生態(tài)系統(tǒng)。

具體來(lái)說(shuō),AIGC項(xiàng)目由三大部分構(gòu)成,即算據(jù)、算力和算法[4],如圖1所示。從合作方式來(lái)看,大多是由科技巨頭提供算據(jù)和算力,初創(chuàng)公司提供算法。具體包括:第一,算據(jù)。AIGC的學(xué)習(xí)和創(chuàng)作能力是基于大量數(shù)據(jù),由機(jī)器學(xué)習(xí)和模擬生成。巨量算據(jù)需要持續(xù)的時(shí)間投入,這恰是科技巨頭的強(qiáng)項(xiàng),而初創(chuàng)公司很難具有這樣的數(shù)據(jù)積累。第二,算力。算力包括硬件和軟件兩個(gè)方面,硬件如GPU、內(nèi)存等,軟件包括云計(jì)算服務(wù)平臺(tái)等。第三,算法。人工智能領(lǐng)域的算法、模型等核心技術(shù)是AIGC實(shí)現(xiàn)突破的關(guān)鍵,包括自然語(yǔ)言理解、神經(jīng)網(wǎng)絡(luò)、多模態(tài)融合等技術(shù)。在AIGC項(xiàng)目中,算法大都由初創(chuàng)公司研發(fā)。這些初創(chuàng)公司通常擁有業(yè)界頂尖的技術(shù)專家,一些企業(yè)具有深厚的研發(fā)和學(xué)術(shù)背景,對(duì)前沿技術(shù)有著深刻的認(rèn)識(shí)和感知。

1.2 AIGC專利研究

大多數(shù)科技公司都會(huì)通過(guò)申請(qǐng)專利保護(hù)自己的核心技術(shù),AIGC領(lǐng)先企業(yè)和科技巨頭也不例外。我國(guó)在AI領(lǐng)域的專利數(shù)量超過(guò)美國(guó),但整體上美國(guó)的進(jìn)展更加迅猛,產(chǎn)品發(fā)布也很穩(wěn)健。從ChatGPT的表現(xiàn)來(lái)看,我國(guó)的AIGC發(fā)展與美國(guó)仍然有一定差距,原因有如下幾點(diǎn):一是從專利申請(qǐng)主體看,美國(guó)的人工智能專利以企業(yè)申請(qǐng)為主,尤其是獨(dú)角獸公司和學(xué)術(shù)型企業(yè),因而技術(shù)創(chuàng)新更能滿足市場(chǎng)需求。我國(guó)則以高校申請(qǐng)為主,導(dǎo)致技術(shù)創(chuàng)新缺乏與市場(chǎng)的有機(jī)結(jié)合[7]。二是從基礎(chǔ)科學(xué)和技術(shù)合作兩個(gè)方面來(lái)看,我國(guó)在人工智能領(lǐng)域的基礎(chǔ)科學(xué)發(fā)展方面處于領(lǐng)先地位,其中,論文發(fā)表數(shù)量占據(jù)優(yōu)勢(shì),但在技術(shù)創(chuàng)新方面表現(xiàn)不佳(朱桂龍等,2019)。三是在人工智能相關(guān)的核心技術(shù)專利中,中國(guó)擁有的智能芯片技術(shù)專利數(shù)量最多,而美國(guó)擁有最多的自然語(yǔ)言處理技術(shù)[8]。具體來(lái)說(shuō),我國(guó)的人工智能專利以應(yīng)用型技術(shù)為主,例如計(jì)算機(jī)視覺(jué)和語(yǔ)音識(shí)別等,無(wú)法支撐大語(yǔ)言模型開(kāi)發(fā);而美國(guó)的人工智能專利以基礎(chǔ)型技術(shù)為主,如神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等,這些基礎(chǔ)技術(shù)可以用于構(gòu)建大語(yǔ)言模型。因此,從專利著手,分析和探尋美國(guó)在AIGC領(lǐng)域的技術(shù)布局,有助于更好地了解我國(guó)與美國(guó)在AIGC領(lǐng)域的差距。

1.3 專利網(wǎng)絡(luò)與技術(shù)布局

通過(guò)專利研究,有助于了解技術(shù)創(chuàng)新發(fā)展趨勢(shì)、專利布局特征以及演變規(guī)律[9-10]。目前,基于專利進(jìn)行關(guān)鍵核心技術(shù)識(shí)別和預(yù)測(cè)的方式主要包括:

(1)利用專利注冊(cè)信息,例如申請(qǐng)人、申請(qǐng)量、專利類型等量化指標(biāo)對(duì)前沿技術(shù)進(jìn)行預(yù)測(cè)[11]。

(2)基于專利題目、摘要等具體內(nèi)容,利用文本挖掘、語(yǔ)義識(shí)別等方法對(duì)前沿技術(shù)進(jìn)行分析 [12]。

(3)基于專利引用數(shù)據(jù),通過(guò)構(gòu)建專利間引用網(wǎng)絡(luò),利用網(wǎng)絡(luò)分析等方法,對(duì)核心技術(shù)進(jìn)行判斷和預(yù)測(cè)[13]。

(4)利用專利IPC分類等,對(duì)技術(shù)主題和關(guān)鍵技術(shù)涉及的知識(shí)領(lǐng)域進(jìn)行分析。針對(duì)專利IPC的研究主要涵蓋以下方面:第一,運(yùn)用IPC分類號(hào)對(duì)技術(shù)主題進(jìn)行分析。第二,利用IPC分類號(hào)出現(xiàn)頻次判斷領(lǐng)域關(guān)鍵技術(shù)。若某IPC分類號(hào)在技術(shù)專利中出現(xiàn)頻次較高,說(shuō)明該技術(shù)類別極有可能是該領(lǐng)域基礎(chǔ)技術(shù)或關(guān)鍵技術(shù)。例如毛云瑩、陸偉[14]提出基于IPC關(guān)聯(lián)的專利技術(shù)和產(chǎn)業(yè)雙向分析框架,對(duì)領(lǐng)域內(nèi)技術(shù)與產(chǎn)業(yè)進(jìn)行關(guān)聯(lián);向姝璇等[15]利用IPC號(hào)組合相似度,對(duì)企業(yè)潛在競(jìng)爭(zhēng)對(duì)手進(jìn)行挖掘。第三,利用IPC號(hào)構(gòu)建專利知識(shí)組合網(wǎng)絡(luò),不僅有助于識(shí)別關(guān)鍵核心技術(shù),而且能夠分析一國(guó)或地區(qū)在該技術(shù)領(lǐng)域內(nèi)的專利戰(zhàn)略和技術(shù)政策[16]。Bueno等[17]利用該方法對(duì)生物能源行業(yè)進(jìn)行研究,通過(guò)構(gòu)建生物能源行業(yè)的IPC合作網(wǎng)絡(luò),對(duì)行業(yè)前沿技術(shù)進(jìn)行預(yù)測(cè);王欽等(2022)通過(guò)構(gòu)建專利組合網(wǎng)絡(luò)圖,分析5G產(chǎn)業(yè)的IPC技術(shù)分布。

總體來(lái)看,現(xiàn)有文獻(xiàn)為本研究提供了堅(jiān)實(shí)基礎(chǔ),但尚存在進(jìn)一步探索空間:第一,目前研究多集中在新能源汽車(chē)、物聯(lián)網(wǎng)、生物能源等相對(duì)成熟的高科技產(chǎn)業(yè),對(duì)AIGC專利的分析較少。第二,有關(guān)我國(guó)人工智能的專利研究多集中于國(guó)家或省域?qū)用?,?duì)國(guó)外領(lǐng)先企業(yè)專利布局的深入分析較少。特別是缺乏深入企業(yè)內(nèi)部,挖掘?qū)@g知識(shí)關(guān)聯(lián)性并對(duì)比不同企業(yè)專利布局的研究。

2 研究設(shè)計(jì)

2.1 數(shù)據(jù)來(lái)源

本文數(shù)據(jù)來(lái)自德溫特專利數(shù)據(jù)庫(kù)(Derwent Innovations Index,DII)。德溫特?cái)?shù)據(jù)庫(kù)是文摘索引型數(shù)據(jù)庫(kù),提供了自1963年以來(lái)的專利文獻(xiàn)信息,包括專利摘要、發(fā)明人、申請(qǐng)人、權(quán)利人、摘要、引用信息和IPC等。

本文對(duì)于領(lǐng)先公司的選取,主要參考《全球AIGC市場(chǎng)預(yù)測(cè)2022—2028年:基于公司、地區(qū)、類型和應(yīng)用》(Global AIGC Market 2022 by Company, Regions, Type and Application, Forecast to 2028)[18],《人工智能生成藝術(shù)的技術(shù)開(kāi)發(fā)和商業(yè)化》(AI-generated Art's Technology Development amp; Commercialisation)[19]等相關(guān)產(chǎn)業(yè)報(bào)告,選擇14家從事AIGC技術(shù)的美國(guó)著名中小型企業(yè),以及在AIGC領(lǐng)域投入巨大且卓有成效的4家大公司,如微軟、谷歌和臉書(shū)(Meta)等致力于AIGC技術(shù)的大型IT公司,以及提供算力硬件的企業(yè)Nvidia。OpenAI未被納入是因?yàn)槠涫欠菭I(yíng)利性企業(yè),并且該公司不發(fā)表論文和申請(qǐng)專利。樣本企業(yè)如表1所示。

2.2 國(guó)際專利分類(IPC)

利用IPC分類判斷專利涉及的知識(shí)領(lǐng)域。IPC根據(jù)專利所屬領(lǐng)域,提供完整且齊全的分類指標(biāo)。本研究根據(jù)2023年3月世界知識(shí)產(chǎn)權(quán)組織更新的IPC目錄識(shí)別相應(yīng)知識(shí)領(lǐng)域。

如果某專利涉及多個(gè)IPC,則認(rèn)為企業(yè)在研發(fā)該成果時(shí)能夠聯(lián)系不同領(lǐng)域知識(shí),整合多個(gè)領(lǐng)域知識(shí),即這些知識(shí)領(lǐng)域之間存在聯(lián)系[20],據(jù)此展現(xiàn)企業(yè)專利布局,并反映企業(yè)在AIGC技術(shù)應(yīng)用中的知識(shí)內(nèi)容及彼此聯(lián)系。不同企業(yè)涉及的知識(shí)領(lǐng)域、擁有的網(wǎng)絡(luò)結(jié)構(gòu)都不同。通過(guò)復(fù)雜網(wǎng)絡(luò)分析方法,對(duì)不同企業(yè)專利布局網(wǎng)絡(luò)進(jìn)行分析、對(duì)比和總結(jié),有助于識(shí)別不同AIGC獨(dú)角獸公司的知識(shí)構(gòu)成、知識(shí)寬度和知識(shí)深度等不同特征。

2.3 數(shù)據(jù)處理與分析過(guò)程

(1)數(shù)據(jù)準(zhǔn)備:根據(jù)樣本企業(yè)名稱,在德溫特?cái)?shù)據(jù)庫(kù)中查詢企業(yè)專利信息并進(jìn)行下載。作為用于對(duì)比的大型企業(yè),其專利數(shù)量較多,故本文根據(jù)AI、AIGC等關(guān)鍵詞篩選專利并下載。數(shù)據(jù)包括具有唯一識(shí)別性的專利號(hào)、IPC代碼和其它相關(guān)元數(shù)據(jù)。將IPC代碼標(biāo)準(zhǔn)化為特定版本(IPC-2013),以確保數(shù)據(jù)集一致。此次共獲得AIGC相關(guān)專利859個(gè),涉及796個(gè)IPC知識(shí)領(lǐng)域。

(2)網(wǎng)絡(luò)構(gòu)建:使用共現(xiàn)分析法,通過(guò)鏈接、共享一個(gè)或多個(gè)IPC代碼專利構(gòu)建IPC網(wǎng)絡(luò)?;?8家企業(yè)專利及其相關(guān)IPC,對(duì)每個(gè)樣本企業(yè)構(gòu)建專利*IPC的二模矩陣,利用UCINET將矩陣轉(zhuǎn)為IPC共現(xiàn)的一模矩陣。同時(shí),為進(jìn)行對(duì)比,生成一個(gè)包含所有專利IPC的整體網(wǎng)絡(luò)。

(3)復(fù)雜網(wǎng)絡(luò)分析:對(duì)于生成的網(wǎng)絡(luò),使用Gephi與UCINET網(wǎng)絡(luò)分析工具進(jìn)行可視化和網(wǎng)絡(luò)分析。具體指標(biāo)如下:

專利布局知識(shí)寬度(width):使用IPC網(wǎng)絡(luò)規(guī)模測(cè)量,規(guī)模越大,表示企業(yè)專利涉及的知識(shí)領(lǐng)域越寬泛[21]。

專利布局知識(shí)深度(depth):表示企業(yè)專利在特定知識(shí)領(lǐng)域的集中程度,使用網(wǎng)絡(luò)中心勢(shì)(network centralization)測(cè)量[22]。該指標(biāo)值越大,表示企業(yè)專利越集中在某特定的IPC知識(shí)領(lǐng)域,企業(yè)對(duì)該知識(shí)領(lǐng)域越了解。具體計(jì)算公式如下:

Centralization=∑ni=1Cmax-Cin-1n-2(1)

其中,Cmax表示觀測(cè)網(wǎng)絡(luò)中心度最高節(jié)點(diǎn)的連接數(shù),Ci為其它節(jié)點(diǎn)的連接數(shù),n為網(wǎng)絡(luò)規(guī)模。

知識(shí)領(lǐng)域緊密程度(cohesion):是指企業(yè)專利知識(shí)聯(lián)系的緊密程度,數(shù)值越大,表示企業(yè)越能夠在不同知識(shí)領(lǐng)域間建立聯(lián)系。本文使用平均聚集系數(shù)進(jìn)行測(cè)量。聚集系數(shù)(Clustering Coefficient)用于測(cè)量網(wǎng)絡(luò)中三元閉包(triadic closure)概率,網(wǎng)絡(luò)聚集系數(shù)是所有行動(dòng)者鄰域密度的平均值[23]。具體計(jì)算公式如下:

CCoefficient=3×G∑ni=1ki2(2)

其中,G表示網(wǎng)絡(luò)中閉合的三角形個(gè)數(shù),ki為網(wǎng)絡(luò)中所有非閉合的三角形數(shù)量。

知識(shí)領(lǐng)域分離程度(fragment):用Girven-Newman算法中的模塊度(modularity)進(jìn)行測(cè)量。通過(guò)計(jì)算,網(wǎng)絡(luò)被分割為不同模塊或社區(qū)。具有高模塊性的網(wǎng)絡(luò),其社區(qū)結(jié)構(gòu)明顯,且各社區(qū)節(jié)點(diǎn)之間連接緊密,但社區(qū)間關(guān)系稀疏[24]。具體計(jì)算公式如下:

Modularity=12∑ijαijδCi,Cj(3)

其中,Ci和Cj分別表示節(jié)點(diǎn)i與j所屬社區(qū),如果兩個(gè)節(jié)點(diǎn)同屬一個(gè)社區(qū),則δ(Ci,Cj)=1。

此外,測(cè)量企業(yè)IPC網(wǎng)絡(luò)中各節(jié)點(diǎn)(知識(shí)領(lǐng)域)的中心位置,以確定專利布局的核心知識(shí)領(lǐng)域和橋接知識(shí)領(lǐng)域。通過(guò)比較核心知識(shí)領(lǐng)域與橋接知識(shí)領(lǐng)域的一致性,構(gòu)建企業(yè)知識(shí)一致性(concurrency)程度。該指標(biāo)反映企業(yè)專利戰(zhàn)略是聚焦于某知識(shí)領(lǐng)域,還是基于不同領(lǐng)域的知識(shí)整合。

核心知識(shí)領(lǐng)域使用特征向量中心性(eigenvector centrality)進(jìn)行測(cè)量,該指標(biāo)反映網(wǎng)絡(luò)節(jié)點(diǎn)影響力和網(wǎng)絡(luò)位置,具體以節(jié)點(diǎn)直接聯(lián)系數(shù)量表征,同時(shí)考慮相鄰節(jié)點(diǎn)的重要性。通過(guò)迭代計(jì)算,如果某節(jié)點(diǎn)被許多節(jié)點(diǎn)指向(這些節(jié)點(diǎn)也具有較高的特征向量中心性),那么該節(jié)點(diǎn)具有較高的特征向量中心性[25]。其計(jì)算公式如下:

Eigencentralityi=1λ∑t∈Mixt(4)

其中,i是被測(cè)量節(jié)點(diǎn),M是直接相鄰的節(jié)點(diǎn)集合,Xt是其鄰近點(diǎn)的向量中心性。

橋接知識(shí)領(lǐng)域使用中介中心性(betweenness centrality)測(cè)量,反映該節(jié)點(diǎn)經(jīng)過(guò)網(wǎng)絡(luò)中其它兩個(gè)節(jié)點(diǎn)最短路徑的頻率[26]。中介中心性高的知識(shí)領(lǐng)域連接著更多不同知識(shí)領(lǐng)域,這種知識(shí)橋接特性使得其可能成為下一個(gè)創(chuàng)新點(diǎn)[27]。其計(jì)算公式如下:

Betweennessi=∑nj∑nkbjk(i),j≠k≠i,jlt;k(5)

其中,i是被測(cè)量節(jié)點(diǎn),j和k是其它節(jié)點(diǎn),bjk(i)是連接j、k且經(jīng)過(guò)i的路徑數(shù)量。

(4)K均值聚類。根據(jù)以上指標(biāo),對(duì)18家樣本企業(yè)進(jìn)行聚類分析,總結(jié)其專利布局。具體方法是使用機(jī)器學(xué)習(xí)中的K均值(K-means)聚類算法,其通過(guò)迭代提供局部最優(yōu)聚類結(jié)果[28]。在最優(yōu)聚類數(shù)量k選擇方面,首先進(jìn)行10次聚類計(jì)算,k依次從1遞增至10。根據(jù)所有結(jié)果的組內(nèi)平方和(within sum of squares, WSS)、eta系數(shù)(η2 coefficient)和誤差減少比例系數(shù)(proportional reduction of error, PRE)進(jìn)行判斷,其中,后兩個(gè)系數(shù)根據(jù)WSS計(jì)算得出[29]。使用軟件Stata 17.0,聚類迭代次數(shù)設(shè)置為10萬(wàn)次。

3 結(jié)果分析

3.1 專利布局概況

圖2展示了18家企業(yè)知識(shí)領(lǐng)域構(gòu)成網(wǎng)絡(luò),其中,網(wǎng)絡(luò)節(jié)點(diǎn)代表具體的IPC分類,邊代表兩個(gè)IPC分類間存在聯(lián)系。節(jié)點(diǎn)越大,表示與其連接的IPC領(lǐng)域越多。本網(wǎng)絡(luò)共涉及796個(gè)IPC領(lǐng)域、6 005條邊,平均每個(gè)IPC領(lǐng)域與15個(gè)IPC領(lǐng)域連接,網(wǎng)絡(luò)密度為0.019,較為稀疏,按照Girven-Newman算法,可以分成50個(gè)子網(wǎng)絡(luò),以不同色度標(biāo)注。本文共標(biāo)出10個(gè)連接數(shù)最高的IPC領(lǐng)域,主要涉及G06F、G06K、G06N、H04L,表明美國(guó)人工智能企業(yè)的專利布局主要集中在電數(shù)字?jǐn)?shù)據(jù)處理、圖形數(shù)據(jù)讀取和呈現(xiàn)、數(shù)據(jù)載體標(biāo)記和傳送、基于特定計(jì)算模型的計(jì)算機(jī)系統(tǒng)、數(shù)字信息的傳輸?shù)戎R(shí)領(lǐng)域。

表2列出18家公司專利網(wǎng)絡(luò)的基本統(tǒng)計(jì)指標(biāo)??梢钥闯?,邊數(shù)量變化趨勢(shì)與專利數(shù)量基本一致。平均點(diǎn)度反映每個(gè)IPC領(lǐng)域與其它領(lǐng)域的連接數(shù),其中,最高的為Cogito公司(14.63),最低的為Guassian公司(2.06);網(wǎng)絡(luò)直徑(diameter)反映網(wǎng)絡(luò)中最長(zhǎng)的測(cè)地線距離(geodesic distance),數(shù)值越大表示網(wǎng)絡(luò)中可達(dá)的知識(shí)領(lǐng)域距離較遠(yuǎn),其中,Google公司的網(wǎng)絡(luò)直徑最長(zhǎng)(7),Appen等4家企業(yè)的直徑最短(2);網(wǎng)絡(luò)密度測(cè)量聯(lián)系的緊密程度,但受網(wǎng)絡(luò)規(guī)模影響,不同企業(yè)網(wǎng)絡(luò)規(guī)模差異較大,不可直接比較,這里僅列出作為參考。

3.2 單個(gè)企業(yè)專利布局情況對(duì)比

表3給出18家企業(yè)專利布局指標(biāo)。在知識(shí)寬度方面,涉及知識(shí)領(lǐng)域最多的是DeepMind,相關(guān)知識(shí)領(lǐng)域達(dá)到234個(gè),Appen涉及的知識(shí)領(lǐng)域最少,只有7個(gè)。在知識(shí)深度方面,最高的依然是DeepMind,其76.5%的專利涉及計(jì)算模型結(jié)構(gòu);集中度最低的是Gaussian公司,其涉及的知識(shí)領(lǐng)域僅占所有領(lǐng)域的4.6%,主要為風(fēng)力驅(qū)動(dòng)。在知識(shí)緊密度方面,最高的是Textio公司,其緊密度為0.97,意味著幾乎所有連接都存在閉合,即所有知識(shí)領(lǐng)域都互相連接。緊密程度最低的為Brighterion公司,僅為0.162,即知識(shí)領(lǐng)域呈現(xiàn)A-B-C連接,僅為16.2%存在A-C閉合,換而言之,其專利布局網(wǎng)絡(luò)結(jié)構(gòu)較為開(kāi)放(open)。在知識(shí)分離程度上,分離度最高的為Gaussian公司,達(dá)到0.867,表示其知識(shí)領(lǐng)域非常分散,整個(gè)網(wǎng)絡(luò)可分成若干子網(wǎng)絡(luò)。知識(shí)分離度最低的是Appen公司,僅有0.107,表示其絕大部分專利涉及的領(lǐng)域存在相互聯(lián)系,可以歸為一個(gè)子網(wǎng)絡(luò)。

3.3 AIGC企業(yè)核心知識(shí)領(lǐng)域與橋接知識(shí)領(lǐng)域

根據(jù)向量中心性計(jì)算結(jié)果,得到各公司專利布局的3個(gè)核心知識(shí)領(lǐng)域,具體見(jiàn)表4。這些領(lǐng)域在IPC整體網(wǎng)絡(luò)中位于中心,也是企業(yè)現(xiàn)階段最為關(guān)注的知識(shí)領(lǐng)域??傮w來(lái)看,核心知識(shí)領(lǐng)域集中在G06大類,主要涉及計(jì)算、推算、計(jì)數(shù)等方面,其子類涉及信息傳遞、計(jì)算模型等,具體包括數(shù)據(jù)、程序模型、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、圖像識(shí)別等領(lǐng)域。但各公司的核心知識(shí)領(lǐng)域不同,例如Datagrid的核心知識(shí)領(lǐng)域主要集中在數(shù)據(jù)傳輸、儲(chǔ)存和分析等方面;Narrative Science則集中在自然語(yǔ)言處理技術(shù)方面。

根據(jù)中介中心性計(jì)算結(jié)果,得到各公司專利布局分值最高的3個(gè)橋接知識(shí)領(lǐng)域,具體見(jiàn)表5。其中,黑體標(biāo)出的是未在核心知識(shí)領(lǐng)域(表4)中出現(xiàn)的知識(shí)領(lǐng)域,這類領(lǐng)域連接不同知識(shí),是未來(lái)創(chuàng)新的可能爆發(fā)點(diǎn)。在由企業(yè)知識(shí)領(lǐng)域構(gòu)成的網(wǎng)絡(luò)中,計(jì)算系統(tǒng)體系結(jié)構(gòu)、學(xué)習(xí)方法(G06N-003/04、G06N-003/08)、數(shù)字信息傳輸協(xié)議、控制規(guī)程(H04L-029/06、H04L-029/08)、數(shù)據(jù)識(shí)別和表示(G06K-009/62)是排名前五的橋接知識(shí)領(lǐng)域,意味著AIGC領(lǐng)域中連接不同知識(shí)領(lǐng)域的是通用技術(shù)。

3.4 K均值算法專利布局聚類結(jié)果

根據(jù)K均值算法計(jì)算,組內(nèi)方差、WSS及相關(guān)系數(shù)判斷如圖3所示,可以看到,在k=3時(shí),WSS、log(WSS)、eta系數(shù)分布圖存在一個(gè)明顯拐點(diǎn),eta系數(shù)表示W(wǎng)SS減少約30%, PRE在k=3時(shí)也達(dá)到最小值。因此,最優(yōu)的聚類組數(shù)應(yīng)該是3。

當(dāng)k=3時(shí),5個(gè)維度上的18家企業(yè)得分與K均值聚類矩陣結(jié)果如圖4所示??梢园l(fā)現(xiàn),所有變量經(jīng)過(guò)標(biāo)準(zhǔn)化處理后,x軸和y軸的取值范圍都為(-2,2)。矩陣中的數(shù)字點(diǎn)代表企業(yè)在橫軸和縱軸上的取值,具體數(shù)字代表企業(yè)所屬聚類。其中,核心、橋接知識(shí)差異表示表4、表5中各企業(yè)向量中心性和中介中心性排名前三的知識(shí)領(lǐng)域不一致數(shù)量。

進(jìn)一步將18家AIGC公司的聚類結(jié)果和聚類組內(nèi)專利布局指標(biāo)均值進(jìn)行匯總。有研究根據(jù)商業(yè)模式對(duì)AI公司進(jìn)行分類,具有較強(qiáng)直觀性和現(xiàn)實(shí)意義。例如可以分為AI產(chǎn)品/服務(wù)提供商、人工智能專業(yè)開(kāi)發(fā)商、數(shù)據(jù)分析提供商和創(chuàng)新技術(shù)研究商[30]。根據(jù)聚類結(jié)果并參照以往研究,本文將18家企業(yè)的專利布局分為三類,具體見(jiàn)表6。

(1)專業(yè)玩家,如聚類1所示,這類企業(yè)的知識(shí)寬度最小,知識(shí)深度中等,知識(shí)聯(lián)系緊密,而且各領(lǐng)域間分離程度較低,核心知識(shí)與橋接知識(shí)基本完全一致。這些企業(yè)專注于AIGC的特定技術(shù)及產(chǎn)品,資源較集中,成立時(shí)間也較短,創(chuàng)始人多為某領(lǐng)域技術(shù)專家,企業(yè)專利也集中在該領(lǐng)域。例如,Narrative Science公司于2010年由西北大學(xué)兩位教授成立于芝加哥,公司技術(shù)聚焦于將企業(yè)海量數(shù)據(jù)自動(dòng)轉(zhuǎn)換為擬人化文本輸出。

(2)大廠/先行者,如聚類2所示,本文選擇對(duì)比的4家大型企業(yè)全部屬于該聚類,這類企業(yè)知識(shí)寬度最廣,但深度最小,知識(shí)領(lǐng)域之間的緊密度較低,擁有比較明顯的子網(wǎng)絡(luò),核心知識(shí)與橋接知識(shí)存在不一致性。這些企業(yè)多是傳統(tǒng)的IT、硬件巨頭,成立時(shí)間較長(zhǎng),主營(yíng)產(chǎn)品雖然不是人工智能領(lǐng)域,但資源充足,較早廣泛地布局AIGC領(lǐng)域且投入多年,因此專利知識(shí)領(lǐng)域較為分散。主要專利策略為防御性策略,或者避免在AIGC領(lǐng)域出現(xiàn)不可預(yù)料的挑戰(zhàn)者。例如,谷歌公司布局人工智能,投資DeepMind公司;微軟公司投資OpenAI公司,并簽訂獨(dú)家云供應(yīng)商協(xié)議,微軟的必應(yīng)搜索引擎接入GTP3;Nvida除涉及傳統(tǒng)CPU、GPU等硬件設(shè)備外,也積極布局云分析業(yè)務(wù)。

(3)創(chuàng)新者,如聚類3所示,這些企業(yè)知識(shí)寬度適中,知識(shí)深度最大,專利布局聚焦于少數(shù)特定領(lǐng)域,同時(shí),知識(shí)連接緊密,分離程度中等,核心知識(shí)與橋接知識(shí)顯著不一致,說(shuō)明除聚焦的知識(shí)領(lǐng)域外,專利布局中連接了不同領(lǐng)域知識(shí),屬于公司技術(shù)突破和業(yè)務(wù)擴(kuò)展方向。例如,Ayasdi公司主要聚焦于拓?fù)鋽?shù)據(jù)分析技術(shù)解決方案,但其業(yè)務(wù)涉及金融、醫(yī)療、政務(wù)等多個(gè)行業(yè),通過(guò)人工智能總結(jié)不同行業(yè)的大數(shù)據(jù)要點(diǎn)并提供優(yōu)化建議,其專利布局則以數(shù)據(jù)處理與提取為主,并涉及不同行業(yè)知識(shí)領(lǐng)域。

為了更好地展現(xiàn)聚類中代表性企業(yè)的專利布局,選擇3家企業(yè)進(jìn)行IPC網(wǎng)絡(luò)可視化,如圖5所示。其中,節(jié)點(diǎn)代表IPC分類,邊代表IPC分類在同一個(gè)專利中存在共現(xiàn)關(guān)系。節(jié)點(diǎn)越大,表示該知識(shí)領(lǐng)域與其它領(lǐng)域聯(lián)系越多;邊越粗,表示兩個(gè)領(lǐng)域的共現(xiàn)關(guān)系越顯著。不同色度表示不同子網(wǎng)絡(luò),根據(jù)Girven-Newman算法可以得出,三類企業(yè)的知識(shí)領(lǐng)域網(wǎng)絡(luò)存在明顯差異。如Automated Insights屬于新創(chuàng)企業(yè),主要產(chǎn)品為Wordsmith,產(chǎn)品功能比較單一,主要是將原始數(shù)據(jù)轉(zhuǎn)為人類風(fēng)格多變的深度文章,其專利圍繞語(yǔ)法分析等展開(kāi),知識(shí)寬度較小。Google則是最早布局AIGC的大企業(yè),其知識(shí)寬度較大,主要涉及計(jì)算、信號(hào)裝置、信息傳輸、外科診斷(G06、G08B、H04L、A61B)等多個(gè)知識(shí)領(lǐng)域,并且明顯分成多個(gè)子網(wǎng)絡(luò),各子網(wǎng)絡(luò)間存在橋接知識(shí)領(lǐng)域聯(lián)系。Cogito公司的子網(wǎng)絡(luò)較少,但是知識(shí)領(lǐng)域間聯(lián)系較緊密,其初始業(yè)務(wù)是利用AIGC為各大公司客戶服務(wù)中心提供支持,如識(shí)別客戶語(yǔ)音、音量、語(yǔ)調(diào)和停頓等,其核心知識(shí)也集中在語(yǔ)音識(shí)別領(lǐng)域(G10L)。2018年其基于該領(lǐng)域服務(wù)催生新業(yè)務(wù),如使用AIGC提供醫(yī)療情緒識(shí)別服務(wù),知識(shí)領(lǐng)域擴(kuò)展至信息傳輸(H04)等新領(lǐng)域。

4 結(jié)論與啟示

本文研究了18家美國(guó)AIGC企業(yè)的專利布局,構(gòu)建了專利IPC網(wǎng)絡(luò),并結(jié)合復(fù)雜網(wǎng)絡(luò)分析方法和K均值聚類算法,從知識(shí)寬度、知識(shí)深度、知識(shí)緊密度、知識(shí)分離程度和知識(shí)一致性程度對(duì)專利布局進(jìn)行聚類。研究發(fā)現(xiàn):①美國(guó)領(lǐng)先企業(yè)的專利布局主要集中在電子數(shù)字?jǐn)?shù)據(jù)處理領(lǐng)域,并強(qiáng)調(diào)不同模態(tài)數(shù)據(jù)轉(zhuǎn)換,以此為核心,擴(kuò)展相關(guān)技術(shù)至不同行業(yè),體現(xiàn)了AIGC技術(shù)的通用性;②領(lǐng)先企業(yè)的專利布局在知識(shí)深度、寬度、緊密度、分離度和一致性程度上都存在差異,與企業(yè)業(yè)務(wù)存在較高相關(guān)性,體現(xiàn)了美國(guó)AIGC產(chǎn)業(yè)多樣化的技術(shù)路徑;③通過(guò)算法,這些企業(yè)可以鮮明地分為三類,即專業(yè)玩家、大廠/領(lǐng)先者和創(chuàng)新者,他們分別在產(chǎn)業(yè)中承擔(dān)不同角色。如專業(yè)玩家長(zhǎng)期聚焦于特定技術(shù)發(fā)展,有效銜接基礎(chǔ)研究環(huán)節(jié)與應(yīng)用研究環(huán)節(jié);大廠/領(lǐng)先者知識(shí)寬度最大,知識(shí)領(lǐng)域涉及不同行業(yè),提升了AIGC的通用性;創(chuàng)新者知識(shí)深度最大,除聚焦特定技術(shù)外,亦涉及少數(shù)新行業(yè),拓展了AIGC技術(shù)應(yīng)用深度。這意味著AIGC產(chǎn)業(yè)發(fā)展具有不同性質(zhì)的企業(yè),對(duì)技術(shù)的研發(fā)、應(yīng)用和擴(kuò)展具有重要意義。

在研究方法上本文采取K均值聚類算法,為專利價(jià)值識(shí)別與信息檢索提供了可靠依據(jù),有助于提供新洞見(jiàn)、改進(jìn)預(yù)測(cè)精度和增強(qiáng)數(shù)據(jù)理解力。具體來(lái)說(shuō),第一,該算法可以對(duì)復(fù)雜的專利數(shù)據(jù)進(jìn)行降維,如K均值聚類可將專利布局分成不同簇,使相似企業(yè)歸為一組,促使專利布局更易于理解,從而有助于識(shí)別與特定領(lǐng)域或技術(shù)相關(guān)的核心企業(yè),感知領(lǐng)域發(fā)展趨勢(shì)、技術(shù)創(chuàng)新水平和競(jìng)爭(zhēng)場(chǎng)域。第二,K均值聚類算法有助于整理和分類專利,通過(guò)將相似的專利布局歸為一組,發(fā)現(xiàn)布局內(nèi)在結(jié)構(gòu)和關(guān)聯(lián)性。這種發(fā)現(xiàn)可以啟發(fā)研究人員探索新方法、新思路和新路徑,從而在創(chuàng)新領(lǐng)域提出新洞見(jiàn)。

基于以上發(fā)現(xiàn),通過(guò)對(duì)比中美兩國(guó)AIGC產(chǎn)業(yè)發(fā)展,對(duì)我國(guó)AIGC產(chǎn)業(yè)發(fā)展提出以下建議:

從企業(yè)層面來(lái)看,未來(lái)AIGC產(chǎn)業(yè)要取得長(zhǎng)遠(yuǎn)發(fā)展,需要更多的“專業(yè)玩家”和“創(chuàng)新者”進(jìn)行優(yōu)勢(shì)互補(bǔ),共同建立AIGC發(fā)展生態(tài),形成良性循環(huán)。我國(guó)的AIGC發(fā)展由騰訊、百度、阿里巴巴、華為等大型科技公司主導(dǎo),“大廠”的優(yōu)勢(shì)在于資金和算據(jù),但“大廠”的傳統(tǒng)業(yè)務(wù)并不是AI領(lǐng)域,因此在核心優(yōu)勢(shì)和技術(shù)深度方面存在一定不足。通過(guò)對(duì)百度、華為等國(guó)內(nèi)企業(yè)IPC專利布局的分析發(fā)現(xiàn),國(guó)內(nèi)企業(yè)的專利布局多集中在G06N3/04和08等領(lǐng)域,即機(jī)器學(xué)習(xí)方法和體系結(jié)構(gòu)、電子識(shí)別等領(lǐng)域;囤積的專利數(shù)量較多,但商業(yè)化應(yīng)用較少,特別是缺乏專業(yè)應(yīng)用的企業(yè)。相比之下,作為“專業(yè)玩家”和“創(chuàng)新者”的初創(chuàng)公司則在算法方面具有天然優(yōu)勢(shì),而各類算法技術(shù)也為AIGC應(yīng)用提供了底層支撐。相比美國(guó)AIGC企業(yè)的多樣化發(fā)展,我國(guó)AIGC企業(yè)則顯得模式較為單一。

從國(guó)家層面來(lái)看,不同產(chǎn)業(yè)擁有不同創(chuàng)新能力演化機(jī)制[31]。要促進(jìn)AIGC產(chǎn)業(yè)發(fā)展,我國(guó)需充分發(fā)揮新型舉國(guó)體制優(yōu)勢(shì):結(jié)合產(chǎn)業(yè)特性,首先是加大人工智能基礎(chǔ)建設(shè),為AIGC產(chǎn)業(yè)發(fā)展提供保障;其次是重點(diǎn)培養(yǎng)“大廠/先行者”,培育行業(yè)領(lǐng)軍企業(yè),帶動(dòng)產(chǎn)業(yè)整體發(fā)展[32]。在基礎(chǔ)建設(shè)方面,我國(guó)可以從算力、算法和數(shù)據(jù)3個(gè)方面入手,發(fā)展人工智能產(chǎn)業(yè),創(chuàng)新云計(jì)算、大數(shù)據(jù)、超算等技術(shù),提升計(jì)算機(jī)算力;推進(jìn)人工智能算法研究和開(kāi)發(fā),培養(yǎng)一批高水平的人工智能算法研究人員和開(kāi)發(fā)人員,加強(qiáng)人工智能算法創(chuàng)新和應(yīng)用;建設(shè)更加完善的數(shù)據(jù)基礎(chǔ)設(shè)施,提高數(shù)據(jù)質(zhì)量和管理水平。在培養(yǎng)“大廠/先行者”方面,可以向人工智能企業(yè)提供稅收減免、研究撥款等財(cái)政支持;實(shí)施強(qiáng)有力的法律法規(guī),保護(hù)AIGC公司的知識(shí)產(chǎn)權(quán);鼓勵(lì)開(kāi)放式創(chuàng)新,通過(guò)創(chuàng)建網(wǎng)絡(luò)、建立合作關(guān)系和開(kāi)展其它形式的合作,不斷拓展企業(yè)知識(shí)深度、廣度和緊密度。

因?yàn)閿?shù)據(jù)和方法所限,本文還存在一些不足,希望未來(lái)能夠進(jìn)一步完善:一是本文樣本企業(yè)僅包含美國(guó)AIGC領(lǐng)域的領(lǐng)先企業(yè),未來(lái)可以進(jìn)一步對(duì)比不同區(qū)域企業(yè)的專利布局;二是專利蘊(yùn)含豐富的信息,未來(lái)研究可以進(jìn)一步挖掘如引文、摘要、發(fā)明合作等專利信息,拓展對(duì)AIGC產(chǎn)業(yè)領(lǐng)域的認(rèn)識(shí)。

參考文獻(xiàn)參考文獻(xiàn):

[1] LIU J, YANG H, LI Q. Coverless image steganography based on neural style transfer[C]. Fourteenth International Conference on Digital Image Processing, 2022, 12342: 870-878.

[2] RAMALHO A. Intellectual property protection for AI-generated creations: Europe, United States, Australia and Japan [M].London:Routledge, 2021.

[3] VAN ROY V, VERTESY D, DAMIOLI G. AI and robotics innovation: a sectoral and geographical mapping using patent data[R].GLO Discussion Paper, 2019.

[4] 李白楊, 白云, 詹希旎,等. 人工智能生成內(nèi)容(AIGC)的技術(shù)特征與形態(tài)演進(jìn) [J].圖書(shū)情報(bào)知識(shí), 2023,40(1): 66-74.

[5] 王友發(fā), 張茗源, 羅建強(qiáng),等. 專利視角下人工智能領(lǐng)域技術(shù)機(jī)會(huì)分析[J].科技進(jìn)步與對(duì)策, 2020, 37(4):19-26.

[6] 周貞云, 邱均平. 面向人工智能的我國(guó)知識(shí)圖譜研究的分布特點(diǎn)與發(fā)展趨勢(shì) [J].情報(bào)科學(xué), 2022, 40(1): 184-192.

[7] 王山, 陳昌兵. 中美人工智能技術(shù)創(chuàng)新的動(dòng)態(tài)比較——基于人工智能技術(shù)創(chuàng)新大數(shù)據(jù)的多S曲線模型分析 [J].北京工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2023, 23(3): 54-67.

[8] 袁野, 吳超楠, 李秋瑩. 人工智能產(chǎn)業(yè)核心技術(shù)的國(guó)際競(jìng)爭(zhēng)態(tài)勢(shì)分析 [J].中國(guó)電子科學(xué)研究院學(xué)報(bào), 2020, 15(11): 1128-1138.

[9] GARZANITI N, TEKIC Z, KUKOLJ D, et al. Review of technology trends in new space missions using a patent analytics approach [J].Progress in Aerospace Sciences, 2021, 125: 100727.

[10] CHOI Y, PARK S, LEE S. Identifying emerging technologies to envision a future innovation ecosystem: a machine learning approach to patent data [J].Scientometrics, 2021, 126: 5431-5476.

[11] 喬永忠, 姚清晨. 中國(guó)授權(quán)不同性質(zhì)專利技術(shù)領(lǐng)域布局實(shí)證研究[J].科技進(jìn)步與對(duì)策, 2015, 32(24):16-20.

[12] LI X, WU Y, CHENG H, et al. Identifying technology opportunity using SAO semantic mining and outlier detection method: a case of triboelectric nanogenerator technology [J].Technological Forecasting and Social Change, 2023, 189: 122353.

[13] 王偉光, 余景年, 彭莉. 中國(guó)工業(yè)機(jī)器人產(chǎn)業(yè)技術(shù)研究——專利地圖視角[J].科技進(jìn)步與對(duì)策, 2017, 34(7): 55-61.

[14] 毛云瑩, 陸偉. 基于IPC關(guān)聯(lián)的專利技術(shù)和產(chǎn)業(yè)雙向分析框架研究 [J].情報(bào)科學(xué), 2022, 40(4): 33-39.

[15] 向姝璇, 李睿. 基于專利文獻(xiàn)整體相似度計(jì)算的競(jìng)爭(zhēng)對(duì)手發(fā)現(xiàn)——以5G領(lǐng)域?yàn)槔?[J].情報(bào)理論與實(shí)踐, 2021, 44(5): 100-105.

[16] CHO T S, SHIH H Y. Patent citation network analysis of core and emerging technologies in Taiwan: 1997-2008 [J].Scientometrics, 2011, 89(3): 795-811.

[17] BUENO C D S, SILVEIRA J M F J D, BUAINAIN A M, et al. Applying an IPC network to identify the bioenergy technological frontier [J].Revista Brasileira de Inovacao, 2022, 17: 259-286.

[18] GLOBAL INFO RESEARCH. Global AIGC market 2022 by company, regions, type and application, forecast to 2028[R/OL].https://marketpublishers.com/report/it-technology/other-ict-n-software/global-aigc-ai-generated-content-market-2022-by-company-regions-type-n-application-forecast-to-2028.html.

[19] BRIDGE T. AIGC series- AI-generated art's technology development amp; commercialisation[EB/OL].https://thirdbridge.com/transcripts/aigc-series-ai-generated-arts-technology-development-commercialisation.

[20] LEYDESDORFF L, KUSHNIR D, RAFOLS I. Interactive overlay maps for US patent (USPTO) data based on International Patent Classification (IPC) [J].Scientometrics, 2014, 98(3): 1583-1599.

[21] RESCH C, KOCK A. The influence of information depth and information breadth on brokers' idea newness in online maker communities [J].Research Policy, 2021, 50(8): 104142.

[22] TIRADO R, HERNANDO , AGUADED J I. The effect of centralization and cohesion on the social construction of knowledge in discussion forums [J].Interactive Learning Environments, 2015, 23(3): 293-316.

[23] GULER I, NERKAR A. The impact of global and local cohesion on innovation in the pharmaceutical industry [J].Strategic Management Journal, 2012, 33(5): 535-549.

[24] XIANG J, HU T, ZHANG Y, et al. Local modularity for community detection in complex networks [J].Physica A: Statistical Mechanics and Its Applications, 2016, 443: 451-459.

[25] BONACICH P. Some unique properties of eigenvector centrality [J].Social Networks, 2007, 29(4): 555-564.

[26] YANG Z, SHU C, GAO S, et al. The combined impact of direct and indirect ties on innovation: the moderating role of similarity in alliance subtypes [J].Journal of Product Innovation Management, 2022, 39(6): 847-870.

[27] BURT R S. Structural holes and good ideas [J].American Journal of Sociology, 2004, 110(2): 349-399.

[28] BURNEY S A, TARIQ H. K-means cluster analysis for image segmentation [J].International Journal of Computer Applications, 2014, 96(4): 1-8.

[29] MAKLES A. Stata tip 110:how to get the optimal k-means cluster solution [J].The Stata Journal, 2012, 12(2): 347-351.

[30] WEBER M, BEUTTER M, WEKING J, et al. AI startup business models: key characteristics and directions for entrepreneurship research[J].Business amp; Information Systems Engineering, 2022, 64(1): 91-109.

[31] 姚威, 胡順順. 知識(shí)轉(zhuǎn)化視角下戰(zhàn)略性新興產(chǎn)業(yè)自主創(chuàng)新能力演化機(jī)制研究[J].科技進(jìn)步與對(duì)策, 2020, 37(4): 62-69.

[32] 姜軍, 武蘭芬. 核心技術(shù)及關(guān)鍵產(chǎn)業(yè)演變研究——中國(guó)專利權(quán)人的美國(guó)發(fā)明專利分析[J].科技進(jìn)步與對(duì)策, 2014, 31(22): 80-83.

(責(zé)任編輯:胡俊?。?/p>

英文標(biāo)題

Empirical Analysis of Patent Layout" of Leading Generative Artificial Intelligence Companies Based on Complex Network Analysis and K-means Clustering Algorithm

英文作者Gao Shanxing1, Wang Hui1, Yang Zhangbo2

英文作者單位(1.School of Management, Xi'an Jiaotong University;

2.School of Humanities and Social Science, Xi'an Jiaotong University, Xi'an 710049, China)

英文摘要Abstract:The emergence of artificial intelligence-generated contents (AIGC) technology has posed great challenges to the economy and society. Most of the existing research discusses aspects of technical regulation and development history; few empirical studies are conducted on the patent layout of AIGC leading enterprises. This paper aims to direct its attention towards the comprehensive examination and scrutiny of the patent layout of enterprises at the forefront of AIGC in the United States. To accomplish this objective, this paper selects 14 leading startups and 4 technology giants in the field of AIGC in the United States to analyze their patent IPC network. Intricate network analysis methods and K-means clustering algorithms are employed.

It is found that the patent layout of AIGC emerging enterprises in the United States focuses on technical fields such as electrical digital data processing, graphic data reading and presentation. Patent layout is analyzed by knowledge width, knowledge depth, knowledge cohesion, knowledge fragment level and knowledge consistency clustering. Through this meticulous study, a profound understanding of the patent layout is achieved, leading to the identification of three distinct categories: professional players, technology giants and leaders, and innovators. Professional players refer to AIGC companies that have a focused and specialized patent layout, indicating a deep understanding and expertise in specific technical fields. Technology giants and leaders are AIGC enterprises that have established themselves as industry leaders, with a patent layout that reflects their dominance and influence in the field. Innovators are AIGC startups that demonstrate a unique and novel approach in their patent layout, showcasing their ability to introduce new ideas and technologies to the AIGC industry. These categories provide invaluable insights into the diverse strategies implemented by the aforementioned enterprises.

Furthermore, an in-depth exploration of the patent core knowledge areas and bridging knowledge areas is conducted, ultimately revealing the focal points of knowledge and the areas of expertise within AIGC companies. Core knowledge refers to the essential and fundamental knowledge areas that are central to the patent layout of AIGC enterprises. These knowledge areas represent the key technical fields in which the companies focus their patent filings. Bridging knowledge areas, on the other hand, are the knowledge areas that connect or bridge different technical fields within the patent layout of AIGC enterprises. These areas indicate the interdisciplinary nature of the companies' patent filings and their ability to integrate knowledge from multiple domains. The identification of core knowledge areas and bridging knowledge areas helps in understanding the strategic focus and innovation capabilities of AIGC companies, as well as the potential for cross-pollination of ideas and technologies across different technical fields.

The paper's pivotal contribution lies within its empirical analysis of the patent layout, which presents a wealth of valuable insights into the intricate clustering patterns and specialized knowledge areas of the leading enterprises in the field of AIGC. Firstly, it provides empirical insights into the patent layout of leading AIGC enterprises. Secondly, it employs complex network analysis methods and K-means clustering algorithms in machine learning to examine the patent IPC network of AIGC companies, offering a novel approach to investigating their patent layouts. Thirdly, it categorizes the patent layout for AIGC enterprises into three distinct groups: professional players, technology giants and leaders, and innovators. These categories are determined based on factors such as knowledge width, depth, cohesion, fragment level, and consistency clustering. Fourthly, it identifies the core knowledge areas and bridging knowledge areas within the patent layouts of AIGC companies, thereby shedding light on their technical focus, interdisciplinary integration, and innovation capabilities.

In summary, this analysis of the layout of patent networks for companies specializing in AIGC encompass enables a comprehensive understanding of the technical focus and specialization of AIGC companies based on the arrangement of their patents. Then it allows for the identification of prominent industry players and technology leaders within the AIGC sector based on the structure of their patent layouts, and facilitates an assessment of the innovation capabilities and novel approaches employed by AIGC companies, as reflected in their patent layouts. Furthermore, this analysis suggests policy measures for the development of the AIGC industry in China, with a specific focus on algorithm, computing power, and data.

英文關(guān)鍵詞Key Words:Artificial Intelligence Generated Contents; AIGC; Complex Network;Patent Layout; K-means

猜你喜歡
復(fù)雜網(wǎng)絡(luò)生成式人工智能
挑戰(zhàn)·融合·變革:“ChatGPT與未來(lái)教育”會(huì)議綜述
生成式人工智能重塑教育及教師應(yīng)對(duì)之道
人機(jī)共生時(shí)代國(guó)際傳播的理念升維與自主敘事體系構(gòu)建
生成式人工智能的教育應(yīng)用與展望
基于圖熵聚類的重疊社區(qū)發(fā)現(xiàn)算法
基于復(fù)雜網(wǎng)絡(luò)理論的通用機(jī)場(chǎng)保障網(wǎng)絡(luò)研究
城市群復(fù)合交通網(wǎng)絡(luò)復(fù)雜性實(shí)證研究
科技視界(2016年20期)2016-09-29 11:19:34
人類社會(huì)生活空間圖式演化分析
商情(2016年11期)2016-04-15 22:00:31
繁峙县| 福清市| 桑日县| 台东县| 东港市| 鄂托克旗| 哈尔滨市| 海城市| 额济纳旗| 博罗县| 措美县| 广昌县| 海晏县| 平湖市| 娄底市| 海丰县| 耒阳市| 潮州市| 富顺县| 金阳县| 南江县| 郴州市| 胶南市| 巴彦县| 海林市| 基隆市| 桐梓县| 朔州市| 陕西省| 祁门县| 吉木乃县| 收藏| 横山县| 河源市| 阳原县| 桐柏县| 富宁县| 城市| 基隆市| 钟山县| 新宁县|