基于CiteSpace的國(guó)際人工智能研究熱點(diǎn)與趨勢(shì)分析

2022-11-04 03:41盛云夢(mèng)

軟件工程 2022年11期

盛云夢(mèng)，劉倩

(上海工程技術(shù)大學(xué)管理學(xué)院，上海 201620)

shengym2562@163.com;lqsn1996@163.com

1 引言(Introduction)

人工智能作為信息和計(jì)算機(jī)技術(shù)領(lǐng)域的一個(gè)重要分支，從前期計(jì)算機(jī)模擬人的認(rèn)知研究發(fā)展為人與計(jì)算機(jī)網(wǎng)絡(luò)結(jié)合的混合群智能研究，其目標(biāo)是以更快的速度和更高的準(zhǔn)確性解決人類智能的問題。在國(guó)家戰(zhàn)略層面，美國(guó)、英國(guó)和德國(guó)等主要發(fā)達(dá)國(guó)家都將人工智能視為國(guó)家競(jìng)爭(zhēng)、信息安全的關(guān)鍵技術(shù)，紛紛加大研究與產(chǎn)業(yè)創(chuàng)新結(jié)構(gòu)升級(jí)。我國(guó)人工智能相關(guān)研究發(fā)展迅速，已步入全球領(lǐng)先水平。目前與人工智能相關(guān)的研究成果相對(duì)普遍，但研究?jī)?nèi)容較分散，大多數(shù)聚焦于某一子領(lǐng)域，較少?gòu)娜忠暯菍?duì)國(guó)際人工智能發(fā)展趨勢(shì)進(jìn)行系統(tǒng)深入的研究，且人工智能是目前發(fā)展最快、影響最廣泛的學(xué)科之一，需結(jié)合多種科學(xué)計(jì)量方法對(duì)文獻(xiàn)數(shù)據(jù)進(jìn)行深入的挖掘和分析。因此，本文運(yùn)用文獻(xiàn)計(jì)量軟件，從總體角度對(duì)國(guó)際人工智能的研究熱點(diǎn)、演進(jìn)過(guò)程、發(fā)展脈絡(luò)進(jìn)行了梳理和分析，希望為該領(lǐng)域的發(fā)展探索提供新的研究視角和思考。

2 研究設(shè)計(jì)(Research design)

2.1 研究目的

為探析近十年人工智能整體發(fā)展的動(dòng)態(tài)與演進(jìn)軌跡，本文對(duì)期刊文獻(xiàn)進(jìn)行研究，主要從科研合作網(wǎng)絡(luò)和文獻(xiàn)、突顯詞、關(guān)鍵詞層面進(jìn)行信息整合和數(shù)據(jù)挖掘，歸納國(guó)際人工智能研究的發(fā)展特征，深入了解領(lǐng)域內(nèi)的動(dòng)態(tài)和焦點(diǎn)問題，對(duì)科研人員進(jìn)行相關(guān)理論研究具有重要的借鑒意義。

2.2 數(shù)據(jù)來(lái)源

本文研究的所有文獻(xiàn)數(shù)據(jù)來(lái)源于全球?qū)W術(shù)信息重要數(shù)據(jù)庫(kù)Web Of Science的核心數(shù)據(jù)庫(kù)。設(shè)定期刊時(shí)間跨度為2011－2021 年，檢索日期設(shè)置為2022年2月1日，檢索條件為：標(biāo)題=“ARTIFICIAL INTELLIGENCE”，文獻(xiàn)類別=“ARTICLE”，利用Web of Science篩選剔除掉非期刊類別的文章，共計(jì)檢索到6，007 條紀(jì)錄。

2.3 研究方法與工具

首先以人工智能相關(guān)領(lǐng)域的期刊發(fā)文量和影響因子為標(biāo)準(zhǔn)篩選了1，886 篇期刊論文，然后借助“CiteSpace”軟件對(duì)具有國(guó)際影響力的人工智能學(xué)術(shù)刊物進(jìn)行可視化的分析，采用文本信息提取法、定性與定量結(jié)合法，挖掘出當(dāng)前世界人工智能研究的熱點(diǎn)，并揭示其演化軌跡和發(fā)展趨勢(shì)。

3 研究結(jié)果與分析(Research results and analysis)

3.1 論文分布及載文期刊分析

對(duì)上述數(shù)據(jù)清洗后的6，007 篇國(guó)際人工智能研究期刊論文的年度產(chǎn)出情況進(jìn)行描述性分析，詳見圖1。

圖1 國(guó)際AI相關(guān)論文年產(chǎn)量分布圖Fig.1 Annual output distribution map of international papers related to AI

從圖1可以看出，2011—2016 年人工智能研究領(lǐng)域相關(guān)文獻(xiàn)量總體呈現(xiàn)逐年增加趨勢(shì)，2017—2021 年，相關(guān)領(lǐng)域文獻(xiàn)呈兩倍急速上升趨勢(shì)。2011 年國(guó)際上關(guān)于人工智能的研究已經(jīng)興起，但研究成果較少，這主要受兩方面的影響，一方面是全球人工智能理論的基礎(chǔ)研究、認(rèn)知理論模型尚待完善，另一方面是硬件、軟件、數(shù)據(jù)等技術(shù)工具的限制。2016 年谷歌旗下的AlphaGo以4：1打敗了世界圍棋高手，迎來(lái)了“人工智能60 周年”的發(fā)展拐點(diǎn)，使人工智能論文數(shù)目猛增。自此以后，人工智能的研究成果在數(shù)量和影響力上都有了明顯的提升，其關(guān)注度也在不斷飆升，到2020 年發(fā)文增長(zhǎng)率為89.07%，上升到了一個(gè)新的高度。國(guó)際上關(guān)于人工智能研究且具有影響力的期刊有：、、等。結(jié)合Web of Science的期刊影響力因子，以及人工智能領(lǐng)域期刊的論文發(fā)文量，對(duì)6，007 條搜索結(jié)果進(jìn)行了提煉和整理，最后得出1，886 條。

3.2 國(guó)際人工智能研究高產(chǎn)國(guó)家分布統(tǒng)計(jì)

設(shè)置面板中的“Country”選項(xiàng)，其余為系統(tǒng)默認(rèn)值，可獲得世界上高產(chǎn)人工智能研究國(guó)家的知識(shí)圖譜，詳見圖2。圖中每個(gè)節(jié)點(diǎn)表示國(guó)家，兩個(gè)節(jié)點(diǎn)的連線代表了兩國(guó)間的聯(lián)系，節(jié)點(diǎn)的大小則是發(fā)文的數(shù)目。為了更好地理解該領(lǐng)域的節(jié)點(diǎn)層次，進(jìn)行深一步的數(shù)據(jù)挖掘，詳見表1。

圖2 人工智能研究高產(chǎn)國(guó)家可視化知識(shí)圖譜Fig.2 Visual knowledge map of high-yield countries for AI research

表1 按照文章數(shù)量和中心度分別排序的前10 位高產(chǎn)國(guó)家Tab.1 Top 10 high-yield countries ranked by the number and centrality of the paper

從論文產(chǎn)出的角度看，中、美、韓在人工智能領(lǐng)域發(fā)表的文章最多，其后的7 個(gè)國(guó)家論文產(chǎn)量差別較小。由圖2可知中國(guó)人工智能研究起步較晚，與英國(guó)、美國(guó)、澳大利亞、越南、西班牙相比在基礎(chǔ)研究、技術(shù)方面存在一定的差距，但已經(jīng)有了較大的發(fā)展，研究也較深入。其中英國(guó)和美國(guó)在人工智能方面的研究起步較早，且部分文獻(xiàn)是人工智能方向研究的關(guān)鍵轉(zhuǎn)折點(diǎn)，這或許是其人工智能行業(yè)發(fā)展較快的一個(gè)重要原因。另一方面，從中心度觀察，中心度值大于等于0.1的節(jié)點(diǎn)被視為關(guān)鍵性的節(jié)點(diǎn)，這些節(jié)點(diǎn)通常被視為導(dǎo)致研究領(lǐng)域發(fā)生變化的重要因素。從表1可以看出，英國(guó)、美國(guó)、澳大利亞、越南、西班牙、伊朗這六個(gè)國(guó)家的文獻(xiàn)中心度大于等于0.1，這六個(gè)國(guó)家具有很高的創(chuàng)新能力，在人工智能領(lǐng)域中發(fā)揮著巨大的作用。

3.3 國(guó)際人工智能研究高產(chǎn)機(jī)構(gòu)分布統(tǒng)計(jì)

運(yùn)行該軟件選取“Institution”選項(xiàng)，可得高產(chǎn)機(jī)構(gòu)的分布圖(圖3)。圖譜中較大的圓對(duì)應(yīng)的連線未必多，表明有較多研究結(jié)果的組織和其他組織的關(guān)系也不是很密切。

圖3 高產(chǎn)機(jī)構(gòu)合作圖譜Fig.3 Cooperation map of high-yield institutions

高產(chǎn)機(jī)構(gòu)合作圖譜共有615 個(gè)節(jié)點(diǎn)、1，743 條連線，每個(gè)節(jié)點(diǎn)代表了該機(jī)構(gòu)的論文數(shù)量，連線表示組織間的相互協(xié)作，協(xié)作越多說(shuō)明這個(gè)組織與其他組織的合作程度就越高。從圖3可觀察到各機(jī)構(gòu)間的合作較為緊密，能夠充分利用各高校、科研單位的文獻(xiàn)，從而激發(fā)出新的研究視野，更深入、迅速地做出有意義的研究。發(fā)文單位基本上為高等院?；蛘哐芯繖C(jī)構(gòu)，高產(chǎn)研究機(jī)構(gòu)主要為Duy Tan Univ、Harvard Med Sch、Univ Tabriz等，其中美國(guó)機(jī)構(gòu)發(fā)文頻次前十名中占比40%，但美國(guó)高等院校及研究機(jī)構(gòu)與其他機(jī)構(gòu)合作不是特別密切，可見其主要利用內(nèi)部資源進(jìn)行獨(dú)立的研究。

3.4 國(guó)際人工智能高產(chǎn)作者分布統(tǒng)計(jì)

為了更好地反映人工智能領(lǐng)域的核心作者和關(guān)聯(lián)度，對(duì)1，886 篇論文進(jìn)行了作者合作圖譜可視化分析(圖4)。

圖4 高產(chǎn)作者合作圖Fig.4 Cooperation map of high-yield authors

圖4中的節(jié)點(diǎn)尺寸代表作者所發(fā)表的論文數(shù)目，連線則代表相互的協(xié)作關(guān)系。根據(jù)普賴斯定律，假設(shè)某一領(lǐng)域中最有生產(chǎn)力的作者論文數(shù)量為，那么=0.749。在這一領(lǐng)域中，發(fā)表超過(guò)篇文章的作者被定義為本研究的主要作者?？芍?13，≈3，即發(fā)表3 篇文章以上的為核心作者，統(tǒng)計(jì)得樣本文獻(xiàn)中核心作者共29 名，其排名靠前的作者為Salaheldin Elkatatny、Abdulazeez Abdulraheem、Md Mohaimenul Islam、Kang Ryoung Park。總體而言，國(guó)際人工智能領(lǐng)域合作關(guān)系較為緊密，該領(lǐng)域的研究力量處于比較集中的狀態(tài)，各個(gè)學(xué)者之間聯(lián)系密切，對(duì)該領(lǐng)域的深度探究具有重要意義。

3.5 基于突顯詞可視化分析的人工智能熱點(diǎn)及趨勢(shì)研究

運(yùn)用軟件的“Detect Bursts”功能，在特定的年份里可以發(fā)現(xiàn)在短期內(nèi)急劇增加的專業(yè)詞匯，從而觀測(cè)更深層次的發(fā)展變化，圖5為樣本文獻(xiàn)生成的突顯詞圖譜。從突顯詞看出其熱點(diǎn)持續(xù)時(shí)間表現(xiàn)出從長(zhǎng)到短的趨勢(shì)。

圖5 前22 個(gè)最強(qiáng)突顯詞Fig.5 Top 22 keywords with the strongest citation bursts

2011—2012 年突顯詞包括時(shí)間序列(time series)、人工神經(jīng)網(wǎng)絡(luò)(ann)、智能仿真(simulation)、機(jī)器學(xué)習(xí)模型中的定義參數(shù)(parameter)、行為(behavior)，這些突顯詞持續(xù)時(shí)間長(zhǎng)達(dá)7至9 年；2014—2017 年突顯詞包括遺傳算法(genetic algorithm)、增長(zhǎng)智能(growth)等，這些關(guān)鍵詞平均持續(xù)時(shí)間長(zhǎng)達(dá)4 年；2018 年至今突顯出支持向量機(jī)(support vector machine)、人工智能未來(lái)法案(future)、智能醫(yī)療(care)、特征學(xué)習(xí)(feature)等突顯詞。以上突顯詞體現(xiàn)了人工智能的發(fā)展脈絡(luò)和趨勢(shì)，其中，支持向量機(jī)、人工智能未來(lái)法案、智能醫(yī)療、特征學(xué)習(xí)等關(guān)鍵詞一直持續(xù)至今，反映出在未來(lái)一段時(shí)間相關(guān)研究仍是人工智能領(lǐng)域的關(guān)鍵趨勢(shì)。

3.6 基于關(guān)鍵詞共現(xiàn)的研究熱點(diǎn)分析

關(guān)鍵詞反映了文獻(xiàn)所要表現(xiàn)的各個(gè)主題之間的相互關(guān)系，是文章中心的核心概括，分析關(guān)鍵詞有利于研究本領(lǐng)域的熱點(diǎn)。運(yùn)行軟件得到圖6所示的人工智能關(guān)鍵詞共現(xiàn)圖譜。該圖譜每一個(gè)節(jié)點(diǎn)的尺寸代表了該詞出現(xiàn)的次數(shù)，隨著出現(xiàn)次數(shù)的增加，這個(gè)圓圈也會(huì)越來(lái)越大。在出現(xiàn)頻率超過(guò)20的關(guān)鍵詞中，神經(jīng)網(wǎng)絡(luò)、系統(tǒng)、模型出現(xiàn)的次數(shù)最多，分別出現(xiàn)次數(shù)為187、141、141?？偨Y(jié)國(guó)際人工智能領(lǐng)域?qū)W者們關(guān)注的熱點(diǎn)主體主要有10 個(gè)方向：診斷(diagnosis)、神經(jīng)網(wǎng)絡(luò)(neural network)、深度學(xué)習(xí)(deep learning)、風(fēng)險(xiǎn)管理(risk management)、優(yōu)化(optimization)、預(yù)測(cè)(prediction)、分類(classification)、算法(algorithm)、智能仿真(simulation)、管理(management)等關(guān)鍵詞，高頻關(guān)鍵詞與中心排名靠前的關(guān)鍵詞基本保持一致，即頻次越高，中心越明顯，中心性一定程度上可以涵蓋熱點(diǎn)和關(guān)鍵轉(zhuǎn)折點(diǎn)。

圖6 關(guān)鍵詞聚類圖Fig.6 Keywords cluster map

結(jié)合文獻(xiàn)分析將關(guān)鍵詞結(jié)果歸納為兩大類。一是針對(duì)深度學(xué)習(xí)的相關(guān)算法研究，深度學(xué)習(xí)是研究計(jì)算機(jī)獲取新的知識(shí)技能，一方面在信息感知、數(shù)據(jù)預(yù)測(cè)和估計(jì)模型上直接使用，另一方面試圖模仿人腦在數(shù)據(jù)中尋找模式的方法，這種模式又被稱為“神經(jīng)網(wǎng)絡(luò)”，神經(jīng)網(wǎng)絡(luò)代表了人工智能在人類思維模仿技術(shù)方面的前沿。二是算法優(yōu)化和特征學(xué)習(xí)，通過(guò)訓(xùn)練數(shù)據(jù)集進(jìn)行預(yù)測(cè)以采取行動(dòng)優(yōu)化某些系統(tǒng)，當(dāng)前有多種算法可用于此優(yōu)化，包括基于模型的強(qiáng)化學(xué)習(xí)、基于遺傳算法的多目標(biāo)尋優(yōu)策略、基于數(shù)據(jù)挖掘的數(shù)據(jù)算法、支持向量機(jī)的特征分析等。三是人工智能與跨門類的尖端學(xué)科，它的研究領(lǐng)域十分廣闊，“人工智能+X”的創(chuàng)新模式將會(huì)在技術(shù)與工業(yè)發(fā)展中逐漸走向成熟，研發(fā)聚集多方向結(jié)合的混合智能，在智能城市、智能農(nóng)業(yè)、智能制造等需求的牽引下需要更多交叉融合的新發(fā)展，從而改變生產(chǎn)力、產(chǎn)業(yè)結(jié)構(gòu)，促進(jìn)人類邁向“普惠型”的智能社會(huì)。

4 討論(Discussion)

隨著信息環(huán)境、數(shù)據(jù)挖掘、跨媒體計(jì)算等方面表現(xiàn)出來(lái)的巨大變化，VR、AR、移動(dòng)終端等穿戴設(shè)備的涌現(xiàn)及元宇宙概念的提出為新一代人工智能的突破提供了技術(shù)環(huán)境和概念延伸。人工智能技術(shù)實(shí)現(xiàn)了新的技術(shù)突破，使其跨越了科學(xué)與應(yīng)用之間的“技術(shù)鴻溝”，在理論與應(yīng)用之間，平臺(tái)支撐系統(tǒng)和平臺(tái)服務(wù)驅(qū)動(dòng)人工智能也走向了新的發(fā)展階段。環(huán)境的日益復(fù)雜需要越來(lái)越多的基于人工智能的支持系統(tǒng)來(lái)制定解決方案，使各個(gè)方向的研究能夠以更快、更準(zhǔn)確的方式進(jìn)行調(diào)整。

就目前發(fā)展來(lái)看，人工智能的發(fā)展從信息感知、機(jī)器學(xué)習(xí)等“淺層智能”過(guò)渡到模仿自然大腦如何處理信息的“深層智能”。出現(xiàn)頻次高的關(guān)鍵詞包括神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、優(yōu)化模型、預(yù)測(cè)、風(fēng)險(xiǎn)管理等，對(duì)其余方向的關(guān)注度相對(duì)平穩(wěn)，且根據(jù)節(jié)點(diǎn)中心性，時(shí)間序列、人工神經(jīng)網(wǎng)絡(luò)、群智能仿真對(duì)人工智能領(lǐng)域具有重要的影響力，支持向量機(jī)、人工智能未來(lái)法案、智能醫(yī)療、特征學(xué)習(xí)等相關(guān)研究仍是未來(lái)一段時(shí)間內(nèi)人工智能領(lǐng)域的熱點(diǎn)。

5 結(jié)論(Conclusion)

本文以CiteSpace軟件為基礎(chǔ)，通過(guò)定性和定量分析研究領(lǐng)域內(nèi)的國(guó)際期刊，得出如下結(jié)論。

從高產(chǎn)國(guó)家、機(jī)構(gòu)、作者分布統(tǒng)計(jì)可視化結(jié)果來(lái)看，國(guó)際人工智能高產(chǎn)國(guó)家集中在中國(guó)、英國(guó)、越南、西班牙、伊朗、美國(guó)；發(fā)文量排名前三的高產(chǎn)研究機(jī)構(gòu)為Duy Tan Univ、Harvard Med Sch、Univ Tabriz，產(chǎn)量排名靠前的作者為Salaheldin Elkatatny、Abdulazeez Abdulraheem、Md Mohaimenul Islam，且各機(jī)構(gòu)間、學(xué)者間的合作較為緊密。在高產(chǎn)國(guó)家、高產(chǎn)機(jī)構(gòu)、高產(chǎn)作者三方面的結(jié)果中，美國(guó)綜合排名靠前，可見其在人工智能領(lǐng)域?qū)W術(shù)研究上較為領(lǐng)先。

從研究熱點(diǎn)來(lái)看，目前國(guó)際人工智能領(lǐng)域重點(diǎn)關(guān)注的是深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)理論和技術(shù)領(lǐng)域的應(yīng)用。國(guó)際人工智能領(lǐng)域的關(guān)鍵詞之間強(qiáng)度較大，與其他多門商業(yè)、生物、醫(yī)療等傳統(tǒng)領(lǐng)域滲透和融合，關(guān)注面愈加廣泛。圍繞人工智能技術(shù)的深入應(yīng)用還有待挖掘，在深層智能的研究如思維、策略等方面仍有不足。鑒于對(duì)社會(huì)經(jīng)濟(jì)和發(fā)展的重要影響，這仍然是進(jìn)一步研究的主要領(lǐng)域。

從研究的演進(jìn)特點(diǎn)和發(fā)展歷程來(lái)看，2011 年至今國(guó)際人工智能經(jīng)歷了蓬勃發(fā)展期、穩(wěn)定期、新一輪爆發(fā)期三個(gè)時(shí)期。從早期理論向?qū)嶋H的轉(zhuǎn)化，到中期基于大數(shù)據(jù)、圖形處理等計(jì)算平臺(tái)的快速發(fā)展，再到后期結(jié)合金融、醫(yī)療機(jī)構(gòu)、教育、數(shù)據(jù)安全、管理等領(lǐng)域進(jìn)行深度應(yīng)用，在社會(huì)和經(jīng)濟(jì)領(lǐng)域都引起了廣泛的關(guān)注。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡