盛云夢(mèng),劉 倩
(上海工程技術(shù)大學(xué)管理學(xué)院,上海 201620)
shengym2562@163.com;lqsn1996@163.com
人工智能作為信息和計(jì)算機(jī)技術(shù)領(lǐng)域的一個(gè)重要分支,從前期計(jì)算機(jī)模擬人的認(rèn)知研究發(fā)展為人與計(jì)算機(jī)網(wǎng)絡(luò)結(jié)合的混合群智能研究,其目標(biāo)是以更快的速度和更高的準(zhǔn)確性解決人類智能的問題。在國(guó)家戰(zhàn)略層面,美國(guó)、英國(guó)和德國(guó)等主要發(fā)達(dá)國(guó)家都將人工智能視為國(guó)家競(jìng)爭(zhēng)、信息安全的關(guān)鍵技術(shù),紛紛加大研究與產(chǎn)業(yè)創(chuàng)新結(jié)構(gòu)升級(jí)。我國(guó)人工智能相關(guān)研究發(fā)展迅速,已步入全球領(lǐng)先水平。目前與人工智能相關(guān)的研究成果相對(duì)普遍,但研究?jī)?nèi)容較分散,大多數(shù)聚焦于某一子領(lǐng)域,較少?gòu)娜忠暯菍?duì)國(guó)際人工智能發(fā)展趨勢(shì)進(jìn)行系統(tǒng)深入的研究,且人工智能是目前發(fā)展最快、影響最廣泛的學(xué)科之一,需結(jié)合多種科學(xué)計(jì)量方法對(duì)文獻(xiàn)數(shù)據(jù)進(jìn)行深入的挖掘和分析。因此,本文運(yùn)用文獻(xiàn)計(jì)量軟件,從總體角度對(duì)國(guó)際人工智能的研究熱點(diǎn)、演進(jìn)過(guò)程、發(fā)展脈絡(luò)進(jìn)行了梳理和分析,希望為該領(lǐng)域的發(fā)展探索提供新的研究視角和思考。
為探析近十年人工智能整體發(fā)展的動(dòng)態(tài)與演進(jìn)軌跡,本文對(duì)期刊文獻(xiàn)進(jìn)行研究,主要從科研合作網(wǎng)絡(luò)和文獻(xiàn)、突顯詞、關(guān)鍵詞層面進(jìn)行信息整合和數(shù)據(jù)挖掘,歸納國(guó)際人工智能研究的發(fā)展特征,深入了解領(lǐng)域內(nèi)的動(dòng)態(tài)和焦點(diǎn)問題,對(duì)科研人員進(jìn)行相關(guān)理論研究具有重要的借鑒意義。
本文研究的所有文獻(xiàn)數(shù)據(jù)來(lái)源于全球?qū)W術(shù)信息重要數(shù)據(jù)庫(kù)Web Of Science的核心數(shù)據(jù)庫(kù)。設(shè)定期刊時(shí)間跨度為2011-2021 年,檢索日期設(shè)置為2022年2月1日,檢索條件為:標(biāo)題=“ARTIFICIAL INTELLIGENCE”,文獻(xiàn)類別=“ARTICLE”,利用Web of Science篩選剔除掉非期刊類別的文章,共計(jì)檢索到6,007 條紀(jì)錄。
首先以人工智能相關(guān)領(lǐng)域的期刊發(fā)文量和影響因子為標(biāo)準(zhǔn)篩選了1,886 篇期刊論文,然后借助“CiteSpace”軟件對(duì)具有國(guó)際影響力的人工智能學(xué)術(shù)刊物進(jìn)行可視化的分析,采用文本信息提取法、定性與定量結(jié)合法,挖掘出當(dāng)前世界人工智能研究的熱點(diǎn),并揭示其演化軌跡和發(fā)展趨勢(shì)。
對(duì)上述數(shù)據(jù)清洗后的6,007 篇國(guó)際人工智能研究期刊論文的年度產(chǎn)出情況進(jìn)行描述性分析,詳見圖1。
圖1 國(guó)際AI相關(guān)論文年產(chǎn)量分布圖Fig.1 Annual output distribution map of international papers related to AI
從圖1可以看出,2011—2016 年人工智能研究領(lǐng)域相關(guān)文獻(xiàn)量總體呈現(xiàn)逐年增加趨勢(shì),2017—2021 年,相關(guān)領(lǐng)域文獻(xiàn)呈兩倍急速上升趨勢(shì)。2011 年國(guó)際上關(guān)于人工智能的研究已經(jīng)興起,但研究成果較少,這主要受兩方面的影響,一方面是全球人工智能理論的基礎(chǔ)研究、認(rèn)知理論模型尚待完善,另一方面是硬件、軟件、數(shù)據(jù)等技術(shù)工具的限制。2016 年谷歌旗下的AlphaGo以4:1打敗了世界圍棋高手,迎來(lái)了“人工智能60 周年”的發(fā)展拐點(diǎn),使人工智能論文數(shù)目猛增。自此以后,人工智能的研究成果在數(shù)量和影響力上都有了明顯的提升,其關(guān)注度也在不斷飆升,到2020 年發(fā)文增長(zhǎng)率為89.07%,上升到了一個(gè)新的高度。國(guó)際上關(guān)于人工智能研究且具有影響力的期刊有:、、等。結(jié)合Web of Science的期刊影響力因子,以及人工智能領(lǐng)域期刊的論文發(fā)文量,對(duì)6,007 條搜索結(jié)果進(jìn)行了提煉和整理,最后得出1,886 條。
設(shè)置面板中的“Country”選項(xiàng),其余為系統(tǒng)默認(rèn)值,可獲得世界上高產(chǎn)人工智能研究國(guó)家的知識(shí)圖譜,詳見圖2。圖中每個(gè)節(jié)點(diǎn)表示國(guó)家,兩個(gè)節(jié)點(diǎn)的連線代表了兩國(guó)間的聯(lián)系,節(jié)點(diǎn)的大小則是發(fā)文的數(shù)目。為了更好地理解該領(lǐng)域的節(jié)點(diǎn)層次,進(jìn)行深一步的數(shù)據(jù)挖掘,詳見表1。
圖2 人工智能研究高產(chǎn)國(guó)家可視化知識(shí)圖譜Fig.2 Visual knowledge map of high-yield countries for AI research
表1 按照文章數(shù)量和中心度分別排序的前10 位高產(chǎn)國(guó)家Tab.1 Top 10 high-yield countries ranked by the number and centrality of the paper
從論文產(chǎn)出的角度看,中、美、韓在人工智能領(lǐng)域發(fā)表的文章最多,其后的7 個(gè)國(guó)家論文產(chǎn)量差別較小。由圖2可知中國(guó)人工智能研究起步較晚,與英國(guó)、美國(guó)、澳大利亞、越南、西班牙相比在基礎(chǔ)研究、技術(shù)方面存在一定的差距,但已經(jīng)有了較大的發(fā)展,研究也較深入。其中英國(guó)和美國(guó)在人工智能方面的研究起步較早,且部分文獻(xiàn)是人工智能方向研究的關(guān)鍵轉(zhuǎn)折點(diǎn),這或許是其人工智能行業(yè)發(fā)展較快的一個(gè)重要原因。另一方面,從中心度觀察,中心度值大于等于0.1的節(jié)點(diǎn)被視為關(guān)鍵性的節(jié)點(diǎn),這些節(jié)點(diǎn)通常被視為導(dǎo)致研究領(lǐng)域發(fā)生變化的重要因素。從表1可以看出,英國(guó)、美國(guó)、澳大利亞、越南、西班牙、伊朗這六個(gè)國(guó)家的文獻(xiàn)中心度大于等于0.1,這六個(gè)國(guó)家具有很高的創(chuàng)新能力,在人工智能領(lǐng)域中發(fā)揮著巨大的作用。
運(yùn)行該軟件選取“Institution”選項(xiàng),可得高產(chǎn)機(jī)構(gòu)的分布圖(圖3)。圖譜中較大的圓對(duì)應(yīng)的連線未必多,表明有較多研究結(jié)果的組織和其他組織的關(guān)系也不是很密切。
圖3 高產(chǎn)機(jī)構(gòu)合作圖譜Fig.3 Cooperation map of high-yield institutions
高產(chǎn)機(jī)構(gòu)合作圖譜共有615 個(gè)節(jié)點(diǎn)、1,743 條連線,每個(gè)節(jié)點(diǎn)代表了該機(jī)構(gòu)的論文數(shù)量,連線表示組織間的相互協(xié)作,協(xié)作越多說(shuō)明這個(gè)組織與其他組織的合作程度就越高。從圖3可觀察到各機(jī)構(gòu)間的合作較為緊密,能夠充分利用各高校、科研單位的文獻(xiàn),從而激發(fā)出新的研究視野,更深入、迅速地做出有意義的研究。發(fā)文單位基本上為高等院?;蛘哐芯繖C(jī)構(gòu),高產(chǎn)研究機(jī)構(gòu)主要為Duy Tan Univ、Harvard Med Sch、Univ Tabriz等,其中美國(guó)機(jī)構(gòu)發(fā)文頻次前十名中占比40%,但美國(guó)高等院校及研究機(jī)構(gòu)與其他機(jī)構(gòu)合作不是特別密切,可見其主要利用內(nèi)部資源進(jìn)行獨(dú)立的研究。
為了更好地反映人工智能領(lǐng)域的核心作者和關(guān)聯(lián)度,對(duì)1,886 篇論文進(jìn)行了作者合作圖譜可視化分析(圖4)。
圖4 高產(chǎn)作者合作圖Fig.4 Cooperation map of high-yield authors
圖4中的節(jié)點(diǎn)尺寸代表作者所發(fā)表的論文數(shù)目,連線則代表相互的協(xié)作關(guān)系。根據(jù)普賴斯定律,假設(shè)某一領(lǐng)域中最有生產(chǎn)力的作者論文數(shù)量為,那么=0.749。在這一領(lǐng)域中,發(fā)表超過(guò)篇文章的作者被定義為本研究的主要作者??芍?13,≈3,即發(fā)表3 篇文章以上的為核心作者,統(tǒng)計(jì)得樣本文獻(xiàn)中核心作者共29 名,其排名靠前的作者為Salaheldin Elkatatny、Abdulazeez Abdulraheem、Md Mohaimenul Islam、Kang Ryoung Park。總體而言,國(guó)際人工智能領(lǐng)域合作關(guān)系較為緊密,該領(lǐng)域的研究力量處于比較集中的狀態(tài),各個(gè)學(xué)者之間聯(lián)系密切,對(duì)該領(lǐng)域的深度探究具有重要意義。
運(yùn)用軟件的“Detect Bursts”功能,在特定的年份里可以發(fā)現(xiàn)在短期內(nèi)急劇增加的專業(yè)詞匯,從而觀測(cè)更深層次的發(fā)展變化,圖5為樣本文獻(xiàn)生成的突顯詞圖譜。從突顯詞看出其熱點(diǎn)持續(xù)時(shí)間表現(xiàn)出從長(zhǎng)到短的趨勢(shì)。
圖5 前22 個(gè)最強(qiáng)突顯詞Fig.5 Top 22 keywords with the strongest citation bursts
2011—2012 年突顯詞包括時(shí)間序列(time series)、人工神經(jīng)網(wǎng)絡(luò)(ann)、智能仿真(simulation)、機(jī)器學(xué)習(xí)模型中的定義參數(shù)(parameter)、行為(behavior),這些突顯詞持續(xù)時(shí)間長(zhǎng)達(dá)7至9 年;2014—2017 年突顯詞包括遺傳算法(genetic algorithm)、增長(zhǎng)智能(growth)等,這些關(guān)鍵詞平均持續(xù)時(shí)間長(zhǎng)達(dá)4 年;2018 年至今突顯出支持向量機(jī)(support vector machine)、人工智能未來(lái)法案(future)、智能醫(yī)療(care)、特征學(xué)習(xí)(feature)等突顯詞。以上突顯詞體現(xiàn)了人工智能的發(fā)展脈絡(luò)和趨勢(shì),其中,支持向量機(jī)、人工智能未來(lái)法案、智能醫(yī)療、特征學(xué)習(xí)等關(guān)鍵詞一直持續(xù)至今,反映出在未來(lái)一段時(shí)間相關(guān)研究仍是人工智能領(lǐng)域的關(guān)鍵趨勢(shì)。
關(guān)鍵詞反映了文獻(xiàn)所要表現(xiàn)的各個(gè)主題之間的相互關(guān)系,是文章中心的核心概括,分析關(guān)鍵詞有利于研究本領(lǐng)域的熱點(diǎn)。運(yùn)行軟件得到圖6所示的人工智能關(guān)鍵詞共現(xiàn)圖譜。該圖譜每一個(gè)節(jié)點(diǎn)的尺寸代表了該詞出現(xiàn)的次數(shù),隨著出現(xiàn)次數(shù)的增加,這個(gè)圓圈也會(huì)越來(lái)越大。在出現(xiàn)頻率超過(guò)20的關(guān)鍵詞中,神經(jīng)網(wǎng)絡(luò)、系統(tǒng)、模型出現(xiàn)的次數(shù)最多,分別出現(xiàn)次數(shù)為187、141、141??偨Y(jié)國(guó)際人工智能領(lǐng)域?qū)W者們關(guān)注的熱點(diǎn)主體主要有10 個(gè)方向:診斷(diagnosis)、神經(jīng)網(wǎng)絡(luò)(neural network)、深度學(xué)習(xí)(deep learning)、風(fēng)險(xiǎn)管理(risk management)、優(yōu)化(optimization)、預(yù)測(cè)(prediction)、分類(classification)、算法(algorithm)、智能仿真(simulation)、管理(management)等關(guān)鍵詞,高頻關(guān)鍵詞與中心排名靠前的關(guān)鍵詞基本保持一致,即頻次越高,中心越明顯,中心性一定程度上可以涵蓋熱點(diǎn)和關(guān)鍵轉(zhuǎn)折點(diǎn)。
圖6 關(guān)鍵詞聚類圖Fig.6 Keywords cluster map
結(jié)合文獻(xiàn)分析將關(guān)鍵詞結(jié)果歸納為兩大類。一是針對(duì)深度學(xué)習(xí)的相關(guān)算法研究,深度學(xué)習(xí)是研究計(jì)算機(jī)獲取新的知識(shí)技能,一方面在信息感知、數(shù)據(jù)預(yù)測(cè)和估計(jì)模型上直接使用,另一方面試圖模仿人腦在數(shù)據(jù)中尋找模式的方法,這種模式又被稱為“神經(jīng)網(wǎng)絡(luò)”,神經(jīng)網(wǎng)絡(luò)代表了人工智能在人類思維模仿技術(shù)方面的前沿。二是算法優(yōu)化和特征學(xué)習(xí),通過(guò)訓(xùn)練數(shù)據(jù)集進(jìn)行預(yù)測(cè)以采取行動(dòng)優(yōu)化某些系統(tǒng),當(dāng)前有多種算法可用于此優(yōu)化,包括基于模型的強(qiáng)化學(xué)習(xí)、基于遺傳算法的多目標(biāo)尋優(yōu)策略、基于數(shù)據(jù)挖掘的數(shù)據(jù)算法、支持向量機(jī)的特征分析等。三是人工智能與跨門類的尖端學(xué)科,它的研究領(lǐng)域十分廣闊,“人工智能+X”的創(chuàng)新模式將會(huì)在技術(shù)與工業(yè)發(fā)展中逐漸走向成熟,研發(fā)聚集多方向結(jié)合的混合智能,在智能城市、智能農(nóng)業(yè)、智能制造等需求的牽引下需要更多交叉融合的新發(fā)展,從而改變生產(chǎn)力、產(chǎn)業(yè)結(jié)構(gòu),促進(jìn)人類邁向“普惠型”的智能社會(huì)。
隨著信息環(huán)境、數(shù)據(jù)挖掘、跨媒體計(jì)算等方面表現(xiàn)出來(lái)的巨大變化,VR、AR、移動(dòng)終端等穿戴設(shè)備的涌現(xiàn)及元宇宙概念的提出為新一代人工智能的突破提供了技術(shù)環(huán)境和概念延伸。人工智能技術(shù)實(shí)現(xiàn)了新的技術(shù)突破,使其跨越了科學(xué)與應(yīng)用之間的“技術(shù)鴻溝”,在理論與應(yīng)用之間,平臺(tái)支撐系統(tǒng)和平臺(tái)服務(wù)驅(qū)動(dòng)人工智能也走向了新的發(fā)展階段。環(huán)境的日益復(fù)雜需要越來(lái)越多的基于人工智能的支持系統(tǒng)來(lái)制定解決方案,使各個(gè)方向的研究能夠以更快、更準(zhǔn)確的方式進(jìn)行調(diào)整。
就目前發(fā)展來(lái)看,人工智能的發(fā)展從信息感知、機(jī)器學(xué)習(xí)等“淺層智能”過(guò)渡到模仿自然大腦如何處理信息的“深層智能”。出現(xiàn)頻次高的關(guān)鍵詞包括神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、優(yōu)化模型、預(yù)測(cè)、風(fēng)險(xiǎn)管理等,對(duì)其余方向的關(guān)注度相對(duì)平穩(wěn),且根據(jù)節(jié)點(diǎn)中心性,時(shí)間序列、人工神經(jīng)網(wǎng)絡(luò)、群智能仿真對(duì)人工智能領(lǐng)域具有重要的影響力,支持向量機(jī)、人工智能未來(lái)法案、智能醫(yī)療、特征學(xué)習(xí)等相關(guān)研究仍是未來(lái)一段時(shí)間內(nèi)人工智能領(lǐng)域的熱點(diǎn)。
本文以CiteSpace軟件為基礎(chǔ),通過(guò)定性和定量分析研究領(lǐng)域內(nèi)的國(guó)際期刊,得出如下結(jié)論。
從高產(chǎn)國(guó)家、機(jī)構(gòu)、作者分布統(tǒng)計(jì)可視化結(jié)果來(lái)看,國(guó)際人工智能高產(chǎn)國(guó)家集中在中國(guó)、英國(guó)、越南、西班牙、伊朗、美國(guó);發(fā)文量排名前三的高產(chǎn)研究機(jī)構(gòu)為Duy Tan Univ、Harvard Med Sch、Univ Tabriz,產(chǎn)量排名靠前的作者為Salaheldin Elkatatny、Abdulazeez Abdulraheem、Md Mohaimenul Islam,且各機(jī)構(gòu)間、學(xué)者間的合作較為緊密。在高產(chǎn)國(guó)家、高產(chǎn)機(jī)構(gòu)、高產(chǎn)作者三方面的結(jié)果中,美國(guó)綜合排名靠前,可見其在人工智能領(lǐng)域?qū)W術(shù)研究上較為領(lǐng)先。
從研究熱點(diǎn)來(lái)看,目前國(guó)際人工智能領(lǐng)域重點(diǎn)關(guān)注的是深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)理論和技術(shù)領(lǐng)域的應(yīng)用。國(guó)際人工智能領(lǐng)域的關(guān)鍵詞之間強(qiáng)度較大,與其他多門商業(yè)、生物、醫(yī)療等傳統(tǒng)領(lǐng)域滲透和融合,關(guān)注面愈加廣泛。圍繞人工智能技術(shù)的深入應(yīng)用還有待挖掘,在深層智能的研究如思維、策略等方面仍有不足。鑒于對(duì)社會(huì)經(jīng)濟(jì)和發(fā)展的重要影響,這仍然是進(jìn)一步研究的主要領(lǐng)域。
從研究的演進(jìn)特點(diǎn)和發(fā)展歷程來(lái)看,2011 年至今國(guó)際人工智能經(jīng)歷了蓬勃發(fā)展期、穩(wěn)定期、新一輪爆發(fā)期三個(gè)時(shí)期。從早期理論向?qū)嶋H的轉(zhuǎn)化,到中期基于大數(shù)據(jù)、圖形處理等計(jì)算平臺(tái)的快速發(fā)展,再到后期結(jié)合金融、醫(yī)療機(jī)構(gòu)、教育、數(shù)據(jù)安全、管理等領(lǐng)域進(jìn)行深度應(yīng)用,在社會(huì)和經(jīng)濟(jì)領(lǐng)域都引起了廣泛的關(guān)注。