肖文芳,黃稚霆,歐俊宏,劉浩鵬,黃詩琪
(廣東醫(yī)科大學(xué) 生物醫(yī)學(xué)工程學(xué)院,廣東 湛江 524023)
人工智能技術(shù)發(fā)展起源于1956年的夏季[1],最初對人工智能的構(gòu)想只是使用設(shè)備模擬人類思維并處理問題。后續(xù)的研究使人工智能從單一的設(shè)備研發(fā)發(fā)展成一門涉獵廣泛的交叉學(xué)科。時至今日,人工智能的重要性已經(jīng)引起了全世界的重視。在事物識別與判斷,機(jī)器自動化與智能化等領(lǐng)域都成為人工智能發(fā)展的重要領(lǐng)域。計算機(jī)視覺技術(shù)是在計算機(jī)上利用適當(dāng)?shù)乃惴▽Σ杉膱D像等進(jìn)行分析的技術(shù),重點(diǎn)在于軟件,關(guān)注點(diǎn)是閱讀后如何使用科學(xué)方法進(jìn)行分析[2]。計算機(jī)視覺研究已經(jīng)在學(xué)術(shù)領(lǐng)域研究多年,發(fā)展出很多深刻的原理與技術(shù),近年的重點(diǎn)主要放在工業(yè)化進(jìn)程上,如利用GPU和視覺計算加速器處理數(shù)據(jù)。但計算機(jī)視覺技術(shù)走出實驗室,走進(jìn)市場,還需進(jìn)一步探索。
本文以CNKI為檢索平臺,以“人工智能”與“計算機(jī)視覺”為檢索主題,時間區(qū)間為1979—2021年,經(jīng)過檢索與篩選,得到文獻(xiàn)6 028篇。借助CiteSpace[3]、VOSviewer[4]、SPSS[5]等可視化分析軟件,運(yùn)用詞頻分析法及聚類分析法等對檢出文獻(xiàn)的作者、機(jī)構(gòu)及關(guān)鍵詞進(jìn)行可視化分析與研究,以期把握基于人工智能的計算機(jī)視覺研究領(lǐng)域的內(nèi)容及特征,并對未來的研究趨勢進(jìn)行探討。
將CNKI收錄基于人工智能的計算機(jī)視覺技術(shù)的文獻(xiàn)數(shù)據(jù)導(dǎo)入VOSviewer軟件中,確定作者為其網(wǎng)絡(luò)節(jié)點(diǎn),經(jīng)過VOSviewer軟件進(jìn)行可視化后得到101個作者(圖1)。在LabelView視圖中節(jié)點(diǎn)與字體的大小取決于該節(jié)點(diǎn)的權(quán)重。由圖1可見,李偉、袁保宗、藤光輝、阮秋琦等的發(fā)文量較多,其中發(fā)文最多的李偉為23篇。
圖1 基于VOSviewer的作者頻次圖
作者的多維尺度分析實質(zhì)是依據(jù)作者之間的“距離”即關(guān)系的緊密程度對研究問題進(jìn)行聚類,能全面反映研究的主要角度與熱點(diǎn)。
利用SPSS進(jìn)行多維尺度分析,得到可視化結(jié)果,如圖2所示。然而仍需對結(jié)果進(jìn)行有效性和可靠性判斷,其中包括變量的二維分布圖。對輸出結(jié)果還要判斷其可靠性和有效性,主要通過應(yīng)力系數(shù)(stress)和擬合優(yōu)度的平方(RSQ)進(jìn)行判斷[6]。RSQ越大越好,一般大于0.6認(rèn)為是可接受的,而stress的標(biāo)準(zhǔn)一般0是完美,2.5是優(yōu),3是良,到20則代表擬合效果很差。畫圖后我們得到RSQ=0.988 81,Stress=0.060 81,因此可以認(rèn)為此結(jié)果是有效且可靠的。
圖2 基于SPSS的作者多維尺度分析圖
通過多維尺度分析的結(jié)果可以將基于人工智能技術(shù)的計算機(jī)視覺研究者分為以下4類。每一個類當(dāng)中的作者所研究的領(lǐng)域都具有一定的相似性。從圖中可以看出李偉、袁保宗、李德華等距離中心最近,屬于該領(lǐng)域較為有影響力的研究者。
節(jié)點(diǎn)大小代表相對詞頻,節(jié)點(diǎn)間連線代表共現(xiàn)關(guān)系,連線顏色深淺代表關(guān)聯(lián)度,節(jié)點(diǎn)發(fā)出的連線數(shù)量代表節(jié)點(diǎn)的中心度及在基于人工智能的計算機(jī)視覺領(lǐng)域的重要程度(圖3)。
由圖3可知,我國基于人工智能的計算機(jī)視覺研究領(lǐng)域中,除“人工智能”與“計算機(jī)視覺”2個上位關(guān)鍵詞外,“機(jī)器視覺”與“圖像處理”在余下的關(guān)鍵詞中占主要地位,大部分研究方向都與其有聯(lián)系。可以認(rèn)為,迄今為止在整個研究領(lǐng)域中,大部分研究都以機(jī)器視覺或圖像處理為出發(fā)點(diǎn)進(jìn)行研究。無論基于何種出發(fā)點(diǎn),大部分的小型聚類(圖3中未顯示文字的節(jié)點(diǎn)構(gòu)成的聚類)都與這2個出發(fā)點(diǎn)存在聯(lián)系,小型聚類間的相互聯(lián)系也相當(dāng)緊密,但小型聚類間并沒有產(chǎn)生出新的具有共同高頻詞(新研究重心)的大型聚類(新研究方向),這反映了基于人工智能的計算機(jī)視覺這一領(lǐng)域空有聯(lián)系,但缺少新的研究重心與方向,只能從過去的研究成果中尋求突破。使用SPSS對關(guān)鍵詞進(jìn)行多維尺度分析得到圖4。
圖3 關(guān)鍵詞共現(xiàn)圖譜顯示出現(xiàn)頻次15次以上的節(jié)點(diǎn)
結(jié)合圖4的可視化結(jié)果得出,基于人工智能的計算機(jī)視覺領(lǐng)域從1996—2018年的研究重?zé)狳c(diǎn)大致分為3個類別:以人工智能和計算機(jī)視覺為主為一派,以圖像處理和物體與模式識別為一派及以人機(jī)交互、機(jī)器學(xué)習(xí)為重點(diǎn)一派。同時也明顯看出人工智能與計算機(jī)視覺圖像處理這一類要明顯比另外2類離中心較近,屬于核心大類,是目前研究的重中之重。圖4呈現(xiàn)出小型聚類(小型研究方向)間的聯(lián)系是脆弱的,不可靠的,甚至在本質(zhì)上是不甚相關(guān)的。
圖4 基于SPSS的關(guān)鍵詞聚類分析圖
研究前沿的識別與追蹤能夠為研究者提供學(xué)科研究的最新演化動態(tài),預(yù)測研究領(lǐng)域的發(fā)展,識別需要進(jìn)一步探索的問題。在研究中,前沿往往采用代表該研究相同的詞匯或短語出現(xiàn)次數(shù)的變化進(jìn)行分析。相對于傳統(tǒng)的高頻主題詞分析,突現(xiàn)主題術(shù)語更適合探測學(xué)科發(fā)展的新興趨勢和突然變化。在分析凸顯主題術(shù)語時,可利用突現(xiàn)詞探測技術(shù)和算法,通過考察關(guān)鍵詞詞頻時間分布,從中探測出頻次變化率高的主題詞。
基于人工智能的計算機(jī)視覺研究前沿劃分為3個階段(圖5)。
圖5 基于CitesPace的1996—2018年突現(xiàn)率排名前25的關(guān)鍵詞
第一階段:在1996年,基于人工智能的計算機(jī)視覺研究處于研究初期,產(chǎn)生大量具有突現(xiàn)度和中心度的突現(xiàn)詞,表明人工智能為基礎(chǔ)的計算機(jī)視覺理論在提出的初期便成為學(xué)術(shù)研究的熱點(diǎn),形成多樣化的研究中心?!靶〔ㄗ儞Q”“主動視覺”“圖像識別”“圖像處理”從出現(xiàn)便呈現(xiàn)出較高的突現(xiàn)度。可見,本領(lǐng)域初期研究是以圖像的識別和轉(zhuǎn)換處理為研究熱點(diǎn),隨著研究不斷深化,本領(lǐng)域也逐步界定了具有自身特色的概念和理念,并進(jìn)行推廣。
第二階段:從1997年到2006年,在過去提出的理論被繼續(xù)豐富的基礎(chǔ)上,大量的新研究熱點(diǎn)被提出并進(jìn)行研究?!坝嬎銠C(jī)制圖學(xué)”“計算機(jī)圖形學(xué)”等詞呈現(xiàn)出20以上的驚人突現(xiàn)度,毫無疑問這是當(dāng)時最火熱的研究熱點(diǎn)。這表明針對已識別的圖像處理與表現(xiàn)成為當(dāng)下的研究熱點(diǎn)。同時,其他的數(shù)據(jù)轉(zhuǎn)換及處理技術(shù)也在飛速發(fā)展。
第三階段:從2006年至今,未見有新研究熱點(diǎn)的提出,原有的研究熱點(diǎn)也逐漸冷卻,2012年后,以往提出的研究熱點(diǎn)都趨于平靜。這表明在經(jīng)歷1996—2005年的理論推廣期和活躍期后,基于人工智能的計算機(jī)視覺研究進(jìn)入醞釀階段。
突現(xiàn)詞分析結(jié)果表明,人工智能與計算機(jī)視覺主研究點(diǎn)在歷年來拓展出了諸多研究方向,但各個方向都未形成明顯的研究派系。各研究方向正在完善自身的理論基礎(chǔ),期待厚積薄發(fā),成為新的研究熱點(diǎn)。
自1996年以來,基于人工智能的計算機(jī)視覺研究成果收獲頗豐。這足以表明基于人工智能的計算機(jī)視覺研究整體呈現(xiàn)活躍態(tài)勢。研究類別包含基本概念、基礎(chǔ)技術(shù)應(yīng)用、具體技術(shù)應(yīng)用、新發(fā)展方向等多方面從理論性到應(yīng)用性的研究。研究方式趨于多樣化。發(fā)文量也呈現(xiàn)隨時間發(fā)展而上升的趨勢。整體看來本領(lǐng)域正欣欣向榮。
但基于人工智能的計算機(jī)視覺研究領(lǐng)域依然存在許多不足。如研究重點(diǎn)的關(guān)聯(lián)不足,作者以及機(jī)構(gòu)間的合作較少,新概念的提出并未引起相關(guān)研究的爆發(fā)性增長等問題。在未來的研究中,第一,應(yīng)當(dāng)加強(qiáng)作者及機(jī)構(gòu)間的聯(lián)系,強(qiáng)強(qiáng)聯(lián)手,以期做出更好的成果;第二,應(yīng)當(dāng)在保證基礎(chǔ)理論研究的情況下加大對新生技術(shù)以及概念的研究力度,當(dāng)新概念或技術(shù)成為熱點(diǎn)時,才能更快地暴露其優(yōu)勢或劣勢,從而決定未來的研究方向;第三,加強(qiáng)領(lǐng)域間的聯(lián)系,多向其他領(lǐng)域借鑒學(xué)習(xí),他山之石可以攻玉,以期獲得新的研究目標(biāo)或者成果。