常莽
近日,斯坦福大學(xué)發(fā)布了《人工智能指數(shù)2022》(Artificial Intelligence Index Report 2022)報(bào)告,這是斯坦福大學(xué)連續(xù)第5年發(fā)布該類型的報(bào)告,該報(bào)告旨在成為世界上最可信、最權(quán)威的AI數(shù)據(jù)和洞察來(lái)源。2022年的報(bào)告分為5個(gè)章節(jié),包括最新的研究進(jìn)展、技術(shù)、AI倫理、投資與教育和AI政策。
研發(fā)是推動(dòng)AI快速發(fā)展的不可或缺的力量。每年學(xué)術(shù)界、工業(yè)界、政府和間組織通過(guò)量論、期刊章、人工智能會(huì)議等為AI研發(fā)做出貢獻(xiàn)。2010 - 2021年,人工智能出版物的總數(shù)翻了一番,從2010年的162 444篇增長(zhǎng)到2021年的334 497篇。
其中,2021年這些出版物的51.5 %是期刊章,21.5 %是會(huì)議論,17.0 %來(lái)自存儲(chǔ)庫(kù)。細(xì)分領(lǐng)域方面,自2015年以來(lái),模式識(shí)別和機(jī)器學(xué)習(xí)方的出版物增加了倍多。其他受深度學(xué)習(xí)影響較的領(lǐng)域,如計(jì)算機(jī)視覺(jué)、數(shù)據(jù)挖掘和自然語(yǔ)言處理,增幅較小。
按論文來(lái)源的部門來(lái)分,教育機(jī)構(gòu)仍是AI研究的主力,而美國(guó)和歐盟的公司參與研發(fā)的程度也很高。值得一提的是,中國(guó)是唯一一個(gè)教育比重不斷上升的國(guó)家。而且,迄今為止,過(guò)去12年中美國(guó)和中國(guó)之間的合作數(shù)量最多,自2010年以來(lái)增加了5倍。其次是英國(guó)與美國(guó)和中國(guó)之間的合作,增加了自2010年以來(lái)增長(zhǎng)了3倍多。2021年,美國(guó)和中國(guó)之間的合作數(shù)量是英國(guó)和中國(guó)之間的2.7倍。
按地區(qū)來(lái)看,2021年,東亞和太平洋地區(qū)以42.9 %的AI期刊出版物發(fā)文量領(lǐng)先,其次是歐洲和中亞(22.7 %)和北美(15.6 %)。此外,南亞、中東和北非的增最為顯著,在過(guò)去12年中,它們的AI期刊出版物數(shù)量分別增長(zhǎng)了約12倍和7倍。
按地理區(qū)域來(lái)分,中國(guó)保持領(lǐng)先地位,2021年為31.0 %,其次是歐盟和英國(guó),為19.1 %,美國(guó)為13.7 %。
在論文的被引次數(shù)上,中國(guó)的份額逐漸增加,歐盟以及英國(guó)和美國(guó)的被引次數(shù)減少,這3個(gè)地理區(qū)域的總引量占全球總引量的66 %以上。
在專利方面,2021年提交的專利數(shù)量是2015年的30倍以上,復(fù)合年增率為76.9 %。中國(guó)的專利數(shù)已經(jīng)占了世界半,并獲得約6 %的授權(quán)。
AI開(kāi)源軟件庫(kù)方面,TensorFlow仍最受歡迎的,GitHub累計(jì)星數(shù)約為161 000,2020年略有增加,遠(yuǎn)高于排名第二的OpenCV。
在今年的報(bào)告中技術(shù)性能這章節(jié)對(duì)AI各個(gè)領(lǐng)域的技術(shù)進(jìn)步進(jìn)了以往更多的分析,包括計(jì)算機(jī)視覺(jué)、語(yǔ)、強(qiáng)化學(xué)習(xí)等技術(shù)的趨勢(shì)。
計(jì)算機(jī)視覺(jué)
圖像分類:圖像分類是指機(jī)器對(duì)圖像中看到的內(nèi)容進(jìn)行分類的能力。過(guò)去年圖像識(shí)別系統(tǒng)技術(shù)取得了巨大的進(jìn)步,特別是研究人員已經(jīng)采了更多的機(jī)器學(xué)習(xí)技術(shù)。截2021年底,頂級(jí)圖像分類系統(tǒng)在Top-1準(zhǔn)確度上每10次分類嘗試平均產(chǎn)1個(gè)錯(cuò)誤,相比之下,2012年底每10次嘗試平均4次錯(cuò)誤。2021年,最頂級(jí)的預(yù)訓(xùn)練系統(tǒng)是CoAtNets,由歌研究員制作。
圖像生成:圖像成是成與真實(shí)圖像法區(qū)分的圖像的任務(wù)。如下圖所示,2021年,AI已經(jīng)可以合成非常難以區(qū)分的人臉照片。
深度偽造檢測(cè):許多人工智能系統(tǒng)現(xiàn)在可以合成與真實(shí)圖像算法區(qū)分的假圖像,例如通過(guò)換臉來(lái)實(shí)現(xiàn)所謂的“深度偽造”。近幾年,研究人員一直試圖通過(guò)制作更強(qiáng)大的深度偽造檢測(cè)算法來(lái)跟上偽造步伐。FaceForensics++是一個(gè)深度偽造檢測(cè)基準(zhǔn)測(cè)試。2012年,最強(qiáng)的AI技術(shù)可以在4個(gè)Face Forenics++數(shù)據(jù)集中正確識(shí)別69.9 %的深度偽造。2021年,該數(shù)字增加到97.7 %。
醫(yī)學(xué)圖像分割:醫(yī)學(xué)圖像分割是指AI系統(tǒng)在醫(yī)學(xué)圖像中分割感興趣對(duì)象(例如器官、病變或腫瘤)的能力。目前,AI能夠在CVC-ClinicDB數(shù)據(jù)集上以94.2 %的正確率識(shí)別結(jié)腸鏡檢查息,相比2015年提升了11.9個(gè)百分點(diǎn)。
人臉檢測(cè):雖然目前的一些面部識(shí)別算法的成功率接近100 %,但因?yàn)橐咔榈挠绊懀骺谡置娌孔R(shí)別成為了AI技術(shù)新的挑戰(zhàn)。2021年,北京郵電學(xué)的研究員發(fā)布了6 000張蒙臉的臉識(shí)別數(shù)據(jù)集,以應(yīng)對(duì)規(guī)模戴罩帶來(lái)的新識(shí)別挑戰(zhàn)。研究人員在各種面部識(shí)別數(shù)據(jù)集上運(yùn)了系列現(xiàn)有的最先進(jìn)的檢測(cè)算法,結(jié)果表明,與未蒙相,頂級(jí)法在蒙孔上的表現(xiàn)要差5~16個(gè)百分點(diǎn)。
語(yǔ)言理解
目前的英文語(yǔ)言理解用的最新基準(zhǔn)測(cè)試為SuperGLUE,于2019年5月發(fā)布。在測(cè)試中,AI系統(tǒng)在8種不同的任務(wù)上進(jìn)行測(cè)試。截至目前最先進(jìn)的系統(tǒng)為SS-MoE模型,在Super GLUE上的得分為91.0,已經(jīng)超過(guò)了人類。
在另一項(xiàng)斯坦福問(wèn)答數(shù)據(jù)集(SQuAD)中,AI最新得分為95.7和93.2,也超過(guò)了人類的表現(xiàn)。
但是,對(duì)于需要邏輯推理的問(wèn)題上AI貌似仍力不從心。在由新加坡國(guó)立大學(xué)科學(xué)家創(chuàng)建的數(shù)據(jù)集ReClor中,困難問(wèn)題的最好表現(xiàn)只有69.3 %的準(zhǔn)確率。
自然語(yǔ)言推理方面,目前斯坦福然語(yǔ)推理(SNLI)數(shù)據(jù)集表現(xiàn)最好的模型是FacebookAIUSA的EFL,其在2021年4月的得分為93.1%。
強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)的測(cè)試標(biāo)準(zhǔn)是2013年推出的Arcade Learning Environment(Atari-57),2019年末,DeepMind的MuZero算法在Atari-57上實(shí)現(xiàn)了最先進(jìn)的性能。到了2021年,來(lái)自清華大學(xué)和字節(jié)跳動(dòng)的研究人員開(kāi)發(fā)出了GDI-H3模型,該模型在Atari上的性能超過(guò)了MuZero -57的近1倍。
機(jī)器人
調(diào)查結(jié)果顯示在過(guò)去7年中,機(jī)器人手臂的價(jià)格有明顯的下降趨勢(shì)。2017年,價(jià)格中位數(shù)機(jī)器人手臂的價(jià)格是42 000美元。從那時(shí)起,價(jià)格已經(jīng)下降了46.2 %,致達(dá)到了2021年的22 600美元。并且,現(xiàn)在機(jī)器人相關(guān)的AI技術(shù)的普及率也出現(xiàn)了大幅提升。
工作
新西蘭的人工智能招聘增漲最快———2021年是2016年的2.42倍,其次是中國(guó)香港(1.56)、愛(ài)爾蘭(1.28)、盧森堡(1.26)和瑞典(1.24)。此外,2020 - 2021年,許多國(guó)家或地區(qū)的AI招聘增漲率有所下降
在2021年所有職位發(fā)布中,人工智能職位發(fā)布的份額最高的是機(jī)器學(xué)習(xí)技能(占所有職位發(fā)布的0.6 %),其次是人工智能(0.33 %)、神經(jīng)網(wǎng)絡(luò)(0.16 %)和自然語(yǔ)言處理(0.13 %)。
美國(guó)信息部的所有職位發(fā)布中有3.30 %與AI相關(guān),其次是科學(xué)和技術(shù)服務(wù)(占所有列表的2.59 %)、制造(2.02 %)和金融和保險(xiǎn)(1.81 %)。
AI的滲透率方面,印度在智能技能滲透率方面領(lǐng)先世界是全球平均水平的3.09倍,緊隨其后的是美國(guó)(2.24)和德國(guó)(1.7)。之后是中國(guó)(1.56)、以列(1.52)和加拿(1.41)。
投資
目前,私人投資仍是AI投融資的主流,其次是并購(gòu)、公開(kāi)發(fā)行和少數(shù)股權(quán)。2021年,全球?qū)θ斯ぶ悄艿乃饺送顿Y總額約為935億美元,是2020年私投資總額的2倍多。
在披露融資額的公司中,與2020年相比,2021年1億美元~5億美元的AI融資輪數(shù)增加了多倍,5 000萬(wàn)美元1億美元的融資輪數(shù)也增加了很多。
2021年,美國(guó)在獲得資助的AI公司的總體私人投資居世界首位,約為529億美元,是排名第2的國(guó)家中國(guó)(172億美元)。排在第三位的是英國(guó)(46.5億美元),其次是以色列(24億美元)和德國(guó)(19.8億美元)。
2021年,美國(guó)有299家新投資的AI公司,其次是中國(guó),有119家,英國(guó)有49家,以色列有28家。
行業(yè)領(lǐng)域方面,2021年人工智能領(lǐng)域最多的私人投資是數(shù)據(jù)管理、處理和云(約122億美元)。在過(guò)去5年中,醫(yī)療和保健類別獲得了全球最多的私人投資(289億美元);其次是數(shù)據(jù)管理、處理和云計(jì)算(269億美元);金融科技(249億美元);和零售(219.5億美元)。
教育
在北美,多數(shù)與智能相關(guān)的課程都是作為本科階段CS課程的1部分。2010- 2020年,北美博士機(jī)構(gòu)的新CS本科畢業(yè)生數(shù)量增加了3.5倍。2020年,超過(guò)31 000名本科生完成了計(jì)算機(jī)科學(xué)學(xué)位,2019年增加了11.60 %。并且,2020年每5名CS學(xué)生中就有1名獲得了AI / ML博士學(xué)位。
2016~2021年,總共有25個(gè)國(guó)家通過(guò)了55項(xiàng)與人工智能相關(guān)的法案,其中美國(guó)以13項(xiàng)法案占據(jù)榜首,其次是俄羅斯、比利時(shí)、西班牙和英國(guó)。2021年頒布的法律數(shù)量上,西班牙、英國(guó)和美國(guó)領(lǐng)先,各超過(guò)3項(xiàng)。
美國(guó)2015年只有一項(xiàng)聯(lián)邦法案與人工智能相關(guān),2021年提升到了130項(xiàng)。
在2021財(cái)年(FY),國(guó)防美國(guó)政府機(jī)構(gòu)共為AI研發(fā)支出分配了15.3億美元,約為2018財(cái)年支出的2.7倍。預(yù)計(jì)2022財(cái)年這一數(shù)字將增至8.8%,申請(qǐng)總額為16.7億美元。
而美國(guó)國(guó)防部2021年在500個(gè)人工智能研發(fā)項(xiàng)目中撥款92.6億美元,比2020年的86.8億美元增加6.68%。國(guó)防部在人工智能上的支出也是最多的,2021年,它在與人工智能相關(guān)的合同上花費(fèi)了11.4億美元。
總體來(lái)看,雖然2021年是個(gè)多事之秋,但人工智能的發(fā)展仍然一路高歌猛進(jìn),私人投資大幅增加、新技術(shù)不斷突破都給這個(gè)行業(yè)的發(fā)展打了強(qiáng)心劑。尤其值得欣慰的是,在中美國(guó)家關(guān)系日趨復(fù)雜的現(xiàn)在,AI行業(yè)的中美合作仍很緊密,這是人類科學(xué)技術(shù)在沖突與斗爭(zhēng)大環(huán)境下的一絲慰藉。