我國(guó)人工智能發(fā)展基本原則包括四點(diǎn):一是要科技引領(lǐng),二是系統(tǒng)布局,三是市場(chǎng)主導(dǎo),四是開(kāi)源開(kāi)放。開(kāi)源開(kāi)放在國(guó)家整體新一代的人工智能發(fā)展規(guī)劃里占非常重要的位置。既然有了布局,那么我們的長(zhǎng)項(xiàng)在哪里?短板在哪里?
四個(gè)優(yōu)勢(shì)
第一,政策優(yōu)勢(shì)。所謂政策優(yōu)勢(shì),國(guó)家對(duì)人工智能產(chǎn)業(yè)發(fā)展特別重視,無(wú)論從國(guó)家層面,還是地方層面,都有很多布局和規(guī)劃,具備政策優(yōu)勢(shì)。
第二,數(shù)據(jù)優(yōu)勢(shì)。中國(guó)的數(shù)據(jù)量非常大,不管是互聯(lián)網(wǎng)的數(shù)據(jù),旅游的數(shù)據(jù),還是老百姓看病的醫(yī)療數(shù)據(jù),都是全世界規(guī)模最大的。有了這些數(shù)據(jù),做人工智能就有米下鍋了。
第三,應(yīng)用場(chǎng)景優(yōu)勢(shì)。聽(tīng)起來(lái)好像全世界的應(yīng)用場(chǎng)景都是一樣的,其實(shí)不是!人工智能要想用,它要有強(qiáng)烈的需求,這個(gè)應(yīng)用場(chǎng)景才能起來(lái),中國(guó)人工智能應(yīng)用場(chǎng)景比任何一個(gè)地方都豐富。
第四,青年人多。中國(guó)本來(lái)人口就多,大學(xué)生里面學(xué)工科的人很多。工科的里面,現(xiàn)在又是人工智能最熱。后面我們?nèi)瞬诺墓?yīng)會(huì)非常充足,而且他們成長(zhǎng)的速度也很快?,F(xiàn)在不管是在國(guó)際上最頂級(jí)的人工智能?chē)?guó)際會(huì)議,還是最頂級(jí)的國(guó)際雜志,投稿人、參會(huì)人差不多一半是中國(guó)年輕人,所以這是我們最大的優(yōu)勢(shì)之一。
四個(gè)短板
第一,基礎(chǔ)理論和原創(chuàng)算法方面差距還是比較大。一是因?yàn)槲覀兤鸩酵?,另外前些年的科研評(píng)估體系使得大家都追熱門(mén),很難在一件事上做二三十年、三四十年,能坐冷板凳的人比較少,所以基礎(chǔ)理論方面還是有比較大的差距。
第二,在高端器件方面有差距。不管是GPU、FPGA,還是高端傳感器等,特別是和模擬、射頻有關(guān)方面的傳感器都是我們的弱項(xiàng)。
第三,開(kāi)源開(kāi)放平臺(tái)有差距?,F(xiàn)在做人工智能基本上都用開(kāi)源開(kāi)放平臺(tái),在開(kāi)源的基礎(chǔ)上快速搭建一個(gè)系統(tǒng)就可以做應(yīng)用了。但是現(xiàn)在大家用得比較多的都是谷歌、Facebook、亞馬遜、微軟、或者IBM的。排在前六名的開(kāi)源開(kāi)放平臺(tái)都是國(guó)外的大企業(yè)。國(guó)內(nèi)盡管有很多互聯(lián)網(wǎng)巨頭都在開(kāi)始這方面的工作,像百度等都在推開(kāi)源開(kāi)放平臺(tái),但是從市場(chǎng)影響力和規(guī)模來(lái)講,還沒(méi)有那么大。
第四,高端人才不足。與美國(guó)的人工智能高端人才數(shù)量相比,我們大概只有他們的20%左右。
云腦 ?建設(shè)新一代人工智能開(kāi)源開(kāi)放共享平臺(tái)
既然存在這四個(gè)短板,我們?cè)趺崔k?我們要補(bǔ)什么?其實(shí),就是要解決開(kāi)源開(kāi)放平臺(tái)的短板。現(xiàn)在還有一個(gè)很大的事,就是現(xiàn)在大家做的開(kāi)源開(kāi)放的源程序放在哪兒?像谷歌、微軟、Facebook的源程序是放在GitHub,如果全放在GitHub上行不行?GitHub原來(lái)是基金會(huì)管理下的托管平臺(tái),后來(lái)被微軟收購(gòu)了,所以現(xiàn)在是微軟下面的托管平臺(tái)。這個(gè)平臺(tái)的母公司微軟公司是注冊(cè)在美國(guó)的,按照美國(guó)法律,GitHub要受美國(guó)法律的管轄。對(duì)于中國(guó)用戶(hù)來(lái)講,如果將來(lái)所有做的東西都放在GitHub上面,如果有一天GitHub不讓某些企業(yè)用,人工智能就變成沒(méi)根了,就懸在半空中了。有沒(méi)有一個(gè)辦法找到一個(gè)高效的、風(fēng)險(xiǎn)可控的托管平臺(tái)。
我們的應(yīng)對(duì)策略就是這兩件事,第一件事是開(kāi)源開(kāi)放平臺(tái)怎么辦?我的想法是通過(guò)云腦來(lái)建設(shè)新一代開(kāi)源共享創(chuàng)新平臺(tái),現(xiàn)在我們的想法是做硬件和做軟件。硬件怎么做?現(xiàn)在已經(jīng)有15家企業(yè)的開(kāi)放創(chuàng)新平臺(tái),這是科技部布局的。我們要做的是在下面再做一個(gè)更廣泛的平臺(tái)。
為了做這個(gè)平臺(tái),我們成立了一個(gè)新一代人工智能產(chǎn)業(yè)創(chuàng)新聯(lián)盟。這個(gè)聯(lián)盟希望能構(gòu)造一個(gè)很好的開(kāi)源開(kāi)放生態(tài),生態(tài)里面包括硬件生態(tài)、軟件生態(tài)和應(yīng)用生態(tài)。
軟件怎么辦?我們啟動(dòng)了啟智平臺(tái)治理體系。目前,平臺(tái)擁有很多核心成員,包括深圳的鵬城實(shí)驗(yàn)室、北京智源人工智能研究院、北京大學(xué)、國(guó)防科技大學(xué)、華為、百度、商湯、京東,等等。同時(shí)還有不同領(lǐng)域的社區(qū),既有最底下的基礎(chǔ)設(shè)施、硬件和上面的算法框架的布局,在孵化方面也有生態(tài)的布局。
硬件怎么辦?現(xiàn)在深圳鵬城實(shí)驗(yàn)室牽頭推出鵬城云腦,準(zhǔn)備做開(kāi)源硬件。鵬城云腦一期是100P操作的大型集群系統(tǒng),既有英偉達(dá)的GPU,也有華為、寒武紀(jì)的人工智能芯片等構(gòu)成的服務(wù)器。之后大概就會(huì)建成1000P的一臺(tái)機(jī)器,這臺(tái)機(jī)器建成了以后,全國(guó)做科研的,不管是高校的、研究所,還是中小微創(chuàng)新創(chuàng)業(yè)的,都可以用來(lái)做訓(xùn)練。
當(dāng)前階段,云腦的使命是要聯(lián)合全國(guó)所有愿意開(kāi)源資源的群體一起做。然后,通過(guò)分布式的資源調(diào)動(dòng)管理系統(tǒng),把所有的服務(wù)器資源調(diào)動(dòng)管理起來(lái),讓它可以為人工智能各行各業(yè)的賦能工作。
這是我們關(guān)于云腦的對(duì)策,希望能做人工智能開(kāi)源開(kāi)放共享創(chuàng)新平臺(tái),提供給國(guó)內(nèi)做人工智能研究和人工智能創(chuàng)業(yè)的人來(lái)使用。
匯智 ?建設(shè)風(fēng)險(xiǎn)可控的人工智能代碼托管平臺(tái)
剛才的那些東西都說(shuō)好了,但是大家做的源代碼貢獻(xiàn)放到哪里去,是不是仍然放到GitHub?當(dāng)然沒(méi)有問(wèn)題。但是放到GitHub上基本上有兩個(gè)問(wèn)題是需要我們考慮的。數(shù)據(jù)顯示,從國(guó)內(nèi)訪(fǎng)問(wèn)的工程師占GitHub整體訪(fǎng)問(wèn)人數(shù)的36%左右,就是1/3,但是不到一半。中國(guó)的工程師用GitHub的非常多,但是中國(guó)的工程師給GitHub做貢獻(xiàn)的不到6%,大概5%左右。也就是說(shuō)很多人其實(shí)只是去拿東西,沒(méi)有做貢獻(xiàn)。為什么?有兩種可能性:
第一種可能性是本來(lái)他就是要拿東西的,也沒(méi)有想要做貢獻(xiàn)。第二種可能性是因?yàn)槟阋鲐暙I(xiàn),你要寫(xiě)很多文檔,而且要用英文。好多工程師的英文不是第一語(yǔ)言,寫(xiě)文檔還有障礙,如果用中文寫(xiě)文檔或者用中文討論問(wèn)題就簡(jiǎn)單了,所以我們要建設(shè)一個(gè)高效的托管平臺(tái)。首先上面用的語(yǔ)言可以是中文,這樣討論就比較方便。同時(shí),這個(gè)托管平臺(tái)應(yīng)該放在中國(guó)境內(nèi)。這樣國(guó)內(nèi)所有做人工智能的人,不管是大學(xué)的,還是企業(yè)的,都可以用。
這個(gè)問(wèn)題我們能不能解決?能解決!怎么解決呢?就是在中國(guó)搞一個(gè)托管平臺(tái)。這個(gè)托管平臺(tái)我們已經(jīng)發(fā)起了,叫匯智,匯集大家的智慧。匯智的托管平臺(tái)已經(jīng)于2019年的7月18日在深圳上線(xiàn)。當(dāng)然目前這個(gè)服務(wù)器也不是放在實(shí)驗(yàn)室的服務(wù)器上,而是放在公有云上。但是公有云給我們提供服務(wù),我們花錢(qián)在公有云上開(kāi)一個(gè)平臺(tái),大家就可以到那兒去訪(fǎng)問(wèn)。
現(xiàn)在上邊放的是什么東西呢?剛才我說(shuō)的像OpenI等,現(xiàn)在有一大堆人工智能框架的東西已經(jīng)都上線(xiàn)了。除了這個(gè)以外,我們還鼓勵(lì)人工智能、RISC-V等開(kāi)源項(xiàng)目和代碼。當(dāng)然我們不排他,這個(gè)托管平臺(tái)不僅有自己的東西,我們還可以做GitHub在中國(guó)的鏡像,甚至其他的一些開(kāi)源代碼在中國(guó)的鏡像,我們都可以做。通過(guò)這樣的托管平臺(tái),大家可以不用擔(dān)心,打雷下雨照樣可以種自己的自留地。
總結(jié)一下,開(kāi)源軟件是人類(lèi)智慧的有效傳承方式,做人工智能必須要做開(kāi)源,中國(guó)要想發(fā)展好新一代的人工智能,必須要有高效和風(fēng)險(xiǎn)可控的開(kāi)源開(kāi)放平臺(tái)。我們現(xiàn)在做了兩個(gè)嘗試,第一是做了云腦,希望它能在軟件和硬件方面提供開(kāi)放的共享創(chuàng)新平臺(tái)。第二是匯智,提供一個(gè)代碼托管平臺(tái),希望這個(gè)平臺(tái)能夠高效、風(fēng)險(xiǎn)可控,為中國(guó)的人工智能發(fā)展夯實(shí)基石。
(本文根據(jù)中國(guó)工程院院士高文公開(kāi)演講整理而成,未經(jīng)本人確認(rèn)。)