龐紅碩
張立華2018年在上??萍脊?jié)新創(chuàng)發(fā)布會上作《智能視覺感知技術(shù)》報告
智能機器人的發(fā)展正如同人類的文明和進化史一般,不斷向著更高級的形態(tài)發(fā)展。一個充滿挑戰(zhàn)的問題正擺在人類面前,未來的智能機器人是否會擁有像人一樣的智慧大腦和復雜意識?
“當前以深度學習為代表的人工智能技術(shù)所能解決的問題往往需要具有大量可以借鑒學習的訓練集,同時要求所獲取的信息是完備的,而在復雜的真實應用環(huán)境中,采集到的數(shù)據(jù)往往包含大量噪聲與不確定性,且僅包含環(huán)境的局部信息,導致了基于深度學習的人工智能應用的局限性。而在同樣環(huán)境下,人類卻往往可以依靠直覺做出較為迅速且適宜的判斷,這為我們發(fā)展新的人工智能理論來解決上述問題提供了靈感?!痹趶偷┐髮W,智能機器人研究院常務(wù)副院長、智能機器人教育部工程研究中心副主任張立華正帶領(lǐng)一個科學家團隊,與清華大學腦與認知科學研究院合作,提出了機器直覺這一新的交叉學科研究方向,致力于讓機器實現(xiàn)類似甚至超過人類的直覺能力,賦予機器洞察力與創(chuàng)造性。
在融合了人類智能+人工智能+群體智能的全息群智理論與機器直覺理論研究的基礎(chǔ)上,他們力圖打造賦智于機器人的核心智能引擎,為智能機器人的發(fā)展提供較為系統(tǒng)、完整的基礎(chǔ)理論與關(guān)鍵技術(shù)支撐。
作為曾經(jīng)創(chuàng)業(yè)并在產(chǎn)業(yè)界卓有成就,如今回歸科研一線,向前沿進發(fā)的優(yōu)秀學者,張立華用20年時間,一手搭建起從科研創(chuàng)新到產(chǎn)業(yè)落地的路徑,窺見了人工智能未來發(fā)展的壯麗圖景。
1994年,凱文·凱利寫下了后來被譽為成功預言了人類未來的《失控:機器、社會與經(jīng)濟的新生物學》一書。在書中,關(guān)于智能機器人、大眾智慧、云計算、物聯(lián)網(wǎng)、虛擬現(xiàn)實、共生、共同進化等詞匯第一次走進人類視野。如今,人工智能的時代已經(jīng)來臨,機器的深度學習已不再讓人類感到陌生,也成為了人工智能系統(tǒng)向前發(fā)展的重要能力。
同樣是1994年,從清華大學自動化系自動控制專業(yè)本科畢業(yè)的張立華不會想到,在未來的20多年時間里,自己將參與一個又一個推動人工智能相關(guān)領(lǐng)域發(fā)展的重大項目開發(fā)和理論研究。
選擇自動化專業(yè)對于張立華來說頗有“無心插柳”的味道。他在清華大學1989年招生簡章上看到自動化專業(yè)那一頁中,有幾張機器人的圖片,引起了他的好奇,于是便選擇了自動化系自動控制專業(yè),從此與人工智能結(jié)下了不解之緣。
2000年,張立華拿到了清華大學控制理論與控制工程專業(yè)博士學位,并獲得了“清華大學優(yōu)秀博士學位論文”獎,此后便開始了在國外的漫長研究生涯。
博士畢業(yè)后的張立華在美國輾轉(zhuǎn)從事科研工作多年,曾先后在多家芯片企業(yè)工作,并在全球視覺計算與人工智能行業(yè)領(lǐng)袖企業(yè)——美國英偉達公司等擔任高級技術(shù)與管理職務(wù)。
在美國多年,不僅讓張立華完成了在人工智能科研領(lǐng)域的不斷累積與進步,也對他未來的科研工作產(chǎn)生了巨大影響。在他看來,在保持科技創(chuàng)新的激情和動力的同時,同樣要致力于實現(xiàn)創(chuàng)新技術(shù)的產(chǎn)業(yè)化。
張立華供職過的其中一家企業(yè),核心產(chǎn)品是三維物理仿真處理器芯片,該公司研發(fā)的物理仿真引擎也是當時世界上最好的兩個物理仿真引擎之一。
物理仿真引擎需要對剛體、流體、軟體等進行模擬,相關(guān)算法非常復雜,需要很大的算力。張立華加入之后,參與研發(fā)以異構(gòu)眾核架構(gòu)計算技術(shù)為核心的三維物理仿真引擎處理器芯片,這需要掌握剛剛初現(xiàn)端倪的異構(gòu)并行計算技術(shù),這意味著他需要重新進行大量學習和創(chuàng)新。
那段研究經(jīng)歷,讓他至今印象深刻。彼時,在三維游戲或工程設(shè)計中,物理仿真的技術(shù)應用很廣。比如,一個游戲中的女孩子穿著裙子跳舞時的動態(tài)效果如何才能做得更逼真,就是張立華和同事需要攻克的難題之一。圍繞一個個難題一一攻克,張立華和同事進行了物理仿真算法上的極致探索。
技術(shù)的攻關(guān)沒有止境,更大的問題在于如何實現(xiàn)芯片的產(chǎn)業(yè)化。即使算法做出來了,但若過于復雜,在當時的成本下,同樣無法實現(xiàn)產(chǎn)業(yè)化。
“我們還要進行優(yōu)化,如果優(yōu)化不了,就要對算法重新分析、重新設(shè)計?!睆埩⑷A說,芯片做出來后,他們還要進行一一調(diào)試,讓各方面的性能達到最佳。為了實現(xiàn)這款芯片的產(chǎn)業(yè)化,他們專門設(shè)計了一款針對異構(gòu)架構(gòu)處理器的性能分析軟件,這個分析軟件最終成為一款全球最早的異構(gòu)系統(tǒng)性能分析的通用軟件之一。
而作為當時的主要參與者,張立華從首席工程師、研發(fā)經(jīng)理,一步步升任為公司的技術(shù)總監(jiān),負責管理公司60%以上的研發(fā)工程師。后來,在英偉達公司工作后,正是由他帶領(lǐng)團隊,將三維物理仿真引擎從原來的處理器移植到英偉達的通用GPU(圖形處理器)上。
“我當時意識到,異構(gòu)技術(shù)肯定是能夠影響未來的新技術(shù)?!睆埩⑷A說,曾經(jīng)世界排名第一的中國“天河一號”超級計算機,用的就是異構(gòu)計算技術(shù)?,F(xiàn)在我們知道,正是以GPU為代表的異構(gòu)并行計算技術(shù)的發(fā)展,才促進了今天深度學習的爆發(fā)式發(fā)展和應用。
和丘成桐院士(左二)的合影
異構(gòu)計算技術(shù)上的突破和三維物理仿真引擎芯片的產(chǎn)業(yè)化經(jīng)歷,讓張立華體驗到將一個新的科技創(chuàng)新實現(xiàn)成果轉(zhuǎn)化,最終實現(xiàn)產(chǎn)業(yè)化,才是科研人最終的歸宿。
“后來,當我有了新的技術(shù)或新的想法,我就會想如何將它產(chǎn)業(yè)化,變成一個生產(chǎn)生活中真正可以創(chuàng)造價值的東西。如果只是在學校純粹做理論研究,就無法產(chǎn)生這樣的激情。”張立華說,只有真正了解社會的需求和產(chǎn)業(yè)的需求,并實現(xiàn)科研的成果轉(zhuǎn)化甚至是產(chǎn)業(yè)化,才是真正“將論文寫在大地上”。
也正是因為這份產(chǎn)業(yè)夢想,張立華回國之初創(chuàng)立了長春博立電子科技有限公司,成立了國內(nèi)最早、規(guī)模最大的異構(gòu)并行計算技術(shù)開發(fā)團隊,并于2015年入選國務(wù)院僑務(wù)辦公室“重點華僑華人創(chuàng)業(yè)團隊”。異構(gòu)計算、人工智能與計算機視覺技術(shù)是張立華的強項,也是企業(yè)技術(shù)研發(fā)的主攻方向。以人工智能核心算法和異構(gòu)計算技術(shù)為基礎(chǔ),博立電子進軍智能汽車、智能機器人、智能制造、智能醫(yī)療以及智慧城市五大行業(yè)領(lǐng)域,讓張立華多年的產(chǎn)業(yè)夢想得以開花結(jié)果,讓他在學術(shù)研究上的積累有了落地的土壤。
在創(chuàng)業(yè)過程中,張立華深感產(chǎn)業(yè)發(fā)展離不開技術(shù)創(chuàng)新,而前沿技術(shù)創(chuàng)新迫切需要理論上的進一步突破,2017年9月,他回歸科研一線,加入復旦大學,擔任復旦大學智能機器人研究院副院長、機器人智能硬件與操作系統(tǒng)研發(fā)平臺負責人、智能感知與無人系統(tǒng)實驗室主任,負責推進人工智能與機器人科研平臺建設(shè),并參與策劃上海市市級重大科技專項等。
張立華認為,近年來以深度學習為代表的人工智能的發(fā)展方興未艾,尤其是在圖像分類、語音識別等特定領(lǐng)域研究,取得了很大的突破,但這些突破仍不具備通用性?,F(xiàn)有的深度神經(jīng)網(wǎng)絡(luò)技術(shù)僅是對生物神經(jīng)系統(tǒng)的初級模擬,功能大多局限于感知與理解層面,還難以在復雜時變、不確定性高的真實環(huán)境中應用。而未來的泛在智能機器人能夠適應各種復雜的環(huán)境,自主地去完成各類復雜任務(wù)。
目前業(yè)界普遍有一種觀點認為,深度學習的發(fā)展已處于瓶頸期,人工智能想要進一步取得突破,就需要從新的方向和領(lǐng)域中去入手。三元空間群體智能理論,就是復旦大學以甘中學、張立華等為代表的人工智能團隊認準的可以實現(xiàn)顛覆式變革的機器智能發(fā)展理論。在他們看來,未來世界不僅包含人類社會空間,也有基于互聯(lián)網(wǎng)絡(luò)形成的虛擬信息空間,此外還有物理空間。物理空間中就包含了未來的智能機器人與各類機智智能終端,面對這一三元空間,應如何根據(jù)新人類社會發(fā)展的新特點去發(fā)展人工智能的理論,正成為人工智能學者要攻克的難題之一。“我們希望人工智能最終能夠達到人類智能的水平?,F(xiàn)在的所謂智能機器人的智能水平遠遠沒法跟人去相比,三元群體智能是我們實現(xiàn)終極目標的可能途徑之一。”
“也許個體的智能水平不一定很高,但把人和智能機器人通過智聯(lián)網(wǎng)絡(luò)連接在一起后,機器可以從人這里學習新的智能,人也同樣可以從機器里學習到新的東西。這不是簡單的相互學習,當三種類型的智能體在一起不斷交互學習的時候,群體智能就會涌現(xiàn)和升級,產(chǎn)生遠遠超出他們本來的智能?!?/p>
現(xiàn)如今,“三元空間群智智能基礎(chǔ)理論與關(guān)鍵技術(shù)前瞻性研究”已被列入上海市人工智能科技重大專項先導項目。復旦大學科研團隊將針對物理空間、人類社會和信息空間,提出人類直覺+機器感知+加速網(wǎng)絡(luò)的三元空間群智智能新范式,通過揭示三元群智進化涌現(xiàn)科學規(guī)律,探索群智智能激勵機制與涌現(xiàn)機理。
張立華說,當“三元空間群體智能理論”的探索足夠成熟,就可以在社會生活的不同領(lǐng)域中實現(xiàn)產(chǎn)業(yè)化,如智能交通中的車路協(xié)同問題等。
此外,張立華課題組與清華大學腦與認知科學研究院合作,共同開展直覺智能研究,并提出了機器直覺這一新的交叉學科研究方向,致力于讓機器實現(xiàn)類似甚至超過人類的直覺能力,賦予機器以創(chuàng)造性的快速預測、判斷、決策、規(guī)劃能力,以期在真實復雜動態(tài)時變場景,如自然災害、公共衛(wèi)生等突發(fā)事件預判以及創(chuàng)造性科學研究等領(lǐng)域發(fā)揮重要作用。
可以預見, 隨著這些新的人工智能理論與方法研究的不斷深入, 人工智能將有望突破現(xiàn)階段理論及應用瓶頸, 朝著通用人工智能的目標更進一步。
人工智能在某些領(lǐng)域已經(jīng)展現(xiàn)出比人類更加強大的能力,在一些醫(yī)療診治過程中,利用醫(yī)療影像進行診療的時候,人工智能甚至會比許多有經(jīng)驗的醫(yī)生診斷的結(jié)果更準確。然而,當智能機器面對其他新的問題時,是否也可以很快地學習并掌握處理的技能?
答案是:當然可以。
如今,張立華和他的團隊,正在計算機視覺領(lǐng)域圍繞多模態(tài)智能感知方面在進行研究,為包括無人機、智能駕駛汽車在內(nèi)的智能機器提供多模態(tài)智能感知的技術(shù),讓它們學會去感知和理解周圍的環(huán)境,最終懂得做出最優(yōu)的判斷和決策。
智能感知的算法非常復雜,不僅要做到實時反應,還要盡量滿足各類真實場景低功耗的需求,這對智能芯片提出了更高的要求。在開發(fā)多模態(tài)智能感知技術(shù)的同時,張立華和團隊也在對嵌入式智能感知芯片進行探索。
張立華說,多模態(tài)的智能感知不僅僅要基于可見光視覺,也要結(jié)合激光雷達、毫米波雷達等傳感器技術(shù),把它們獲取的信息融合在一起,進一步提高智能感知芯片的精度和可靠性。
未來,智能芯片就相當于智能機器人的核心大腦,有強大算力,還有足夠的智能化水平。不僅要具備強大的感知能力,還要有足夠智能的控制決策能力,他把它稱為智能計算與控制芯片,這將是一款完全面向機器人和一些智能無人系統(tǒng)的全新的芯片?!皣鴥?nèi)的芯片技術(shù)還相對落后于美國等國家,我們正在努力探索,希望實現(xiàn)技術(shù)的突破和創(chuàng)新,開發(fā)出屬于中國自己的嵌入式智能芯片技術(shù)?!?/p>
行為識別研究是張立華和團隊正在攻克的另一領(lǐng)域。作為國家信息技術(shù)標準化技術(shù)委員會生物特征識別分委會行為識別工作組的組長,張立華說,行為識別技術(shù)有著更廣泛的應用領(lǐng)域。比如,在安防中,可以識別檢查對象是否可能做出危險的行為或動作。
在行為識別領(lǐng)域,步態(tài)識別是一個熱門的研究方向?!澳呐驴床灰娺@個人的臉,但如果能找到走路的一段視頻,通過分析他的步態(tài)特征,就可以大概率地識別出一個人的身份?!比缃?,張立華和團隊正在將行為識別應用于體育運動中,如在花樣滑冰或者速度滑冰運動中,運動員的動作、姿態(tài)是否標準,就可以通過行為識別技術(shù)甄別,從而進行智能化的訓練分析。
在人工智能領(lǐng)域,腦機交互技術(shù)被譽為一項改變未來的技術(shù),在“三元空間群體智能理論”研究中,腦機交互技術(shù)的突破將起到?jīng)Q定性的作用。“腦機接口就是通過解析人的腦電波信號,可以識別出人的意圖,包括在腦子里思考的語言。比如,我可能想了一段話,但我并沒有說出來,通過腦機交互卻可以將這些信息提取出來?!?/p>
課題組學術(shù)討論
張立華說,未來的腦機交互技術(shù)將真正顛覆現(xiàn)有的人機交互方式,人類和機器人可以通過腦機解碼實現(xiàn)思維的聯(lián)通與交互?!叭祟惡蜋C器人之間,不再需要鍵盤,通過腦機交互,人類的想法就可以自動傳輸給機器人?!?/p>
人工智能的全球競爭已經(jīng)拉開了帷幕。在中國,人工智能已經(jīng)有了良好的發(fā)展基礎(chǔ),但涉及芯片等核心部件,仍受制于人。
在張立華看來,復旦大學成立智能機器人研究院,就是希望打破這一局面。圍繞突破國際智能機器人領(lǐng)域的戰(zhàn)略性、基礎(chǔ)性、前沿性等相關(guān)重大科學問題,以智能計算、智能芯片、智能機器人及應用工程的交叉為突破點,以產(chǎn)業(yè)需求和包括機器人國家重點研發(fā)計劃等重大任務(wù)為牽引,研究智能機器人信息處理與控制、核心器部件、系統(tǒng)集成與應用等理論與技術(shù),并應用于智能醫(yī)療機器人、智能工業(yè)機器人、智能服務(wù)機器人的研發(fā)和產(chǎn)業(yè)化,最終致力于形成全自主知識產(chǎn)權(quán)的系列智能終端和以機器人為智能終端的新產(chǎn)業(yè)研發(fā)經(jīng)濟模式。
團隊成員之一的董志巖博士畢業(yè)于吉林大學,在研究生階段曾長期跟隨已故著名科學家黃大年進行無人機控制方面的研發(fā)工作。彼時,張立華也正在與黃大年團隊密切合作,負責研發(fā)一個以VR虛擬現(xiàn)實來輔助分析地質(zhì)空間結(jié)構(gòu)的技術(shù)。正因為這一交集,2018年,董志巖加入了張立華的團隊,并在其中負責智能感知與控制以及集群控制等方向的研究;負責腦機交互的團隊成員康曉洋博士畢業(yè)于上海交通大學,瑞士洛桑聯(lián)邦理工學院博士后的經(jīng)歷使他認為,神經(jīng)與腦機接口器件在智能機器人領(lǐng)域大有可為;陳遲曉博士則畢業(yè)于復旦大學,主要負責人工智能芯片研發(fā)的他認為,芯片的開發(fā)是中國的戰(zhàn)略需求,無數(shù)的中國智能科學家都在激發(fā)著自己的創(chuàng)新能力。
張立華說,依托國家的強大力量之上,他和團隊將著眼于未來世界的發(fā)展,將智能尖端技術(shù)在中國實現(xiàn)產(chǎn)業(yè)化。他們未來的規(guī)劃是,在全息群智與機器直覺基礎(chǔ)理論與一系列關(guān)鍵技術(shù)前瞻性研究的基礎(chǔ)上,致力于推動新一代人工智能和智能機器人的發(fā)展,同時希望能夠繼續(xù)在人工智能行為識別等領(lǐng)域繼續(xù)突破,在算法上有進一步的發(fā)展。
讓張立華期待的是,一旦真正能夠在人工智能理論與算法上有所突破,也就意味著中國的智能芯片也將實現(xiàn)功能與設(shè)計上的創(chuàng)新。
環(huán)境感知能力、自主控制決策能力、智能芯片技術(shù)……不止張立華的團隊,全球的智能機器人科學家,都在致力于提高機器人的智能水平。
《失控:機器、社會與經(jīng)濟的新生物學》一書中,講述了未來的世界將是一個生物與機器聯(lián)姻的時代。在全新的時代,我們?nèi)祟愒撊绾卫斫鈾C器?又如何認識我們自己?盡管智能機器人距離真正能夠?qū)崿F(xiàn)自主決策,仍有很大的距離,但人類對于未來是否會被機器替代或殺死的恐慌,在社會上也被廣泛討論。
人工智能學界和業(yè)界的普遍觀點認為,人工智能要想發(fā)展到能夠達到甚至超過人類智能的水平仍需要一個長期的過程?!霸谶€沒到這個階段前,很難去判斷人工智能會產(chǎn)生怎樣的影響,但現(xiàn)階段我們可以把人工智能用好?!睆埩⑷A說。他認為,人工智能是通過與環(huán)境的交互而不斷學習的,這其中也會包括人的道德觀念。人類在設(shè)計智能系統(tǒng)的架構(gòu)時,就可以讓智能機器人學會向善,讓其先天具有從善的傾向或是意圖。在張立華的世界中,人工智能的未來是充滿智慧與美好的,作為站在產(chǎn)業(yè)與科學前沿的學者,他要做的就是讓全人類盡快和他一樣,一起感受與創(chuàng)造這個美好的未來。