程唯珈
“人工智能的基石是數(shù)學(xué),沒有數(shù)學(xué)基礎(chǔ)科學(xué)的支持,人工智能很難行穩(wěn)致遠?!苯?,由聯(lián)合國教科文組織和中國工程院聯(lián)合主辦的聯(lián)合國教科文組織國際工程科技知識中心2019國際高端研討會上,中國科學(xué)院院士、西安交通大學(xué)教授徐宗本在題為《AI與數(shù)學(xué):融通共進》的主題報告上如是說。在他看來,目前人工智能所面臨的一些基礎(chǔ)問題,其本質(zhì)是來自數(shù)學(xué)的挑戰(zhàn)。
數(shù)學(xué)家眼里的人工智能是什么?徐宗本給出的答案簡潔明了:當(dāng)下主要指機器學(xué)習(xí)。如果給這個名詞賦予一個說明,他認為這是人或者智能體,通過與環(huán)境的交互來提升自身行為和解決問題能力的智能化操作?!皺C器學(xué)習(xí)是把這種智能形式化為數(shù)學(xué)公式,轉(zhuǎn)換成計算機可以操作的算法和軟件。”他說。進一步說,人工智能實際上是一個將數(shù)學(xué)、算法理論和工程實踐緊密結(jié)合的領(lǐng)域。將其剖開來看,就是算法,也就是數(shù)學(xué)、概率論、統(tǒng)計學(xué)、各種數(shù)學(xué)理論的體現(xiàn)。
不過徐宗本認為,作為人工智能基石的數(shù)學(xué),還存在五大核心問題待解,而這也是制約人工智能進一步發(fā)展的“絆腳石”。
第一是大數(shù)據(jù)的統(tǒng)計學(xué)基礎(chǔ)。徐宗本認為,人工智能和大數(shù)據(jù)是一對“孿生姐妹”。人工智能更多指應(yīng)用模式,強調(diào)與領(lǐng)域知識的結(jié)合。大數(shù)據(jù)則是最底層的信息技術(shù),強調(diào)機器和機器、機器與人之間的內(nèi)容交互與理解。但是當(dāng)前,分析大數(shù)據(jù)的統(tǒng)計學(xué)基礎(chǔ)面臨顛覆,應(yīng)用于復(fù)雜大數(shù)據(jù)分析的極限理論、統(tǒng)計推斷方法、真?zhèn)闻卸ǖ葦?shù)學(xué)基礎(chǔ)尚未完全建立起來。
第二是大數(shù)據(jù)計算基礎(chǔ)算法。一般而言,理解和分析大數(shù)據(jù)都是通過數(shù)據(jù)處理或數(shù)據(jù)分析來實現(xiàn)的,而無論是數(shù)據(jù)處理還是數(shù)據(jù)分析,最終都歸于求解一系列基本的數(shù)學(xué)問題,如線性方程組求解、圖計算、最優(yōu)化計算、高維積分等。不過,這些看似早已解決的問題在大數(shù)據(jù)情形下卻成了“攔路虎”。他以旅游為例,打了一個生動的比方來解釋這種挑戰(zhàn)?!氨热鐝奈靼驳奖本趺醋咦罱??過去地圖分辨率不高,根據(jù)普通的地圖可以獲取基本的路線。但現(xiàn)在大數(shù)據(jù)背景下,地圖的分辨率越來越高,不可能一次就涵蓋西安至北京之間全部城市與道路的數(shù)據(jù),只能一次一次地提供其中某些城市間的道路信息。到達北京需要多少時間,怎樣走最近?要帶多少錢?現(xiàn)在的機器還回答不了這些問題。這是由于在分布式圖信息環(huán)境下,圖計算的基礎(chǔ)算法問題還沒有解決?!毙熳诒菊f。
第三是深度學(xué)習(xí)的數(shù)學(xué)理論。徐宗本認為,這個問題在當(dāng)下尤為關(guān)鍵。新一輪的人工智能多以深度學(xué)習(xí)為基本模型,然而深度學(xué)習(xí)的設(shè)計基礎(chǔ)在哪里,什么樣的結(jié)構(gòu)決定了什么樣的性能,能不能有臺勞公式和富里埃級數(shù)這樣的數(shù)學(xué)表示理論,這些基本的理論問題還沒有解決。正是由于這個原因,現(xiàn)在的人工智能還得靠“人工”來換“智能”,這也是造成當(dāng)下“人工智能=人工+智能”的原因。
徐宗本院士在作主題報告? 資料圖
第四是非常規(guī)約束下的最優(yōu)輸運。人工智能的很多問題都可歸納為兩個領(lǐng)域數(shù)據(jù)打通問題,即讓兩個對象在滿足某一個特定的不變量情況下互相轉(zhuǎn)移?!氨热缰杏⑽幕プg,就是在保持語義的情況下將中文數(shù)據(jù)轉(zhuǎn)換成英文數(shù)據(jù)。”應(yīng)用到現(xiàn)實,徐宗本暢想,將醫(yī)院的CT和核磁共振圖像相互轉(zhuǎn)移或能很好地解決醫(yī)療診斷的信息不足問題?!耙驗檎盏氖峭粋€人,這里人就是不變量。要解決這些問題,建立特定約束下實現(xiàn)最優(yōu)傳輸?shù)臄?shù)學(xué)理論與方法是基本的。”
第五是關(guān)于學(xué)習(xí)方法論的建模與函數(shù)空間上的學(xué)習(xí)理論。徐宗本表示,研究生階段學(xué)到的機器學(xué)習(xí)理論,需上升到方法論學(xué)習(xí)的階段。
“從數(shù)學(xué)上說,無論函數(shù)空間上的學(xué)習(xí)理論怎么建立,本質(zhì)是要適應(yīng)不同的任務(wù)。由于任務(wù)本身是函數(shù),是無窮的,那么就需要把過去機器學(xué)習(xí)中對樣本、數(shù)據(jù)的選擇、泛化,推廣到對任務(wù)的選擇、泛化中?!?/p>
如果辯證地看待數(shù)學(xué)和人工智能的關(guān)系,相輔相成可能是其最好的詮釋。徐宗本表示,不僅數(shù)學(xué)可為人工智能提供基礎(chǔ),人工智能也為數(shù)學(xué)研究提供新的方法論。
“比如解偏微分方程,過去人們可能會使用計算機,現(xiàn)在用人工智能可以做得更好?!彼J為,讓數(shù)學(xué)中的模型方法與人工智能的數(shù)據(jù)方法結(jié)合,可將機器的深度學(xué)習(xí)應(yīng)用得更加精確。
面對如今發(fā)展得如火如荼的人工智能產(chǎn)業(yè),徐宗本也道出了自己對從業(yè)者的希冀。
“人工智能想要做得好,要靠數(shù)學(xué)問題尤其是算法的解決?!毙熳诒驹俅螐娬{(diào),從業(yè)者應(yīng)潛心從基礎(chǔ)研究抓起,使我國的應(yīng)用場景優(yōu)勢真正轉(zhuǎn)化為技術(shù)優(yōu)勢和產(chǎn)業(yè)優(yōu)勢。