羅保林 林海
按照進化論的觀點,人是地球上的生物在自然選擇、進化過程中形成的,歷經猿人、能人、直立人、早期智人、晚期智人等階段。而今,從赤道到兩極,地球上凡有陸地的地方大多都有人類活動。隨著時間的推移,人類開始意識到自身發(fā)展的局限,有一天竟然異想天開地要去創(chuàng)造智能。終于,人工智能躍然而出!
1956年,在達特茅斯學院召開的一個夏季討論班上,以約翰·麥卡錫等為首的一批富有遠見卓識的年輕科學家在一起聚會,共同研究和探討用機器模擬智能的一系列有關問題,并首次提出了“人工智能”這一術語,標志著人工智能這門新興學科的正式誕生。從此,人工智能一直以遠超人類想象的速度發(fā)展著,它們開始逐漸進入人類生活的方方面面。
人工智能——關于知識的科學
簡單來說,人工智能是關于知識的科學,我們將通過兩個方面的問題對此探討。首先,知識是怎樣被表達的?在人類的頭腦里,知識是怎樣的一種存在?通過什么樣的表達方式能夠讓機器擁有知識?其次,知識是怎樣被獲取的?我們人類通過什么方法獲取知識?什么樣的操作方法才能夠讓機器從浩如煙海的大量信息中自動獲取知識?
在計算機的編程語言里,把概念稱為“類”,而某個概念所代表的一個個具體的事物,則被稱為這個類的“實例”。一個概念,有許多屬性。概念的屬性里有一種特別重要的屬性,叫作關系。一個概念,有它的內涵和外延。內涵就是指這個概念代表的事物所共同具有的本質屬性的總和。概念的內涵和外延,不一定能夠確切地被描述,在許多情況下,它們都是模糊的。比如,關于大小、輕重、冷熱、快慢等概念的內涵和外延,就都是模糊的。
怎樣表達知識,可以歸結為怎樣表達概念。表達概念的方法有許多種,如古典的產生式表示法和嗣后發(fā)展的框架表示法、狀態(tài)空間表示法,以及現(xiàn)代的知識圖譜表示法。
知識的表達,就好像樹上的蘋果,已經掛在枝頭了。而知識的獲取,就好像我們從樹上摘取蘋果,再將它們存放在小籃子里。所謂知識的獲取就是我們從結構化的知識中,獲取我們所需要的知識,生成新的知識。
知識獲取的一個基本方法是利用搜索技術。我們的搜索是盲目的。而在搜索的過程中,我們不斷地深入,直到碰到死胡同才返回。這樣的搜索方法就是盲目的深度優(yōu)先的搜索方法。
盲目搜索方法的效率是比較低的。于是我們想到是否可以一邊搜索,一邊對搜索方向的好壞進行評估。使用系統(tǒng)相關的信息對搜索過程的好壞隨時進行評估,這樣的搜索方法叫作啟發(fā)性的搜索方法。從最簡單的跳棋到國際象棋、中國象棋,直至最復雜的中國圍棋,機器都成功地戰(zhàn)勝了人類最頂尖的棋手。這里,機器所使用的就是啟發(fā)性的搜索方法。谷歌的阿爾法圍棋將深度學習的方法引入到蒙特卡洛方法中,設計了一個策略網絡用來評估可能的落子點,還設計了一個估值網絡來對棋局的勝負可能進行評估,這樣就可以在極短的時間內,十分高效地對非常復雜的棋局進行計算,找到最可能獲勝的博弈方法。
知識獲取的另一個主要方法是群智能算法,這是受到生物界成功生存的策略啟發(fā)而產生的一種算法。目前,得到廣泛應用的群智能算法有遺傳算法、粒子群優(yōu)化算法和蟻群算法。
上述的這些人工智能獲取知識的技術主要都是由人工編程,然后通過機器的計算獲取新知識。而我們更感興趣的是如何讓機器自主地學習知識,以及如何模擬人類的神經網絡來獲取知識。
機器學習使人工智能的發(fā)展上了一個新的臺階。以往,知識的獲取都是經人工編程之后,機器按照人工設定的步驟和方法來獲取知識,而機器學習則是在給機器提供一個學習模型之后,機器能夠對現(xiàn)有的數(shù)據和知識自主地進行分析和抽象,建立起知識的新模型,估計模型的參數(shù),從數(shù)據和原有的知識里挖掘出對人類更有價值的知識。其結果是能夠利用原有的知識和經驗使得機器系統(tǒng)得到自我改善,變得更加“聰明”。建立在大量數(shù)據基礎上的統(tǒng)計學和計算機科學的融合,給機器學習提供了強大的動力。與此同時,深度學習也給機器學習帶來了全新的面貌。目前,機器學習包括有監(jiān)督的機器學習、無監(jiān)督的機器學習和弱監(jiān)督的機器學習。
隨著神經科學和腦科學的發(fā)展,人們對于人類的智能機制有了一定的了解,由此在結構上讓機器對人腦進行模擬,這就是人工神經網絡和深度學習。
人類大腦里面的神經元的數(shù)量極其龐大。每個神經元都和周圍的神經元相互連接,形成了大腦極其復雜的結構,支撐著人類的智能。
神經元的結構比較簡單,而由神經元所組成的神經網絡,其結構卻極其復雜。神經網絡可以看作是分層的,由許多層的神經元所組成。處在某一層的神經元,從前一層的神經元那里得到輸入信號,再經過自己的加工和處理之后,輸出到下一層的神經元。如果神經信號是一層一層地向后傳遞的,那么就把這個神經網絡叫作前饋型的神經網絡。而如果把某一層輸出的神經信號引回到前面某一層的輸入端,那么就把這種神經網絡叫作反饋型的神經網絡。
模擬前饋型神經網絡的算法叫作BP神經網絡算法。BP神經網絡算法是一個多層結構的算法,每一層都有眾多的神經元。除了第一層輸入層和最后一層輸出層之外,BP神經網絡中間的各層叫作隱藏層。
BP神經網絡算法的隱藏層不能太多,以免影響了它的性能和應用。為此,我們需要對其進行改進,增加隱藏層的層數(shù),也就是深度,這樣的神經網絡被稱為深度神經網絡。卷積神經網絡就是一種深度神經網絡。卷積神經網絡在圖像處理的各個領域,特別是人臉識別上,取得了巨大的成功。
還有一種道理并不深奧而功能強大的深度神經網絡,叫作生成對抗網絡。生成對抗網絡經過訓練后,能夠根據文本來生產所需要的圖像,也能夠根據要求生成各種文本,如新聞報道、學術報告、詩歌、歌詞等。
從信息系統(tǒng)、專家系統(tǒng)到人工智能
1955年,美國數(shù)學家約翰·麥卡錫聯(lián)合克勞德·香農(信息論創(chuàng)立者)、馬文·明斯基(人工智能大師,《心智社會》的作者)、納撒尼爾·羅徹斯特(IBM計算機的設計者之一)發(fā)起了達特茅斯項目。第二年夏天,他們接著舉辦了“人工智能夏季研討會”,正式啟動達特茅斯項目,首次提出了“人工智能”這一概念,正式確立了一個對人類行為、意識和思維過程進行模擬的新科技領域,并將數(shù)學邏輯應用到了人工智能的早期形成中。
人工智能領域必不可少的基礎工具是電子計算機。電子計算機是1941年在美國和德國同時出現(xiàn)的。計算機以信息為工作對象,具有對信息進行存儲和處理的功能。原始的計算機體積極其龐大,而且如果想要改變處理信息的程序,就要更改復雜的電子線路。后來,程序也可以像數(shù)據一樣被記錄在存儲器里了,隨著電子器件的進步,計算機的體積逐漸縮小了。
美國的應用數(shù)學家諾伯特·維納不但創(chuàng)立了信息論,而且建立了系統(tǒng)的反饋理論。在20世紀50年代初,人們在反饋理論的基礎上建立了各種自動控制系統(tǒng),用于控制環(huán)境溫度、控制水位、控制速度和位置等。自動控制系統(tǒng)是人工智能邁出的第一步,它使得機器看起來好像會思考了。
1955年末,艾倫·紐威爾和赫伯特·西蒙編寫了一個名為“邏輯理論家”的程序。該程序能夠在解決問題的各個路徑中選擇最具潛力的路徑,被認為具有一定的智能,是人工智能發(fā)展過程中的一個里程碑。1956年,在麥卡錫等提出了“人工智能”這一概念之后,一些大學紛紛設立了人工智能研究中心,尋求更有效的算法,包括進一步優(yōu)化“邏輯理論家”程序和建立具有自學習功能的系統(tǒng)。1957年,“邏輯理論家”的開發(fā)團隊推出了新程序——“通用解題機”。這個新程序擴展了維納的反饋理論,可以解決很多常識問題。兩年后,IBM開發(fā)了一個用于證明幾何定理的程序。1958年,麥卡錫宣布開發(fā)了LISP語言。該語言很快就為大多數(shù)人工智能開發(fā)者所采用。1963年,麻省理工學院得到美國政府的資助,研究開發(fā)了機器輔助識別系統(tǒng),加快了人工智能發(fā)展的步伐。
隨著計算機體積的縮小、能耗的下降、計算速度的提高和存儲容量的拓展,計算機處理信息的能力在不斷地增強。20世紀70年代,在一般的信息系統(tǒng)基礎上出現(xiàn)了專家系統(tǒng)。專家系統(tǒng)可以從大量的數(shù)據中找出某些規(guī)律,解決不確定解的問題,預測在一定條件下某種解的概率。專家系統(tǒng)的市場應用很廣。1978年,我國就推出了“關幼波肝病診斷與治療專家系統(tǒng)”,根據專家的經驗,幫助醫(yī)生診斷疾病。此外,還出現(xiàn)了幫助尋找礦藏的專家系統(tǒng),用于股市預測的專家系統(tǒng),等等。
20世紀70年代人工智能領域風起云涌,出現(xiàn)了許多新理論和新方法。例如,在機器視覺方面,根據圖像的陰影、形狀、顏色、邊界和紋理等基本信息,計算機經過分析和推斷,可以辨別出該圖像可能是什么物體。1972年開發(fā)出的PROLOG語言在人工智能研發(fā)中得到了廣泛的應用。
20世紀80年代,人工智能的發(fā)展提速,更多地進入了商業(yè)領域。專家系統(tǒng)的需求迅速攀升,出現(xiàn)了為大型計算機編程的專家系統(tǒng),以及為專家系統(tǒng)查找和改正錯誤的專家系統(tǒng)。許多制造業(yè)的實體公司依賴專家系統(tǒng)而運行,資本和人才紛紛涌向人工智能相關的研發(fā)機構和企業(yè)。當時,有許多人工智能研究的成果進入了市場,尤其是機器視覺更是取得了較大進展。在生產線上安裝的機器視覺系統(tǒng),能夠分辨物體形狀的不同。但是在80年代的后期,人工智能產業(yè)也出現(xiàn)了泡沫。通常,由一項新技術所形成的產業(yè)典型的發(fā)展曲線是Z字形的,而人工智能產業(yè)的發(fā)展則呈現(xiàn)出相連的雙Z字形。開始時有一個緩慢的啟動,積累到一定程度即出現(xiàn)第一個高潮。這時候,由于過度炒作,資本大量涌入,興起了很多公司。但是社會需求的不足引發(fā)了經濟泡沫,造成了產業(yè)的滑坡,一些公司紛紛破產,發(fā)展陷入低谷。然后,經過洗牌和清理,能夠堅持下來的公司獲得了轉機,事業(yè)慢慢地有了起色,之后才迎來高速的發(fā)展。在這次泡沫破裂中,美國國防部高級研究計劃署支持的所謂“智能卡車”項目,也由于項目缺陷和成功無望被停止提供項目的經費。
然而,盡管經歷了種種挫折,人工智能仍在慢慢地恢復發(fā)展,新的技術不斷被開發(fā)出來。在美國首創(chuàng)的模糊邏輯,可以從不確定的條件中作出抉擇;還有神經網絡,被視為實現(xiàn)人工智能的可能途徑?;谀:壿?,人工智能技術簡化了攝像設備。人工智能技術還被用于導彈系統(tǒng)和預警顯示和其他先進武器,這些智能設備在戰(zhàn)爭中經受住了考驗。語音和文字識別等人工智能技術也大量地出現(xiàn)在了普通民眾的生活中,并持續(xù)、不可避免地改變著我們的生活。
人工智能產業(yè)三大支柱——大數(shù)據、算法和智能芯片
當前,人工智能之所以進入了蓬勃發(fā)展的時期,是因為它具備了發(fā)展的三個必要條件,或者稱為三大支柱,即大數(shù)據、算法和智能芯片。
由于互聯(lián)網的發(fā)展和普及,我們目前已經積累了大量的數(shù)據,而且每天還有新數(shù)據產生。這些數(shù)據涉及各行各業(yè),完全不是過去一般意義上的統(tǒng)計數(shù)據可以相提并論的。大數(shù)據是非結構化的數(shù)據,不是按照一定的規(guī)則和意圖從自然和社會中摘取的片面數(shù)據,能更加生動、全面地反映自然和社會生活的種種關系。通過數(shù)據挖掘,我們可以從浩瀚的信息中獲得有用的知識。
在交通領域,我們可以通過大數(shù)據記錄每個交通參與者的行蹤。人們每天在什么時間,乘坐何種交通工具,經過怎樣的路線,從哪里去哪里,都一清二楚。人工智能借此找到規(guī)律,以規(guī)劃和管理城市的交通。在醫(yī)療領域,大數(shù)據中記錄著就醫(yī)者的各項生理和病理指標,診斷和治療的過程,以及所用的藥物和醫(yī)療措施。通過大數(shù)據,醫(yī)生可以為患者找到最佳的診療方案,避免過度治療和治療不足。人工智能還可以支持最佳抉擇,避免醫(yī)療事故,評估藥物的不良反應。大數(shù)據使得醫(yī)療過程更加透明,能夠促進社會公平,讓患者獲得更好的服務。
人工智能發(fā)展的另一個支柱是算法。所謂算法,就是通過對數(shù)據的處理,引導出一個有用的結論。以往傳統(tǒng)的算法,主要是基于數(shù)理邏輯的一種演繹性推理,智能性是很有限的??陀^世界是極其復雜的,各種事物存在著或明或暗的聯(lián)系,因而人們所面對的數(shù)據,也具有一定的模糊性和不確定性。人類的思維,有邏輯性的一面,也有非邏輯性的一面。例如,思維中的聯(lián)想、比擬、歸納,以至于直覺和靈感,就不是數(shù)理邏輯能夠解決的。在人工智能的發(fā)展史上,定理的機器證明帶來了第一次高潮,專家系統(tǒng)的模糊抉擇帶來了第二次高潮,現(xiàn)在,一次新的發(fā)展高潮是由神經網絡算法和深度學習所帶來的。
大數(shù)據的處理和神經網絡深度學習的算法都需要智能芯片的支持。中國科學院計算技術研究所于2017年發(fā)布了全球新一代人工智能芯片——“寒武紀”系列,其中有3款面向智能手機等終端的“寒武紀”處理器,2款面向服務器等云端的“寒武紀”高性能智能處理器,以及1款專門為開發(fā)者打造的人工智能軟件平臺?!昂浼o1A”處理器已經被華為應用到麒麟芯片中。(節(jié)選自《與人共舞——人工智能成就夢幻世界》)
作者簡介:
羅保林,畢業(yè)于清華大學,在中國科學院獲工學博士學位,中科院過程工程研究所研究員、博士生導師、中國科普作家協(xié)會會員。
林海,1963年就讀于清華大學無線電系,畢業(yè)后在電視、雷達、計算機、自動控制等領域從事研究工作,曾任計算機與自動化專業(yè)教授。1987年因雷達信息處理獲國家技術發(fā)明二等獎。退休后從事文學創(chuàng)作和科普寫作,現(xiàn)為中國科普作家協(xié)會會員。
內容簡介:
隨著計算技術的飛速發(fā)展,人工智能似乎在頃刻之間就悄悄地來到我們身邊,一時間我們的周圍到處舞動著人工智能,令人眼花繚亂。從手機到3D打印,從谷歌眼鏡到全息投影,就連美圖App一鍵整容都要依靠人工智能。而且,人工智能的快速發(fā)展超乎人類的想象,一時間,人機交互、無人駕駛、虛擬現(xiàn)實等智能設備扎堆出現(xiàn),智能機器人頻頻亮相。