国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人工智能進入機器學習新階段

2020-09-06 13:21周志華
中國信息化周報 2020年32期
關(guān)鍵詞:機器人工智能階段

周志華

經(jīng)常有人問:“比人類更聰明的人工智能什么時候能夠出現(xiàn)?”這樣的問題非常難回答,因為談到人工智能,有兩種完全不同的觀點,其差別非常之大。

一種是“強人工智能”觀點,認為未來會研制出和人一樣聰明,甚至比人更聰明的機器;另一種是“弱人工智能”觀點,認為人更聰明,機器工作應向人類借鑒而變得“聰明”。目前在人工智能科學界,探索主要集中在“弱人工智能”。

人工智能做的事情就是借鑒我們所看到的智能行為,做出工具幫助我們做更強大的事情。應該說,人工智能研究的主要目的并不是“人造智能”,而是“intelligence-inspired computing”,智能啟發(fā)的計算。

人工智能發(fā)展的三個階段

人工智能作為一門學科誕生于1956年。彼時計算機的能力還很弱,但已經(jīng)有很多學者在思考“隨著計算能力的發(fā)展,計算機是不是可以做一些更復雜的事情?”同年夏天,在達特茅斯學院開了一個會議,后來被稱為人工智能之父的約翰·麥卡錫在這個會議上提出了“人工智能”這一概念。

經(jīng)過60余年的發(fā)展,從主流研究內(nèi)容來看,人工智能的發(fā)展經(jīng)歷三個階段:

第一個階段是20世紀50年代中期到60年代初,這個階段主要是將邏輯推理能力賦予計算機系統(tǒng)。圖靈獎得主西蒙和紐厄爾研制出來的“邏輯理論家”程序就是其中典型代表,可以說,當時的計算機所具有的推理能力已經(jīng)達到了人類的巔峰水平。

慢慢地,人們意識到,計算機僅有邏輯推理能力是不夠的,即便是數(shù)學家,為了證明數(shù)學定理除了要有邏輯推理能力,還要有數(shù)學知識。所以人工智能的研究很自然地進入了第二個階段,即“知識工程”時期。在這個階段,人們將知識總結(jié)出來,教給計算機系統(tǒng),由此產(chǎn)生出很多“專家系統(tǒng)”,實實在在地解決了很多應用問題。

隨著時間的推移,人們發(fā)現(xiàn)要把知識總結(jié)出來再教給系統(tǒng)非常困難。一方面,有時候我們雖然能夠解決一些問題,但是這個知識是什么可能說不清楚。另一方面,有些時候人們并不愿意去分享知識。為了解決這一問題,人工智能研究先驅(qū)們希望讓機器可以自動地學習知識。從20世紀90年代開始,人工智能的主流研究進入第三個階段(機器學習)且一直持續(xù)至今。

大數(shù)據(jù)時代的機器學習

機器學習的經(jīng)典定義是“利用經(jīng)驗改善系統(tǒng)自身的能力”。不論怎樣的經(jīng)驗,一旦放在計算機系統(tǒng)中,必然以數(shù)據(jù)形式存在。機器學習要研究怎么去利用經(jīng)驗,就必須對數(shù)據(jù)進行分析。因此,機器學習這一階段發(fā)展到今天,主要研究的是如何利用計算機對數(shù)據(jù)進行分析的理論和方法。

20世紀末,人類發(fā)現(xiàn)自己淹沒在一個數(shù)據(jù)的海洋里,我們需要對數(shù)據(jù)進行分析,而機器學習恰恰在這個時候走上歷史的舞臺,給人類提供了一個機會。因此,我們對機器學習快速發(fā)展的需求高漲。

今天被定義為“大數(shù)據(jù)時代”,但僅有大數(shù)據(jù)并不意味著獲得了價值。大數(shù)據(jù)是一座礦山,我們擁有了礦山,但如果想要得到礦山的價值,必須有強大的數(shù)據(jù)分析技術(shù),而這個數(shù)據(jù)分析技術(shù)就是要機器學習。在大數(shù)據(jù)時代,想要讓數(shù)據(jù)發(fā)揮作用,離不開機器學習技術(shù)。

機器學習在今天可以說是無處不在,無論是互聯(lián)網(wǎng)搜索還是人臉識別、汽車自動駕駛、火星機器人,甚至包括美國總統(tǒng)大選、軍隊的戰(zhàn)場數(shù)據(jù)情況分析,任何地方只要有數(shù)據(jù)存在,只要人們希望用計算機來幫助進行數(shù)據(jù)的分析,就可能使用機器學習技術(shù)。我們說人工智能現(xiàn)在很“熱”,恰恰是因為機器學習,特別是深度學習技術(shù)在過去的十年里取得了巨大的發(fā)展,在大數(shù)據(jù)時代發(fā)揮了巨大的作用。如今,很多企業(yè)的解決方案是基于深度學習技術(shù)來實現(xiàn)的。

機器學習的技術(shù)局限與下一步發(fā)展

在談到機器學習的時候,有些人想到的是算法,有些人想到的是數(shù)據(jù)??梢哉f,今天的機器學習是以“算法加數(shù)據(jù)”的形態(tài)存在的。在這種形態(tài)下,技術(shù)存在一定的局限性。

數(shù)據(jù)需求大

首先,我們需要大量的訓練樣本。在一些應用里,我們的樣本總量很少,比如在做油田定位時,數(shù)據(jù)必須通過人工誘發(fā)地震才能獲得,數(shù)據(jù)的獲得成本是非常高,不可能有大量的數(shù)據(jù);其次,數(shù)據(jù)可能很多,但滿足精準需求的很少。比如銀行在做欺詐檢測時,每天一個銀行的信用卡交易數(shù)據(jù)可能有幾百萬甚至上千萬條,但其中信用卡欺詐的數(shù)據(jù)可能很少;另外,數(shù)據(jù)的總量很多,但是已經(jīng)被標注了結(jié)果的很少。比如做軟件的缺陷檢測,我們擁有大量的程序代碼,但程序代碼中缺陷被標記出來的非常少。

環(huán)境適應弱

一個已經(jīng)訓練好的機器學習模型,如果環(huán)境發(fā)生變化,就很有可能失效。比如在一個傳感器世界里,放出一百個傳感器。一個月之后有60個傳感器失效了,這時候重新部署60個傳感器,原有模型的性能會大幅度衰減。因為新的傳感器所發(fā)出的信號質(zhì)量和強度和原來的也會有很大的變化,原有模型已經(jīng)很難適應。

可解釋性差

今天的機器學習系統(tǒng)絕大多數(shù)都是黑箱,我們可以利用機器學習非常精確的預測,但是很難解釋是如何做出這樣的預測的。這就會導致機器學習系統(tǒng)在一些高風險應用里很難使用。比如做地震預報,我們預報明天有地震,請群眾撤離。領(lǐng)導肯定會問是如何做出這樣的決策,這時候如果機器學習模型是黑箱,我們將無法說明做出預報的理由,這樣的預報很難被采納。

性能差異大

我們在使用機器學習技術(shù)時,即使對同樣的數(shù)據(jù),普通用戶所能得到的結(jié)果和專家所能得到的結(jié)果差別可能非常大。怎樣處理數(shù)據(jù)、如何使用機器學習模型,每個人的知識和經(jīng)驗差別會導致獲得結(jié)果的巨大差異。

數(shù)據(jù)分享難

以現(xiàn)有的醫(yī)院情況舉例。如今各地都在發(fā)力智慧醫(yī)療,大型醫(yī)院里很多病例數(shù)據(jù),基于這些病例數(shù)據(jù)能夠做出非常優(yōu)秀的診斷系統(tǒng)。相比之下,社區(qū)醫(yī)院的病例數(shù)據(jù)較少,基于已有數(shù)據(jù)很難做出好的模型,需要大型醫(yī)院的數(shù)據(jù)支撐。但是大型醫(yī)院一旦與社區(qū)醫(yī)院分享病例數(shù)據(jù),會涉及到數(shù)據(jù)隱私、數(shù)據(jù)所有權(quán)、數(shù)據(jù)保護等問題,對接起來非常不舒暢,存在一個數(shù)據(jù)分享的“墻”。

學 件

關(guān)于機器學習,還有很多其他問題。幾乎每個研究方向都有人在做相關(guān)的探索。但如果將所有問題逐一獨立解決,很難擺脫“頭疼醫(yī)頭、腳疼醫(yī)腳”的狀態(tài)。應該考慮在一個整體性的框架之下全面地去思考并解決這些問題。最近研究者提出了一個想法,叫做“學件”(Learnware)。目的是讓那些在某一領(lǐng)域的機器學習應用中已經(jīng)建立好的模型被分享出來,建立一個“市場”讓人們能夠分享這些模型。這樣,當一個新用戶想要做機器學習應用時,就不用從頭去建模型,而是可以先到學件市場上在已有模型中尋找合適的模型作為基礎(chǔ)。

為了達到這一目的,學件應由兩部分組成。一部分是模型(Model),另一部分是用于描述這個模型的規(guī)約(Specification)。模型需要滿足三個重要要求:可重用性、可演進性、可了解性;規(guī)約要能夠給模型提供足夠的描述。如果學件市場可以成為現(xiàn)實,我們將解決機器學習的局限性問題。

猜你喜歡
機器人工智能階段
機器狗
關(guān)于基礎(chǔ)教育階段實驗教學的幾點看法
機器狗
在學前教育階段,提前搶跑,只能跑得快一時,卻跑不快一生。
2019:人工智能
人工智能與就業(yè)
未來機器城
數(shù)讀人工智能
下一幕,人工智能!
大熱的O2O三個階段,你在哪?