岳未央
人工智能(AI)機(jī)器學(xué)習(xí)是誕生于20世紀(jì)中葉的一門年輕的學(xué)科,它對人類的生產(chǎn)、生活方式產(chǎn)生了重大的影響,也引發(fā)了激烈的哲學(xué)爭論。佛羅里達(dá)國際大學(xué)計算與信息科學(xué)學(xué)院助理教授馬克·弗雷森(Mark Finlayson)認(rèn)為,AI帶來的真正危險不在于艾隆·馬斯克(Elon Musk)和斯蒂芬·霍金(Stephen Hawking)(他對AI完全不懂)所述的機(jī)器人會胡作非為。真正的危險在于:AI會如何影響我們對待自己的方式,這就像核武器的威懾力那樣。并且這一可能性與我們的距離遠(yuǎn)比我們自己設(shè)想的要近,它幾乎就是已經(jīng)在發(fā)生的事實(shí):Uber聲稱要給我們提供許多無人駕駛汽車。如果這件事真的發(fā)生了,想象一下相關(guān)行業(yè)的利潤不是與全世界競爭共享,而是流入一個單獨(dú)的公司中或者一個人的口袋中時,世界會發(fā)生怎樣的劇變?
有一個說法,說科技的進(jìn)步是遠(yuǎn)遠(yuǎn)超過人類本身的進(jìn)化,之所以科技和信息技術(shù)有如此飛速的成長,主要的一個原因就是所謂的摩爾定律,摩爾定律就是我們的計算能力每過18個月就翻一次倍,在過去一直按照摩爾定律進(jìn)行。
今后的發(fā)展如果按常規(guī)的技術(shù)用摩爾定律進(jìn)行推進(jìn)的話,會碰到一個瓶頸。為何會出現(xiàn)這種情況呢?本質(zhì)上的原因是在于如果把一臺電腦放在自己的大腿上,時間長了我們會覺得很燙。這是因為在計算過程中電子的能耗非常大,而假設(shè)每個三極管所產(chǎn)生出來的熱量都是差不多,經(jīng)過18個月翻一次倍速的運(yùn)行增長,機(jī)器本身的發(fā)熱量也將相應(yīng)翻一次倍。這就意味著目前的這臺機(jī)器已經(jīng)無法滿足日常的“超負(fù)荷”運(yùn)行需求,我們需要更高的技術(shù)和更好的材料來承載更高速能帶來的更大負(fù)荷。
但是對于科學(xué)家來說這是一個非常好的機(jī)會,能不能尋找一個新型創(chuàng)新摩爾定律能夠繼續(xù)往前進(jìn)非常關(guān)鍵。摩爾定律會碰到這樣的問題:在趕集的集市,想象你是一輛跑車,它在趕集的時候始終在碰撞,如果不能散發(fā)熱量就會受到阻礙。如果想到這個原理大家就可以想到我們?yōu)槭裁床粸殡娮釉谛酒膶哟巫鲆粋€高速公路,這就是科學(xué)研究的發(fā)明,電子在芯片層次有一個車道的概念,能夠各行其道互不干擾。在右邊我們可以使用尾燈,這個車往前走,在左邊的話我們是往前開,如果能把高速公路的運(yùn)動模式實(shí)現(xiàn)在電子芯片層次的運(yùn)動模式,我們真正意義上有一個新的工作原理,使得摩爾定律能夠往前推進(jìn)。
之所以人工智能在最近一段時間能夠有突飛猛進(jìn)的成長,主要是幾個原因:一個受到摩爾定律的影響,由于計算能力每過18個月就翻一次倍,用的芯片就能夠做非常快速的信息處理,單位元能夠做的機(jī)器處理比人的大腦神經(jīng)元都來得多。如果能把機(jī)器芯片模仿人的大腦神經(jīng)元,就能形成一個網(wǎng)狀的神經(jīng)機(jī)構(gòu),大數(shù)據(jù)的時代使得及其能夠快速學(xué)習(xí)。人工智能現(xiàn)在還只是停留在仿生學(xué)的一個階段,可以做一個類比,比如人類曾經(jīng)非常向往飛翔,我們之所以向往飛翔就是看到鳥會飛,看到鳥會飛,我們就想自己能不能也長一個翅膀飛。比如偉大的藝術(shù)家達(dá) . 芬奇曾經(jīng)設(shè)計過人身上輔助一個翅膀能飛起來,所以這是一個簡單的仿生學(xué)。但我們?nèi)祟愓嬲軌驅(qū)W會飛行是由于我們理解了飛行的原理——空氣動力學(xué),一旦我們理解了飛行的原理就可以造大飛機(jī),大飛機(jī)看起來和鳥不完全一樣,但卻是從鳥那邊來的啟發(fā)。所以這對于人工智能來講也是最大的挑戰(zhàn),現(xiàn)在的人工智能還僅僅停留在用神經(jīng)元仿生的原理,而我們真正需要的則是一個能夠發(fā)展人工智能的理論基礎(chǔ)。
人工智能是怎樣發(fā)展起來的
回顧整個人工智能發(fā)展史,不得不去引發(fā)高度關(guān)注的是“機(jī)器學(xué)習(xí)”這樣一個重要的鋪墊式技術(shù)發(fā)展進(jìn)程:
奠基時期
20世紀(jì)50年代初到60年代中葉
Hebb于1949年基于神經(jīng)心理學(xué)的學(xué)習(xí)機(jī)制開啟機(jī)器學(xué)習(xí)的第一步。此后被稱為Hebb學(xué)習(xí)規(guī)則。Hebb學(xué)習(xí)規(guī)則是一個無監(jiān)督學(xué)習(xí)規(guī)則,這種學(xué)習(xí)的結(jié)果是使網(wǎng)絡(luò)能夠提取訓(xùn)練集的統(tǒng)計特性,從而把輸入信息按照它們的相似性程度劃分為若干類。這一點(diǎn)與人類觀察和認(rèn)識世界的過程非常吻合,人類觀察和認(rèn)識世界在相當(dāng)程度上就是在根據(jù)事物的統(tǒng)計特征進(jìn)行分類。而這個研究成果也就正式揭開“機(jī)器學(xué)習(xí)”也就是“人工智能”技術(shù)的第一篇章。
從60年代中到70年代末,機(jī)器學(xué)習(xí)的發(fā)展步伐幾乎處于停滯狀態(tài)。雖然這個時期基于邏輯的機(jī)器歸納學(xué)習(xí)系統(tǒng)取得較大的進(jìn)展,但未能投入實(shí)際應(yīng)用。這個時期的研究目標(biāo)是模擬人類的概念學(xué)習(xí)過程,并采用邏輯結(jié)構(gòu)或圖結(jié)構(gòu)作為認(rèn)知基礎(chǔ)。機(jī)器能夠采用符號來描述概念,并提出關(guān)于學(xué)習(xí)概念的各種假設(shè)。
事實(shí)上,這個時期整個AI領(lǐng)域都遭遇了瓶頸。當(dāng)時的計算機(jī)有限的內(nèi)存和處理速度不足以解決任何實(shí)際的AI問題。要求程序?qū)@個世界具有兒童水平的認(rèn)識,研究者們很快發(fā)現(xiàn)這個要求太高了:1970年沒人能夠做出如此巨大的數(shù)據(jù)庫,也沒人知道一個程序怎樣才能學(xué)到如此豐富的信息。于是AI研究就此告一段落,人們的“人工智能”夢也因此暫時進(jìn)入休眠狀態(tài)。
20世紀(jì)70年代末到80年代中葉
從70年代末開始,人們從學(xué)習(xí)單個概念擴(kuò)展到學(xué)習(xí)多個概念,探索不同的機(jī)器學(xué)習(xí)策略和各種學(xué)習(xí)方法。這個時期,機(jī)器學(xué)習(xí)在大量的時間應(yīng)用中回到人們的視線,又慢慢復(fù)蘇。1980年,在美國的卡內(nèi)基 . 梅隆大學(xué)(CMU)召開了第一屆機(jī)器學(xué)習(xí)國際研討會,標(biāo)志著機(jī)器學(xué)習(xí)研究已在全世界興起。此后,機(jī)器歸納學(xué)習(xí)進(jìn)入應(yīng)用。
蓬勃發(fā)展時期
21世紀(jì)初至今
機(jī)器學(xué)習(xí)發(fā)展分為兩個部分,淺層學(xué)習(xí)(Shallow Learning)和深度學(xué)習(xí)(Deep Learning)。1)這個階段的人工神經(jīng)網(wǎng)絡(luò)具有優(yōu)異的特征學(xué)習(xí)能力,學(xué)習(xí)得到的特征能對數(shù)據(jù)有更本質(zhì)的認(rèn)識和分類;2)深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的難度,可以通過“逐層初始化”來有效克服,且這種學(xué)習(xí)能夠在無監(jiān)督的狀況下實(shí)現(xiàn)的(網(wǎng)絡(luò)系統(tǒng)基于語料庫自動抓?。?
神經(jīng)網(wǎng)絡(luò)模型貌似能夠?qū)崿F(xiàn)更加艱難的任務(wù),如目標(biāo)識別、語音識別、自然語言處理等。但是,應(yīng)該注意的是,這絕對不意味著其他機(jī)器學(xué)習(xí)方法的終結(jié)。盡管深度學(xué)習(xí)的成功案例迅速增長,但是對這些模型的訓(xùn)練成本是相當(dāng)高的,而維護(hù)和二次開發(fā)的成本依舊很高。
由此我們可以看出機(jī)器學(xué)習(xí)的發(fā)展并不是一帆風(fēng)順的,它也經(jīng)歷了螺旋式上升的過程,成就與坎坷并存。其中大量的研究學(xué)者的成果才有了今天人工智能的空前繁榮,是量變到質(zhì)變的過程,也是內(nèi)因和外因的共同結(jié)果。
人工智能在關(guān)鍵領(lǐng)域的“跨界合作”
AI和自動化機(jī)器人已經(jīng)對我們的生活產(chǎn)生了極大的沖擊,從打掃衛(wèi)生這樣簡單的事到像自動駕駛汽車和Google DeepMind這樣的復(fù)雜任務(wù)。AI現(xiàn)在覆蓋的領(lǐng)域已經(jīng)非?;?,有大數(shù)據(jù)、移動互聯(lián)網(wǎng)、有人工智能,總體而言人工智能有兩個主要的應(yīng)用路徑:
一是用云端大量的數(shù)據(jù)做計算來成為行業(yè)決策的重要輔助工具,而這種途徑通常只適用于大企業(yè)。伴隨著大數(shù)據(jù)、云計算等新一代信息技術(shù)的快速發(fā)展和智能化應(yīng)用需求的日益凸顯,今年“阿爾法狗”將人工智能的話題推向了一個新熱度。人工智能技術(shù)的突飛猛進(jìn)不僅體現(xiàn)在神秘的機(jī)器人領(lǐng)域,它在人們?nèi)粘I钪械陌l(fā)展和應(yīng)用同樣越來越引人注目。
人們對新事物總是充滿恐懼。就在大家擔(dān)心無人駕駛汽車是否弊大于利的時候,AI重塑金融規(guī)律的創(chuàng)新也引起許多人對其中的法律和道德問題的顧慮。讓一個軟件程序來決定,誰擁有投資開戶的資格,誰能夠獲得貸款(征信),應(yīng)該收取多少的費(fèi)率,甚至在主流金融體系之外的金融服務(wù)客戶都可能收獲意想不到的后果。但也有些人認(rèn)為,沒有什么能夠比算法更公平公正了——純粹數(shù)學(xué),畢竟,不會有偏見,對吧?
這個論點(diǎn)的缺陷之一是,算法也是人為創(chuàng)建的,通常會在連他們都意識不到的細(xì)微處隱含了偏見。這些偏見也許會被嵌入到算法當(dāng)中。比如,去年卡內(nèi)基 . 梅隆大學(xué) 的研究者測試谷歌的算法是如何向用戶推送廣告時發(fā)現(xiàn),廣告設(shè)置中的“男性”和“女性”標(biāo)簽中,谷歌會給“男性”用戶推薦薪酬更高的招聘廣告。更極端地說,一個人工智能引擎做出信貸決策時,也許會傾向于只認(rèn)可常春藤盟校畢業(yè)的,或者家庭收入超過30萬美元的群體。
人工智能,究其本質(zhì)而言,還不能完全控制今天的以規(guī)則為基礎(chǔ)的系統(tǒng)。在AI里面,電腦可以隨著時間的推移來學(xué)習(xí)人們通常是如何做的:通過接收信息,然后決策基于這些數(shù)據(jù)進(jìn)行征信決策,并不斷觀察結(jié)果進(jìn)行風(fēng)控。隨著它們在錯誤和正確的信息中不斷學(xué)習(xí),它們會不斷修正自己的規(guī)則和算法,然后開始作出它們自己的結(jié)論。
喬治 . 華盛頓大學(xué)社群主義政策研究所國際事務(wù)教授兼主任Amitai Etzioni指出,無人駕駛汽車被指示不要超速,但它們也被設(shè)計了學(xué)習(xí)程序。當(dāng)周圍的汽車加速時,它也會加速。它們所謂的標(biāo)準(zhǔn)是根據(jù)周圍的參照而對結(jié)果做出調(diào)整。
使用人工智能自動化決策的另一個問題是,它們是否會使用智能合約技術(shù)自動執(zhí)行,謂之可依賴性。“一不小心,我們就可能無法實(shí)現(xiàn)我們認(rèn)為通過自動化能夠做好的一切,”多倫多一名專門研究反洗黑錢規(guī)則、反恐怖主義集資、跨國資產(chǎn)追回的律師,Digital Finance Institute聯(lián)合創(chuàng)始人克里斯丁·度海枚(Christine Duhaime)表示,“原因是,我們實(shí)現(xiàn)越高水平的自動化后,就越難與人類溝通問題。如果一個自動生成的決策將對客戶造成消極后果,那么這需要對其有一個保護(hù)的機(jī)制?!?/p>
確保決策過程中所有被用到的數(shù)據(jù)都是精確且最新的,這對企業(yè)來說是一個特別的責(zé)任,除非用戶明確表示授權(quán),同時企業(yè)在適當(dāng)?shù)臅r候具備恰當(dāng)?shù)募夹g(shù)安保措施和隱私保護(hù)政策,并且只訪問特許儲存的數(shù)據(jù)。度海枚指出,在AI中還有一個危險隱患是,該技術(shù)實(shí)則將那些無法使用計算機(jī)或移動設(shè)備的殘疾人和老者排除在外了。“在這樣的情況下,我們打著普惠金融的旗號,最后卻將大部分客戶拒之門外,我們實(shí)際也沒有解決銀行現(xiàn)存問題的能力。這只不過是制造了不可解的新的金融問題罷了?!?/p>
其次就是被用于與生物科技領(lǐng)域的人工智能技術(shù)。生物學(xué)者通常通過人工智能來讀許多醫(yī)學(xué)的圖片,比如看X光的圖片、看超聲波的圖片、看核磁共振的圖片。這也是在生物基因技術(shù)產(chǎn)業(yè)上非常好的布局。日前,CB Insights 研究公司整理出一份醫(yī)療領(lǐng)域AI創(chuàng)業(yè)圖景,統(tǒng)計了全球活躍其中的 92 家初創(chuàng)公司。在 2011 年,人工智能醫(yī)療公司的融資交易只有 10 起,而到了 2015 年,這個數(shù)字達(dá)到了 60 起。
Frost & Sullivan 的分析師 Harpreet Singh Buttar表示,“到 2025 年,不管是人類大健康管理,還是利用虛擬形象與患者交流,AI 都會滲透其中,貫穿生活的方方面面?!睆闹形覀円材芸吹饺斯ぶ悄?醫(yī)療的一些關(guān)注熱點(diǎn)。
圖像及診斷類:從 2015 年 1 月開始,圖像及診斷類的 22 家 AI 創(chuàng)業(yè)公司中,有17家獲得了天使/ A 輪融資,可以感受到這一領(lǐng)域已經(jīng)呈井噴之勢。Frost & Sullivan的一份報告指出,2005年以來,醫(yī)學(xué)成像資料存儲量已經(jīng)增長10倍,并且隨著更多先進(jìn)設(shè)備的推出還會繼續(xù)增長。
藥物挖掘公司:目前, 8 家藥物挖掘公司中已經(jīng)有 6 家獲得了風(fēng)投,藥物挖掘同樣也是一個值得關(guān)注的領(lǐng)域,相關(guān)的新興公司也不少。
以腫瘤治療為代表的精準(zhǔn)醫(yī)療:腫瘤治療因其復(fù)雜性及個性化的特點(diǎn),如果能運(yùn)用人工智能實(shí)現(xiàn)“降維”精準(zhǔn)打擊,無疑能提高治療的效率,說不定又會有一條生命因為科技而被拯救呢?
遠(yuǎn)程病患監(jiān)控:目前的初創(chuàng)公司主要是通過自然語言處理及深度學(xué)習(xí)實(shí)現(xiàn)這一功能,當(dāng)患者通過語音描述癥狀時,系統(tǒng)能基于海量數(shù)據(jù)庫的知識給予反饋。
醫(yī)療算法平臺:如果在醫(yī)生資源或醫(yī)院資源上受到了限制,專注算法并將方案提供給醫(yī)療供應(yīng)商也同樣是一個不錯的選擇。
“AI的下一個挑戰(zhàn)就是把不同的層面聯(lián)系在一起,首先要有非常精密的程序?!迸=虼髮W(xué)計算機(jī)系主任、教授邁克爾·伍迪季(Michael Wooldridge)表示,英國、美國和中國很多人都使用智能手環(huán),它能夠監(jiān)控人的心率、血糖、走了多少步等,所有這些信息給到AI,就能去實(shí)現(xiàn)一些健康的應(yīng)用。在英國,一種觀點(diǎn)是人工智能最大的應(yīng)用就是在醫(yī)療體系的優(yōu)化上。英國國家醫(yī)療系統(tǒng)的病例,包括所有英國人的病例數(shù)據(jù)和用藥記錄結(jié)合AI技術(shù),將有望極大地完善英國的全民醫(yī)療體系。“今天所講的AI就能夠運(yùn)用到醫(yī)療領(lǐng)域,確實(shí)為整個醫(yī)療行業(yè)帶來新的發(fā)現(xiàn),所以人工智能的下一個風(fēng)口應(yīng)該是在醫(yī)療領(lǐng)域?!?