高煥堂
摘要:敘述了AI思維給人類(lèi)教育的三項(xiàng)啟示:1)機(jī)器學(xué)生在學(xué)習(xí)how-to-do(如何去做)經(jīng)驗(yàn)上,其能力遠(yuǎn)勝于人類(lèi)學(xué)生。2)過(guò)度強(qiáng)調(diào)how-to-do先驗(yàn)知識(shí)的傳承,反而會(huì)局限學(xué)生(無(wú)論是人類(lèi)或機(jī)器)對(duì)全局最優(yōu)的探索,因而妨礙其發(fā)揮天賦的創(chuàng)新潛能。3)引導(dǎo)人類(lèi)學(xué)生更多how-to-think的演練和信心,可能促進(jìn)兩種學(xué)生在《創(chuàng)新/實(shí)踐》上的完美組合。
關(guān)鍵詞:AI;思維;how-to-do;how-to-think
1 AI思維:為什么AlphaGo Zero會(huì)贏?
2016年,AlphaGo戰(zhàn)勝了人類(lèi)的圍棋冠軍高手。2017年AlphaGo Zero超越了AlphaGo,而且百戰(zhàn)百勝。為了讓大家更了解AlphaGo Zero會(huì)贏的原因,我拿企鵝來(lái)比喻AlphaGo機(jī)器。
設(shè)想2015年之前(的某一天),某學(xué)校里有一位人類(lèi)老師,他教一些人類(lèi)學(xué)生在臺(tái)北抓魚(yú)去市場(chǎng)賣(mài)、看誰(shuí)能賣(mài)最多。越大的魚(yú)可以賣(mài)越多錢(qián)。臺(tái)北有池塘、河流、也有沿海。老師告訴人類(lèi)學(xué)生說(shuō):池塘的魚(yú)比較小,河流的魚(yú)比較大,海里的魚(yú)最大,海上風(fēng)浪大,要注意自身安全。幾次比賽之后,人類(lèi)學(xué)生全部到河流去抓魚(yú)了。
2016年,來(lái)了一位企鵝學(xué)生(比喻AlphaGo機(jī)器)。這位人類(lèi)老師也告訴企鵝說(shuō):池塘的比較小,河流的魚(yú)比較大,海里的魚(yú)最大,海上風(fēng)浪大,要注意自身安全。
這只企鵝學(xué)生發(fā)現(xiàn)了所有人類(lèi)學(xué)生都天天到河里抓魚(yú),河里都剩下小魚(yú)了,它逛到池塘邊,跳進(jìn)池塘、潛入池底抓出一條大魚(yú)(且刻意不告訴其他學(xué)生和老師),得到了冠軍。
2017年,又未了一位新的企鵝學(xué)生(比喻AlphaGo Zero機(jī)器)。這只新企鵝學(xué)生比較頑皮,根本聽(tīng)不進(jìn)老師教它的任何知識(shí),自己跟同學(xué)們一起去抓魚(yú)了。它走到海邊,撲通一聲就跳入海中,玩得不亦樂(lè)乎,順手一抓就得到一只超大魚(yú)(且刻意不告訴其他學(xué)生和老師),得到了冠軍。
那么,AlphaGo Zero會(huì)贏的背后原因是什么?老師傳授給學(xué)生的先驗(yàn)知識(shí):“池塘的比較小,河流的魚(yú)比較大,海里的魚(yú)最大,海上風(fēng)浪大,要注意自身安全。”這是人類(lèi)老師基于其經(jīng)驗(yàn)而領(lǐng)悟的先驗(yàn)知識(shí),是基于人類(lèi)特性而定的最佳方案,僅是人類(lèi)探索空間的局部最優(yōu)(local optima)而已。但是不一定是“人類(lèi)+企鵝AlphaGo”探索空間的全局最優(yōu)(global optima)。
企鵝AlphaGo承襲了老師的知識(shí),也認(rèn)為大海很危險(xiǎn),就沒(méi)去大海了。但是它有特殊習(xí)性(人類(lèi)沒(méi)有):喜歡玩水。所以它的探索空間大于人類(lèi)(包括池塘內(nèi)部),而發(fā)現(xiàn)了“人類(lèi)+企鵝AlphaGo”探索空間的全局最優(yōu)(池里抓魚(yú)),而勝過(guò)了人類(lèi)學(xué)生。
企鵝AlphaGo Zero沒(méi)有承襲老師的知識(shí),不認(rèn)為大海有危險(xiǎn)(其實(shí)企鵝喜歡海浪),就跑去大海了。所以它的探索空間大于“人類(lèi)+企鵝AlphaGo”,而發(fā)現(xiàn)了“人類(lèi)+企鵝AlphaGo+企鵝AlphaGo Zero”探索空間的全局最優(yōu)(海中抓魚(yú)),而勝過(guò)了企鵝AlphaGo和人類(lèi)。
2 AI思維:給人類(lèi)教育的三項(xiàng)啟示
2.1 第一項(xiàng)啟示
從上所述,AI思維給人類(lèi)教育的啟示之一是:學(xué)校老師有兩種學(xué)生:人類(lèi)學(xué)生與機(jī)器學(xué)生。老師們把how-to-do的經(jīng)驗(yàn)教給機(jī)器學(xué)生,其機(jī)器經(jīng)驗(yàn)迅速勝過(guò)人類(lèi)經(jīng)驗(yàn)。這意味著,老師將其how-to-do(如何去做)經(jīng)驗(yàn)傳承給人類(lèi)學(xué)生(如棋藝學(xué)徒),這些人類(lèi)學(xué)生很可能都輸給機(jī)器學(xué)生,被機(jī)器學(xué)生淘汰出局而失業(yè)。就如同人類(lèi)棋藝高手輸給AlphaGo一般。簡(jiǎn)而言之,這項(xiàng)啟示就是:機(jī)器學(xué)生在學(xué)習(xí)how-to-do經(jīng)驗(yàn)上,其能力遠(yuǎn)勝于人類(lèi)學(xué)生。
2.2 第二項(xiàng)啟示
然而,AlphaGo還不是頂級(jí)高手,還輸給了AlphaGo Zero。因?yàn)樗浅R蕾?lài)人類(lèi)的過(guò)去經(jīng)驗(yàn)(如歷史棋譜),只要曾經(jīng)認(rèn)可為錯(cuò)的,便不再去探索發(fā)展,因而往往只找到局部最優(yōu)(local optima),而不是全局最優(yōu)的方案。
回顧人類(lèi)的每一次革命性創(chuàng)新都是人類(lèi)跳出了局部最優(yōu)的表現(xiàn)。例如,古典力學(xué),麥克斯韋方程,再到廣義相對(duì)論等比比皆是。從上所述,AI思維給人類(lèi)教育的啟示之二是:老師把太多的先驗(yàn)知識(shí)教給學(xué)生(包括人類(lèi)學(xué)生和機(jī)器學(xué)生),可能妨礙學(xué)生的創(chuàng)新能力,因?yàn)閷W(xué)生在面對(duì)復(fù)雜的新情境時(shí)會(huì)迅速找到局部最優(yōu),而停止繼續(xù)探索發(fā)展,失去跳出局部最優(yōu)的創(chuàng)新機(jī)會(huì)。
其實(shí),從一般的教學(xué)都可以體會(huì)上述的啟示。試想,如果您是爸爸或媽媽且是游泳教練,您會(huì)如何教您自己的小孩學(xué)游泳呢?同樣地,如果您是爸爸或媽媽且是網(wǎng)球教練,您會(huì)如何教您自己的小孩打網(wǎng)球呢?先練習(xí)打墻壁,還是直接進(jìn)球場(chǎng),陪他亂打一通呢?再試想,如果您是爸爸或媽媽且英語(yǔ)很流俐,您會(huì)如何教您自己的小孩講英語(yǔ)呢?先講解簡(jiǎn)單文法和句型,還是直接英語(yǔ)對(duì)話(huà),陪他亂講一通呢?
老師引領(lǐng)人類(lèi)學(xué)生自己學(xué)習(xí)、累積知識(shí)和經(jīng)驗(yàn),比老師給予的先驗(yàn)知識(shí)更能發(fā)揮學(xué)生的天賦創(chuàng)造力。老師引領(lǐng)機(jī)器學(xué)生自己學(xué)習(xí)、累積知識(shí)和經(jīng)驗(yàn)的速度和豐富性讓老師給予的先驗(yàn)知識(shí)顯得微不足道了。
簡(jiǎn)而言之,這項(xiàng)啟示就是:過(guò)度強(qiáng)調(diào)how-to-do先驗(yàn)知識(shí)的傳承,反而會(huì)局限學(xué)生(無(wú)論是人類(lèi)或機(jī)器)對(duì)全局最優(yōu)的探索,因而妨礙其發(fā)揮天賦的創(chuàng)新潛能。
2.3 第三項(xiàng)啟示
上文提到機(jī)器擅長(zhǎng)學(xué)習(xí),從how-to-do經(jīng)驗(yàn)中學(xué)習(xí)和領(lǐng)悟,而呈現(xiàn)出智慧。大數(shù)據(jù)提供給它極佳的學(xué)習(xí)材料。機(jī)器的智慧很類(lèi)似人類(lèi)的“歸納性”智慧,它的思考過(guò)程不清晰,所以只產(chǎn)生思考的“結(jié)論”知識(shí),而沒(méi)有產(chǎn)生思考的“過(guò)程”知識(shí)。
由于AI機(jī)器沒(méi)有表現(xiàn)出思考過(guò)程,人類(lèi)也無(wú)法全然把握機(jī)器智慧的可信度。機(jī)器一旦面臨它未曾學(xué)習(xí)過(guò)的情境,就有可能會(huì)犯錯(cuò)。例如,去年一名特斯拉(Tesla)車(chē)主在其特斯拉汽車(chē)的“自動(dòng)輔助駕駛”軟件未能在陽(yáng)光下發(fā)現(xiàn)一輛白色卡車(chē)后死于撞車(chē)事故。這項(xiàng)機(jī)器學(xué)習(xí)的弱點(diǎn),如果能得到人類(lèi)智慧的相助,就能達(dá)到更完美的境界了。
從上所述,AI給人類(lèi)教育的啟示之三是:學(xué)校老師可以更關(guān)注于引導(dǎo)學(xué)生how-to-think(如何去思考),包括跨界思維和聯(lián)想等。這讓機(jī)器(學(xué)生)的全局探索能力來(lái)協(xié)助人類(lèi)(學(xué)生)的創(chuàng)意思考迅速尋找到全局最優(yōu)的實(shí)踐方案。同時(shí)也讓人類(lèi)更多的“思考”來(lái)弭補(bǔ)機(jī)器“智慧”的弱點(diǎn)。于是,人類(lèi)和機(jī)器變得相輔相成、達(dá)到創(chuàng)新與實(shí)踐的最佳組合。
3 結(jié)論
引導(dǎo)人類(lèi)學(xué)生更多how-to-think的演練和信心,可能促進(jìn)兩種學(xué)生在“創(chuàng)新/實(shí)踐”上的完美組合。