徐堅(jiān)
?
Alphago人工智能帶給教育及職業(yè)教育領(lǐng)域的思考
徐堅(jiān)
今天Alphago的4∶1完勝,Alphago的最先獲三勝,讓我吃驚、震撼、失望、迷茫和極度的擔(dān)憂。我自己從事數(shù)據(jù)預(yù)測以及數(shù)據(jù)挖掘的教學(xué),Alphago中的蒙特卡洛樹算法我曾經(jīng)教過學(xué)生。當(dāng)時,我就覺得非常有趣,但是,這些算法實(shí)際使用時會存在一個巨大的問題,就是現(xiàn)實(shí)世界對結(jié)果的影響變量太多,所以這些決策算法的結(jié)果只能供決策者決策時參考。
經(jīng)過比較詳細(xì)研究Alphago的算法發(fā)現(xiàn),它在布局階段的前20步采用人類經(jīng)驗(yàn),之后開始在人類經(jīng)驗(yàn)的基礎(chǔ)上融入了自己學(xué)習(xí)的權(quán)重,變得更加的理性以及所謂的大局觀。由于圍棋的復(fù)雜性,Alphago也不能在每步都能精確地知道當(dāng)前棋盤中所有下法的勝率。所以,他采用的是在可以期待的近期(20步以內(nèi))綜合價值和勝率會超過50%的走法。從這幾點(diǎn)來看,這次的機(jī)器戰(zhàn)勝遠(yuǎn)超過國際象棋中人類被戰(zhàn)勝的意義。Alphago的算法是一種新的適應(yīng)機(jī)器的思維,發(fā)揮了機(jī)器的強(qiáng)項(xiàng),彌補(bǔ)了機(jī)器的短處。這非常讓人感到害怕、悲觀和失望。因?yàn)?,人生就是一盤棋局。如果50年后,有一個智能機(jī)器助手,它不能告訴你最終的未來,但是可以告訴你在幾年內(nèi)的未來,你該如何是好?那這是不是一種宿命論?事實(shí)上,筆者在教授數(shù)據(jù)分析課程的這幾年中,一直在宿命論和未來不確定性兩種相對的觀點(diǎn)中搖擺。數(shù)據(jù)統(tǒng)計(jì)已經(jīng)有足夠的算法和可靠的實(shí)踐在某些方面做出人類無法預(yù)計(jì)或預(yù)見的準(zhǔn)確預(yù)測,只不過那些領(lǐng)域還很小,比如,庫存的預(yù)測、銷量的預(yù)測,等等。數(shù)據(jù)已經(jīng)在顯示其巨大的價值,而一旦數(shù)據(jù)預(yù)測技術(shù)能夠輸入足夠多的變量,采用類似Alphago或更加高級的算法,進(jìn)而對你個人、你所在組織、公司、國家的短期未來甚至是長期未來做出80%、甚至是90%的準(zhǔn)確預(yù)測,你會怎樣去接受這樣的未來?!當(dāng)然,不確定性仍會存在,這是一個好消息。在此,我對Alphago事件嘗試做一些思考分析。
1.Deepmind公司用十年的時間磨練,修改算法,雖然在算法上沒有創(chuàng)新,但是如何融合已有算、如何調(diào)整權(quán)重等多個方面,仍然是做了大量、艱苦的工作。
2.Google擁有超級大量的計(jì)算資源供Alphago的使用,也就是說目前機(jī)器學(xué)習(xí)的過程非常的耗費(fèi)時間以及計(jì)算資源。按照以往的經(jīng)驗(yàn),20年內(nèi),我們使用的桌面型機(jī)器就應(yīng)該能夠支撐起Alphago目前所需的計(jì)算資源。從現(xiàn)在開始,再過30-40年,可能Alphago這個“古老”的程序只需要幾天就能完成現(xiàn)在幾個月所需的機(jī)器學(xué)習(xí)時間。
3.在硬件上CPU和GPU的協(xié)同調(diào)度,以及分布式的運(yùn)算的運(yùn)用,大大加快的計(jì)算的速度。這也是近幾年軟硬件基礎(chǔ)發(fā)展奠定的基礎(chǔ)。
4.Alphago在擊敗歐洲冠軍時進(jìn)行了嚴(yán)格的保密,說明當(dāng)時Alphago團(tuán)隊(duì)當(dāng)時也并不是很自信能夠戰(zhàn)勝。事實(shí)上,我認(rèn)為,在這次比賽開始前,他們?nèi)匀粵]有這個把握,仍然應(yīng)該認(rèn)為是一半對一半的勝率。但是,哪怕輸了,也沒有關(guān)系,反正繼續(xù)讓Alphago學(xué)習(xí)后再提升。
5.Alphago對戰(zhàn)時采用方式近似的模擬了人腦的信息的處理方式,只不過速度更快。所以,Alphago也不能百分之百的勝率,但是隨著學(xué)習(xí)的時間不斷增加,最終會遠(yuǎn)遠(yuǎn)超過人類。
1.個人,組織,公司,國家間的競爭將會更加重視人工智能的策略參考。人類的思考開始依賴于機(jī)器的理性,人的決策變得更加的理性,情感的因素會不斷下降,也意味著更加沒有人情味。這必然會影響到人類的進(jìn)化進(jìn)程。
2.人與機(jī)器的關(guān)系需要重新的思考,人應(yīng)該如何同機(jī)器共存。
3. IT行業(yè)的人力資源需求將大規(guī)模增長,而有些行業(yè)將大規(guī)模失業(yè)。
4.基因技術(shù)、可控核聚變、機(jī)器人技術(shù)、人工智能這些技術(shù)都將對人類產(chǎn)生重大意義的影響,但是如何控制好這些技術(shù)將成為一個重大的問題,否則任何一個技術(shù)都可能毀滅人類。為了控制好這些技術(shù),需要從現(xiàn)在開始立即進(jìn)行大量的辯論及監(jiān)督審查。
5.Alphago在最終在決定某個落子的評分中,其權(quán)重為人類經(jīng)驗(yàn)參數(shù)同左右互搏這種機(jī)器學(xué)習(xí)得來的概率參數(shù)各占50%。Alpago團(tuán)隊(duì)曾經(jīng)調(diào)整過不同的權(quán)重,但是經(jīng)過實(shí)驗(yàn)發(fā)現(xiàn)各占50%時的最終勝率最高。這一數(shù)據(jù)是否在暗示,如果要戰(zhàn)勝人類就必須首先理解人類的思考,否則就無法做到青出于藍(lán)而勝于藍(lán)。但是,在理解人類思考的同時,也會無法避免地繼承人類的弱點(diǎn),這也是Alphago最終會有失敗的一局。另外,在具體的步驟中,也不是每步都是完美的??赡苓@也許是人工智能能夠超越人類,但是可能無法毀滅人類的重要一點(diǎn)。因?yàn)?,如果人工智能自己最終學(xué)會思考,相信人工智能最終會參透,或許最符合人工智能自身的利益生存方式是同人類共存,而不是消滅人類。
1.Alphago算法有較強(qiáng)的通用性,但也有很多的限制。首先為了更加精確,需要大樣本量的學(xué)習(xí),Alphago為了加快學(xué)習(xí)進(jìn)度在學(xué)習(xí)現(xiàn)有人類棋盤的基礎(chǔ)上,開始自己與自己互博,加快學(xué)習(xí)的速度。這點(diǎn)在通用領(lǐng)域中實(shí)現(xiàn)有一定的難度。在教育領(lǐng)域中,目前比較適合Alphago算法快速進(jìn)入的領(lǐng)域的是在線課程的學(xué)習(xí)。
2.在線課程的學(xué)習(xí)目前來說僅僅完成了內(nèi)容的提供,如何編排現(xiàn)有的課程已達(dá)到最高的學(xué)習(xí)效率,這點(diǎn)目前還沒有引入人工智能方法。如果引入,將會對教學(xué)的方法理論產(chǎn)生一定的影響,甚至?xí)绊懙骄€下課程順序的設(shè)計(jì)安排。
3.多媒體材料的類型的挖掘,不同類型的媒體會帶來不同的教學(xué)效果,人工智能在這個領(lǐng)域有助于通過大數(shù)據(jù)分析統(tǒng)計(jì)出在認(rèn)知不同階段采用何種類型的教學(xué)媒體效果最好。
4.個性化的學(xué)習(xí),引入Alphago算法后的人工智能,會為個性化學(xué)習(xí)帶來天翻地覆的變化。通過攝像頭對學(xué)習(xí)者情緒的監(jiān)控,結(jié)合學(xué)習(xí)過程中不間斷的學(xué)習(xí)效果的評估,可以會帶來真正意義上的個性化學(xué)習(xí)。
5.真正意義上的個性化學(xué)習(xí)會對分層教學(xué)產(chǎn)生深遠(yuǎn)的影響,因?yàn)閷W(xué)習(xí)的進(jìn)度快慢會非常容易的將不同學(xué)習(xí)能力的學(xué)習(xí)者分類,教育會不知不覺走向過程和結(jié)果的不公平。
6.目前,已經(jīng)有在線課程網(wǎng)站同招聘網(wǎng)站結(jié)合的構(gòu)想,利用在線學(xué)習(xí)的記錄,為雇主提供是否雇傭的參考。未來可能會更加大規(guī)模地出現(xiàn)該類現(xiàn)象,未來各級各類學(xué)校的升學(xué)也可能會更加依賴機(jī)器或網(wǎng)站記錄的學(xué)習(xí)過程,同時造成新的學(xué)習(xí)能力歧視。但是,這樣針對個體的不公平,卻可以帶來整個組織以及國家的利益最大化,將來如何面對這樣的不公平,會成為一個重要的討論話題。
7.Alphago通過在線教學(xué)領(lǐng)域的挖掘最終也會或多或少的影響到傳統(tǒng)的教學(xué)。如在教師多媒體的選擇標(biāo)準(zhǔn)、課程順序及進(jìn)度的選擇。但是,在遠(yuǎn)遠(yuǎn)沒有量化的教學(xué)領(lǐng)域,還有很長的路需要走,而一旦傳統(tǒng)的教學(xué)領(lǐng)域被量化,如學(xué)生的表情、情緒、反應(yīng)等,那么教師這個職業(yè)將同今天的圍棋一樣,不得不慎重的思考接受一個類似上帝的理性的人工智能的建議。另外,最快掌握這一技術(shù)的組織和國家,將獲得先發(fā)的優(yōu)勢。
1.大量的主要是重復(fù)性的工作,盡管需要一定的隨機(jī)應(yīng)變能力的工作,將會在30~50年逐步被人工智能所替代。這些職業(yè)中的低層次職員將被大量地解雇。這一點(diǎn)提醒職業(yè)教育的層次需要不斷地上移,為符合人力資源市場的需求及保證國家的競爭力,職業(yè)教育中本科教育及研究生教育的比例將逐步加大。
2.工廠的工人將被大量的機(jī)械手臂代替,全自動化的工廠將越來越多。盡管處于邁向老齡化的社會,卻并不能保證年輕人足夠的就業(yè)崗位。IT產(chǎn)業(yè)的人力需求將越來越大,各個產(chǎn)業(yè)的從業(yè)者都將儲存一定的人工智能的知識,以便同智能機(jī)器助手更好地共存。
3.職業(yè)教育的過程將更多地信息化,如教學(xué)資源庫使用將更加類似于在線教學(xué)。通過物聯(lián)網(wǎng)技術(shù),教學(xué)的過程被更加地量化,實(shí)踐操作的過程中實(shí)現(xiàn)較高精度的量化,實(shí)踐教學(xué)的效率極大地提高。但是,工業(yè)領(lǐng)域的職業(yè)中的實(shí)踐教學(xué)的比例將大幅度下降,由于機(jī)械臂的大規(guī)模采用,實(shí)踐教學(xué)將被機(jī)械臂的操作實(shí)踐教學(xué)大規(guī)模替代。對于人工智能分析、操作以及針對不同環(huán)境進(jìn)行適應(yīng)性調(diào)整的能力將成為大部分職業(yè)必修的課程。
4.有必要考慮培養(yǎng)學(xué)生的機(jī)器思維的理解能力,讓學(xué)生能夠理解人工智能的思維的方式,理解這種更加冷靜的思維方式。同時,也要讓學(xué)生明白人工智能不是萬能,也會犯錯,需要保持警惕,不可過分依賴人工智能。
5.在職業(yè)道德的教育中需要充分的討論人與智能機(jī)器之間的關(guān)系,以及如何看待智能機(jī)器,應(yīng)該擬物化的看待智能機(jī)器抑或是擬人化的看待?如果擬人化的看待,那么,擬人化到何種程度?如果面臨險境,是否會因?yàn)榍楦幸蛩厝フ戎悄軝C(jī)器而犧牲自己?等一系列的問題。
[責(zé)任編輯張棟梁]
作者簡介:徐堅(jiān),男,南京信息職業(yè)技術(shù)學(xué)院,華東師范大學(xué)職業(yè)教育與成人教育研究所2015級博士研究生,主要研究方向?yàn)槁殬I(yè)教育與人工智能。