国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

從手工研磨咖啡的決策來談人工智能教學(xué)中的取舍

2019-12-02 13:11陳凱
中國信息技術(shù)教育 2019年21期
關(guān)鍵詞:信息熵喝咖啡公式

陳凱

小馨同學(xué)每天早晨上學(xué)和傍晚放學(xué)時,都要到街邊的醇香咖啡屋里坐上那么一會兒,她有時會點上一杯手工研磨的咖啡,有時候喝橙汁。

小嚴(yán)同學(xué)正在做一份關(guān)于飲用咖啡習(xí)慣的社會調(diào)查,小馨同學(xué)是他的研究對象。

小嚴(yán)同學(xué)統(tǒng)計后發(fā)現(xiàn),小馨同學(xué)走進咖啡屋六次,有三次喝了咖啡,還有三次沒有喝。(對于真正的科學(xué)統(tǒng)計來說,這點樣本數(shù)顯然太少了,本文的重點不在于統(tǒng)計學(xué),所以只取了非常少的所謂樣本)這個數(shù)據(jù)最多說明,小馨同學(xué)喝咖啡的比例是否為五比五,除此之外似乎沒有其他什么用處。然而,小嚴(yán)是個細(xì)心的同學(xué),他注意到,那是一家奇怪的咖啡屋,它提供的咖啡,要么是甜咖啡,要么就是清咖啡,在某一時刻,兩種口味中只有一種;還有,它提供的要么是熱咖啡,要么是冰咖啡,在某一時刻,兩種溫度中只有一種。經(jīng)過記錄后,小嚴(yán)同學(xué)所觀察到的小馨同學(xué)的行為是這樣的:

溫度? 味道? 時間? 是否喝咖啡

熱? ?甜? ? 早? ?喝

熱? ?甜? ? 晚? ?不喝

熱? ?淡? ? 早? ?喝

熱? ?淡? ? 晚? ?不喝

冰? ?甜? ? 晚? ?不喝

冰? ?淡? ? 早? ?喝

看了這樣一份記錄表,小嚴(yán)同學(xué)心中產(chǎn)生出一個疑問:如果小馨同學(xué)晚上走進咖啡屋,那里只提供冰的淡咖啡,那么她更有可能喝咖啡,還是不喝?畢竟,冰、淡、晚這三個屬性的組合,在已有的記錄表中并沒有出現(xiàn)過。

這篇文章中的例子,是要從信息熵的角度,來說明機器將如何根據(jù)已有的數(shù)據(jù),對未來的行為做出預(yù)測;同時,通過這個例子,我們可以討論在基礎(chǔ)教育階段,在人工智能教學(xué)過程中某些環(huán)節(jié)所涉及的知識和技能超出學(xué)生當(dāng)前水平的情況下,應(yīng)該如何做出取舍。

● 事件概率均等時的信息熵計算

人工智能教學(xué)中的許多內(nèi)容,是和信息技術(shù)教學(xué)基礎(chǔ)(必修)模塊中的內(nèi)容緊密聯(lián)系在一起的,人工智能中常見的分類問題的實施過程,其實也正是從混亂走向秩序的過程。信息技術(shù)教學(xué)中一般都會提到信息論中信息的概念,認(rèn)為信息是用來消除(隨機)不確定性的東西,這里的“消除”,更多指的是機器按特定算法所做的不確定性的消除,而不是直接以人力消除。隨機不確定性的程度能夠用以比特為單位的信息熵來描述。

然而,在基礎(chǔ)教育階段,不確定性被“消除”的實際工作過程,往往在教學(xué)過程中被忽略了。比如,通過計算信息增益來實施分類,是以決策樹的方法實現(xiàn)分類的理論基礎(chǔ),但在信息技術(shù)教學(xué)的基礎(chǔ)模塊部分,當(dāng)提及信息概念時,并沒有再進一步提及信息增益相關(guān)內(nèi)容,于是,就錯失了通向人工智能中決策樹分類問題的一個重要的引導(dǎo)性內(nèi)容。何以如此?筆者猜測,恐怕是因為信息論中的數(shù)學(xué)公式的推導(dǎo)和計算會對學(xué)生的理解造成比較大的困難。但經(jīng)過研究和實際教學(xué)驗證,筆者發(fā)現(xiàn),還是存在可行的教學(xué)方案,在人工智能教學(xué)中回避較為艱深的數(shù)學(xué)公式的推導(dǎo)和計算過程,而將重點放在不確定性消除過程中數(shù)學(xué)公式的應(yīng)用上。

考慮小馨喝咖啡的例子,假設(shè)未來的事件只有兩類,即“喝”與“不喝”,如果小馨總是選擇“喝”,那么就根本不存在不確定性,則信息熵為0,如果小馨總是選擇“不喝”,信息熵同樣為0。假如“喝”與“不喝”的決策是一半對一半,則信息熵是1(至少需要一位二進制數(shù)字來存儲兩類不同的決定)??紤]一下,若小馨的選擇有四種情況,即“不喝”“喝一杯”“喝兩杯”“喝三杯”,則信息熵是2(至少需要兩位二進制數(shù)字來存儲四類不同的決定)。如果可選擇的類別是N,而以比特為單位的信息熵是X,則2的X次方等于N,換成對數(shù)公式就是X=log2N。這是整個教學(xué)過程中很關(guān)鍵(也可能是唯一)的數(shù)學(xué)公式,這個公式也是高中數(shù)學(xué)中會學(xué)習(xí)到的內(nèi)容,學(xué)生理解起來難度并不大。

如圖1所示,將小馨是否喝咖啡的兩選一決策與信息熵的關(guān)系標(biāo)注到坐標(biāo)上,可發(fā)現(xiàn)三處特別的位置。三個坐標(biāo)點處在非零即一的整數(shù)位上,然而這就引出了一個新的問題:如果兩類決定出現(xiàn)概率不均等,那么應(yīng)該如何計算信息熵呢?直觀上就可以猜測出,經(jīng)過三個整數(shù)點的函數(shù)圖形最可能是一條弧線,并且函數(shù)圖形必然與對數(shù)函數(shù)密切相關(guān)。

● 事件概率不均等時的信息熵計算

就算是只考慮“喝”與“不喝”兩類決定,但若是這兩類決定出現(xiàn)概率不均等,那么應(yīng)該如何計算信息熵呢?在這里,混雜了概率計算的信息熵公式必然會成為教學(xué)過程中較難逾越的深塹。但要記住的是,在信息技術(shù)教學(xué)中,數(shù)學(xué)公式是應(yīng)用工具,在分析不確定性的消除的整個過程中,這個工具很好地展現(xiàn)了運算的結(jié)果,而公式本身的推導(dǎo)和計算過程并不是教學(xué)重點。

筆者制作了一個簡單的小程序,對于小馨喝咖啡的行為,只要將“喝”與“不喝”兩類選擇各自的次數(shù)輸入到程序中(為了使教學(xué)過程簡潔明了,這里只考慮兩類決策,而不考慮更多類決策的情況),即可得到該情況所對應(yīng)的信息熵的值。學(xué)生還可以用二分類的信息熵圖表,直觀地感受到信息熵的變化規(guī)律,如圖2所示。

實現(xiàn)繪圖的關(guān)鍵公式是:

y = -1 * ( x / 1 * (Log(x) / Log(2)) + (1 - x) / 1 * (Log(1 - x) / Log(2)) )

當(dāng)X取值為1/2的時候(即兩類不同決定概率均等),則計算結(jié)果為1;公式不能將X取值為0或1,但可以無限接近0或1。

在教學(xué)中,可告知學(xué)生計算結(jié)果由此公式而來,但公式的推導(dǎo)過程,則是數(shù)學(xué)課的任務(wù)了。學(xué)生在后續(xù)的學(xué)習(xí)過程中,可以直接調(diào)用公式,或者使用內(nèi)置公式的小程序來進行計算。

● 手工決策過程

回到一開始的問題:如果小馨同學(xué)晚上走進咖啡屋,那里只提供冰的淡咖啡,那么她更有可能喝咖啡,還是不喝?這個問題并沒有一定的答案,因為小馨的行為完全是自由的。問題的關(guān)鍵是,機器應(yīng)該以什么樣的方式去做出一個合理的預(yù)測。如果從信息熵的角度出發(fā),這個問題就轉(zhuǎn)換為:當(dāng)以哪一個屬性作為分類依據(jù)時,可以使得不確定性(信息熵)減少的程度最大?這個問題便和信息增益有關(guān)。

若以溫度作為分類依據(jù),那么可列表如下:

溫度? 是否喝咖啡

1)

熱? ? 喝

熱? ? 喝

熱? ? 不喝

熱? ? 不喝

2)

冰? ? 不喝

冰? ? 喝

供應(yīng)熱咖啡時,不同決定的比例是對半開,選擇冰咖啡時,不同決定的比例還是對半開,即便不進行計算,也可以直觀地知道,信息熵沒有減少。

若以味道作為分類依據(jù),那么可列表如下:

味道? 是否喝咖啡

1)

甜? ? 喝

甜? ? 不喝

甜? ? 不喝

2)

淡? ? 喝

淡? ? 不喝

淡? ? 喝

無論是對甜咖啡還是淡咖啡,不同決定的比例都是1比2,或2比1,這兩種情況,計算出的信息熵結(jié)果都是0.918,這個數(shù)字可直接查閱二分類信息熵圖表或二分類信息熵小程序獲得。

若以時間為分類依據(jù),那么可列表如下:

時間? 是否喝咖啡

1)

早? ? 喝

早? ? 喝

早? ? 喝

2)

晚? ? 不喝

晚? ? 不喝

晚? ? 不喝

早上的決定完全一致,晚上的決定也完全一致,則說明信息熵為0。到這里,即便不查表就已經(jīng)很清楚了,是否喝咖啡,時間可能是最重要的決策依據(jù)。機器便可以此為依據(jù),做出判斷,認(rèn)為小馨不會在晚上喝冰的淡咖啡。

本文提供的數(shù)據(jù)很簡單,沒有考慮到采樣不平衡的情況,比如,小嚴(yán)同學(xué)更多是在早上做記錄,而比較少在晚上做記錄;或者咖啡店更多提供的是熱咖啡,而較少提供冰咖啡。使用加權(quán)平均,就可以方便地解決此問題,如對于以下記錄數(shù)據(jù):

時間? 是否喝咖啡

1)

早? ? 喝

早? ? 喝

早? ? 喝

早? ? 不喝

2)

晚? ? 喝

晚? ? 不喝

晚? ? 不喝

信息熵的計算公式就是:4/7*(1比3情況的信息熵)+3/7*(1比2情況的信息熵);查對二分類信息熵圖表可知信息熵為:4/7*0.918+3/7*0.811。這一部分工作可由學(xué)生親自手工進行,一方面由此了解到機器根據(jù)信息熵的計算而進行分類的過程,另一方面也可讓學(xué)生在學(xué)習(xí)過程中增加參與感。

關(guān)于小馨喝咖啡的例子分析到這里時,信息增益和決策樹的概念已經(jīng)呼之欲出了,人工智能教學(xué)中的許多內(nèi)容和信息技術(shù)教學(xué)基礎(chǔ)模塊中的內(nèi)容,是有著緊密的聯(lián)系的。在基礎(chǔ)模塊的教學(xué)中,部分內(nèi)容只要再稍微深入一點,就可以和人工智能的教學(xué)內(nèi)容無縫對接。筆者認(rèn)為,在課時及學(xué)生知識技能水平有限的情況下,教師在進行人工智能教學(xué)時,優(yōu)先選擇的教學(xué)內(nèi)容應(yīng)該具有這樣的特點:在教學(xué)過程中涉及的知識和技能,最好在信息技術(shù)教學(xué)基礎(chǔ)模塊或算法模塊中已有所鋪墊;在通向某個具體人工智能教學(xué)目標(biāo)的過程中,能夠找出一條任務(wù)需求明確、進階平緩、邏輯清晰連貫的路徑;在教學(xué)過程中,既要能回避艱深的數(shù)學(xué)推導(dǎo)證明過程,又要能彰顯出數(shù)學(xué)工具在解決問題中的作用。

猜你喜歡
信息熵喝咖啡公式
公主愛喝咖啡
組合數(shù)與組合數(shù)公式
排列數(shù)與排列數(shù)公式
如何正確喝咖啡
近似邊界精度信息熵的屬性約簡
他約我去喝咖啡
喝咖啡可護肝
基于信息熵的承運船舶短重風(fēng)險度量與檢驗監(jiān)管策略研究
信息熵及其在中醫(yī)“證癥”關(guān)聯(lián)中的應(yīng)用研究
論犯罪信息
鄂托克前旗| 小金县| 兴山县| 仁布县| 临朐县| 大石桥市| 美姑县| 松滋市| 德江县| 新民市| 黄冈市| 岫岩| 绩溪县| 新龙县| 大理市| 霍城县| 土默特左旗| 松溪县| 北宁市| 台湾省| 达拉特旗| 湖州市| 固阳县| 特克斯县| 保亭| 千阳县| 陆丰市| 望奎县| 石渠县| 酉阳| 海宁市| 普洱| 武义县| 泸州市| 海阳市| 芷江| 岢岚县| 句容市| 临江市| 磴口县| 新疆|