史寧中
這次討論大數(shù)據(jù)與小學數(shù)學教學,是一個嶄新的話題,我只是簡單地講一講,啟發(fā)大家思考兩個方面的問題:第一,什么是大數(shù)據(jù)?第二,大數(shù)據(jù)給小學數(shù)學教育帶來的變化是什么?
什么是大數(shù)據(jù)
上個世紀80年代非常熱的詞有兩個,一個叫做“海量數(shù)據(jù)”,一個叫做“高維數(shù)據(jù)”。為什么有海量數(shù)據(jù)這個詞?隨著科學實驗手段的加強和信息技術(shù)的飛速發(fā)展,人們能夠在很短的時間內(nèi)得到大量的數(shù)據(jù),這樣的數(shù)據(jù)叫做“海量數(shù)據(jù)”。
到本世紀提出大數(shù)據(jù)的概念,是因為網(wǎng)絡(luò)數(shù)據(jù)。網(wǎng)絡(luò)數(shù)據(jù)比過去通過實驗得到的數(shù)據(jù)要大得多。這些數(shù)據(jù)帶來了極大的變化,因此全世界開始重視這些數(shù)據(jù)。先是《自然》雜志,在2012年9月登了10篇文章來討論大數(shù)據(jù)。還有《科學》雜志,在2011年有兩期討論大數(shù)據(jù)的文章。
更重要的是,政府開始重視這個事情。大家都知道斯諾登的事情,各種情報的收集,大部分都是網(wǎng)絡(luò)數(shù)據(jù),包括電話錄音。美國政府在2012年推出了《大數(shù)據(jù)的研究與發(fā)展計劃》,對大數(shù)據(jù)進行研究。聯(lián)合國也在2012年發(fā)布了《大數(shù)據(jù)促發(fā)展——挑戰(zhàn)與機遇》的白皮書。中國也開始重視大數(shù)據(jù),成立了互聯(lián)網(wǎng)委員會,考慮網(wǎng)絡(luò)安全問題,特別是最近的法治研究和社會意識形態(tài)研究,都把網(wǎng)絡(luò)數(shù)據(jù)和大數(shù)據(jù)分析的問題提上日程。
大數(shù)據(jù)是如何產(chǎn)生的?
網(wǎng)絡(luò)數(shù)據(jù)不是像我們傳統(tǒng)方式那樣,通過實驗得到的,通過調(diào)查得到的。
很多數(shù)據(jù)是主動產(chǎn)生的,比如說博客,還有跟著博客發(fā)表意見的評論,特別是短信、微信。它們的產(chǎn)生沒有明確的規(guī)律,但是這些數(shù)據(jù)對了解民意非常重要。如何對這樣的數(shù)據(jù)進行分析?這個問題對教育帶來了什么,對小學數(shù)學帶來了什么?值得思考。
還有一類數(shù)據(jù)是自動產(chǎn)生的,不管你愿不愿意。比如說街上的交通監(jiān)視、汽車導(dǎo)航系統(tǒng)、手機運動的軌跡。這樣的數(shù)據(jù)規(guī)律性很強,管理價值非常大。由這些數(shù)據(jù)提供交通服務(wù)是非常有效的。比如導(dǎo)航服務(wù),就能使出行路線最優(yōu)化。
還有一種驅(qū)動產(chǎn)生的數(shù)據(jù),這個數(shù)據(jù)商家更感興趣。比如網(wǎng)上購物,網(wǎng)上買機票、火車票,網(wǎng)上訂旅館。
大數(shù)據(jù)的特征是什么?
大數(shù)據(jù)的特征是價值稀疏。數(shù)據(jù)量那么大,每天能夠產(chǎn)生25億GB,真正有分析價值的不到0.5%,大部分都是沒用的東西。但是沒用的東西一旦有用了價值就非常大,比如說交通監(jiān)視,大部分時間都沒有事故,突然有事故了,數(shù)據(jù)的價值就極大。傳統(tǒng)意義上認為,數(shù)據(jù)都是等同的,都提供一樣多的信息,現(xiàn)在不是了,有些數(shù)據(jù)提供的信息大,有些數(shù)據(jù)提供的信息少。這怎么分析呢?輿情控制中心在什么地方呢?
還有,這樣的數(shù)據(jù)結(jié)構(gòu)復(fù)雜,有文本數(shù)據(jù)、音像數(shù)據(jù),怎么分析?進一步,這樣的數(shù)據(jù)是多元動態(tài)的,是源源不斷的,隔一段時間分析一次,需要做實時分析,不能等到數(shù)據(jù)都來了再分析。怎么保證實時分析的結(jié)果和整體分析的結(jié)果是一樣的,這個問題涉及信息科學、管理科學、統(tǒng)計學、數(shù)學等多門學科。大數(shù)據(jù)有分析價值,但要用不同的分析方法才能得到有用的東西。
大數(shù)據(jù)給小學數(shù)學教育帶來的啟示
大數(shù)據(jù)給小學數(shù)學教育帶來了什么呢?我認為最重要的是感悟數(shù)據(jù)分析。
其一,建立數(shù)據(jù)分析觀念
2011年修訂的《義務(wù)教育數(shù)學課程標準》(以下簡稱《課標》)把過去核心詞里的“統(tǒng)計觀念”,改成“數(shù)據(jù)分析觀念”,就是希望老師知道,數(shù)據(jù)分析是很重要的,并且希望教學能夠構(gòu)建適當?shù)谋尘?,讓學生感受到數(shù)據(jù)分析是很重要的。
結(jié)合大數(shù)據(jù)的主題,回想在“數(shù)據(jù)分析觀念”中提到的三件事情是非常重要的。
第一件事情,感悟數(shù)據(jù)中蘊含的信息。要讓孩子們知道,所有的道理不一定都是老師教的,不一定都是父母說的,也不一定是書本上說的,有一些信息,有一些道理是通過數(shù)據(jù)知道的。這個叫做數(shù)學的“實事求是”。有些東西是要經(jīng)過思考的,根據(jù)什么來思考呢?根據(jù)事實思考,然后得出自己的結(jié)論。這樣,孩子就可能會想問題,就可能會發(fā)現(xiàn)問題,提出問題,分析問題,解決問題。
第二件事情,知道數(shù)據(jù)中的信息可以用不同的辦法獲取。數(shù)據(jù)中的信息不像純數(shù)學那樣,只能靠一個辦法得到。世界上絕對真理是不存在的,很多事情是相對的,相對的意思就是同樣的數(shù)據(jù),用不同的方法分析會得到不同的結(jié)論。因此它取決于這個人的判斷準則,取決于他的價值觀。什么樣的辦法好呢?大家討論叫做民主,或者是最符合背景的方法就是一個好辦法。這個是判斷準則,也可以自己定。我最希望小學老師把這件事情講給學生,讓他們從小樹立起這個信念。中國人到現(xiàn)在為止,發(fā)明創(chuàng)造極少,原因就是那個標準都是外國人定的,中國人到現(xiàn)在為止自己制定的產(chǎn)品標準極少。不會定標準,就永遠不能引領(lǐng)這個行業(yè),特別是不能制定標準,就不能當大老板。這個事情得從小開始重視,應(yīng)該讓孩子們知道,有些標準是老師定的,但是有些標準你也可以定。
第三件事情,感悟數(shù)據(jù)是隨機的??赡苓@次取得的數(shù)據(jù)是這樣的,下一次取得的數(shù)據(jù)是那樣的。雖然是隨機的,但是只要你取得相當多的數(shù)據(jù)之后,就能發(fā)現(xiàn)其中的規(guī)律性。什么叫隨機性?如何理解算術(shù)平均?單純從數(shù)學的角度考慮,算術(shù)平均就是加法和除法,僅僅就是一種運算,實際上,算術(shù)平均有深刻的統(tǒng)計意義,或者是有隨機意義,從這個角度考慮教學才有意義。比如測量一個東西,每次測量的結(jié)果都是不一樣的,這里有隨機誤差,可以表示為x=u+ε,x是測量數(shù)據(jù),u是真實數(shù)據(jù),ε是隨機誤差。因為在測量過程中,只有測量數(shù)據(jù)是已知的,其余兩個量真值和誤差都是未知的,這樣是沒法進行運算的。舉例說,如果你知道你們家兩個月的電費是多少,你怎么能知道每個月的電費是多少呢?怎么辦?就是反復(fù)測量,比如測量了n次,每一次都用這個公式計算,得到n個式子,其中每次測量的x是不一樣的;真值u都是一樣的,和為n倍的u;每次的隨機誤差是不一樣的。既然是隨機誤差,那么有可能正,有可能負,在理想狀態(tài)下,當n很大時隨機誤差的和應(yīng)該接近零。如果它是零的話,我們就得到了一個非常重要的結(jié)果:算術(shù)平均等于真值。因此在這個意義下,我們用算術(shù)平均估計真值,可以看到,這樣估計是有道理的,這是統(tǒng)計教學的核心。
以《課標》的例22上學問題為例,王麗同學記錄了一周五天的上學時間,上學時間是隨機的,但是一定要知道這個數(shù)據(jù)蘊含的信息,然后說如何獲取信息,如何感悟隨機。一個孩子會不會想問題,很關(guān)鍵的是看他能不能從頭到尾地思考問題。因此記錄上學時間時,首先要知道時間是什么,孩子們必須建立起這個意識,我離家的時間和到學校的時間是如何認定的,有手表當然是方便的,沒有手表就要對好學校的鐘和家里的鐘。這些事情看起來是小事情,但是培養(yǎng)孩子會系統(tǒng)地思考問題,真正能夠培養(yǎng)孩子的智慧,往往就表現(xiàn)在這樣的地方。如果記錄一個星期的上學時間的話,上學路上就不能刻意上哪兒去玩。因此要排除兩個誤差,一個是鐘表帶來的誤差,還有人為的誤差,這樣才能使隨機誤差的和是零。
對上面記錄的數(shù)據(jù),可以有不同層次的描述。第一個層次是直接描述。比如上面的數(shù)據(jù),8分20秒出現(xiàn)得比較多,最快7分50秒,最慢9分10秒,這些都是信息。一定要讓孩子說出理由來,如果做到說出的理由和得到的結(jié)論一致,我認為就很好了。大部分孩子說出的理由和得到的結(jié)論不一致,這是不行的。第二個層次是計算描述。比如上學時間在7分50秒和9分10秒之間,或者計算算術(shù)平均即平均上學時間都是計算描述。第三層次是整體描述。在北京做的實驗,有的孩子可以寫出這樣的描述:最快、第二快、第三快、第四快分別是多少,第二快有2次。像這樣簡單的問題,能夠培養(yǎng)孩子對數(shù)據(jù)提取信息最簡單的操作方式。類似的活動還有跳繩、投籃,等等。
其二,學會獲取信息
首先是如何獲取數(shù)據(jù),然后在數(shù)據(jù)中提取信息,這是很難的一件事情,這個叫做實驗設(shè)計。要讓孩子們清楚調(diào)查的背景是什么,調(diào)查的目的是什么,如何設(shè)計調(diào)查方案。如《課標》的例18,班級新年聯(lián)歡會買什么水果?小學一二年級的學生往往回答買蘋果,因為蘋果好看,三四年級的學生會問大家喜歡什么,五六年級的學生會考慮有多少錢。第一個層次知道問題需要判斷,第二個層次知道通過數(shù)據(jù)判斷,第三個層次是建立判斷標準。問班上同學意見,讓孩子們調(diào)查,可以作為綜合實踐課來安排。有些事情可以事先調(diào)查,然后在課堂上討論,包括匯報調(diào)查的結(jié)果,交流調(diào)查的方案,最后由老師幫助總結(jié)。還有整體設(shè)計的問題,如調(diào)查超市的蔬菜是否漲價。這個問題非常難,小學六年級的孩子能把這個問題調(diào)查清楚,什么叫蔬菜漲價,哪個菜漲價了,這跟大數(shù)據(jù)分析是一模一樣的,是大家經(jīng)常買的菜漲價了,還是別的菜漲價了,要先進行分類。
今年“兩會”期間,中央臺開辟一個欄目叫《兩會大數(shù)據(jù)》,這個欄目里經(jīng)常有這樣一個問題,某一個網(wǎng)說這個問題是最重要的,占到48%,另一個網(wǎng)也認為這個問題是最重要的,占到52%,這都是大數(shù)據(jù)算出來的。那么認為這個問題重要的人到底占多少呢?你說A網(wǎng)是48%,B網(wǎng)是52%,把它們加起來除以2,行嗎?不行!為什么不行?因為參與A網(wǎng)和B網(wǎng)調(diào)查的人數(shù)可能不同,這樣帶來的問題就多了,必須增加一個信息,即參加A網(wǎng)和B網(wǎng)討論的人有多少。因此,我們分析一個問題能不能得到結(jié)論很重要,要分析得到的信息是不是足夠多。所以,數(shù)據(jù)的真正含義不僅僅在這個數(shù),而是要把它與周邊有關(guān)的東西放在一起才能分析。
其三,學會分類
2007年,我在寫《數(shù)學思想概論》的時候,思考了數(shù)學的思維是什么?我研究的都是西方人的想法,后來就想知道中國古人是怎么想問題的,然后我用了一年的時間研究中國古人的思維。研究完之后,我非常吃驚的是,居然兩千多年來,中國人從來沒有研究過我們的祖先是如何想問題的。周易的思想方法是什么樣的,老子的思想方法是什么樣的,孔子的思想方法是什么樣的,這些問題沒有人研究。后來我連續(xù)發(fā)表了四篇文章來討論中國古代人的思維,發(fā)現(xiàn)中國古代人的思維和西方人是不一樣的,西方人研究一般與特殊的關(guān)系。古代的中國人不是這樣思維的,他們研究類與類的關(guān)系。老子從來沒有解釋他的道是什么,孔子也沒有解釋他的仁是什么。但是,在一個具體的事情上,老子告訴我們,這么樣就是有道,這么樣就是無道,孔子也是這樣,在某一個具體事情上,這么樣就是仁,這么樣就是不仁。因此中國古代把世界上很多的事情分成類進行研究,比如,周易把整個世界上的事情分了64類,對每一類分別進行研究。
大數(shù)據(jù)必須分類研究,現(xiàn)代科學也開始分類研究,因為一般和特殊之間的關(guān)系已經(jīng)研究不清楚了。比如社交網(wǎng)絡(luò)的研究,是因為同學關(guān)系建立起來的,還是因為興趣關(guān)系建立起來的,還是因為在同一個工作場所建立起來的,不同類型的社交網(wǎng)絡(luò)規(guī)律是不一樣的,要分類進行研究。只有分類了,才能把事情討論清楚,因此,分類是極為重要的。分類要有一個分水嶺。比如,三角形的分類,就畫一個銳角三角形,中間畫一個直角三角形,再在直角三角形下面畫一個鈍角三角形。這樣就可以看到,直角三角形是銳角三角形和鈍角三角形的分水嶺。分類要注意兩件事情:一是抓住共性,二是注重差異。許多問題不分類研究是得不到結(jié)論的,學會分類,學會分類研究,將會受益無窮?!墩n標》例20是扣子分類,有藍顏色的扣子和黃顏色的扣子,有不同的扣眼。教學時不能讓學生上來就分,上來就分就等于什么也沒教會他。要教他們事先想一想怎么分?先定好標準,如先按顏色分、再按扣眼分,或者先按扣眼分、再按顏色分。反正得定個規(guī)矩,然后按規(guī)矩來做事情,這也是非常重要的一件事情。
其四,感悟數(shù)字化的便利
過去的電視是以圖像傳播的,現(xiàn)在把圖像變成數(shù)字,通過數(shù)字傳播,再還原成圖像,這是為什么?因為數(shù)字化之后,傳播過程中的噪音就小了,圖像就更清晰了,進行研究也就更準確了。如果通過圖像研究,現(xiàn)在的科學技術(shù)還達不到這一點。因此,要讓孩子們感悟到很多東西看起來跟數(shù)字無關(guān),實際上是可以數(shù)字化的。比如說班會調(diào)查,把蘋果設(shè)為1,香蕉設(shè)為2,橘子設(shè)為3,等等。
《課標》中的例35是關(guān)于圖形還原的。電視是怎么把圖像變成數(shù)字傳輸?shù)??把電視畫面分成幾千個格,就是我們手機上的像素,如果這塊有一個點,有圖像叫1,沒有圖像叫做0,這樣就把圖像變成數(shù)字了,然后把這些數(shù)字輸送出去,到那頭用解碼器恢復(fù)過來,電視就是這么傳播的。因此根據(jù)這個想法,《課標》設(shè)計了例35,把一個圖分為四塊,每一塊先用數(shù)字起個名,然后讓這些小塊有的旋轉(zhuǎn),有的平移,得到一個亂七八糟的圖。亂七八糟的圖給另一組學生,他們再根據(jù)記錄還原回去。設(shè)計這么一堂課是極為重要的,可以培養(yǎng)孩子數(shù)字化的思想。用數(shù)字表示圖形旋轉(zhuǎn),比如旋轉(zhuǎn)90度就是1,旋轉(zhuǎn)180度是2,把這些數(shù)字記錄下來,然后給另一個組,還原成原來的圖。我真希望大家能設(shè)計出更好的類似這樣的問題。
今天講的很多例子,都跟數(shù)據(jù)分析有關(guān)。其中還包含重要的邏輯推理。在大數(shù)據(jù)背景下,對于數(shù)學教育我現(xiàn)在最想說的一句話是:通過我們的教學讓小學生更聰明起來,會想問題,會處理問題。