唐小勇 李小春
(1.湖南農(nóng)業(yè)大學(xué),信息科學(xué)技術(shù)學(xué)院 湖南長沙 410128;2.湖南農(nóng)業(yè)大學(xué)東方科技學(xué)院 湖南長沙 410128)
隨著高等教育由精英教育向大眾教育的轉(zhuǎn)型,高等教育在滿足社會精英人才需求的同時,還應(yīng)該培養(yǎng)適應(yīng)社會現(xiàn)代化發(fā)展的應(yīng)用型本科人才。作為本科院校大多數(shù)專業(yè)的公共數(shù)學(xué)基礎(chǔ)課程之一的《概率論》,一直在自然科學(xué)、社會科學(xué)、工程技術(shù)、經(jīng)濟(jì)生活等領(lǐng)域起著重要的作用。不同于其它兩門公共數(shù)學(xué)基礎(chǔ)課程《高等數(shù)學(xué)》、《線性代數(shù)》是研究確定性現(xiàn)象的數(shù)學(xué)分支,《概率論計》是研究隨機(jī)現(xiàn)象的數(shù)據(jù)規(guī)律的一門學(xué)科。所謂的隨機(jī)現(xiàn)象指的是事前不可預(yù)言的現(xiàn)象,需要在大量的數(shù)據(jù)中找出某種規(guī)律,然后對這種規(guī)律提出合理的假設(shè),再對這種假設(shè)進(jìn)行檢驗,最后根據(jù)這種規(guī)律來預(yù)測未來的發(fā)展趨勢。不同于自然科學(xué)等存在的客觀現(xiàn)象,社會生活中廣泛存在著隨機(jī)現(xiàn)象,因此,概率論也成為處理隨機(jī)現(xiàn)象的最好工具。但是,隨著“云時代”的到臨,大數(shù)據(jù)受到越來越多的關(guān)注。根據(jù)研究機(jī)構(gòu)Gartner給出的定義,大數(shù)據(jù)是需要新處理模式才能有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。根據(jù)IBM提出的有關(guān)大數(shù)據(jù)的特征,它具有“5V”的特征:規(guī)模性(Volume)、高速性(Velocity)、多樣性(Variety)、低價值密度性(Value)、真實性(Veracity)。而隨著大數(shù)據(jù)大規(guī)模的被廣泛使用,不僅僅很多學(xué)者和研究機(jī)構(gòu)也開始關(guān)注這個問題,各國政府以及企業(yè)也非常重視大數(shù)據(jù)的挖掘工作。大數(shù)據(jù)所隱藏的價值信息不但成為很多行業(yè)贏得競爭的關(guān)鍵,還對國家的穩(wěn)定發(fā)展具有重大的戰(zhàn)略意義。為此,李克強(qiáng)總理在2015年9月簽批《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》,綱要明確提出在未來5到10年推動大數(shù)據(jù)的發(fā)展和應(yīng)用。[1]
但是,大數(shù)據(jù)的數(shù)據(jù)特征使得傳統(tǒng)的統(tǒng)計學(xué)方法不一定再使用,傳統(tǒng)的統(tǒng)計學(xué)理論需要更新。因此,與之相對應(yīng)的《概率論》課程的教學(xué)也需要進(jìn)行改革。
大數(shù)據(jù)給統(tǒng)計學(xué)帶來了新的機(jī)遇,但也帶來了一些新的挑戰(zhàn),一些經(jīng)典的統(tǒng)計學(xué)分析在大數(shù)據(jù)中已經(jīng)完全失效。因此,在大數(shù)據(jù)時代背景下,傳統(tǒng)統(tǒng)計學(xué)應(yīng)該如何發(fā)展?相關(guān)統(tǒng)計學(xué)課程又應(yīng)當(dāng)做怎樣的教學(xué)改革,這都是統(tǒng)計學(xué)家與教學(xué)工作者很關(guān)注的問題。
1.相關(guān)性與因果性。舍恩伯格等在《大數(shù)據(jù)時代》中提到:“相關(guān)關(guān)系比因果關(guān)系更好地了解這個世界”,這種區(qū)別于傳統(tǒng)數(shù)學(xué)研究“因果關(guān)系”的現(xiàn)象引起了更多國外學(xué)者的關(guān)注。數(shù)據(jù)之間的相關(guān)關(guān)系的研究,使得人們對于世界的認(rèn)識有一個更為開放的信息系統(tǒng)視覺,對事物的認(rèn)識不再局限于封閉的領(lǐng)域。比如淘寶每年在11.11日舉辦的光棍節(jié)大促銷活動,淘寶官網(wǎng)通過hadoop數(shù)據(jù)平臺,對2011-2015年的淘寶全網(wǎng)數(shù)據(jù)分析,發(fā)現(xiàn)中國人在八大行業(yè)如時尚美妝、家電數(shù)碼、食品、服裝等方面消費較多,而且對這八大行業(yè)給出了行業(yè)發(fā)展趨勢報告。而且,通過個體的消費偏好、消費金額等數(shù)據(jù),利用相關(guān)性原理,以計算機(jī)強(qiáng)大的分析能力來尋找個體購物的最優(yōu)的關(guān)聯(lián)物。很多網(wǎng)站也涌現(xiàn)出大數(shù)據(jù)相關(guān)性的應(yīng)用成果,不需要個體自行搜索,系統(tǒng)根據(jù)歷史記錄,自動給出可視化的數(shù)據(jù)新聞。
雖然大數(shù)據(jù)分析的相關(guān)性研究的結(jié)果價值不凡,但相關(guān)性不能反應(yīng)出事物之間的本質(zhì)關(guān)系,只能反映出數(shù)據(jù)之間的關(guān)系。還有就是事物之間的相關(guān)性并不能替代事物之間的因果關(guān)系,因為基于相關(guān)分析的結(jié)果只是反映出事物之間的關(guān)聯(lián)性,說明事物間有某種相同的變化趨勢,但是事物之間可能并不存在因果關(guān)系。故如果做決策分析時,直接采用相關(guān)性的結(jié)論,可能會導(dǎo)致決策失誤。
2.總體、個體、樣本
總體、個體、樣本是統(tǒng)計學(xué)中最基本的概念,也是統(tǒng)計學(xué)中最重要的關(guān)系,幾乎所有的統(tǒng)計理論都是從這三個概念出發(fā)而發(fā)展出來的?,F(xiàn)有的統(tǒng)計學(xué)中,總體指的是具有某種共同屬性的組成的集合,個體指的是集合中的每個元素,即是符合總體屬性的個別事物,是數(shù)據(jù)的承擔(dān)者或是來源者,樣本指的是從總體中隨機(jī)抽取的每個元素組成的集合。統(tǒng)計學(xué)研究的是總體的發(fā)展規(guī)律,但由于一些客觀原因如人力、物力的限制,無法來研究總體的發(fā)展規(guī)律,就從總體中隨機(jī)抽樣出一部分樣本,通過對樣本的研究來探討出總體的發(fā)展規(guī)律。所以,在一般的統(tǒng)計學(xué)中,其研究的邏輯路線是:先確定好研究的對象,然后研究每個個體的性質(zhì),從中找出所需的變量或者研究指標(biāo),然后再抽樣獲取所需變量的具體數(shù)據(jù),進(jìn)而根據(jù)這些數(shù)據(jù)通過統(tǒng)計分析得出結(jié)論,然后對結(jié)論進(jìn)行檢驗。這種思路,很顯然是先確定總體,再由總體來確定研究所需的數(shù)據(jù)。但是,在大數(shù)據(jù)背景下,先看到的是數(shù)據(jù)而不是數(shù)據(jù)的承擔(dān)者,特別是網(wǎng)絡(luò)化時代當(dāng)中的數(shù)據(jù),根本無法得知數(shù)據(jù)的來源以及數(shù)據(jù)的基本特征,呈現(xiàn)出來的除了數(shù)據(jù)本身之外并無其他東西。這就導(dǎo)致大多數(shù)情況下直接面對全體數(shù)據(jù),原來傳統(tǒng)統(tǒng)計學(xué)中的抽樣以及統(tǒng)計理論完全失效了。[2]
舍恩伯格等在《大數(shù)據(jù)時代》中也提出,大數(shù)據(jù)的“大”不僅僅是數(shù)據(jù)體量的大,更重要的是數(shù)據(jù)結(jié)構(gòu)本身的重大改變。因此,他們在書中提出“要全體不要抽樣的”觀點。因為大數(shù)據(jù)可提供所有數(shù)據(jù)本身的信息,通過數(shù)據(jù)不但可以研究事物之間的普遍性規(guī)律,還可以具體研究個體的特征信息。但是,對舍恩伯格的“不需要樣本”的觀點,很多人持懷疑態(tài)度。因為在探索性的大數(shù)據(jù)分析中,抽樣分析仍然需要,只是功能會發(fā)生改變。而且,從動態(tài)的來看,大數(shù)據(jù)只是某個時刻的總體而已,后面時刻總要包含前面時刻的總體,那么,前面時刻的大數(shù)據(jù)也只是后面時刻大數(shù)據(jù)的一個樣本而已。所以,即使大數(shù)據(jù)的總體、樣本的關(guān)系發(fā)生了改變,但抽樣分析還是必不可少的,只是需要構(gòu)建新的方法而已。
大數(shù)據(jù)時代下,傳統(tǒng)的統(tǒng)計學(xué)思維模式發(fā)生了改變,一些統(tǒng)計理論需要構(gòu)建,新的軟件需要學(xué)習(xí)。因此,在大數(shù)據(jù)背景下,概率論的教學(xué)該怎樣進(jìn)行?這是每個數(shù)學(xué)教師所面臨的問題。
1.改變思維模式。由于大數(shù)據(jù)研究的事物對象發(fā)生了改變,直接面對全體數(shù)據(jù)本身,因此,統(tǒng)計思維模式也應(yīng)跟著變化。在大數(shù)據(jù)時代下,數(shù)據(jù)不僅僅是研究對象,還是研究的基礎(chǔ)資源,數(shù)據(jù)本身可以反映出事物之間的關(guān)系,還可以協(xié)助解決其他問題。所以,在現(xiàn)行的統(tǒng)計課堂上,需要改變統(tǒng)計思維模式。對數(shù)據(jù)的看法需要改變,從原來的研究對象來確定數(shù)據(jù)轉(zhuǎn)變成通過數(shù)據(jù)來研究事物對象。通過對數(shù)據(jù)的掌握與分析,來進(jìn)一步揭示事物的本質(zhì)關(guān)系。
2.更新教學(xué)內(nèi)容。由于大數(shù)據(jù)當(dāng)中的研究對象發(fā)生改變,抽樣的理論需要重新構(gòu)建,傳統(tǒng)數(shù)學(xué)當(dāng)中的確定性關(guān)系不再至關(guān)重要,事物之間的相關(guān)性比因果性更重要,等等這些方法與概念的重新推導(dǎo)與定義,都需要更新教學(xué)內(nèi)容。而且,在傳統(tǒng)概率論教學(xué)中,重公式推導(dǎo)輕數(shù)值計算。所以,在大數(shù)據(jù)時代下,數(shù)學(xué)的理論推導(dǎo)應(yīng)該讓步與數(shù)值計算,統(tǒng)計學(xué)課程的設(shè)定應(yīng)該更加重視應(yīng)用層面的知識,應(yīng)該培養(yǎng)學(xué)生解決實際問題的能力。
3.重視計算機(jī)技能。大數(shù)據(jù)時代下,一些傳統(tǒng)的統(tǒng)計軟件解決不了的問題,可以在新的軟件下得以實現(xiàn)。而且大數(shù)據(jù)需要的是統(tǒng)計知識與計算機(jī)技能的結(jié)合,學(xué)生除掌握基本的統(tǒng)計理論外,還應(yīng)該熟練操作計算機(jī)。運用計算機(jī)與統(tǒng)計方面的知識把數(shù)據(jù)整合在一起進(jìn)行分析,轉(zhuǎn)化成可以分析的統(tǒng)計數(shù)據(jù),并對數(shù)據(jù)的結(jié)果進(jìn)行解釋,這些都需要加強(qiáng)學(xué)生的計算機(jī)技能的培養(yǎng)。
在大數(shù)據(jù)時代下,數(shù)據(jù)比黃金還重要,但如何把這些數(shù)據(jù)轉(zhuǎn)化成所需要的知識,這還需要統(tǒng)計學(xué)的教學(xué)得到改變。因此,教師應(yīng)該針對現(xiàn)實社會人才的需求狀況,積極改革統(tǒng)計學(xué)的教學(xué),來培養(yǎng)出適應(yīng)時代發(fā)展的優(yōu)秀人才。
[1] 李小平. 概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社, 2013.
[2] 馬雙鴿,方匡南.大數(shù)據(jù)時代統(tǒng)計學(xué)發(fā)展的若干問題[J].統(tǒng)計研究,2017,1:5-11.