記得在上大學(xué)時(shí),一位給我們講授心理學(xué)研究方法的老師曾經(jīng)說過:“學(xué)習(xí)統(tǒng)計(jì)就像是往沙漠里面澆水”。時(shí)至今日,我仿佛依然能夠感受到當(dāng)時(shí)這句話在我心中引起的那種強(qiáng)烈共鳴。沒錯(cuò),我在統(tǒng)計(jì)學(xué)習(xí)上沒少下工夫,但卻收效甚微。花了很多時(shí)間去區(qū)分那些看上去長得很像的術(shù)語,試著努力地記住每一個(gè)公式的適用范圍,幾乎是懷著畢恭畢敬的心情去演算練習(xí)題……但是,在這門課程結(jié)束不久之后,我發(fā)現(xiàn)自己對(duì)各種統(tǒng)計(jì)方法的認(rèn)識(shí)還是非常模糊。直到開始撰寫畢業(yè)設(shè)計(jì)論文的時(shí)候,我還是對(duì)數(shù)據(jù)統(tǒng)計(jì)存在畏懼感。在完成論文的過程中,我對(duì)老師的話有了新的理解:如果沙漠里面存在一片綠洲,澆進(jìn)去的水就會(huì)蒸發(fā)得慢一些,研究項(xiàng)目就是沙漠中的綠洲。
學(xué)生進(jìn)行STEM項(xiàng)目研究的過程,是學(xué)習(xí)像科學(xué)家和工程師那樣思考和行動(dòng)的過程。只有通過基本的統(tǒng)計(jì)方法對(duì)數(shù)據(jù)進(jìn)行整理和分析,才能有足夠的證據(jù)解釋和說明研究的問題,驗(yàn)證假設(shè)是否得到支持,以及圍繞某一個(gè)課題進(jìn)行深入細(xì)致的探討。從某種程度上看,數(shù)據(jù)統(tǒng)計(jì)可以算是科學(xué)研究中用于交流的“通用語言”,因此,學(xué)習(xí)和運(yùn)用數(shù)據(jù)統(tǒng)計(jì)方法,屬于科學(xué)研究中的基本方法訓(xùn)練。最近,在我翻譯《STEM項(xiàng)目學(xué)生研究手冊(cè)》(以下簡稱《研究手冊(cè)》)的相關(guān)章節(jié)時(shí),其中的數(shù)據(jù)分析和圖表展示方法介紹,給我的“沙漠”再次澆了一點(diǎn)水。也許是將高中生作為閱讀對(duì)象的緣故,這本《研究手冊(cè)》用淺顯易懂的句子解釋了統(tǒng)計(jì)學(xué)中的專業(yè)術(shù)語,跳過了枯燥公式演繹推導(dǎo)環(huán)節(jié),用實(shí)例告訴學(xué)生各種方法所適用的情況,有什么需要注意的問題。本書作者的撰文思路和語言風(fēng)格,讓我直觀地看到數(shù)據(jù)統(tǒng)計(jì)和圖表展示在STEM項(xiàng)目完成過程中的關(guān)鍵性作用。而且,如果運(yùn)用得當(dāng)?shù)脑?,它們還會(huì)使學(xué)生的項(xiàng)目變得更加出色。
我有一位朋友在大學(xué)里當(dāng)老師,他最近幾年一直在指導(dǎo)學(xué)生的畢業(yè)論文。當(dāng)我向他咨詢學(xué)生在研究過程中數(shù)據(jù)統(tǒng)計(jì)方面出現(xiàn)的問題時(shí),他很激動(dòng)地表示“有話說”,并很快給我列出了他指導(dǎo)的學(xué)生中最常見的幾個(gè)問題。當(dāng)我再次仔細(xì)閱讀《研究手冊(cè)》的相關(guān)章節(jié)時(shí),我發(fā)現(xiàn),這些常常出現(xiàn)在大學(xué)生的研究中的數(shù)據(jù)統(tǒng)計(jì)問題,在這本針對(duì)高中生的項(xiàng)目指南中就已經(jīng)提到了,并且給出了有效的解決建議。
問題1:學(xué)生對(duì)研究結(jié)果預(yù)測的主觀愿望過于強(qiáng)烈,在進(jìn)行統(tǒng)計(jì)分析時(shí),他們更喜歡那些符合自己預(yù)期的數(shù)據(jù),而對(duì)那些看上去不太“美觀”的數(shù)據(jù)結(jié)果采取選擇性地忽略,甚至非常草率地刪除或者舍棄掉。
《研究手冊(cè)》在實(shí)驗(yàn)記錄和數(shù)據(jù)分析章節(jié)中反復(fù)強(qiáng)調(diào):不要先人為主地看待你的研究和數(shù)據(jù)結(jié)果。書中還提到一些很實(shí)用的操作方法來避免這個(gè)問題。例如,永遠(yuǎn)不要在實(shí)驗(yàn)記錄本中撕頁或者刪除文本;永遠(yuǎn)不要用修正液覆蓋錯(cuò)誤和修改的地方,而是在相應(yīng)部分輕輕劃一道刪除線。當(dāng)使用電腦進(jìn)行統(tǒng)計(jì)計(jì)算時(shí),即使發(fā)現(xiàn)數(shù)據(jù)運(yùn)算結(jié)果對(duì)于你的假設(shè)沒有顯著作用,也不要輕易刪除數(shù)據(jù)。
問題2:在統(tǒng)計(jì)學(xué)課堂上,學(xué)生常把大量的時(shí)間花在對(duì)統(tǒng)計(jì)的原理和公式推導(dǎo)的學(xué)習(xí)上,對(duì)數(shù)據(jù)進(jìn)行實(shí)際操作計(jì)算的經(jīng)驗(yàn)相對(duì)較少。當(dāng)我問學(xué)生關(guān)于平均數(shù)差異檢驗(yàn)、方差分析、回歸分析的原理,大多數(shù)人都能回答上來。然而,當(dāng)我要求他們針對(duì)一些具體數(shù)據(jù),根據(jù)自己的研究假設(shè)去進(jìn)行方差分析或者回歸分析時(shí),用不了多久,他們就會(huì)跑回來問我:“老師,方差分析中的自變量可以有多個(gè)嗎?回歸分析中的自變量可以同時(shí)有多個(gè)嗎?”
正如我在前面提到的那樣,這本《研究手冊(cè)》指導(dǎo)我們有效地避免這個(gè)問題,因?yàn)樗趯懛ㄉ细鼈?cè)重于技能的實(shí)際運(yùn)用。例如在計(jì)算一組數(shù)據(jù)的標(biāo)準(zhǔn)差時(shí),有總體標(biāo)準(zhǔn)差和樣本標(biāo)準(zhǔn)差兩種方程,書中并沒有從原理上詳細(xì)剖析兩個(gè)方程的區(qū)別,只是簡單直接地告訴讀者:“標(biāo)準(zhǔn)差是一個(gè)高估值,來彌補(bǔ)犯錯(cuò)誤的可能性,STEM研究中使用樣本標(biāo)準(zhǔn)差計(jì)算方程更恰當(dāng)”
(第103頁)。對(duì)于比較復(fù)雜的推斷性統(tǒng)計(jì)問題,《研究手冊(cè)》也是采用舉重若輕的介紹方法。學(xué)生不是很難理解方差分析中自變量可以有多少個(gè)嗎?該書作者給了一個(gè)中學(xué)生很容易讀懂的例子:“在比較一個(gè)彈射器以3種不同彈力發(fā)射1顆4千克彈丸的平均距離時(shí),可以用方差分析進(jìn)行檢驗(yàn)?!保ǖ?34頁)
問題3:大多數(shù)學(xué)生在原始數(shù)據(jù)的處理方面存在欠缺。開始正式的數(shù)據(jù)統(tǒng)計(jì)之前,研究者通常需要對(duì)原始數(shù)據(jù)進(jìn)行處理,例如,缺失數(shù)據(jù)的處理,是否有特異值,是否存在錄入錯(cuò)誤,數(shù)據(jù)是否呈正態(tài)分布等。我發(fā)現(xiàn)大多數(shù)學(xué)生認(rèn)為這個(gè)環(huán)節(jié)可有可無,當(dāng)他們收集到實(shí)驗(yàn)的原始數(shù)據(jù)之后,就興致勃勃地開始進(jìn)行描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)。這時(shí)我就會(huì)問他們一個(gè)問題:你怎么判斷原始數(shù)據(jù)是否滿足正態(tài)分布?如果數(shù)據(jù)不是正態(tài)分布,做出來的方差分析會(huì)有什么后果?到這個(gè)時(shí)候,大多數(shù)學(xué)生才恍然大悟。但是,緊接著他們可能會(huì)說出一句更雷人的話:“老師,我們不知道怎么做正態(tài)分布檢驗(yàn)?!?/p>
遇到這樣的學(xué)生應(yīng)該怎么辦?《研究手冊(cè)》的作者可能已經(jīng)與這樣的學(xué)生打過交道,因?yàn)闀小懊枋鼋y(tǒng)計(jì)”一章詳細(xì)地介紹了離群值的判斷和處理方法,以避免“雷人”的問題再次出現(xiàn)。作者首先告訴學(xué)生出現(xiàn)離群值并不可怕,因?yàn)椤皩I(yè)的科學(xué)家在使用新的方法時(shí)也有可能出錯(cuò),這很常見”(第101頁)。“如果你確認(rèn)離群值的出現(xiàn)是由于自己的錯(cuò)誤、儀器故障,或者其他你知道的與離群值無關(guān)的原因?qū)е碌模敲?,你可以在?duì)數(shù)據(jù)進(jìn)行計(jì)算和分析時(shí)把它剔除掉”(第101頁)。但是,別忘了“在結(jié)果中還是要提到離群值,并且在論文的結(jié)論部分要進(jìn)行分析和解釋”(第101頁)。這才是科學(xué)研究應(yīng)有的嚴(yán)謹(jǐn)態(tài)度。作者給學(xué)生介紹了“經(jīng)驗(yàn)法則”,通過四分位距的計(jì)算結(jié)果輔助判斷某個(gè)數(shù)據(jù)是否屬于離群值。至于判斷總體數(shù)據(jù)分布是否為正態(tài),作者并沒有向高中生提出這么高的數(shù)學(xué)要求,她只是提到“當(dāng)數(shù)據(jù)呈非正態(tài)分布時(shí),集中趨勢的值可能會(huì)有變化”(第99頁),“可以從正態(tài)分布數(shù)據(jù)的平均值和標(biāo)準(zhǔn)差中推斷出數(shù)據(jù)的更多信息”(第104頁)。
問題4:缺乏制作圖表的激情。學(xué)生在進(jìn)行實(shí)驗(yàn)室數(shù)據(jù)或調(diào)查數(shù)據(jù)的統(tǒng)計(jì)分析時(shí),很多人不會(huì)使用圖表呈現(xiàn)自己的結(jié)果。例如,在描述兩個(gè)變量是否存在線性關(guān)系時(shí),大多數(shù)人只知道用相關(guān)系數(shù)或回歸系數(shù)表示,卻不會(huì)使用散點(diǎn)圖呈現(xiàn)。在描述一個(gè)變量是否隨時(shí)間變化時(shí),很多人不清楚可以用折線圖或曲線圖表示。一些學(xué)生想到了要用圖表呈現(xiàn)數(shù)據(jù)統(tǒng)計(jì)結(jié)果,但是他們只會(huì)把統(tǒng)計(jì)軟件中輸出的圖表直接拷貝到實(shí)驗(yàn)報(bào)告中,導(dǎo)致后期無法修改圖表。一些學(xué)生不會(huì)自己在文字編輯軟件中繪制圖表,更談不上制作美觀的圖表。
圖形和表格是用一種可視化的方法展現(xiàn)原始數(shù)據(jù)、描述統(tǒng)計(jì)結(jié)果和推斷統(tǒng)計(jì)結(jié)果。使用圖表的目的不僅僅是美觀,更重要的是突顯那些從研究中得到的重要發(fā)現(xiàn)。該書按照定量和定性數(shù)據(jù)兩類介紹了圖表的使用和繪制技巧,每一種圖表都輔以實(shí)例,讓學(xué)生一目了然。作者還提到了圖表的標(biāo)題、標(biāo)注和圖例使用中需要注意的一些小細(xì)節(jié),例如,“標(biāo)注必須要清楚地表現(xiàn)出圖表要展示的信息,數(shù)軸、表格的行列名稱都要有明確的詞語和單位描述”(第128頁)。
問題5:在計(jì)算完成后,不知道如何對(duì)數(shù)據(jù)結(jié)果進(jìn)行解釋。經(jīng)常會(huì)有學(xué)生來問我:“老師,我的結(jié)果計(jì)算出來了,但是我不知道應(yīng)該看哪個(gè)?有很多個(gè)F值,我應(yīng)該看哪一個(gè),是修正的還是未修正的。在修正的F值后,哪一種修正更好,F(xiàn)值顯著了,這兩個(gè)變量是什么關(guān)系?……”
學(xué)生不知道怎么解釋數(shù)據(jù)這個(gè)現(xiàn)象反映出來的問題本質(zhì)是,他們沒有搞清楚自己為什么要進(jìn)行數(shù)據(jù)統(tǒng)計(jì)。其實(shí),數(shù)據(jù)統(tǒng)計(jì)運(yùn)算不是盲目的,而是要驗(yàn)證研究結(jié)果是否支持假設(shè),從大的方面來說,是要為解決某一個(gè)問題而進(jìn)行的。《研究手冊(cè)》中給學(xué)生列出了3個(gè)問題,幫助他們審視自己的數(shù)據(jù)。這3個(gè)問題是:“數(shù)據(jù)真實(shí)地反映了什么,從數(shù)據(jù)中還能提出哪些問題?”“數(shù)據(jù)如何反映兩個(gè)變量之間的關(guān)系?”“數(shù)據(jù)能支持假設(shè)嗎f3efa7fc9b27bace0aab67d52dcb4180?”在這3個(gè)問題之下,作者從大量STEM學(xué)生項(xiàng)目經(jīng)驗(yàn)中總結(jié)出一系列關(guān)于“為什么”和“如何”的問題,幫助學(xué)生更加深入地思考自己的數(shù)據(jù)結(jié)果。最后還不忘提醒學(xué)生:“得到不支持假設(shè)的數(shù)據(jù)也是有價(jià)值的。無論如何,都不能改變假設(shè)來匹配數(shù)據(jù),或者改變數(shù)據(jù)來迎合假設(shè)!”
從研究假設(shè)出發(fā),對(duì)實(shí)驗(yàn)中收集到的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和分析,這個(gè)過程需要研究者具備足夠的耐心、細(xì)致和敏銳的觀察力。關(guān)于數(shù)據(jù)分析這個(gè)事,還有一點(diǎn)你應(yīng)該知道的是:無論多“大牌”的科學(xué)家和工程師,在某一篇研究論文中反映出來的數(shù)據(jù)分析工作量,永遠(yuǎn)比他們研究過程中實(shí)際運(yùn)算的少得多。數(shù)據(jù)分析的過程和結(jié)果,在研究論文中的結(jié)果和討論部分會(huì)用到,但是這兩個(gè)部分對(duì)結(jié)果數(shù)據(jù)使用的要求有差異。結(jié)果部分只是列數(shù)據(jù)進(jìn)行描述,而不必進(jìn)行解釋和分析;討論部分,研究者則需要對(duì)結(jié)果數(shù)據(jù)的所有特征和趨勢進(jìn)行解釋、分析和討論。
“聽到的會(huì)忘記,看到的能記住,只有真正做過才能理解”,《研究手冊(cè)》向讀者傳達(dá)的正是這樣一個(gè)基本理念?!堆芯渴謨?cè)》中結(jié)合中學(xué)生STEM項(xiàng)目實(shí)踐案例,告訴讀者對(duì)于數(shù)據(jù)做統(tǒng)計(jì)分析不是單純的數(shù)學(xué)計(jì)算,而是項(xiàng)目研究完整過程的重要環(huán)節(jié),這個(gè)環(huán)節(jié)運(yùn)用到的很多技巧和細(xì)節(jié),都是在研究過程中摸索出來的,也只有通過親自實(shí)踐才能真正地掌握。相對(duì)于其他統(tǒng)計(jì)學(xué)教程,這本《研究手冊(cè)》的寫法更加通俗易懂,貼近STEM學(xué)生項(xiàng)目的研究實(shí)際需要,我推薦用作中學(xué)生了解統(tǒng)計(jì)學(xué)的入門材料。