国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)分析與量化研究的區(qū)別與整合
——兼議教育量化研究的未來走向

2017-04-13 23:56:40汪雅霜
關(guān)鍵詞:教育學(xué)范式分析

汪雅霜,嵇 艷

(1.南京大學(xué) 教育研究院,南京 210093;2.南京醫(yī)科大學(xué) 護(hù)理學(xué)院,南京 211166)

?

大數(shù)據(jù)分析與量化研究的區(qū)別與整合
——兼議教育量化研究的未來走向

汪雅霜1,嵇 艷2

(1.南京大學(xué) 教育研究院,南京 210093;2.南京醫(yī)科大學(xué) 護(hù)理學(xué)院,南京 211166)

大數(shù)據(jù)對(duì)社會(huì)科學(xué)研究產(chǎn)生較大影響,大數(shù)據(jù)分析開始逐漸應(yīng)用于教育學(xué)等研究領(lǐng)域并取得了較好成效。隨著大數(shù)據(jù)分析在學(xué)術(shù)領(lǐng)域中的使用,人們對(duì)大數(shù)據(jù)分析和量化研究的認(rèn)識(shí)產(chǎn)生了分歧,甚至有學(xué)者將大數(shù)據(jù)分析等同于量化研究。研究表明,大數(shù)據(jù)分析不同于教育學(xué)等研究領(lǐng)域中所使用的量化研究,兩者在科學(xué)研究范式、數(shù)據(jù)獲取方式、數(shù)據(jù)分析方法等方面都有所不同。但是,大數(shù)據(jù)分析與量化研究在學(xué)術(shù)研究中可取長(zhǎng)補(bǔ)短,未來的研究可結(jié)合大數(shù)據(jù)分析和量化研究各自的特點(diǎn)進(jìn)行整合,拓寬研究的思路與空間。建議在研究范式上強(qiáng)調(diào)知識(shí)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)相統(tǒng)一,在數(shù)據(jù)獲取上強(qiáng)調(diào)結(jié)構(gòu)與非結(jié)構(gòu)、橫斷面與歷史數(shù)據(jù)相結(jié)合,在數(shù)據(jù)分析方法上強(qiáng)調(diào)統(tǒng)計(jì)推斷與數(shù)據(jù)挖掘相融合。

大數(shù)據(jù)分析;量化研究;教育研究;社會(huì)科學(xué)研究

一 學(xué)術(shù)研究已步入大數(shù)據(jù)時(shí)代

隨著互聯(lián)網(wǎng)、云計(jì)算以及物聯(lián)網(wǎng)等計(jì)算方法和信息技術(shù)的快速發(fā)展,數(shù)據(jù)獲取、儲(chǔ)存與分析功能獲得極大突破。大數(shù)據(jù)(Big Data)逐漸進(jìn)入公眾的視野,大數(shù)據(jù)分析(Big Data Analytics)應(yīng)用的范圍也越來越廣泛。大數(shù)據(jù)開始改變?nèi)藗兊恼J(rèn)知與生活方式,對(duì)社會(huì)各界帶來沖擊與挑戰(zhàn),對(duì)學(xué)術(shù)研究也產(chǎn)生了極大的影響。在教育學(xué)等研究領(lǐng)域,雖然有學(xué)者對(duì)大數(shù)據(jù)持懷疑和批評(píng)態(tài)度[1,2],但大數(shù)據(jù)的倡導(dǎo)者認(rèn)為,大數(shù)據(jù)克服了以往傳統(tǒng)“小數(shù)據(jù)”量化研究代表性差、主觀性強(qiáng)、準(zhǔn)確性低等缺陷,使研究的結(jié)果更加客觀中立、規(guī)范科學(xué)。更有大數(shù)據(jù)的崇拜者由于大數(shù)據(jù)強(qiáng)大的數(shù)據(jù)基礎(chǔ)及其蘊(yùn)含的信息和知識(shí),對(duì)傳統(tǒng)量化研究干脆予以全面顛覆,更斷言數(shù)據(jù)科學(xué)家將會(huì)取代社會(huì)科學(xué)家[3]。眾所周知,量化研究自出現(xiàn)于社會(huì)科學(xué)研究領(lǐng)域以來,為經(jīng)濟(jì)學(xué)、社會(huì)學(xué)等學(xué)科注入了全新的生機(jī)與活力。近幾年來,我國(guó)教育學(xué)研究領(lǐng)域也開始大量使用量化研究來對(duì)相關(guān)教育問題進(jìn)行分析。量化研究通過把研究對(duì)象“量化”為數(shù)據(jù),用“數(shù)據(jù)說話”,使得教育研究真正開始進(jìn)入“科學(xué)”研究的范疇,推進(jìn)了教育研究科學(xué)化的進(jìn)程。量化研究離不開數(shù)據(jù),而大數(shù)據(jù)分析則把數(shù)據(jù)的作用發(fā)揮到了極致,因此有學(xué)者認(rèn)為,借助大數(shù)據(jù)分析的推力,教育學(xué)等社會(huì)科學(xué)將脫下“準(zhǔn)科學(xué)”的外衣,真正進(jìn)入“科學(xué)”的殿堂[4]。那么,大數(shù)據(jù)分析就是量化研究嗎?大數(shù)據(jù)分析與量化研究又有怎樣的聯(lián)系和區(qū)別呢?如何結(jié)合大數(shù)據(jù)分析與量化研究的特點(diǎn)來開展教育研究呢?

二 大數(shù)據(jù)與大數(shù)據(jù)分析的內(nèi)涵與定義

(一)大數(shù)據(jù)的內(nèi)涵

有學(xué)者將大數(shù)據(jù)定義為“龐大、多樣化、復(fù)雜的、縱向的和/或分布式的數(shù)據(jù)集,由工具、傳感器、網(wǎng)絡(luò)互動(dòng)、電子郵件、視頻、點(diǎn)擊數(shù)據(jù)流和/或其它現(xiàn)在以及將來可使用的數(shù)字資源”[5]。維基百科定義大數(shù)據(jù)為“足夠龐大和復(fù)雜的數(shù)據(jù)集,以至于現(xiàn)有的數(shù)據(jù)管理工具或傳統(tǒng)的數(shù)據(jù)處理應(yīng)用程序難以處理”。美國(guó)高德納公司(Gartner Group)認(rèn)為“大數(shù)據(jù)”是需要新處理模式才能具有更強(qiáng)的洞察發(fā)現(xiàn)力、流程優(yōu)化能力和決策力來適應(yīng)海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。以上幾種表述雖然不盡相同,但對(duì)大數(shù)據(jù)普遍的共識(shí)是:大數(shù)據(jù)的數(shù)據(jù)量龐大、種類繁多、數(shù)據(jù)復(fù)雜以致傳統(tǒng)工具難于處理。數(shù)據(jù)蘊(yùn)含可供分析的信息,可創(chuàng)造知識(shí)和價(jià)值。目前,學(xué)術(shù)界一般用“4V”概括大數(shù)據(jù)的特征:即種類多(Variety)、速度快(Velocity)、容量大(Volume)、價(jià)值密度低(Value)。大數(shù)據(jù)的意義就在于,可供人類分析和使用的數(shù)據(jù)量在大增,通過對(duì)大數(shù)據(jù)的整合、交換、分析和挖掘,可以發(fā)現(xiàn)新的知識(shí)、創(chuàng)造新的價(jià)值,帶來“大知識(shí)”、“大利潤(rùn)”、“大科技”和“大發(fā)展”[6]54-58。

(二)大數(shù)據(jù)分析的定義

大數(shù)據(jù)引起了人們的廣泛關(guān)注和高度重視,但大數(shù)據(jù)的“4V”特征決定了大數(shù)據(jù)分析才是其核心議題。如何有效處理和分析大數(shù)據(jù),進(jìn)行數(shù)據(jù)的去冗存精,從大數(shù)據(jù)中挖掘出有用的信息、發(fā)展新的知識(shí)、產(chǎn)生行動(dòng)決策的智慧,才是大數(shù)據(jù)的關(guān)鍵。那么,何謂大數(shù)據(jù)分析呢?先從范式層面來看,有學(xué)者認(rèn)為大數(shù)據(jù)分析是信息時(shí)代的產(chǎn)物及顯著特征,并構(gòu)成了信息時(shí)代復(fù)雜性的基礎(chǔ)。知識(shí)本質(zhì)上不再是傳統(tǒng)意義上的得到辯護(hù)的真信念集合,網(wǎng)絡(luò)本身成為了知識(shí)的本體。因此,知識(shí)發(fā)現(xiàn)的方式和科學(xué)研究的范式改變,不再是預(yù)設(shè)和檢驗(yàn)?zāi)撤N假設(shè),而是直接通過數(shù)據(jù)對(duì)復(fù)雜社會(huì)領(lǐng)域中的動(dòng)態(tài)變化的法則進(jìn)行分析和處理[7]。再?gòu)募夹g(shù)方法來看,有學(xué)者認(rèn)為大數(shù)據(jù)分析即根據(jù)數(shù)據(jù)生成機(jī)制,廣泛采集、存儲(chǔ)并清洗數(shù)據(jù),以大數(shù)據(jù)分析模型為依據(jù),在大數(shù)據(jù)分析平臺(tái)的有力支撐下,運(yùn)用云計(jì)算技術(shù)來調(diào)度計(jì)算分析資源,最終挖掘出隱藏在大數(shù)據(jù)背后的模式或規(guī)律的數(shù)據(jù)分析過程[8]。大數(shù)據(jù)分析的運(yùn)用主要集中于政界與工業(yè)界,用于發(fā)現(xiàn)政治或商業(yè)等領(lǐng)域的運(yùn)行規(guī)律,使決策者可以在數(shù)據(jù)所形成的證據(jù)基礎(chǔ)上推進(jìn)決策的科學(xué)性,使決策更具權(quán)威性和準(zhǔn)確性。目前,隨著信息技術(shù)與教育的深度融合,大數(shù)據(jù)分析也開始逐漸應(yīng)用于教育學(xué)研究領(lǐng)域。大數(shù)據(jù)分析可以描繪出學(xué)生的學(xué)習(xí)路線圖,監(jiān)測(cè)學(xué)生學(xué)習(xí)的全過程,從而為學(xué)校提升學(xué)生學(xué)習(xí)質(zhì)量提供科學(xué)的依據(jù)。

三 大數(shù)據(jù)分析與量化研究的比較

(一)量化研究的發(fā)展歷程

大數(shù)據(jù)分析基于前所未有的海量數(shù)據(jù)。那么,大數(shù)據(jù)分析就是量化研究嗎?大數(shù)據(jù)分析與教育學(xué)等研究領(lǐng)域中所使用的量化研究有什么關(guān)系呢?要回答這兩個(gè)問題,還需要追溯量化研究的起源與發(fā)展,闡明量化研究的本質(zhì),進(jìn)而揭示兩者的關(guān)系。18世紀(jì)30年代,法國(guó)著名的哲學(xué)家孔德(Auguste Comte)提出實(shí)證主義(Positivism)概念,主張用自然科學(xué)方法研究社會(huì)現(xiàn)象。實(shí)證主義承襲了經(jīng)驗(yàn)主義哲學(xué)的思想,強(qiáng)調(diào)感覺經(jīng)驗(yàn),反對(duì)傳統(tǒng)神學(xué)和形而上學(xué),認(rèn)為唯有科學(xué)方法才是人類認(rèn)識(shí)客觀世界的手段??椎碌脑缙趯?shí)證主義思想奠定了量化研究的方法論基礎(chǔ)。隨后,涂爾干(Emile Durkheim)率先踐行了孔德的實(shí)證主義社會(huì)學(xué),認(rèn)為社會(huì)科學(xué)研究在于尋找普遍性的規(guī)律和事物之間的因果關(guān)系,并且以“社會(huì)整合度”分析了自殺行為的原因,證明了在社會(huì)科學(xué)研究中運(yùn)用量化的可能性,開創(chuàng)了量化研究的先河。

除了受哲學(xué)思潮的影響,自然科學(xué)的巨大進(jìn)步也激發(fā)了人們運(yùn)用自然科學(xué)方法研究社會(huì)現(xiàn)象的熱情,形成了一股列寧稱之為“從自然科學(xué)奔向社會(huì)科學(xué)的強(qiáng)大潮流”[9]5。尤其是上世紀(jì)50年代以后逐步形成的當(dāng)代科學(xué)技術(shù)革命,將這股強(qiáng)大潮流又推向了新的高潮,使社會(huì)科學(xué)研究中一直存在的科學(xué)主義方法論思潮更加根深蒂固。正如賴特·米爾斯(Wright Wills)所說:“在許多問題的研究中,與哲學(xué)有別的經(jīng)驗(yàn)主義方法無(wú)疑是游刃有余的?!盵10]73

如上所述,教育學(xué)等研究領(lǐng)域中所使用的量化研究是在批判神學(xué)與形而上學(xué)的基礎(chǔ)上產(chǎn)生的,因后兩者的本體論已超出了人類理性認(rèn)知的能力[2]。因此,量化研究是以客觀主義認(rèn)識(shí)論為基礎(chǔ)的,通過統(tǒng)計(jì)學(xué)測(cè)量獲得數(shù)字資料,尋求能解釋社會(huì)現(xiàn)象與行為的普遍法則。強(qiáng)調(diào)在一個(gè)價(jià)值無(wú)涉、邏輯的還原論和決定論的理論框架下,測(cè)量與分析變量之間的因果關(guān)系[11]。量化(quantization)是以“量”的形式收集和分析經(jīng)驗(yàn)材料。量是一個(gè)基本的數(shù)學(xué)概念,以數(shù)為基礎(chǔ),作為客觀事物之間區(qū)分異同的一種屬性,是事物可以用數(shù)來表示的規(guī)定性。通過測(cè)量可獲得量的大小,測(cè)量將量與作為標(biāo)準(zhǔn)的同類量進(jìn)行比較。因此,量的表達(dá)是由數(shù)字構(gòu)成的數(shù)的集合以及與物質(zhì)集合相關(guān)的計(jì)量單位組成[12]。

(二)大數(shù)據(jù)分析與量化研究的不同

針對(duì)大數(shù)據(jù)分析與量化研究的考察,我們不難發(fā)現(xiàn)兩者的不同,大數(shù)據(jù)分析不能等同于教育學(xué)等研究領(lǐng)域中使用的量化研究。首先,在研究的方法論層面上,大數(shù)據(jù)分析代表了信息時(shí)代一種新的復(fù)雜性的科學(xué)研究范式或知識(shí)發(fā)現(xiàn)方式。不同于量化研究傳統(tǒng)的科學(xué)研究范式的特征,基于大數(shù)據(jù)的科學(xué)研究具有數(shù)據(jù)密集型和數(shù)據(jù)驅(qū)動(dòng)型的典型特征,與傳統(tǒng)科學(xué)研究的思維體系有較大的差異[7]。其次,在具體的方法層面上,大數(shù)據(jù)分析遵循的是量化研究的“量化”思路,但“量化”的本質(zhì)發(fā)生了變化。教育學(xué)等研究領(lǐng)域中的量化研究的“量化”是測(cè)量研究對(duì)象以轉(zhuǎn)化為以數(shù)為基礎(chǔ)的量。而大數(shù)據(jù)分析是基于已有生成的數(shù)據(jù),包括數(shù)字形式的數(shù)據(jù),也包括圖形、表格、文字等半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),以量化的思想對(duì)所有數(shù)據(jù)進(jìn)行結(jié)構(gòu)化的轉(zhuǎn)化。最后,在方法程序和操作方式上,大數(shù)據(jù)分析與量化研究也有所不同。量化研究使用的是傳統(tǒng)的基于統(tǒng)計(jì)學(xué)原理的數(shù)據(jù)處理與分析方法,而大數(shù)據(jù)分析則采用基于數(shù)據(jù)庫(kù)原理和計(jì)算機(jī)技術(shù)的數(shù)據(jù)挖掘和分析技術(shù)。綜上所述,大數(shù)據(jù)分析已經(jīng)不再是傳統(tǒng)意義上的、基于小數(shù)據(jù)思想的量化研究。

四 大數(shù)據(jù)分析與量化研究的具體區(qū)別

那么,教育學(xué)等研究領(lǐng)域的量化研究與大數(shù)據(jù)分析具體有何區(qū)別?雖然兩者都是以數(shù)據(jù)為基礎(chǔ)進(jìn)行分析,都試圖通過數(shù)據(jù)理解和把握人類社會(huì),但是在科學(xué)研究范式、數(shù)據(jù)獲取方式、數(shù)據(jù)分析方法等方面都有了較大差別。

(一)科學(xué)研究范式不同

教育學(xué)等研究領(lǐng)域使用的量化研究是實(shí)證主義研究范式指導(dǎo)下的具體研究方法,首先遵循傳統(tǒng)科學(xué)研究“提出假設(shè)——構(gòu)建模型——收集數(shù)據(jù)——驗(yàn)證假設(shè)”的基本研究路徑,也就是基于問題收集數(shù)據(jù),并通過實(shí)驗(yàn)、觀察、調(diào)查等方法來處理研究對(duì)象。其次,量化研究收集的數(shù)據(jù)來自經(jīng)抽樣得到的、假設(shè)能代表總體的樣本。因此,量化研究在統(tǒng)計(jì)分析時(shí)存在由樣本推斷總體的統(tǒng)計(jì)思想。而基于大數(shù)據(jù)的分析是通過對(duì)“總體”數(shù)據(jù)的分析與挖掘來發(fā)現(xiàn)知識(shí)。在大數(shù)據(jù)分析中,數(shù)據(jù)被認(rèn)為是“全樣本數(shù)據(jù)”,不存在統(tǒng)計(jì)推斷的思想,數(shù)據(jù)分析路徑是直接從總體數(shù)據(jù)中發(fā)現(xiàn)規(guī)律并預(yù)測(cè)趨勢(shì),加以歸納總結(jié)形成結(jié)論,即“發(fā)現(xiàn)—總結(jié)”。挖掘數(shù)據(jù)不是為了科學(xué)驗(yàn)證,而是要發(fā)現(xiàn)數(shù)據(jù)背后隱藏的人類態(tài)度或行為的規(guī)律[13]。正如數(shù)據(jù)庫(kù)研究專家吉姆·格雷(Jim Gray)指出的兩者間的區(qū)別,大數(shù)據(jù)分析的典型特征是“數(shù)據(jù)驅(qū)動(dòng)”,區(qū)別于傳統(tǒng)的由研究者提出問題或假設(shè)、構(gòu)建框架、假設(shè)檢驗(yàn)的“知識(shí)驅(qū)動(dòng)”路徑[14]。大數(shù)據(jù)分析的認(rèn)識(shí)論基礎(chǔ)是直接利用產(chǎn)生于數(shù)據(jù)中的規(guī)律和趨勢(shì),而非通過數(shù)據(jù)分析檢驗(yàn)結(jié)論。這也意味著大數(shù)據(jù)分析與教育學(xué)等研究領(lǐng)域使用的量化研究所遵循的科學(xué)研究范式不同。

(二)數(shù)據(jù)獲取方式不同

教育學(xué)等研究領(lǐng)域使用的量化研究中的數(shù)據(jù)是研究者為了特定研究目的,主動(dòng)運(yùn)用抽樣技術(shù)從總體中抽取出具有代表性的樣本,再通過實(shí)驗(yàn)、觀察、調(diào)查等方法收集的,其數(shù)據(jù)具有有限性、穩(wěn)定性、不可擴(kuò)充性等特征。而大數(shù)據(jù)具有復(fù)雜性、不確定性、涌現(xiàn)性等特征[13],主要通過網(wǎng)絡(luò)技術(shù)生成,包含互聯(lián)網(wǎng)、智能設(shè)備、醫(yī)療設(shè)備、視頻監(jiān)控、移動(dòng)設(shè)備等,除少量數(shù)據(jù)可以被公開共享以外,絕大多數(shù)都掌握在政府與企業(yè)手中,研究人員難以獲得。與傳統(tǒng)數(shù)據(jù)在研究中的工具性和依據(jù)性不同,大數(shù)據(jù)分析先有數(shù)據(jù),再通過對(duì)數(shù)據(jù)的結(jié)構(gòu)化與全面分析獲得有價(jià)值的結(jié)論,數(shù)據(jù)本身已經(jīng)上升到蘊(yùn)含豐富的有待開發(fā)的信息和知識(shí)的資源地位[12]。盡管傳統(tǒng)數(shù)據(jù)的客觀性和真實(shí)性等被大數(shù)據(jù)擁護(hù)者們所詬病,但大數(shù)據(jù)也并非無(wú)所不能,也有其先天不足之處。首先,由于大數(shù)據(jù)的隨機(jī)生成特點(diǎn),可能形成眾多沒有價(jià)值的數(shù)據(jù),而有價(jià)值的信息可能被掩蓋,即大數(shù)據(jù)“價(jià)值密度低”的特點(diǎn)。其次,大數(shù)據(jù)也是基于一定條件下的總體數(shù)據(jù),而非隨機(jī)抽取的能代表總體的個(gè)體總和,數(shù)據(jù)的代表性可能并不如量化研究。例如,研究中來自互聯(lián)網(wǎng)的數(shù)據(jù),因網(wǎng)絡(luò)用戶往往是特定的用戶群體,而不能代表所有人群。第三,教育學(xué)等研究領(lǐng)域使用的量化研究注重使用問卷管理等技術(shù)以確保數(shù)據(jù)盡可能真實(shí)準(zhǔn)確,而大數(shù)據(jù)在產(chǎn)生、管理和使用過程中,由于某些主觀因素,例如受利益驅(qū)使的人為操控,在可信度方面也有不盡如人意之處。

(三)數(shù)據(jù)分析方法不同

在量化研究的數(shù)據(jù)分析階段,對(duì)數(shù)據(jù)的處理依賴基于數(shù)學(xué)原理和定律、以概率論為基礎(chǔ)的統(tǒng)計(jì)學(xué)方法。由于研究者難以獲取總體數(shù)據(jù),由此催生了由樣本推斷總體的思想,包括一系列抽樣技術(shù)和參數(shù)估計(jì)方法。因此,統(tǒng)計(jì)學(xué)的主要任務(wù)就是要克服非絕對(duì)隨機(jī)取樣引起的變異,運(yùn)用分析方法通過對(duì)樣本數(shù)據(jù)的統(tǒng)計(jì)描述和推斷而獲得對(duì)研究對(duì)象總體的認(rèn)識(shí)。而大數(shù)據(jù)的出現(xiàn),因數(shù)據(jù)量之龐大、類型之復(fù)雜、發(fā)展之快速,使得數(shù)據(jù)分析僅靠統(tǒng)計(jì)學(xué)的一己之力已經(jīng)難以實(shí)現(xiàn)。統(tǒng)計(jì)學(xué)必須加入以計(jì)算機(jī)科學(xué)、數(shù)學(xué)、邏輯學(xué)、系統(tǒng)科學(xué)、行為科學(xué)等眾多學(xué)科為基礎(chǔ)的數(shù)據(jù)科學(xué)中[13],才能解決大數(shù)據(jù)分析的問題。為克服統(tǒng)計(jì)方法計(jì)算能力有限的問題,大數(shù)據(jù)分析需要依托云計(jì)算,主要依賴基于計(jì)算機(jī)科學(xué)的數(shù)據(jù)挖掘技術(shù),包括機(jī)器學(xué)習(xí),通過各種算法從數(shù)據(jù)中挖掘信息,如發(fā)現(xiàn)相關(guān)性規(guī)律、預(yù)測(cè)分析等,這與教育學(xué)等研究領(lǐng)域的量化研究所使用的分析方法不同。

五 大數(shù)據(jù)分析與量化研究的整合

大數(shù)據(jù)分析不同于教育學(xué)等研究領(lǐng)域中使用的量化研究,但大數(shù)據(jù)分析的興起與發(fā)展并不意味著量化研究方法的式微。因?yàn)槟壳暗募夹g(shù)限制無(wú)法完善大數(shù)據(jù)本身的缺陷,例如大數(shù)據(jù)更多的是記錄人的行為,而較少兼顧主觀態(tài)度和價(jià)值觀。因此,大數(shù)據(jù)分析不能取代抽樣調(diào)查、實(shí)驗(yàn)研究等量化研究在教育學(xué)等研究領(lǐng)域中的地位,但大數(shù)據(jù)分析為量化研究開拓了更廣闊的研究領(lǐng)域。兩者在知識(shí)發(fā)現(xiàn)和數(shù)據(jù)類型等方面存在互補(bǔ)。一方面,量化研究的“小數(shù)據(jù)”忌諱“數(shù)據(jù)驅(qū)動(dòng)”,強(qiáng)調(diào)基于理論的假設(shè)驗(yàn)證,而大數(shù)據(jù)分析恰恰利用了“大數(shù)據(jù)”,旨在通過數(shù)據(jù)發(fā)現(xiàn)知識(shí);另一方面,大數(shù)據(jù)可以彌補(bǔ)量化研究“小數(shù)據(jù)”的不足,擴(kuò)大數(shù)據(jù)的規(guī)模并豐富數(shù)據(jù)的類型。因此,積極應(yīng)對(duì)大數(shù)據(jù)帶來的機(jī)遇與挑戰(zhàn),整合大數(shù)據(jù)分析與量化研究,充分利用大數(shù)據(jù)的優(yōu)勢(shì),在教育學(xué)等研究領(lǐng)域中開展更好的量化研究,這是研究者值得思考的議題,也是教育量化研究的未來走向。

目前,在教育學(xué)等研究領(lǐng)域中使用大數(shù)據(jù)分析來開展研究已成為一種趨勢(shì),大量的研究人員開始利用大數(shù)據(jù)分析技術(shù),在研究中增加新維度、拓展新空間。近幾年來,一些學(xué)者進(jìn)行了積極嘗試,例如復(fù)旦大學(xué)的研究者利用慕課平臺(tái)上的中文課程“大數(shù)據(jù)與信息傳播”后臺(tái)點(diǎn)擊行為大數(shù)據(jù),分析了四種視頻風(fēng)格及六種PPT特征,并對(duì)分析進(jìn)行評(píng)分者一致性的檢驗(yàn),將視頻特征的分析結(jié)果與跳轉(zhuǎn)行為頻率之間的關(guān)系進(jìn)行比對(duì)[15]。那么,具體而言,教育學(xué)等研究領(lǐng)域的研究者在大數(shù)據(jù)背景下如何開展更好的量化研究呢?根據(jù)上文所述,量化研究與大數(shù)據(jù)分析主要在科學(xué)研究范式、數(shù)據(jù)獲取方式、數(shù)據(jù)分析方法三個(gè)方面存在區(qū)別,這三個(gè)方面也是開展科學(xué)研究最為關(guān)鍵的環(huán)節(jié)。因此,以下也將從這三個(gè)方面進(jìn)行闡述。

(一)科學(xué)研究范式:強(qiáng)調(diào)知識(shí)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)相統(tǒng)一

大數(shù)據(jù)分析重構(gòu)了知識(shí)的構(gòu)成問題和研究過程,形成了研究與實(shí)踐范式的轉(zhuǎn)換,表現(xiàn)為知識(shí)驅(qū)動(dòng)轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng),從知識(shí)發(fā)現(xiàn)轉(zhuǎn)向某種意義的智慧獲取[16]。大數(shù)據(jù)分析代表了信息時(shí)代一種新的復(fù)雜性的研究范式,新的研究范式形成新的研究思路與方法,不必拘泥于傳統(tǒng)的基于理論來建構(gòu)模型,只需依賴大量數(shù)據(jù)就能發(fā)現(xiàn)復(fù)雜的關(guān)系與結(jié)構(gòu),創(chuàng)造出新的知識(shí)。大數(shù)據(jù)分析拓寬了量化研究的視野,盡管有不少學(xué)者將大數(shù)據(jù)分析思維理解為只需要探究一般的相關(guān)關(guān)系,即幫助我們?cè)诖罅康臄?shù)據(jù)中,挖掘出事物之間的相關(guān)關(guān)系。但基于大數(shù)據(jù)的量化研究并不能止步于相關(guān)分析,而要以相關(guān)分析為基礎(chǔ)來尋找相關(guān)聯(lián)的變量,再深入科學(xué)理論從而發(fā)現(xiàn)更為復(fù)雜的因果機(jī)制。正如有學(xué)者指出,大數(shù)據(jù)時(shí)代有助于發(fā)現(xiàn)隱藏的“歷史事實(shí)”,但決定或影響大數(shù)據(jù)資料背后一系列“歷史事實(shí)”所構(gòu)成的整體性現(xiàn)象中的錯(cuò)綜復(fù)雜關(guān)系的因果機(jī)制,仍然依賴于運(yùn)用科學(xué)理論不辭余力地去探索,唯有對(duì)因果機(jī)制的梳理解決,才能更好彰顯大數(shù)據(jù)對(duì)量化研究的貢獻(xiàn)[17]。因此,在知識(shí)驅(qū)動(dòng)模式產(chǎn)生的理論基礎(chǔ)上,實(shí)現(xiàn)“知識(shí)驅(qū)動(dòng)”與“數(shù)據(jù)驅(qū)動(dòng)”的融合是大數(shù)據(jù)時(shí)代教育學(xué)等相關(guān)學(xué)科研究范式轉(zhuǎn)變的必然趨勢(shì)。在相關(guān)理論的指導(dǎo)下,研究者可以結(jié)合現(xiàn)實(shí)需求與大數(shù)據(jù)中的特定數(shù)據(jù),改變先有數(shù)據(jù)后有分析的邏輯順序,先凝練出大致的研究方向并提出理論假設(shè),再利用大數(shù)據(jù)平臺(tái)挖掘數(shù)據(jù),從而更好地驗(yàn)證假設(shè)和解決現(xiàn)實(shí)問題,研究結(jié)果也可以進(jìn)一步補(bǔ)充理論的發(fā)展。比如,有學(xué)者發(fā)現(xiàn)在線學(xué)習(xí)領(lǐng)域的相關(guān)研究大部分集中于在線學(xué)習(xí)資源建設(shè)與教學(xué)設(shè)計(jì)等方面,卻忽略了在線學(xué)習(xí)中學(xué)生情緒的測(cè)量。因此,江蘇師范大學(xué)的學(xué)者們基于情緒測(cè)量理論,采取大數(shù)據(jù)的一般處理流程,綜合網(wǎng)絡(luò)爬蟲、視頻監(jiān)控、情感識(shí)別、可穿戴設(shè)備、文本挖掘等大數(shù)據(jù)分析技術(shù)等來構(gòu)建在線學(xué)習(xí)情緒測(cè)量模型?;诖髷?shù)據(jù)的在線學(xué)習(xí)情緒測(cè)量模型強(qiáng)調(diào)“知識(shí)驅(qū)動(dòng)”與“數(shù)據(jù)驅(qū)動(dòng)”的融合。模型包括應(yīng)用層、技術(shù)層和數(shù)據(jù)層,根據(jù)其功能劃分為四個(gè)模塊——用戶數(shù)據(jù)模塊、反饋交互模塊、情緒集成模塊以及分析診斷模塊。該模型旨在解決在線學(xué)習(xí)中缺少情感交流的問題,可提高在線學(xué)習(xí)者加強(qiáng)學(xué)習(xí)過程中的情感交互,提升學(xué)習(xí)者在線學(xué)習(xí)的興趣,使學(xué)習(xí)者的積極情緒得以激活以及在線學(xué)習(xí)效率得以大幅度提升[18]。

(二)數(shù)據(jù)獲取方式:強(qiáng)調(diào)結(jié)構(gòu)與非結(jié)構(gòu)、橫斷面與歷史數(shù)據(jù)相結(jié)合

目前,教育學(xué)等研究領(lǐng)域中使用的量化研究以分析結(jié)構(gòu)化數(shù)據(jù)為主,對(duì)于內(nèi)涵豐富的非結(jié)構(gòu)化數(shù)據(jù)并沒有非常適切的分析方法。但大數(shù)據(jù)分析技術(shù)對(duì)于數(shù)據(jù)結(jié)構(gòu)的要求并不像量化研究那樣高,人們?cè)诨ヂ?lián)網(wǎng)上留下的行為習(xí)慣信息、社交信息、地理位置信息、偏好信息等各方面的信息都能實(shí)時(shí)進(jìn)行處理,全方位的描繪出每一個(gè)個(gè)體的個(gè)性化特征[19]。因此,量化研究若能利用大數(shù)據(jù)平臺(tái),實(shí)現(xiàn)結(jié)構(gòu)化與非結(jié)構(gòu)化資料相統(tǒng)一,在大數(shù)據(jù)中直接獲取并篩選出與研究問題相契合的變量,那么量化研究就會(huì)如虎添翼,大大節(jié)省數(shù)據(jù)采集與清洗過程中的人力成本和時(shí)間成本。另外,除了反映當(dāng)下狀態(tài)的橫斷面數(shù)據(jù),歷史數(shù)據(jù)的收集是大數(shù)據(jù)研究的優(yōu)勢(shì)。即便傳統(tǒng)量化研究也可以收集縱向的歷史數(shù)據(jù),但與信息時(shí)代的大數(shù)據(jù)相比是極為有限的。大規(guī)模的歷史數(shù)據(jù)有助于將傳統(tǒng)的量化研究置于更廣闊的時(shí)間與空間維度下,幫助研究者理解數(shù)據(jù)的歷史背景與社會(huì)制度環(huán)境,挖掘清楚“因”導(dǎo)致“果”的關(guān)系鏈條與傳導(dǎo)機(jī)制[20]。因此,利用大數(shù)據(jù)平臺(tái),從中獲取半結(jié)構(gòu)化與非結(jié)構(gòu)化的數(shù)據(jù)以及豐富的歷史數(shù)據(jù),是當(dāng)前教育學(xué)等相關(guān)領(lǐng)域研究者利用大數(shù)據(jù)進(jìn)行量化研究的可行途徑。比如,2011年,哈佛大學(xué)、麻省理工學(xué)院、谷歌研究團(tuán)隊(duì)與大英百科全書的學(xué)者,在國(guó)際頂尖期刊《科學(xué)》上發(fā)表了題為《使用百萬(wàn)數(shù)字化書籍的文化量化研究》的論文。該項(xiàng)研究是借助大數(shù)據(jù)平臺(tái)獲取豐富歷史數(shù)據(jù),實(shí)現(xiàn)結(jié)構(gòu)化與非結(jié)構(gòu)化資料相統(tǒng)一的典型案例。研究團(tuán)隊(duì)借助谷歌圖書的海量數(shù)字化資料,分析了公元1500年到2000年間500多萬(wàn)本書籍高達(dá)5000多億單詞的語(yǔ)料庫(kù)。通過在語(yǔ)料庫(kù)中對(duì)關(guān)鍵詞的使用頻率變化進(jìn)行分析,可以展示500年來人類文化發(fā)展史中或饒有興致或鮮為人知的現(xiàn)象和趨勢(shì)[21]。

(三)數(shù)據(jù)分析方法:強(qiáng)調(diào)統(tǒng)計(jì)推斷與數(shù)據(jù)挖掘相融合

量化研究與大數(shù)據(jù)分析各有所長(zhǎng)。量化研究收集數(shù)據(jù)帶有一定的目的性,是“為研究”而收集,也可以說是基于理論創(chuàng)新而“制造”數(shù)據(jù),從這個(gè)方面來說,傳統(tǒng)小數(shù)據(jù)比大數(shù)據(jù)更適合開展具有理論意義和理論突破的研究[22]。而大數(shù)據(jù)分析更擅長(zhǎng)于發(fā)現(xiàn)規(guī)律和預(yù)測(cè)趨勢(shì)。從關(guān)注的人群來看,教育學(xué)等研究領(lǐng)域中的量化研究關(guān)注個(gè)體和特定小群體的研究,而大數(shù)據(jù)分析關(guān)注總體人群的研究,從而舍棄了對(duì)個(gè)體或小群體在研究中的價(jià)值。在具體的數(shù)據(jù)分析方法層面,量化研究方法包括實(shí)驗(yàn)研究中的因果推斷、調(diào)查研究中的相關(guān)分析和回歸分析等。而大數(shù)據(jù)分析則主要依靠可視化分析、語(yǔ)義分析以及偏差分析等數(shù)據(jù)挖掘技術(shù)。大數(shù)據(jù)分析一般很難使用傳統(tǒng)意義上的因果推斷與回歸分析模型,但是考慮到大數(shù)據(jù)的海量性,如果能把基于大數(shù)據(jù)所做的數(shù)據(jù)挖掘技術(shù)與統(tǒng)計(jì)推斷技術(shù)進(jìn)行結(jié)合,就能形成具有說服力的證據(jù)鏈[23]。若能發(fā)揮兩種數(shù)據(jù)分析方法各自的特點(diǎn),促進(jìn)大數(shù)據(jù)分析與量化研究的優(yōu)勢(shì)互補(bǔ),將會(huì)大大促進(jìn)研究結(jié)果的完整性與可信度,這也是在大數(shù)據(jù)背景下教育學(xué)等相關(guān)學(xué)科開展量化研究的重要方法。比如,在關(guān)于慕課的相關(guān)研究中就可以很好地把數(shù)據(jù)挖掘技術(shù)與統(tǒng)計(jì)推斷技術(shù)相結(jié)合。目前,慕課的具體實(shí)現(xiàn)的方法就是教育數(shù)據(jù)挖掘和學(xué)習(xí)分析。學(xué)習(xí)分析是一個(gè)跨學(xué)科的研究領(lǐng)域,涉及計(jì)算機(jī)科學(xué)、信息科學(xué)、學(xué)習(xí)科學(xué)、統(tǒng)計(jì)學(xué)以及心理學(xué)等相關(guān)學(xué)科。學(xué)習(xí)分析通過監(jiān)測(cè)學(xué)生的學(xué)業(yè)表現(xiàn)來發(fā)現(xiàn)學(xué)生學(xué)習(xí)過程中的相關(guān)問題并進(jìn)行及時(shí)干預(yù)。而學(xué)習(xí)分析的重要研究工具之一就是統(tǒng)計(jì)推斷方法。教育數(shù)據(jù)挖掘更注重新的數(shù)據(jù)分析方法與模型,而學(xué)習(xí)分析則更強(qiáng)調(diào)利用已有的統(tǒng)計(jì)模型來回答影響學(xué)生學(xué)習(xí)的相關(guān)問題[24]。東北師范大學(xué)的研究者基于大數(shù)據(jù)學(xué)習(xí)分析將數(shù)據(jù)挖掘技術(shù)與統(tǒng)計(jì)推斷技術(shù)相結(jié)合來分析在線學(xué)習(xí)行為,找出影響學(xué)生學(xué)習(xí)結(jié)果的預(yù)警因素,并建立相關(guān)的學(xué)習(xí)干預(yù)模型。同時(shí),研究人員結(jié)合深度訪談與問卷調(diào)查來對(duì)模型的有效性進(jìn)行驗(yàn)證。研究結(jié)果表明干預(yù)模型能夠有效識(shí)別出有學(xué)習(xí)困難的學(xué)生,并能及時(shí)向?qū)W生發(fā)出預(yù)警信息以及提供個(gè)性化的干預(yù)措施[25]。

[1]胡弼成,王祖霖.“大數(shù)據(jù)”對(duì)教育的作用、挑戰(zhàn)及教育變革趨勢(shì)——大數(shù)據(jù)時(shí)代教育變革的最新研究進(jìn)展綜述[J].現(xiàn)代大學(xué)教育,2015,(4):98-104.

[2]楊子飛.“第三洞穴”與“數(shù)據(jù)主義”——論大數(shù)據(jù)社會(huì)科學(xué)的內(nèi)在矛盾[J].自然辯證法研究,2016,(8):63-67.

[3]閻光才.教育及社會(huì)科學(xué)研究中的數(shù)據(jù)——兼議當(dāng)前的大數(shù)據(jù)熱潮[J].北京大學(xué)教育評(píng)論,2013,(4):77-86.

[4]李國(guó)杰.大數(shù)據(jù)研究的科學(xué)價(jià)值[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2012,(9):8-15.

[5]FLORIDI L. Big data and their epistemological challenge[J].Philosophy&Technology,2012,(4):435-437.

[6]涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2012.

[7]戴潘.基于大數(shù)據(jù)的科學(xué)研究范式的哲學(xué)研究[J].哲學(xué)動(dòng)態(tài),2016,(9):105-109.

[8]官思發(fā),孟璽,李宗潔,等.大數(shù)據(jù)分析研究現(xiàn)狀,問題與對(duì)策[J].情報(bào)雜志,2015,(5):98-104.

[9]林聚任,劉玉安.社會(huì)科學(xué)研究方法[M].濟(jì)南:山東人民出版社,2004.

[10]賴特·米爾斯.社會(huì)學(xué)的想象力[M].北京:生活·讀書·新知三聯(lián)書店,2010.

[11]YILMAZ K. Comparison of quantitative and qualitative research traditions: epistemological, theoretical, and methodological differences[J].EuropeanJournalofEducation,2013,(2):311-325.

[12]劉紅,胡新和.數(shù)據(jù)革命:從數(shù)到大數(shù)據(jù)的歷史考察[J].自然辯證法,2013,(6):33-39.

[13]李金昌.大數(shù)據(jù)與統(tǒng)計(jì)新思維[J].統(tǒng)計(jì)研究,2014,(1):10-17.

[14]蔣家河,陳振華.風(fēng)險(xiǎn)傳播視角下對(duì)大數(shù)據(jù)的反思[J].青年記者,2016,(18):28-29.

[15]陳侃,周雅倩,丁妍,嚴(yán)文蕃,呂倩文.在線視頻學(xué)習(xí)投入的研究——MOOCs視頻特征和學(xué)生跳轉(zhuǎn)行為的大數(shù)據(jù)分析[J].遠(yuǎn)程教育雜志,2016,(4):35-42.

[16]方環(huán)非.大數(shù)據(jù):歷史、范式與認(rèn)識(shí)論倫理[J].浙江社會(huì)科學(xué),2015,(9):113-120.

[17]韓炯.從計(jì)量史學(xué)邁向基于大數(shù)據(jù)計(jì)算思維的新歷史學(xué)——對(duì)當(dāng)代西方史學(xué)量化研究新發(fā)展的思考[J].史學(xué)理論研究,2016,(1):65-74.

[18]晉欣泉,王林麗,楊現(xiàn)民.基于大數(shù)據(jù)的在線學(xué)習(xí)情緒測(cè)量模型構(gòu)建[J].現(xiàn)代教育技術(shù),2016,(12):5-11.

[19]大數(shù)據(jù)非結(jié)構(gòu)與半結(jié)構(gòu)化[EB/OL].(2013-09-09)[2016-11-03].http://www.enkj.com/idcnews/Article/20130909/2447.

[20]陳志武.量化歷史研究的過去與未來[J].清史研究,2016,(4):1-16.

[21]陳云松.大數(shù)據(jù)中的百年社會(huì)學(xué)——基于百萬(wàn)書籍的文化影響力研究[J].社會(huì)學(xué)研究,2015,(1):23-48.

[22]唐文方.大數(shù)據(jù)與小數(shù)據(jù):社會(huì)科學(xué)研究方法的探討[J].中山大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2015,(6):141-146.

[23]陳云松,吳青熹,黃超.大數(shù)據(jù)何以重構(gòu)社會(huì)科學(xué)[J].新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2015,(3):54-61.

[24]張羽,李越.基于MOOCs大數(shù)據(jù)的學(xué)習(xí)分析和教育測(cè)量介紹[J].清華大學(xué)教育研究,2013,(4):22-26.

[25]趙慧瓊,姜強(qiáng),趙蔚,等.基于大數(shù)據(jù)學(xué)習(xí)分析的在線學(xué)習(xí)績(jī)效預(yù)警因素及干預(yù)對(duì)策的實(shí)證研究[J].電化教育研究,2017,(1):62-69.

[責(zé)任編輯:羅銀科]

Differences and Integration Between Big Data Analytics and Quantitative Research——Future Direction of Educational Quantitative Research3

WANG Ya-shuang1,JI Yan2

(1. Institute of Education, Nanjing University, Nanjing, Jiangsu 210093;2. Nursing School, Nanjing Medical University, Nanjing, Jiangsu 211166, China)

Big data analytics has great influences on social science research and has been gradually applied in educational research. However, there are some misunderstandings on big data analytics and quantitative research. Some researchers even think big data analytics is the same as quantitative research. This paper shows that big data analytics is different from the quantitative research in scientific research paradigm, the approach to data acquisition and data analysis method. But the study also shows that it’s possible for integrating the big data analytics and quantitative research in the future educational research. It is suggested that the research paradigm of knowledge-driven and the data-driven be unified, the structure and non-structure data, the cross-sectional and historical data be combined, and the data analysis method on statistical inference and data mining be integrated.

big data analytics; quantitative research; educational research; social science research

2017-02-08

江蘇省教育科學(xué)“十二五”規(guī)劃2015年重點(diǎn)資助課題“江蘇省本科生學(xué)習(xí)投入度的實(shí)證研究”(B-a/2015/01/002)。

汪雅霜(1985—),男,湖南桃江人,教育學(xué)博士,南京大學(xué)教育研究院助理研究員,研究方向?yàn)榻逃郎y(cè)量與評(píng)價(jià)、定量研究方法; 嵇艷(1982—),女,江蘇鹽城人,教育學(xué)博士,南京醫(yī)科大學(xué)護(hù)理學(xué)院講師,研究方向?yàn)樾睦砼c教育測(cè)量、教育統(tǒng)計(jì)與評(píng)價(jià)。

G526.5

A

1000-5315(2017)04-0036-06

猜你喜歡
教育學(xué)范式分析
究教育學(xué)之理,解教育學(xué)之惑
——《教育學(xué)原理研究》評(píng)介
實(shí)踐—反思教育學(xué)文叢
以寫促讀:構(gòu)建群文閱讀教學(xué)范式
甘肅教育(2021年10期)2021-11-02 06:14:08
范式空白:《莫失莫忘》的否定之維
隱蔽失效適航要求符合性驗(yàn)證分析
孫惠芬鄉(xiāng)土寫作批評(píng)的六個(gè)范式
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
管窺西方“詩(shī)辯”發(fā)展史的四次范式轉(zhuǎn)換
電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
教育學(xué)是什么科學(xué)
天门市| 赤水市| 霍城县| 吉木萨尔县| 杭锦后旗| 娱乐| 乌恰县| 茂名市| 中西区| 吕梁市| 无棣县| 巴中市| 临泽县| 家居| 新巴尔虎左旗| 澄城县| 怀来县| 灵璧县| 项城市| 衡阳市| 沁阳市| 界首市| 密云县| 咸阳市| 兴业县| 泗阳县| 鄯善县| 金昌市| 乐山市| 合肥市| 南和县| 泸定县| 正镶白旗| 旬邑县| 河津市| 定远县| 华阴市| 阿克陶县| 通州区| 新民市| 海晏县|