李瑞
(電子科技大學(xué)外國語學(xué)院,四川成都 610054)
近年來,互聯(lián)網(wǎng)用戶持續(xù)快速增長。截止到2018年,互聯(lián)網(wǎng)網(wǎng)民數(shù)量已經(jīng)達到390 億,這意味著世界上有一半以上的人口都在使用互聯(lián)網(wǎng)。根據(jù)維基百科的數(shù)據(jù),2017 年中國有超過53.2%的人使用互聯(lián)網(wǎng),網(wǎng)民數(shù)量居世界第一。互聯(lián)網(wǎng)的迅速發(fā)展促使電子數(shù)據(jù)的飛速增長。新技術(shù)、新設(shè)備以及社交網(wǎng)站等通信手段的出現(xiàn)和應(yīng)用,產(chǎn)生了大量的電子數(shù)據(jù),在不久的將來,這些數(shù)據(jù)將隨著互聯(lián)網(wǎng)的規(guī)模不斷增長。
根據(jù)統(tǒng)計結(jié)果顯示,網(wǎng)絡(luò)數(shù)據(jù)的數(shù)量從2005 年的150EB 增長到2010 年的1200EB,預(yù)計未來幾年將以每年40%的速度持續(xù)增長。這些信息的數(shù)量規(guī)模超過了當時任何軟件和硬件的存儲和計算能力,這意味著這些大型數(shù)據(jù)集無法使用傳統(tǒng)的計算技術(shù)進行處理。在此背景下,2011 年,麥肯錫提出了大數(shù)據(jù)的概念。大數(shù)據(jù)是指以巨大的數(shù)據(jù)量、高度多樣性或極高的速度收集的信息。今天,大量的數(shù)據(jù)正在從各種渠道產(chǎn)生和流動,而且這種情況持續(xù)不斷地發(fā)生在我們的日常生活中。
隨著社交網(wǎng)絡(luò)的蓬勃發(fā)展,世界各地的創(chuàng)業(yè)公司開始研究由海量數(shù)據(jù)所創(chuàng)造的信息網(wǎng)絡(luò)。雅虎在2005年創(chuàng)建了Hadoop。Hadoop 是一種用于存儲和處理海量數(shù)據(jù)的開源結(jié)構(gòu)。同時全世界的一些政府部門也開始著手大數(shù)據(jù)項目。2009 年,印度政府對一個民間信息收集項目進行了大型投資,該項目收集了當?shù)鼐用竦暮缒呙钄?shù)據(jù)、指紋和照片。從2012 年開始,全球越來越多的政府發(fā)布了一系列綱要文件,旨在推動大數(shù)據(jù)的發(fā)展和推廣應(yīng)用。2012 年,聯(lián)合國宣布大數(shù)據(jù)時代已經(jīng)到來,并指出這是各國政府的歷史機遇。聯(lián)合國認為,大數(shù)據(jù)的價值在于數(shù)據(jù)的數(shù)量和多樣性,使決策者能夠跟蹤事物的生命周期,從而對現(xiàn)有的政策和項目做出合理的調(diào)整。
這場數(shù)據(jù)驅(qū)動的革命給我們現(xiàn)代社會的各個領(lǐng)域和行業(yè)帶來了全面的變革。在過去幾年中,將新興技術(shù)應(yīng)用于其他行業(yè)和領(lǐng)域已經(jīng)帶來了革新性的進步。
例如,物聯(lián)網(wǎng)(Internet of Things)這一新興技術(shù)在智慧城市建設(shè)中發(fā)揮了主導(dǎo)作用。物聯(lián)網(wǎng)用實時數(shù)據(jù)改造落后的基礎(chǔ)設(shè)施和建筑物,提供智能化服務(wù),使我們所居住的城市更加現(xiàn)代化。交通堵塞、公共安全和犯罪預(yù)防等城市問題利用了大數(shù)據(jù)技術(shù)的幫助,24 小時實時的視頻監(jiān)控數(shù)據(jù)記錄了城市中的每個日夜。對于制造業(yè)來說,大數(shù)據(jù)的出現(xiàn)幫助傳統(tǒng)設(shè)備向智能機器轉(zhuǎn)型,智能機器能夠生成和收集實時數(shù)據(jù),從而做出準確及時的決策。智能交通來自于與大數(shù)據(jù)相關(guān)的新興技術(shù),如物聯(lián)網(wǎng)(IoT)和云計算。它要求根據(jù)多通道實時交通狀況數(shù)據(jù)進行精確決策,涉及到交通數(shù)據(jù)系統(tǒng)與其他系統(tǒng)之間的數(shù)據(jù)共享和知識圖譜。在智慧教育的建設(shè)中,采用新的數(shù)據(jù)相關(guān)技術(shù),將大學(xué)變成更智能的學(xué)術(shù)機構(gòu)。海量的數(shù)據(jù)采集使學(xué)生更加信息暢通。這些用于管理大數(shù)據(jù)的智能基礎(chǔ)設(shè)施加快了教育信息化的進程。
智慧教育的特點還包括對智能技術(shù)的應(yīng)用。虛擬現(xiàn)實(Virtual Realization)是指由計算機創(chuàng)造的模擬環(huán)境,它可以與真實環(huán)境相似,也可以不同。虛擬現(xiàn)實有助于傳統(tǒng)教學(xué)向沉浸式體驗教學(xué)轉(zhuǎn)變。學(xué)生們被帶到微觀和宏觀的虛擬世界中,在那里他們可以沉浸體驗剛剛學(xué)到的新的化學(xué)反應(yīng)。學(xué)生們可以直觀地看到書中的抽象概念和結(jié)構(gòu),更好地理解它們。毫無疑問,這種多元教學(xué)促進了學(xué)生的好奇心和對知識的掌握。云計算(Cloud Computing)是指一種新的計算服務(wù)交付方式,即可以訪問云上的服務(wù)器、數(shù)據(jù)庫和軟件,而無需在自己的設(shè)備上安裝它們。云計算的發(fā)展為智能教室的出現(xiàn)指明了發(fā)展方向,它源于IBM 于2008 年首次提出的“智慧地球”概念,并擴展到其他領(lǐng)域,形成了智慧城市、智慧交通、智慧教育的概念。智能教室是智能技術(shù)在課堂上的應(yīng)用。在這種情況下,學(xué)生從被動的參與者轉(zhuǎn)變?yōu)橹腔劢逃到y(tǒng)的主動建構(gòu)者,為智慧課堂的構(gòu)建提供學(xué)習(xí)經(jīng)驗數(shù)據(jù)和主觀反饋。直播課堂和虛擬人工智能教師也來自云計算。此外,學(xué)習(xí)者在網(wǎng)絡(luò)學(xué)習(xí)過程中所關(guān)心的問題,可以很容易地被人工智能教師所處理,讓教師有更多的自由去關(guān)注更重要的問題。在這個學(xué)習(xí)過程中,研究者收集和分析了大量的數(shù)據(jù),包括課程任務(wù)、學(xué)習(xí)行為、課堂互動和課后投入等,以便了解教師和學(xué)生的表現(xiàn),有利于個性化的課程推薦和準確的多維教學(xué)評價。大數(shù)據(jù)應(yīng)用的未來效益包括提高制造效率、企業(yè)創(chuàng)新、智慧城市建設(shè)、環(huán)保能力增強和精準的個性化服務(wù)。
大數(shù)據(jù)在教育中的應(yīng)用越來越廣泛。根據(jù)數(shù)據(jù)來源和應(yīng)用領(lǐng)域的不同,教育大數(shù)據(jù)可以定義為:教育大數(shù)據(jù)是作用于教育、服務(wù)于教育的技術(shù)和應(yīng)用系統(tǒng)的大數(shù)據(jù)。信息技術(shù)在校園里的應(yīng)用已有好幾年歷史。近年來互聯(lián)網(wǎng)的迅速發(fā)展使學(xué)校擁有可用的、高質(zhì)量的海量數(shù)據(jù)的美好愿景成為現(xiàn)實。
世界各國政府為了順應(yīng)科技模擬教育的流行趨勢,積極采取行動。他們將免費入學(xué)、高質(zhì)量課程和低成本相結(jié)合,廣泛普及高等教育,提高了學(xué)習(xí)效率,減少了欠發(fā)達國家接受高等教育的局限性。英國政府宣布投資3000 萬英鎊來促進創(chuàng)新教育技術(shù),其中包括人工智能。中國政府在教育部于2001 年出臺的《普通教育課程改革綱要(試行)》文件中發(fā)布了促進個性化學(xué)習(xí)的教育改革舉措。在美國教育部教育技術(shù)辦公室(U.S.Office of Educational Technology)2012年發(fā)布的一份咨詢報告中,將利用學(xué)生數(shù)據(jù)系統(tǒng)改善教育作為了國家的優(yōu)先事項。
2009 年以來,大數(shù)據(jù)在教育領(lǐng)域占據(jù)了重要地位,在發(fā)展的路上機遇與挑戰(zhàn)并存。這種大數(shù)據(jù)參與的技術(shù)強化教育的特點是:學(xué)習(xí)普及率更高,學(xué)生學(xué)習(xí)成績更高,評分系統(tǒng)更好,課程更個性化,輟學(xué)人數(shù)更少。
高等教育應(yīng)用新技術(shù)帶來的新發(fā)展,都表明了傳統(tǒng)高等教育界以及開放大學(xué)等更靈活的提供者為應(yīng)對這些挑戰(zhàn)所作的努力是有效的。大規(guī)模的在線開放課程MOOC(Massive Open Online Courses) 的發(fā)展就是一個很有力的證明。
MOOC 是免費的、開放的在線課程,由全世界的大學(xué)提供,所有人都可以報名學(xué)習(xí)。MOOC 是一種重要的教育資源,它能促進全世界學(xué)習(xí)者得到更多優(yōu)質(zhì)教育的學(xué)習(xí)機會。在便利政策的扶持下,MOOC 發(fā)展迅猛。近幾年來,互聯(lián)網(wǎng)用戶的數(shù)量呈指數(shù)級增長,更多的在線學(xué)習(xí)者進入在線學(xué)習(xí)領(lǐng)域。因此,MOOC在這些移動設(shè)備用戶中變得越來越流行。2013 年,大規(guī)模在線開放課程的爆發(fā)式出現(xiàn),引發(fā)了一場名為MOOC 革命的現(xiàn)象。從那一刻起,各種各樣的在線學(xué)習(xí)平臺紛紛進入MOOC 領(lǐng)域,為MOOC 的長久發(fā)展做出了貢獻。數(shù)以百計的MOOC 提供者為學(xué)生提供數(shù)千門課程,這些課程的入學(xué)要求各不相同。
在所有的在線課程提供商中,Coursera、edX 和Udacity 三足鼎立。Coursera 由斯坦福大學(xué)教授于2012 年創(chuàng)立,目前與世界頂級大學(xué)和教育機構(gòu)建立了合作關(guān)系。Coursera 的一些在線課程結(jié)業(yè)證書得到了大學(xué)的認可,這些課程主要集中在商科和計算機科學(xué)領(lǐng)域。Coursera 擁有2400 多萬注冊學(xué)習(xí)者,149 所大學(xué)提供商,提供2000 多門課程。Udacity 也是由斯坦福大學(xué)的兩位教授創(chuàng)建的,他們發(fā)布了免費的在線課程“人工智能入門”,吸引了190 個國家的16 萬多名學(xué)生。這些大學(xué)和行業(yè)專家共同努力開發(fā)和提供了Udacity 的課程。EdX 是由麻省理工學(xué)院和哈佛大學(xué)聯(lián)合創(chuàng)辦的。它與160 多所大學(xué)建立合作關(guān)系,提供1300 多門課程。廣泛傳播的MOOC 革命也引起了中國教育部的關(guān)注。2015 年4 月,隨著網(wǎng)絡(luò)公開課的蓬勃發(fā)展。中國強調(diào)了發(fā)展MOOC 平臺的重要性,2016年中國高校建設(shè)了20 多個在線平臺,2017 年提供了受到大學(xué)認可的在線課程。
在線學(xué)習(xí)不僅方便了在校學(xué)生的課程學(xué)習(xí),也方便了在職人員的學(xué)習(xí)。據(jù)估計,目前約有六分之五的在線學(xué)習(xí)者是在職人員,他們沒有時間和精力去學(xué)校上課。網(wǎng)絡(luò)教育的靈活性、創(chuàng)新性和可擴展性吸引了大量的校外學(xué)習(xí)者。許多在線學(xué)習(xí)平臺,如Udemy、Coursera 和Udacity,通過線上課堂為數(shù)百萬人提供服務(wù),其中一些課程直接來自大學(xué)課堂。在每個學(xué)術(shù)領(lǐng)域,互聯(lián)網(wǎng)提供了唾手可得的學(xué)習(xí)資料和課程,消除了時間和空間的限制,因此,那些非在校生但渴望學(xué)習(xí)的人可以通過在線學(xué)習(xí)很容易地獲得高質(zhì)量的講座和課程。
僅在2019 年,MOOC 就招收了1000 多萬名學(xué)員,預(yù)計全球總?cè)雽W(xué)人數(shù)將達到1.1 億,并以每年10%的速度持續(xù)增長。而在中國,2019 年有超過12500 家中國MOOC 服務(wù)商。網(wǎng)絡(luò)課程的普及率說明人們對在線學(xué)習(xí)的需求是巨大的。2020 年爆發(fā)的新冠疫情使在線學(xué)習(xí)的滲透率進一步提升。學(xué)校、大學(xué)和公司都關(guān)閉,人們都被迫在家工作數(shù)月,這大大促進了在線課程的招生,并培養(yǎng)了人們在線學(xué)習(xí)的習(xí)慣。
教育大數(shù)據(jù)在展現(xiàn)現(xiàn)代教學(xué)驚人潛力和美好未來的同時,也面臨著各種各樣的挑戰(zhàn)。
對在線教育的財政投入可能給全球各國政府造成沉重負擔,特別是那些對在線學(xué)習(xí)有更大需求的欠發(fā)達地區(qū)的政府。例如在偏遠地區(qū),互聯(lián)網(wǎng)的帶寬通常不夠,無法支撐流媒體的使用,因為這需要大量的資金投入。教育中的大數(shù)據(jù)也引發(fā)了許多隱私問題和數(shù)據(jù)使用的知情同意的問題。大量的學(xué)習(xí)經(jīng)驗數(shù)據(jù)被收集并用于進一步的分析和剖析,學(xué)生會感到自己被監(jiān)視。所以在隱私問題和數(shù)據(jù)知情權(quán)上,需要采取審慎的預(yù)防措施,以確保所收集數(shù)據(jù)的擴展和利用是合規(guī)合理的,避免數(shù)據(jù)濫用對學(xué)習(xí)者造成傷害。
除了大數(shù)據(jù)應(yīng)用帶來巨大效益,數(shù)據(jù)生產(chǎn)的指數(shù)增長對數(shù)據(jù)存儲和數(shù)據(jù)處理的需求也值得關(guān)注?,F(xiàn)代生活中的每一瞬間都會產(chǎn)生和傳輸大量的數(shù)據(jù)。在這些領(lǐng)域中,互聯(lián)網(wǎng)產(chǎn)業(yè)、公安、科研、制造業(yè)、農(nóng)業(yè)、教育、醫(yī)療衛(wèi)生等所占份額最大。在智慧城市建設(shè)中,視頻監(jiān)控記錄、交通量和空氣質(zhì)量數(shù)據(jù)等每時每刻都在生成,這些不斷生成的數(shù)據(jù)量呈指數(shù)級增長,每天產(chǎn)生的全球視頻監(jiān)控數(shù)據(jù)超過560PB。在智能交通建設(shè)中,交通系統(tǒng)與其他信息數(shù)據(jù)庫的實時互聯(lián),從不同的信息渠道產(chǎn)生大量的數(shù)據(jù),從而實現(xiàn)智能決策。交通狀況的信息以圖像和視頻的形式從廣域視頻監(jiān)控系統(tǒng)中呈現(xiàn)出來,實時傳輸信息。智慧課堂在智慧教育中占最大比重,因而隨著智慧教育的發(fā)展,學(xué)習(xí)相關(guān)的數(shù)據(jù)呈指數(shù)級增長,其中課堂的實時監(jiān)控數(shù)據(jù),學(xué)習(xí)時長和在線測驗成績等數(shù)據(jù)都占據(jù)了系統(tǒng)存儲區(qū)域的大部分容量。對于互聯(lián)網(wǎng)行業(yè)來說,移動智能終端的出現(xiàn)和廣泛應(yīng)用每分鐘都會產(chǎn)生大量的用戶數(shù)據(jù),數(shù)據(jù)庫、云計算、物聯(lián)網(wǎng)等新的智能技術(shù)也促進了數(shù)字數(shù)據(jù)的指數(shù)級增長。
大數(shù)據(jù)的數(shù)據(jù)量給各方都帶來了巨大的壓力和挑戰(zhàn)。這些數(shù)據(jù)的收集、存儲、傳輸和分析不僅需要大規(guī)模的資金投入,而且需要先進的數(shù)據(jù)挖掘技術(shù)。穩(wěn)定的存儲需要復(fù)雜可靠的軟件和硬件設(shè)施,同時也需要高帶寬的互聯(lián)網(wǎng)傳輸基礎(chǔ)設(shè)施。此外,大數(shù)據(jù)來源的多樣性也要求對數(shù)據(jù)進行深入的理論和實踐分析。將大數(shù)據(jù)轉(zhuǎn)化為有價值的信息需要智能技術(shù)的開發(fā)和應(yīng)用,以便揭示數(shù)據(jù)中隱含的有價值的趨勢信息。因此,組織、機構(gòu)和公司必須能夠利用大數(shù)據(jù)挖掘和分析技術(shù)來滿足這些需求。這樣做的目的是可以提供個性化的課程推薦和準確的多維教學(xué)評價。這些數(shù)據(jù)的收集、存儲、傳輸和分析需要先進的數(shù)據(jù)挖掘和分析技術(shù),在教育領(lǐng)域被稱為學(xué)習(xí)分析技術(shù)。
學(xué)習(xí)分析是指運用智能技術(shù)對學(xué)習(xí)數(shù)據(jù)進行分析,以提高教學(xué)質(zhì)量?;诖髷?shù)據(jù)的學(xué)習(xí)分析有助于收集、測量和分析學(xué)習(xí)者的多模態(tài)數(shù)據(jù)。它可以為教師和平臺設(shè)計者提供準確的個性化教學(xué)服務(wù),從而優(yōu)化學(xué)生的在線學(xué)習(xí)表現(xiàn),提升學(xué)生的學(xué)習(xí)體驗。
通過對國外相關(guān)文獻的整理,我們可以看到,學(xué)習(xí)分析領(lǐng)域雖然是新興領(lǐng)域,但相關(guān)的研究已經(jīng)涉及到很多其他領(lǐng)域,主要包括學(xué)習(xí)分析的分析方法、分析工具、分析模型和分析系統(tǒng)的研究與開發(fā)。同時,學(xué)習(xí)分析在教學(xué)中的應(yīng)用也越來越受到教育相關(guān)者重視。
學(xué)習(xí)者畫像是指分析學(xué)習(xí)者的特征并根據(jù)這些標簽進行標記。學(xué)習(xí)者畫像是一種普遍應(yīng)用在教學(xué)中的服務(wù),其中個性化教學(xué)服務(wù)是最受歡迎的應(yīng)用之一。在信息教育化時期,面對多媒體教學(xué)環(huán)境、多樣化的教學(xué)模式、數(shù)字化學(xué)習(xí)資源和特征迥異的學(xué)習(xí)者,要實現(xiàn)個性化教育教學(xué),必須準確地刻畫和塑造學(xué)習(xí)者的學(xué)習(xí)特征?;趯W(xué)習(xí)者畫像,教師可以為學(xué)生提供更有針對性的教學(xué)。
這些技術(shù)增強和數(shù)據(jù)豐富的教育系統(tǒng)能幫助教師在更好地理解學(xué)生行為。實時傳輸?shù)臄?shù)據(jù)提供了準確的學(xué)習(xí)進度監(jiān)控,使教師能夠更準確地評估學(xué)習(xí)者是否提前或延遲學(xué)習(xí)進度。課后,該技術(shù)也可以幫教育者為學(xué)習(xí)者制定學(xué)習(xí)計劃,以提高學(xué)生的學(xué)習(xí)參與度。
個性化教學(xué)服務(wù)作為一種先進的教學(xué)理念,充分尊重學(xué)生的個性,其獨特的優(yōu)勢已得到國內(nèi)外學(xué)者的認可。教育不是工廠,學(xué)生也不是產(chǎn)品。學(xué)生不能按統(tǒng)一標準被加工成“標準件”。因此,教育者需要正確認識學(xué)習(xí)者的個體差異,繼承因材施教的教育理念,才能實現(xiàn)特定的培養(yǎng)目標。
隨著互聯(lián)網(wǎng)的發(fā)展,大數(shù)據(jù)在各行各業(yè)里得到了廣泛的應(yīng)用,其中大數(shù)據(jù)在教育領(lǐng)域的發(fā)展尤為亮眼。在線學(xué)習(xí)和學(xué)習(xí)分析技術(shù)成為了智慧教育的重要組成部分。在中國,以MOOCs 為首的在線教育平臺提供了數(shù)萬在線課程,吸引了的學(xué)習(xí)者。2020 年新冠疫情的爆發(fā),讓在線學(xué)習(xí)得到了井噴式增長。這些變化都使得學(xué)習(xí)者產(chǎn)生了大量學(xué)習(xí)行為數(shù)據(jù),這為數(shù)據(jù)的提取分析帶來了巨大的挑戰(zhàn)。學(xué)習(xí)分析技術(shù)利用大數(shù)據(jù)里的數(shù)據(jù)挖掘技術(shù),從海量的原始數(shù)據(jù)里,挖掘有價值的行為信息,以便更好地幫助學(xué)習(xí)者了解自己的學(xué)習(xí)狀態(tài),幫助老師完善課程設(shè)計,幫助教育者改進教學(xué)系統(tǒng)。