趙玉潔
編者按:大數(shù)據(jù)的發(fā)展使得教育面臨一場新的變革。如何應(yīng)對大數(shù)據(jù)時(shí)代的挑戰(zhàn)?如何提升對海量數(shù)據(jù)的整合、分析和運(yùn)用能力?已經(jīng)成為教育部門急需思考的重要問題。本期的專題研究將從“大數(shù)據(jù)在高校信息化中的應(yīng)用”、“量化自我支持的個(gè)性化學(xué)習(xí)”、“高校學(xué)籍預(yù)警機(jī)制”等方面來闡述大數(shù)據(jù)時(shí)代教育信息化工作的新思路,希望能為相關(guān)研究者提供借鑒。
摘 要:隨著信息革命的蓬勃發(fā)展,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等信息技術(shù)已經(jīng)滲透到社會的每一個(gè)角落,由此產(chǎn)生的各種數(shù)據(jù)呈爆炸式增長,而這些海量數(shù)據(jù)中所承載的信息和價(jià)值是難以估量的。在這種大數(shù)據(jù)時(shí)代,教育作為社會生活的一個(gè)重要陣地,也不可置身事外。本文通過討論高校中的數(shù)據(jù)源和數(shù)據(jù)特點(diǎn),探討大數(shù)據(jù)技術(shù)在高校中如何應(yīng)用,并從技術(shù)和實(shí)施兩個(gè)層面分析大數(shù)據(jù)在高校教育信息化建設(shè)中面臨的挑戰(zhàn)以及相應(yīng)的解決策略。
關(guān)鍵詞:大數(shù)據(jù);教育信息化;高校
中圖分類號:G434 文獻(xiàn)標(biāo)志碼:A 文章編號:1673-8454(2015)19-0038-04
一、引言
自從人類社會進(jìn)入信息時(shí)代后,數(shù)據(jù)作為信息時(shí)代獨(dú)一無二的傳遞媒介,在我們的生活中無處不在。特別是隨著互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的快速發(fā)展,似乎一切都可以被數(shù)據(jù)化、被記錄。曾經(jīng)靜靜躺在各種媒介中的數(shù)據(jù),開始爆發(fā)出驚人的價(jià)值和巨大的信息量,這引起了越來越多人的關(guān)注和重視。人類已經(jīng)邁入一個(gè)深度挖掘數(shù)據(jù)內(nèi)在信息和核心價(jià)值的大數(shù)據(jù)時(shí)代。
在這場大數(shù)據(jù)的浪潮中,高校扮演著重要角色,既是大數(shù)據(jù)時(shí)代的參與者,也是大數(shù)據(jù)發(fā)展的推動者。高校能夠利用自己所掌握的大量數(shù)據(jù)和信息資源,在教育和研究工作中發(fā)揮出舉足輕重的作用,這也是順應(yīng)大數(shù)據(jù)時(shí)代發(fā)展趨勢、推動自身信息化建設(shè)和發(fā)展的一個(gè)良好契機(jī)。
美國政府為了順應(yīng)并推動大數(shù)據(jù)這一趨勢,于2012年3月宣布投資2億美元啟動“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,把大數(shù)據(jù)研究和生產(chǎn)計(jì)劃提高到國家戰(zhàn)略層面。2014年4月,美國聯(lián)邦教育部宣布從財(cái)政預(yù)算中拿出2500萬美元用于教育數(shù)據(jù)挖掘和分析。我國也十分重視大數(shù)據(jù)在高校教育中的發(fā)展?!秶抑虚L期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》明確提出,在加快教育信息化進(jìn)程中要“加強(qiáng)優(yōu)質(zhì)教育資源開發(fā)與應(yīng)用……促進(jìn)優(yōu)質(zhì)教育資源普及共享”?!秶窠?jīng)濟(jì)和社會發(fā)展第十二個(gè)五年規(guī)劃綱要》提出,“重點(diǎn)研究……海量信息處理及知識挖掘的理論與方法……”
我國在高校研究大數(shù)據(jù)的條件更是得天獨(dú)厚。據(jù)國家統(tǒng)計(jì)局2014年2月公布的數(shù)據(jù)顯示,我國目前在校大學(xué)生達(dá)2468.1萬人。2013年我國網(wǎng)民近30%使用過在線教育產(chǎn)品,市場空間巨大。未來幾年中國在線教育市場將保持每年30%以上的增速。預(yù)計(jì)到2017年,我國在線教育市場規(guī)模將會突破1600億元。
然而在大數(shù)據(jù)風(fēng)暴以迅雷不及掩耳之勢席卷全球各個(gè)行業(yè)的時(shí)候,我們卻充滿了疑惑,畢竟大數(shù)據(jù)本身尚未發(fā)展成熟,如何將它合理應(yīng)用到高校領(lǐng)域還是值得深思的。本文將從高校中的大數(shù)據(jù)來源入手,分析高校大數(shù)據(jù)具有的特征,探討大數(shù)據(jù)將對高校信息資源共享發(fā)揮的作用,深入挖掘大數(shù)據(jù)在高校信息化建設(shè)應(yīng)用中的挑戰(zhàn),以探尋合理的策略實(shí)現(xiàn)大數(shù)據(jù)時(shí)代高校間資源共享,推動教育信息化的全面建設(shè)。
二、高校中的大數(shù)據(jù)
1.大數(shù)據(jù)是什么
(1)大數(shù)據(jù)的概念及目標(biāo)
最早提出“大數(shù)據(jù)”時(shí)代到來的是全球知名資訊公司麥肯錫。麥肯錫[1]稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波的生產(chǎn)率增長和消費(fèi)者盈余浪潮的到來。”Gartner[2]于2012年對大數(shù)據(jù)做出如下定義:“大數(shù)據(jù)是大量、高速及多變的信息資產(chǎn),它需要新型的處理方式去促成更強(qiáng)的決策能力、洞察力與優(yōu)化處理。”維基百科對大數(shù)據(jù)的定義則簡單明了:大數(shù)據(jù)是指利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時(shí)間超過可容忍時(shí)間的數(shù)據(jù)集。[3]
無論哪種定義實(shí)際都強(qiáng)調(diào)大數(shù)據(jù)的目標(biāo):①獲取知識與推測趨勢;②掌握個(gè)性化特征;③通過分析辨識真相。因此,大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于通過將各種數(shù)據(jù)集合并后的分析得出大量額外的有價(jià)值信息和數(shù)據(jù)關(guān)系,幫助指導(dǎo)人們優(yōu)化自身的決策和行為方式。
(2)大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別
信息的大爆炸不斷提醒著我們,未來將會因大數(shù)據(jù)技術(shù)而改變。與傳統(tǒng)數(shù)據(jù)相比,大數(shù)據(jù)之所以如此受人追捧,是因?yàn)槠渚哂刑烊粌?yōu)勢。兩者最本質(zhì)區(qū)別在于:①數(shù)據(jù)采集的來源不同。傳統(tǒng)的數(shù)據(jù)庫只是采集基本數(shù)據(jù)信息,使用數(shù)據(jù)自身含義,沒有利用數(shù)據(jù)的附加價(jià)值。而大數(shù)據(jù)來源于對傳統(tǒng)數(shù)據(jù)的提取和分析,更強(qiáng)調(diào)數(shù)據(jù)之間的關(guān)聯(lián)性,主要研究數(shù)據(jù)間的關(guān)系;②數(shù)據(jù)應(yīng)用的方向不同。傳統(tǒng)的數(shù)據(jù)庫主要對數(shù)據(jù)進(jìn)行存儲和查詢,以對過去產(chǎn)生的數(shù)據(jù)進(jìn)行保存為核心。大數(shù)據(jù)對事物發(fā)展的預(yù)測為核心思想,通過對海量數(shù)據(jù)進(jìn)行分析,得到未來發(fā)展趨勢或者推斷將來的可能性。
2.高校中的大數(shù)據(jù)
(1)高校中的數(shù)據(jù)源
高校是一個(gè)每時(shí)每刻都會產(chǎn)生大量數(shù)據(jù)的地方。自從我國推行教育信息化以來,這些數(shù)據(jù)大部分被記錄保存了下來。比如人事、教學(xué)、財(cái)務(wù)等部門的基本業(yè)務(wù)數(shù)據(jù),網(wǎng)絡(luò)教學(xué)課件和視頻、網(wǎng)絡(luò)遠(yuǎn)程教育教學(xué)資源的多媒體數(shù)據(jù),學(xué)生教師上論壇、微博、微信等社交網(wǎng)絡(luò)產(chǎn)生的網(wǎng)絡(luò)行為數(shù)據(jù),校園網(wǎng)內(nèi)連接無線網(wǎng)絡(luò)而感知的位置數(shù)據(jù)等。
伴隨著高校教育信息化建設(shè)程度的不斷深入和加強(qiáng),比以往更多的海量數(shù)據(jù)被積累保存,這對于高校來說,是一筆寶貴的財(cái)富。這些海量數(shù)據(jù)并不是單純的數(shù)據(jù)積累、記錄和保存,其潛在的價(jià)值將會對現(xiàn)代化高校建設(shè)產(chǎn)生積極重要的意義。例如,通過對“課堂、成績、就業(yè)”等方面數(shù)據(jù)的統(tǒng)籌分析,能夠在一定程度上對傳統(tǒng)教育領(lǐng)域的授課和學(xué)習(xí)模式的改革給予指導(dǎo)和建議,通過學(xué)生的圖書借閱歷史和選課信息綜合判斷學(xué)生的興趣愛好。在這個(gè)信息就是金錢的時(shí)代,大數(shù)據(jù)技術(shù)的應(yīng)用將會在高校教育信息化中起到越來越重要的作用。如何充分利用數(shù)據(jù)價(jià)值,使其為學(xué)校管理、教學(xué)、服務(wù)等工作提供有益幫助,將是本文重點(diǎn)研究的內(nèi)容。
(2)高校中大數(shù)據(jù)的特點(diǎn)
對于大數(shù)據(jù)關(guān)注,往往過分集中于“大”的特點(diǎn),而忽略了處理大數(shù)據(jù)所必須面對的一個(gè)難題:未經(jīng)處理的碎片數(shù)據(jù)是造成大數(shù)據(jù)價(jià)值密度低的直接原因。在高校內(nèi)部圍繞著教師或?qū)W生服務(wù)和管理產(chǎn)生的數(shù)據(jù)也具有“碎片化”的特點(diǎn)。這一點(diǎn)王左利在他的論文中也提到了。[4]同時(shí)他還總結(jié)了大數(shù)據(jù)的另一個(gè)特點(diǎn)——持續(xù)性?!俺掷m(xù)性”體現(xiàn)了校園科研、教學(xué)和管理業(yè)務(wù)的規(guī)律。必須基于長期、持續(xù)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,靠短期數(shù)據(jù)分析獲得的結(jié)論對指導(dǎo)教育教學(xué)改革無益。
而筆者認(rèn)為,高校的數(shù)據(jù)還體現(xiàn)了另外一個(gè)特點(diǎn)——多維度?!岸嗑S度”能夠表征校園活動參與個(gè)體的完整狀態(tài)。如,對一位學(xué)生而言,學(xué)習(xí)成績反映學(xué)習(xí)效果;借書種類反映興趣愛好;一卡通消費(fèi)情況反映家庭狀況;上網(wǎng)軌跡反映思想動態(tài)等。只有將多維度的數(shù)據(jù)進(jìn)行有效整合,通過建立量化分析模型,反映一個(gè)學(xué)生的生活習(xí)慣與學(xué)習(xí)進(jìn)步的相互關(guān)系,才能清晰全面地分析學(xué)生個(gè)體。
3.大數(shù)據(jù)教育與傳統(tǒng)教育相比的優(yōu)勢
通過討論大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的不同以及高校數(shù)據(jù)源的特點(diǎn),發(fā)現(xiàn)在大數(shù)據(jù)影響下的教育與傳統(tǒng)教育相比具有諸多優(yōu)勢,主要體現(xiàn)在以下三個(gè)方面:
數(shù)據(jù)采集:傳統(tǒng)教育數(shù)據(jù)的采集方式來源于調(diào)查問卷、心理測試等。采集標(biāo)準(zhǔn)和規(guī)則均已完善。而大數(shù)據(jù)的采集是過程式的,它關(guān)注著學(xué)生在校數(shù)據(jù)的整個(gè)生命周期,關(guān)注著學(xué)生在校生活的每一個(gè)微觀表現(xiàn)。
策略決策:傳統(tǒng)數(shù)據(jù)詮釋宏觀、整體的教育狀況,用于影響教育政策決策;大數(shù)據(jù)透析微觀、個(gè)體的學(xué)生在課堂上的狀況,用于調(diào)整教育行為進(jìn)而實(shí)現(xiàn)個(gè)性化教育。
評估誤差:傳統(tǒng)數(shù)據(jù)來源于階段性的、針對性的評估,其采樣過程可能有系統(tǒng)誤差;大數(shù)據(jù)采用微觀持續(xù)性記錄方式,采樣的方式誤差較小。
三、大數(shù)據(jù)在高校教育信息化建設(shè)的應(yīng)用
隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,大數(shù)據(jù)帶來的信息風(fēng)暴正在改變我們的生活、工作和思維。那么,當(dāng)這場風(fēng)暴席卷高校的時(shí)候,到底會給高校教育信息化建設(shè)帶來哪些變革呢?高校是數(shù)據(jù)生產(chǎn)大戶,中國高校數(shù)量多而且規(guī)模大,萬人以上的大學(xué)非常多,在高校里上學(xué)的學(xué)生從招生、學(xué)籍、選課、成績、飯?zhí)?、活動等方面產(chǎn)生大量的數(shù)據(jù)。在大數(shù)據(jù)時(shí)代,只有用好這些數(shù)據(jù),才能更好地幫助教學(xué)、科研、學(xué)生管理等工作,大大提高高校的信息化水平。
1.教學(xué)評估
大數(shù)據(jù)分析可以應(yīng)用于教育中的數(shù)據(jù)挖掘。目前教育機(jī)構(gòu)已經(jīng)積累了大量數(shù)據(jù),使研究者有更多的新機(jī)會探究學(xué)生學(xué)習(xí)環(huán)境和狀態(tài)。通過監(jiān)測這些信息,形成教育大數(shù)據(jù)庫,全面掌握學(xué)生學(xué)習(xí)的全過程,發(fā)現(xiàn)學(xué)生的學(xué)習(xí)常態(tài)。通過數(shù)據(jù)流的變動分析,總結(jié)教育規(guī)律、調(diào)整教學(xué)內(nèi)容和教學(xué)模式,客觀全面地評價(jià)學(xué)生學(xué)習(xí)成果和自身的教學(xué)成果。
2.個(gè)體分析
對于教育領(lǐng)域來說,大數(shù)據(jù)的應(yīng)用讓研究個(gè)體學(xué)習(xí)也成為了可能,讓專門培養(yǎng)和針對性訓(xùn)練成為可能。通過學(xué)校數(shù)據(jù)中心分析學(xué)生的各類信息,如考試成績的變化、借閱圖書的種類、一卡通消費(fèi)額度等信息,綜合性地分析判斷學(xué)生的狀態(tài)。根據(jù)分析結(jié)果,對于不同的學(xué)生因地制宜地制定相應(yīng)的教學(xué)模式、培養(yǎng)方案。另外,也可以借助學(xué)校的微信公眾平臺為學(xué)生推送其感興趣的資訊信息。
3.輿情預(yù)測
學(xué)生中存在的問題和困惑,往往最先通過網(wǎng)絡(luò)顯露和傳播。如果學(xué)生的意見和建議得不到重視或延誤解決,就可能在網(wǎng)上形成炒作,個(gè)體情緒可能傳染到群體,演變?yōu)槿后w的不滿情緒,使網(wǎng)絡(luò)成為輿論的放大器。通過分析學(xué)生網(wǎng)絡(luò)訪問軌跡實(shí)現(xiàn)積累監(jiān)測,利用其需求、行為、動向等眾多數(shù)據(jù)資源加強(qiáng)輿情分析和預(yù)警。另外,通過對學(xué)生數(shù)據(jù)的追蹤和分析,能夠發(fā)現(xiàn)情緒不穩(wěn)定的學(xué)生或者受不法分子蠱惑的學(xué)生,及時(shí)將有可能發(fā)生的悲劇扼殺在搖籃里。因此,精準(zhǔn)的預(yù)測分析能提升輿情管理工作水平,提高校園管理水平。
總之,大數(shù)據(jù)的教育應(yīng)用可以為學(xué)生提供一個(gè)量身定做的個(gè)性化學(xué)習(xí)環(huán)境、一個(gè)靈活調(diào)整的可控教育系統(tǒng)、一個(gè)教育問題早期預(yù)警系統(tǒng),為教師了解學(xué)生學(xué)習(xí)途徑和方法提供了嶄新的、可視的、可量化的新手段。
四、大數(shù)據(jù)在高校教育信息化應(yīng)用中的挑戰(zhàn)
1.從技術(shù)層面來看
(1)數(shù)據(jù)源的可用性
關(guān)于大數(shù)據(jù)的一個(gè)普遍觀點(diǎn)是,數(shù)據(jù)自己可以說明一切,數(shù)據(jù)自身就是事實(shí)。但實(shí)際情況是,如果不仔細(xì)甄別,數(shù)據(jù)也會欺騙,就像人們有時(shí)會被自己的雙眼欺騙一樣。高質(zhì)量數(shù)據(jù)的獲取是確保信息可用性的重要前提。[5]高校數(shù)據(jù)的來源多種多樣,包括各職能部門的基本業(yè)務(wù)數(shù)據(jù)、教學(xué)資源的多媒體數(shù)據(jù)、使用網(wǎng)絡(luò)的行為數(shù)據(jù)、無線網(wǎng)絡(luò)感知的位置數(shù)據(jù)等。數(shù)據(jù)模態(tài)千差萬別,如關(guān)系數(shù)據(jù)、標(biāo)量數(shù)據(jù)、圖數(shù)據(jù)、流數(shù)據(jù)、XML數(shù)據(jù)、矢量數(shù)據(jù)等。既有重復(fù)性數(shù)據(jù),又有冗余性數(shù)據(jù),質(zhì)量參次不齊,加工整理困難。這些校園化數(shù)據(jù)是否可用給大數(shù)據(jù)在高校中的推進(jìn)帶來極大的挑戰(zhàn)。
(2)數(shù)據(jù)融合的可行性
眾所周知,數(shù)據(jù)不融合就發(fā)揮不出數(shù)據(jù)的潛在價(jià)值,高校大數(shù)據(jù)面臨的一個(gè)重要問題就是數(shù)據(jù)融合。作為高等院校,大數(shù)據(jù)的融合應(yīng)該走在前列,必須徹底打通數(shù)據(jù)孤島,將各個(gè)業(yè)務(wù)充分整合。然而,由于傳統(tǒng)的業(yè)務(wù)系統(tǒng)缺乏長期規(guī)劃,采用的技術(shù)包羅萬象。據(jù)調(diào)研發(fā)現(xiàn),目前高校所采用的數(shù)據(jù)庫包括Oracle、Sybase、Microsoft SQL Server、Mysql、Visual FoxProd等。有些學(xué)校或部門甚至沒有數(shù)據(jù)庫,而是采用Excel管理數(shù)據(jù)。在這種基礎(chǔ)上實(shí)現(xiàn)數(shù)據(jù)的有效融合,形成高質(zhì)量的大數(shù)據(jù),對于融合技術(shù)是一個(gè)重要的挑戰(zhàn)。
(3)數(shù)據(jù)分析的持續(xù)性
教育的規(guī)律有時(shí)很難理清,成功的個(gè)體也未必能夠簡單復(fù)制,評價(jià)教育本身的指標(biāo)都有一定程度的缺陷,需要幾年甚至更長期的監(jiān)測和不斷的更正。因此,高校中的大數(shù)據(jù)分析,不僅僅是橫向的對比,如職能部門間、兄弟院校間,更需要縱向歷史數(shù)據(jù)的對比。無論是數(shù)據(jù)收集、數(shù)據(jù)清洗還是數(shù)據(jù)挖掘的模型,都需要隨著每天產(chǎn)生的大量詳實(shí)而瑣碎的數(shù)據(jù)信息進(jìn)行調(diào)整和修正,這也是一個(gè)不小的挑戰(zhàn)。
(4)數(shù)據(jù)挖掘的復(fù)雜性
大數(shù)據(jù)分析無疑是整個(gè)大數(shù)據(jù)時(shí)代的核心所在,因?yàn)榇髷?shù)據(jù)的價(jià)值就產(chǎn)生于數(shù)據(jù)分析過程中。在高校大數(shù)據(jù)的應(yīng)用中,無論是做個(gè)性分析還是輿情預(yù)測,都需要構(gòu)建特定的挖掘模型。教育行業(yè)因?yàn)槠涮厥庑?,傳統(tǒng)的分析技術(shù)如數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)分析等并不能完全滿足高校大數(shù)據(jù)分析的需求,因此,需要在數(shù)據(jù)預(yù)處理、算法模型、評價(jià)指標(biāo)等方面做出調(diào)整。當(dāng)然,數(shù)據(jù)挖掘的復(fù)雜性,不僅是高校大數(shù)據(jù)所面臨的挑戰(zhàn),也是整個(gè)大數(shù)據(jù)領(lǐng)域的巨大挑戰(zhàn)。
2.從實(shí)施層面來看
(1)數(shù)據(jù)共享意識
大數(shù)據(jù)時(shí)代需要海量數(shù)據(jù)作為基礎(chǔ),高校中的大數(shù)據(jù),其中很大一部分來源于各職能部門。而現(xiàn)狀是大量的數(shù)據(jù)分布在各個(gè)互相獨(dú)立的職能部門中,甚至大量的信息資源成為了個(gè)別部門的私有財(cái)產(chǎn)。造成這種狀況的原因一方面是因?yàn)槟甏眠h(yuǎn),數(shù)據(jù)整理工作難度較大、工作優(yōu)先級較低;另一方面是業(yè)務(wù)部門并不清楚哪些數(shù)據(jù)是可以被分享的、哪些數(shù)據(jù)是不能被分享的。歸根結(jié)底,還是資源分享的意識不夠。然而,信息資源只有在相互流動、形成規(guī)模效應(yīng)的前提下才能夠發(fā)揮出最大的價(jià)值,因此,還需要加強(qiáng)高校的數(shù)據(jù)共享意識。
(2)人員配備與組織結(jié)構(gòu)
高校內(nèi)部對于各職能部門間信息資源規(guī)劃缺位,導(dǎo)致了建設(shè)進(jìn)度不同、資源投入有差距、各部門各顯神通一窩蜂建設(shè),增加了數(shù)據(jù)資源共享共用的壁壘。在大力推行教育信息化之前,很多學(xué)校并沒有專門的信息化部門,技術(shù)人員儲備不足,甚至沒有。高校大數(shù)據(jù)的推行需要一批既懂得相關(guān)技術(shù),又熟悉業(yè)務(wù)流程的技術(shù)人員。人才的匱乏也是非常不利的一點(diǎn)因素——相比于商業(yè)環(huán)境下對研究實(shí)效的追逐,教育研究的緩慢與空洞顯得相形見絀。
(3)個(gè)人隱私保護(hù)
教育說到底是一個(gè)交互的過程,交互的內(nèi)容收集一定程度上與隱私等是矛盾的。目前大數(shù)據(jù)的發(fā)展仍然面臨著許多問題,安全與隱私問題是人們公認(rèn)的關(guān)鍵問題之一,如教師的工資收入,學(xué)生的生活習(xí)慣、好友聯(lián)絡(luò)情況、閱讀習(xí)慣、檢索習(xí)慣等。多項(xiàng)案例實(shí)際說明,即使無害的數(shù)據(jù)被大量收集后,也會暴露個(gè)人隱私。如何做到大數(shù)據(jù)采集與用戶隱私保護(hù)的平衡是一個(gè)很重要的研究課題。
五、大數(shù)據(jù)在高校教育信息化應(yīng)用中的策略
1.建立科學(xué)的數(shù)據(jù)規(guī)劃
在教育信息化發(fā)展歷程中,高校早期缺乏信息化的意識,積累的數(shù)據(jù)質(zhì)量參次不齊。即使在大數(shù)據(jù)時(shí)代的今天,信息化工作人員對于數(shù)據(jù)規(guī)劃意識依然朦朧。只是簡單地意識到所有的數(shù)據(jù)都是有用的,但是具體怎么用,哪些可以共享,并沒有明確的規(guī)劃。通過總體的科學(xué)數(shù)據(jù)規(guī)劃所得到的數(shù)據(jù)模型將是富有生命力的,在長達(dá)數(shù)年之內(nèi),它們可以憑借微小的調(diào)整和增加,就可適用于多種類型的系統(tǒng)和數(shù)據(jù)庫。所以,擁有一個(gè)數(shù)據(jù)的長期規(guī)劃是非常必要的。
2.加強(qiáng)數(shù)據(jù)的質(zhì)量管理
數(shù)據(jù)質(zhì)量是數(shù)據(jù)分析結(jié)論有效性和準(zhǔn)確性的基礎(chǔ),也是最重要的前提和保障。對于大數(shù)據(jù)在高校的應(yīng)用,數(shù)據(jù)的質(zhì)量管理需要考慮以下幾個(gè)關(guān)鍵問題。一是數(shù)據(jù)收集階段的標(biāo)準(zhǔn)化、全面化、高效化。既要滿足收集速度和精度要求,又需要滿足數(shù)據(jù)來源的質(zhì)量要求。從數(shù)據(jù)源頭保證數(shù)據(jù)質(zhì)量。二是數(shù)據(jù)清洗過程中的合理化和精確化。去除大量的噪聲數(shù)據(jù),精確地提取有效數(shù)據(jù),保證數(shù)據(jù)處理過程中的高質(zhì)量。在此基礎(chǔ)之上,建立良好的數(shù)據(jù)管理機(jī)制,包括加強(qiáng)數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)、重視歷史數(shù)據(jù)積累、學(xué)習(xí)數(shù)據(jù)處理技術(shù)等,以求在數(shù)據(jù)準(zhǔn)備階段提高數(shù)據(jù)質(zhì)量。
3.構(gòu)建“上推下主”的體制
高校的管理體制規(guī)定著機(jī)構(gòu)設(shè)置、職責(zé)運(yùn)行和權(quán)限劃分,高校中推行大數(shù)據(jù)共享和應(yīng)用,顯然要涉及對傳統(tǒng)管理模式所形成的利益關(guān)系調(diào)整,因而需要觸及體制調(diào)整與改革。只有從頂層部門進(jìn)行全面、細(xì)致、強(qiáng)力的規(guī)劃推動,才能減少乃至消除職能部門間資源共享的屏障。信息化部門應(yīng)借助自身在技術(shù)層面的優(yōu)勢,整合各業(yè)務(wù)系統(tǒng)數(shù)據(jù),形成數(shù)據(jù)中心,變被動為主動地去維護(hù)數(shù)據(jù)。同時(shí),也要為學(xué)校職能部門等不同層次的用戶提供定制的主題數(shù)據(jù)分析。各學(xué)科職能部門也要充分溝通和配合,及時(shí)反饋和跟進(jìn)。只有通過這種頂層推動、信息部門主導(dǎo)的模式進(jìn)行體制改革,才能有效地推進(jìn)大數(shù)據(jù)在高校中的應(yīng)用。
六、總結(jié)與展望
在大數(shù)據(jù)以“迅雷不及掩耳”之勢席卷各個(gè)行業(yè)的時(shí)候,筆者更加關(guān)注大數(shù)據(jù)在高校信息化建設(shè)中的推進(jìn)。本文通過討論高校中的數(shù)據(jù)源和數(shù)據(jù)的特點(diǎn),探討大數(shù)據(jù)技術(shù)在高校中如何應(yīng)用,并從技術(shù)和實(shí)施兩個(gè)層面分析大數(shù)據(jù)在高校教育信息化建設(shè)中所面臨的挑戰(zhàn)以及相應(yīng)的解決策略。
隨著對大數(shù)據(jù)理解和應(yīng)用的深入,我們期待看到大數(shù)據(jù)技術(shù)為高校信息化建設(shè)帶來更多的活力。也希望能夠拋磚引玉,給更多關(guān)注高校信息化建設(shè)中大數(shù)據(jù)的研究以幫助和啟發(fā),同時(shí),也希望真正讓大數(shù)據(jù)應(yīng)用融入到校園生活的每一個(gè)角落里來,更好地服務(wù)于廣大師生。
參考文獻(xiàn):
[1]李志剛主編.大數(shù)據(jù):大價(jià)值、大機(jī)遇、大變革[M].北京:電子工業(yè)出版社,2012.10.
[2]Gartner.BIG DATA[EB/OL].http://www.gartner.com/technology/home.jsp.
[3]Wikipedia. Big data[EB/OL].http://en.wikipedia.org/wiki/Big_data.
[4]王左利.校園大數(shù)據(jù)規(guī)劃先行[J].中國教育網(wǎng)絡(luò),2014(1).
[5]李建中,劉顯敏.大數(shù)據(jù)的一個(gè)重要方面:數(shù)據(jù)可用性[J].計(jì)算機(jī)研究與發(fā)展,2013(6).
(編輯:王天鵬)