何勝+周兵+李仁璞+熊太純+郭丹
[摘要]大數(shù)據(jù)背景下,高校圖書館如何充分利用自身海量的數(shù)據(jù)資源提升教師的數(shù)據(jù)素養(yǎng)水平,是該領(lǐng)域面臨的挑戰(zhàn)性問題。首先綜述了數(shù)據(jù)素養(yǎng)研究現(xiàn)狀,結(jié)合大數(shù)據(jù)特征討論“大數(shù)據(jù)素養(yǎng)”的內(nèi)涵并給出其定義;接著依據(jù)高校教師的特點,提出以圖書館大數(shù)據(jù)平臺為依托,在大數(shù)據(jù)意識培養(yǎng)、大數(shù)據(jù)能力提高和大數(shù)據(jù)倫理內(nèi)化三個層面上對應(yīng)開展教育培訓,實踐服務(wù)和虛擬互動三方面服務(wù)的“大數(shù)據(jù)素養(yǎng)”教育策略?;趫D書館大數(shù)據(jù)平臺的方案能夠有效地將大數(shù)據(jù)技術(shù)深入融合到數(shù)據(jù)素養(yǎng)教育中,幫助高校教師盡快適應(yīng)當前大數(shù)據(jù)技術(shù)變革的要求。
[關(guān)鍵詞]數(shù)據(jù)素養(yǎng)教育;大數(shù)據(jù);高校圖書館;大數(shù)據(jù)倫理
十八屆五中全會提出實施國家大數(shù)據(jù)戰(zhàn)略,極大地推動了大數(shù)據(jù)在高等教育領(lǐng)域的應(yīng)用研究。高校圖書館擁有豐富的數(shù)據(jù)和人力資源,是教育大數(shù)據(jù)應(yīng)用的主要陣地。近年來,基于數(shù)據(jù)素養(yǎng)理論和高校圖書館資源,提高教師數(shù)據(jù)素養(yǎng)的相關(guān)研究,學界已經(jīng)積累了一些研究成果。然而在大數(shù)據(jù)環(huán)境下,如何從海量資源中收集數(shù)據(jù),發(fā)現(xiàn)知識,從而輔助教學活動,提高科研效率,完善自身專業(yè)發(fā)展,已成為當前教師數(shù)據(jù)素養(yǎng)教育面臨的主要問題,相關(guān)的研究還比較零散,并缺乏系統(tǒng)的解決方案。
本文在綜述數(shù)據(jù)素養(yǎng)研究的基礎(chǔ)上,提出“大數(shù)據(jù)素養(yǎng)”的概念并探討其內(nèi)涵;針對高校教師“大數(shù)據(jù)素養(yǎng)”教育面臨的問題,提出一種基于圖書館大數(shù)據(jù)平臺的解決方案。
1研究現(xiàn)狀分析
1.1數(shù)據(jù)素養(yǎng)概念和數(shù)據(jù)素養(yǎng)教育
國外學界將數(shù)據(jù)素養(yǎng)稱為數(shù)據(jù)信息素養(yǎng)(Datainformation Literacy,DIL)。David Herzog認為DIL過程包括數(shù)據(jù)獲取、評估、分析及可視化;Adam Beauchamp則將DIL簡述為闡釋、評價和傳播信息的能力;JacobCarlson認為數(shù)據(jù)素養(yǎng)教育應(yīng)涵蓋以下能力:數(shù)據(jù)采集、轉(zhuǎn)換、重用、分析和可視化能力,并應(yīng)注意數(shù)據(jù)倫理規(guī)范;Tibor Koltay認為數(shù)據(jù)素養(yǎng)是關(guān)于獲取數(shù)據(jù)、并能進行批判式的評價和利用的能力;Qin Jian強調(diào)數(shù)據(jù)素養(yǎng)教育過程中需要提升對科學數(shù)據(jù)的理解、利用和管理等能力。國內(nèi)方面,黃如花等深入分析英美等國的研究現(xiàn)狀后認為數(shù)據(jù)素養(yǎng)應(yīng)包括數(shù)據(jù)意識、數(shù)據(jù)能力和數(shù)據(jù)倫理三方面內(nèi)容;孟祥保討論了科學數(shù)據(jù)素養(yǎng)(Science DataLiteracy)的3個層次,即具有數(shù)據(jù)意識,具備數(shù)據(jù)知識與技能,了解數(shù)據(jù)管理政策法規(guī)、數(shù)據(jù)倫理。
從以上分析可以看出,國內(nèi)外學者對數(shù)據(jù)素養(yǎng)教育的概念及內(nèi)涵解析并不完全一致,但基本上都涵蓋數(shù)據(jù)意識、數(shù)據(jù)能力和數(shù)據(jù)倫理這三個方面的內(nèi)容,并認為數(shù)據(jù)能力是關(guān)鍵要素。
1.2圖書館支持下的數(shù)據(jù)素養(yǎng)教育研究
由于圖書館擁有大量數(shù)據(jù)資源且數(shù)據(jù)服務(wù)人才高度集中,因而成為開展數(shù)據(jù)素養(yǎng)教育的主要機構(gòu)。國外學界關(guān)注圖書館支持下的高校師生數(shù)據(jù)素養(yǎng)教育的實證研究。美國大學與圖書館研究協(xié)會(The Association of Collegeand Research Libraries,ACRL)認為,圖書館員有必要與高校教師開展合作,為DIL培育開發(fā)新的具有粘合力的課程;針對教師DIL的提高問題,加州大學洛杉磯分校的社會學系教師與圖書館員合作開展實踐研究:教師負責科學方法論、專業(yè)知識教學,館員負責數(shù)據(jù)采集、存儲和管理的實用性技能教學,共同提高師生的數(shù)據(jù)素養(yǎng)。國內(nèi)方面,張晨認為高校師生的數(shù)據(jù)素養(yǎng)教育將成為大數(shù)據(jù)時代圖書館的主要職能之一,并研究了數(shù)據(jù)素養(yǎng)教育的內(nèi)容與方式;基于網(wǎng)絡(luò)文獻調(diào)查法等手段,黃如花等提出數(shù)據(jù)素養(yǎng)教育應(yīng)結(jié)合圖書館資源平臺,采取包括初級、進階和高級三個階段的分層次循序漸進的方式開展。鄧李君等認為高校圖書館在數(shù)據(jù)管理、資源整合、數(shù)據(jù)描述、數(shù)據(jù)保存等方面具有較強的優(yōu)勢,專業(yè)講座、個性化培養(yǎng)等方式是提升高校教師數(shù)據(jù)素養(yǎng)的有效方式。
國外學者著重探討以高校教師和圖書館員相互合作的方式開展師生數(shù)據(jù)素養(yǎng)教育;國內(nèi)方面力圖跟蹤國外研究進行理論探討的同時,基于圖情領(lǐng)域方法提出數(shù)據(jù)素養(yǎng)教育的具體措施。但是國內(nèi)外研究存在如下問題:第一,偏重討論有限數(shù)據(jù)規(guī)模下的數(shù)據(jù)素養(yǎng)教育,在如何結(jié)合大數(shù)據(jù)特征,針對高校教師提升“大數(shù)據(jù)素養(yǎng)”以適應(yīng)大數(shù)據(jù)技術(shù)變革要求的角度,缺乏系統(tǒng)研究;第二,認可圖書館數(shù)據(jù)和智力資源對數(shù)據(jù)素養(yǎng)教育的優(yōu)勢,但是將教師和學生的數(shù)據(jù)素養(yǎng)放在一起討論。由于高校教師和學生分屬兩個不同特性的群體,在素養(yǎng)教育方面的知識儲備和能力水平存在不小的差異,有必要將二者分開加以討論,才能使數(shù)據(jù)素養(yǎng)教育方案更有針對性;第三,對“大數(shù)據(jù)素養(yǎng)”教育的討論大多還停留在方法概述和概念解析階段,缺乏有效的設(shè)計方案。
綜合以上分析,本文結(jié)合大數(shù)據(jù)理念和以往學界對數(shù)據(jù)素養(yǎng)的研究成果,首先分析“大數(shù)據(jù)素養(yǎng)”的內(nèi)涵并探索性提出“大數(shù)據(jù)素養(yǎng)”的定義,在此基礎(chǔ)上提出以高校教師為主體對象,涵蓋大數(shù)據(jù)意識培養(yǎng),大數(shù)據(jù)能力提高,大數(shù)據(jù)倫理內(nèi)化三個方面內(nèi)容的基于圖書館大數(shù)據(jù)平臺的應(yīng)對策略。
2“大數(shù)據(jù)素養(yǎng)”定義
“大數(shù)據(jù)素養(yǎng)”是全新的概念,現(xiàn)有文獻一般討論或解析大數(shù)據(jù)背景下的數(shù)據(jù)素養(yǎng)的內(nèi)涵,尚未有文獻直接給出“大數(shù)據(jù)素養(yǎng)”的定義??紤]到大數(shù)據(jù)雖然具有鮮明的特征,但其本質(zhì)仍然是數(shù)據(jù),也具有一般數(shù)據(jù)的基礎(chǔ)屬性,因而學界專家以往所提出的數(shù)據(jù)素養(yǎng)概念和內(nèi)涵,對海量數(shù)據(jù)情景下的數(shù)據(jù)素養(yǎng)研究具有重要啟發(fā)意義,所以可將數(shù)據(jù)素養(yǎng)的主要內(nèi)涵“數(shù)據(jù)意識、數(shù)據(jù)能力和數(shù)據(jù)倫理”擴展為“大數(shù)據(jù)意識、大數(shù)據(jù)能力和大數(shù)據(jù)倫理”,同時結(jié)合大數(shù)據(jù)的“數(shù)據(jù)量大、多樣性、增長快以及高價值”的4V特征賦予“大數(shù)據(jù)素養(yǎng)”新的意義。
本文借鑒國內(nèi)外學者對數(shù)據(jù)素養(yǎng)的研究成果,著重從技術(shù)和應(yīng)具備的能力角度,對“大數(shù)據(jù)素養(yǎng)”的概念做如下表述:“大數(shù)據(jù)素養(yǎng)”就是具備大數(shù)據(jù)意識,擁有運用數(shù)據(jù)處理和分析工具收集、整合、分析多樣化的海量數(shù)據(jù)資源,獲取并應(yīng)用高價值知識的能力,以及具備應(yīng)付大數(shù)據(jù)倫理失范問題的道德規(guī)范和法律知識的倫理修養(yǎng)。
2.1大數(shù)據(jù)意識
如圖1左側(cè)框中所示,大數(shù)據(jù)意識包括資源意識、技術(shù)意識和安全意識。
1)資源意識。大數(shù)據(jù)是重要資源。云計算、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)產(chǎn)生的海量數(shù)據(jù),其中蘊含巨大價值,是重要的資源,需要通過信息技術(shù)或工具挖掘。高校圖書館資源包括:各種紙質(zhì)資源,音視頻等電子資源,各類數(shù)據(jù)庫以及系統(tǒng)產(chǎn)生的日志數(shù)據(jù)等,這些數(shù)據(jù)需要整合并存儲到有統(tǒng)一結(jié)構(gòu)的數(shù)據(jù)庫,是開展“大數(shù)據(jù)素養(yǎng)”教育的主要資源。
2)技術(shù)意識。大數(shù)據(jù)處理需要技術(shù)支持。由于海量、多樣且高速增長的數(shù)據(jù)主要依賴技術(shù)手段收集、存儲、分配、管理和分析,對所采用的工具及使用方法應(yīng)有深入了解。學科服務(wù)是高校圖書館的主要任務(wù),要求精準、快速提供檢索服務(wù)和知識問答,涉及的技術(shù)包括:語義網(wǎng),數(shù)據(jù)導航、云計算等。
3)安全意識。大數(shù)據(jù)安全刻不容緩。安全意識包括風險意識和法律意識。由于大數(shù)據(jù)的開放性,大到國家安全,小至個人隱私都面臨泄漏的風險;因大量數(shù)據(jù)被盜竊和篡改、甚至被出賣而導致的損失,應(yīng)有依據(jù)相關(guān)法律自我保護的意識。高校圖書館數(shù)據(jù)庫中個人資料等數(shù)據(jù),從訪問日志挖掘出來的讀者偏好等都屬于個人隱私,應(yīng)有清醒的安全保護意識。
2.2大數(shù)據(jù)能力
大數(shù)據(jù)能力包括大數(shù)據(jù)采集能力、分析能力和應(yīng)用能力。
1)采集能力。從海量、多樣的數(shù)據(jù)資源中采集數(shù)據(jù),經(jīng)過清洗后整合形成統(tǒng)一的結(jié)構(gòu)化數(shù)據(jù)庫??梢詰?yīng)用抽取一一轉(zhuǎn)換一一裝載(Extraction-Transformation-Loading,ETL)技術(shù),將高校圖書館的各類資源采集并融合,構(gòu)建統(tǒng)一的語義網(wǎng)知識庫。
2)分析能力。基于所構(gòu)建的結(jié)構(gòu)化數(shù)據(jù)庫,恰當運用數(shù)據(jù)挖掘工具,包括各種分析算法和工具軟件,進行快速、精準的知識檢索,實現(xiàn)個性化推薦等。
3)應(yīng)用能力。應(yīng)用數(shù)據(jù)導航和可視化等工具實現(xiàn)學科知識導航,應(yīng)用社會網(wǎng)絡(luò)和語義網(wǎng)絡(luò)分析工具分析學科發(fā)展趨勢,提供智能決策等。
2.3大數(shù)據(jù)倫理
從思想和實踐層面上,將大數(shù)據(jù)倫理概括為道德規(guī)范和行為準則兩個方面。
1)道德規(guī)范。海量、多樣、快速、高價值特點,融合自由、合作、分享等時代精神,使得大數(shù)據(jù)具有極高的開放性,由此引起的安全和隱私保護問題,需要從思想上內(nèi)化為使用者的道德規(guī)范,其中包括道德觀念、道德準則、道德行為、道德評價等方面。
2)行為準則。在數(shù)據(jù)采集、數(shù)據(jù)取舍、數(shù)據(jù)使用過程中,有關(guān)大數(shù)據(jù)預測和預防性保護、數(shù)據(jù)獨裁與唯數(shù)據(jù)論、人性自由與外部約束等倫理問題,需要在實踐應(yīng)用中對使用者行為加以約束,如采取技術(shù)保障手段和制定法律條文等。
從以上的分析還可以看出,大數(shù)據(jù)意識是認識層面,要求認識到大數(shù)據(jù)的價值,以及數(shù)據(jù)管理不善可能帶來的危害;大數(shù)據(jù)能力是核心內(nèi)容,是數(shù)據(jù)素養(yǎng)提升的關(guān)鍵要素;大數(shù)據(jù)倫理在具備基本的數(shù)據(jù)意識和擁有一定的數(shù)據(jù)能力的基礎(chǔ)上,使用者應(yīng)持有的道德規(guī)范和應(yīng)遵循的行為準則,是大數(shù)據(jù)素養(yǎng)的高級階段。
3高校教師“大數(shù)據(jù)素養(yǎng)”教育策略
依據(jù)百度百科的描述,策略是指“不同的條件下,為達到不同的結(jié)果所采用的方式、方法、媒體的總和”,本文策略研究聚焦于當前大數(shù)據(jù)環(huán)境下,針對大數(shù)據(jù)素養(yǎng)教育所要達到的要求,圖書館在提升高校教師大數(shù)據(jù)素養(yǎng)方面應(yīng)采取的方法和手段。
本文提出一種基于圖書館大數(shù)據(jù)系統(tǒng)平臺開展數(shù)據(jù)素養(yǎng)教育的方案。因為大數(shù)據(jù)平臺能快速地整合海量的教育資源,以培訓方式提高教師的大數(shù)據(jù)意識;能有效地基于平臺中集成的工具軟件進行自我實踐,從而提升教師大數(shù)據(jù)技術(shù)能力;能持久地與圖書館館員互動,長期獲取大數(shù)據(jù)倫理知識并逐步內(nèi)化為個體特質(zhì)。另外,相比于其他受教育的主體,高校教師一般具有較高的知識水平和較強的動手實踐能力,經(jīng)過培訓后,能夠較快地適應(yīng)大數(shù)據(jù)平臺的各種互動方式。
3.1圖書館大數(shù)據(jù)服務(wù)平臺
圖書館大數(shù)據(jù)平臺架構(gòu)一般由數(shù)據(jù)采集、數(shù)據(jù)存儲和數(shù)據(jù)服務(wù)幾個部分組成,為了實時處理海量數(shù)據(jù),一般采取云計算分布式計算平臺;為實現(xiàn)學科知識庫精準檢索和提供個性化服務(wù),可采用語義網(wǎng)技術(shù)構(gòu)建大規(guī)模知識庫。這是一種以大數(shù)據(jù)素養(yǎng)教育為目標的大數(shù)據(jù)平臺(如圖2所示)。該框架包括數(shù)據(jù)采集與清洗,數(shù)據(jù)存儲和圖書館大數(shù)據(jù)服務(wù)與應(yīng)用三個部分。
數(shù)據(jù)采集與清洗。相關(guān)技術(shù)采用Hadoop的云平臺及分布式數(shù)據(jù)庫技術(shù)(MySQL和MongoDB)。應(yīng)用語義網(wǎng)和本體技術(shù),從互聯(lián)網(wǎng)、物聯(lián)網(wǎng)資源(包括博客,微博,微信公眾號,新聞網(wǎng)站和論壇以及語義網(wǎng)知識庫等),圖書館資源(包括學科專業(yè)數(shù)據(jù)庫,書目庫,專利庫,OA資源等)中抽取教育資源、學科數(shù)據(jù)等,并進行數(shù)據(jù)清洗。
數(shù)據(jù)存儲。采用D2R Server、D2RQ等工具對不同的數(shù)據(jù)集關(guān)聯(lián),構(gòu)建教育資源、圖書館關(guān)聯(lián)數(shù)據(jù),語義網(wǎng)學科知識庫和互動交流基礎(chǔ)數(shù)據(jù)庫,并存儲于云平臺上的MySQL數(shù)據(jù)庫或MongoDB數(shù)據(jù)庫。
圖書館大數(shù)據(jù)服務(wù)和應(yīng)用。開發(fā)Web應(yīng)用系統(tǒng),并通過數(shù)據(jù)庫訪問接口獲取數(shù)據(jù),應(yīng)用數(shù)據(jù)挖掘和機器學習技術(shù),獲取高價值知識,提供面向教師的教育培訓,實踐服務(wù)和虛擬互動等應(yīng)用。
3.2大數(shù)據(jù)素養(yǎng)教育策略
如圖2所示,結(jié)合大數(shù)據(jù)意識培養(yǎng),能力提高和倫理內(nèi)化的目標,分別采取教育培訓、實踐服務(wù)和虛擬互動的形式開展“大數(shù)據(jù)素養(yǎng)”教育。以下主要從教育方式和內(nèi)容兩個角度,結(jié)合圖書館大數(shù)據(jù)平臺,面向高校教師討論大數(shù)據(jù)素養(yǎng)教育策略。
3.2.1大數(shù)據(jù)意識培養(yǎng)
教育形式。在圖書館大數(shù)據(jù)平臺上,以在線課程與講座視頻為主,通過在線課程、MOOC,微課,視頻點播等不同媒體,開展一般性內(nèi)容的基礎(chǔ)講座和個性化內(nèi)容的專業(yè)講座,為教師提供大數(shù)據(jù)意識的培養(yǎng)。大數(shù)據(jù)平臺的優(yōu)勢在于,海量的存儲空間能存儲巨量的課程資源,高速的云計算平臺能使課程和各種視頻的播放非常流暢快捷。
教育內(nèi)容。①資源意識。識別大數(shù)據(jù)資源的類型,了解自己領(lǐng)域相關(guān)的科研和教育資源獲取方法;②技術(shù)意識。認識大數(shù)據(jù)處理和分析的一系列的方法和技術(shù)的背景,以及不同技術(shù)的適用范圍;③安全意識。認識到各種教學和科研資源(包括版權(quán))使用規(guī)范以及個人隱私保護的意義。
3.2.2大數(shù)據(jù)能力提高
教育形式。通過對圖書館數(shù)據(jù)資源的收集、整合和分析等實踐活動,以及使用平臺所提供的知識檢索、個性化服務(wù)和數(shù)據(jù)導航等服務(wù),密切與平臺互動以提高自身技術(shù)能力。大數(shù)據(jù)平臺的優(yōu)勢在于,高校教師可以自設(shè)情境,自行實踐包括知識檢索,體驗知識問答和個性化推薦等技術(shù)和服務(wù);能充分體驗到大數(shù)據(jù)平臺中精準的知識檢索,豐富的導航與可視化效果。
教育內(nèi)容。①采集能力。對不同類型格式數(shù)據(jù)的收集入庫,數(shù)據(jù)格式的相互轉(zhuǎn)換,數(shù)據(jù)存儲以及應(yīng)用相關(guān)工具將不同類型的數(shù)據(jù)庫整合成統(tǒng)一結(jié)構(gòu)化數(shù)據(jù)庫的能力。②分析能力。應(yīng)用平臺提供的軟件工具和搜索引擎檢索學科知識,實踐個性化定制知識,體驗個性化推薦服務(wù);應(yīng)用可視化工具創(chuàng)建數(shù)據(jù)導航和知識地圖,顯示數(shù)據(jù)演變過程和知識脈絡(luò)關(guān)系等。③應(yīng)用能力。根據(jù)數(shù)據(jù)導航,知識地圖以及個性化推薦的結(jié)果,理解知識來源、知識流動和知識匯聚的脈絡(luò),跟蹤科研動態(tài),預測學科發(fā)展前沿。
3.2.3大數(shù)據(jù)倫理內(nèi)化
教育形式。通過建立在大數(shù)據(jù)平臺上的各類虛擬社區(qū)和互動論壇(如新聞社區(qū),BBS論壇等),在圖書館館員的主導下,開展互動交流:包括教師之間互動、教師和館員的網(wǎng)絡(luò)互動等,并通過社交網(wǎng)絡(luò)分析工具對交流內(nèi)容進行分析,以發(fā)現(xiàn)熱點主題并跟蹤熱點內(nèi)容。大數(shù)據(jù)平臺的優(yōu)勢在于,應(yīng)用語義網(wǎng)檢索工具能快速精準獲取互聯(lián)網(wǎng)上的相關(guān)資料,及時提供到論壇,供教師學習和參考;應(yīng)用平臺上的大規(guī)模網(wǎng)絡(luò)實時分析工具快速發(fā)現(xiàn)論壇新的熱點話題并加以引導。
教育內(nèi)容。①道德規(guī)范。從海量數(shù)據(jù)資源中提取有關(guān)大數(shù)據(jù)道德規(guī)范的文檔,視頻,熱點評論等資料,并與教師互動。②行為準則。提取有關(guān)國家數(shù)據(jù)管理政策法規(guī)、數(shù)據(jù)倫理等知識,分享并討論,幫助教師逐步內(nèi)化為具有自我約束力的個體行為規(guī)范。
4結(jié)束語
本文探討的“大數(shù)據(jù)素養(yǎng)”的內(nèi)涵是以意識為基礎(chǔ),以能力為核心,倫理為升華的有機整體,因而針對性提出先培訓意識,再實踐能力,最后內(nèi)化為倫理的大數(shù)據(jù)素養(yǎng)的養(yǎng)成思路。
“大數(shù)據(jù)素養(yǎng)”有著豐富的內(nèi)涵和深刻的含義,考慮到大數(shù)據(jù)應(yīng)用非常依賴信息技術(shù)手段,本文提出的“大數(shù)據(jù)素養(yǎng)”的定義,偏重從技術(shù)和應(yīng)具備的能力角度解析和探討。基于其它視角的討論,是本文后續(xù)研究重點關(guān)注的內(nèi)容。