羅軍鋒+徐菲
摘 要:隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)從簡單的處理對象開始轉(zhuǎn)變?yōu)榛A(chǔ)性資源,如何更好地管理和利用好大數(shù)據(jù)已經(jīng)成為普遍關(guān)注的話題,各行各業(yè)的信息化因此都會發(fā)生深層次的變革,高校也不例外。本文將聚焦大數(shù)據(jù)時代下的高校信息化這個話題,首先討論了大數(shù)據(jù)的基本概念、關(guān)鍵技術(shù)、高校信息化在大數(shù)據(jù)時代的主要挑戰(zhàn),最后介紹了我校大數(shù)據(jù)處理的基本框架平臺。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)分析;高校信息化
中圖分類號:TP311 文獻標(biāo)志碼:A 文章編號:1673-8454(2014)03-0011-04
引言
近年來,隨著以博客、社交網(wǎng)、微博、微信為代表的新媒體地不斷出現(xiàn),特別是信息獲取技術(shù)、物聯(lián)網(wǎng)、云計算等技術(shù)的興起,引發(fā)了數(shù)據(jù)規(guī)模爆炸式的增長,學(xué)術(shù)界、企業(yè)界、政府機構(gòu)紛紛開始關(guān)注大數(shù)據(jù)問題。學(xué)術(shù)界最早是《Nature》于2008年就推出了Big Data???。[1]全球知名的咨詢公司麥肯錫2011年6月份發(fā)布了一份關(guān)于大數(shù)據(jù)的報告“Big data:The next frontier for innovation,competition,and productivity”,對大數(shù)據(jù)的影響、關(guān)鍵技術(shù)和應(yīng)用領(lǐng)域等都進行了很詳細的分析。[2]美國奧巴馬政府啟動了“大數(shù)據(jù)研究和發(fā)展倡議”,計劃在生物醫(yī)學(xué)、環(huán)境、科研等領(lǐng)域利用大數(shù)據(jù)進行技術(shù)突破。我國在《國家中長期科技發(fā)展規(guī)劃綱要(2006-2020)》提出:“信息領(lǐng)域要重點研究開發(fā)……海量信息處理及知識挖掘的理論與方法……”。另一方面,著名的連鎖超市沃爾瑪每小時需要處理100萬條用戶請求,維護著超過2.5PB的數(shù)據(jù)庫;社交網(wǎng)絡(luò)Facebook存儲超過500億張照片;IDC多年的研究結(jié)果證實:全球數(shù)據(jù)量大約每兩年翻一番,每年產(chǎn)生的數(shù)據(jù)量按指數(shù)級增長,目前全球有46億移動電話用戶,有20億人訪問互聯(lián)網(wǎng),所有這些都證明了大數(shù)據(jù)時代已經(jīng)到來,甚至有人認(rèn)為,大數(shù)據(jù)是繼物聯(lián)網(wǎng)、云計算后IT產(chǎn)業(yè)又一次顛覆性的技術(shù)變革。
本文試圖從大數(shù)據(jù)的基本概念、定義出發(fā),分析了大數(shù)據(jù)時代的關(guān)鍵技術(shù),大數(shù)據(jù)時代的高等教育信息化面臨的挑戰(zhàn)、對策、未來的應(yīng)用前景等。
一、大數(shù)據(jù)的基本概念及特點
對于大數(shù)據(jù)目前尚沒有一個公認(rèn)的定義,維基百科對大數(shù)據(jù)的定義為:大數(shù)據(jù)是指利用常用軟件捕獲、管理和處理數(shù)據(jù)所耗時間超過可容忍時間的數(shù)據(jù)集。[3]麥肯錫將大數(shù)據(jù)定義為:無法在一定時間內(nèi)用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合。[4]大數(shù)據(jù)不是一種新技術(shù),也不是新產(chǎn)品,而是一種新現(xiàn)象,大數(shù)據(jù)強調(diào)對數(shù)據(jù)的抓取、管理和處理。
1.大數(shù)據(jù)具有以下4個特點,既4個“V”[5]
(1)數(shù)量(Volumes):是指數(shù)據(jù)規(guī)模超大。數(shù)量級別從TB(1TB=1024GB)級別,躍升到 PB(1PB=1024TB)、EB(1 EB = 1 024 PB )乃至 ZB (1 ZB =1 024 EB )級別。
(2)多樣性(Variety):是指管理結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)來自多種數(shù)據(jù)源如傳感器、智能設(shè)備, 數(shù)據(jù)種類和格式?jīng)_破了以前所限定的結(jié)構(gòu)化數(shù)據(jù)范疇,包括文本、微博、音頻、視頻等等。
(3)速度(Velocity):是指處理數(shù)據(jù)快,包含大量或?qū)崟r數(shù)據(jù)分析處理的時間要求非常短,1秒定律。速度影響數(shù)據(jù)時延,從數(shù)據(jù)創(chuàng)建或獲取到數(shù)據(jù)可以訪問的時間差。
(4)價值(Value):是指價值密度低,商業(yè)價值高。以視頻為例 ,連續(xù)不間斷的監(jiān)控過程中 ,可能有用的數(shù)據(jù)僅僅有一兩秒。
大數(shù)據(jù)與傳統(tǒng)的數(shù)據(jù)庫也有明顯的區(qū)別,兩者在數(shù)據(jù)來源、數(shù)據(jù)處理方式和數(shù)據(jù)思維等各個方面都有很大的變化。正像孟小峰所言,兩者的區(qū)別就是“池塘捕魚”和“大海捕魚”的區(qū)別,前者代表著傳統(tǒng)數(shù)據(jù)庫時代的數(shù)據(jù)管理方式,后者則對應(yīng)著大數(shù)據(jù)時代的數(shù)據(jù)管理方式,其在數(shù)據(jù)規(guī)模、數(shù)據(jù)類型、數(shù)據(jù)模式、數(shù)據(jù)對象、處理工具上都有巨大的差異。[6]這意味著面對大數(shù)據(jù)時代,應(yīng)該采取全新的數(shù)據(jù)思維來應(yīng)對,這種數(shù)據(jù)思維將數(shù)據(jù)看作一種基礎(chǔ)資源,用這種資源來協(xié)同解決諸多領(lǐng)域的問題。
2.大數(shù)據(jù)來源
那么大數(shù)據(jù)來源于哪里呢?人類經(jīng)過幾千年的發(fā)展,今天數(shù)據(jù)的產(chǎn)生已經(jīng)不受時間、地點的限制。目前,大數(shù)據(jù)的來源主要有以下幾個部分。
(1)信息系統(tǒng)。或者叫運營系統(tǒng),數(shù)據(jù)庫的出現(xiàn)促使了這一階段的快速發(fā)展,常見的超市管理系統(tǒng)、銀行管理系統(tǒng),高校人事管理信息系統(tǒng),每一筆業(yè)務(wù),都會在數(shù)據(jù)庫中產(chǎn)生一系列數(shù)據(jù),該系統(tǒng)經(jīng)過多年的發(fā)展,已經(jīng)趨于穩(wěn)定與成熟。
(2)互聯(lián)網(wǎng)廣大用戶。互聯(lián)網(wǎng)的誕生促使了人類交流新篇章的開啟,尤其是微博、微信為代表的新媒體的發(fā)展和以智能手機、平板電腦為代表的新型移動職能終端的出現(xiàn),促使了以用戶原創(chuàng)內(nèi)容(User Generated Content,UGC)這類數(shù)據(jù)的爆炸式增長,其產(chǎn)生的數(shù)據(jù)量更是無可比擬的。
(3)物聯(lián)網(wǎng)系統(tǒng)。傳感器的廣泛布置,將人類的觸角實時伸向了社會的各個角落,這些設(shè)備源源不斷地產(chǎn)生新數(shù)據(jù)。
數(shù)據(jù)是廣泛的,龐大的,巨量的,所缺乏的是從中提取出知識的能力是更需要的。大數(shù)據(jù)的根本目的也就是提取有用的知識,并將用到具體的領(lǐng)域。這才是大數(shù)據(jù)的真正挑戰(zhàn)。
二、大數(shù)據(jù)的關(guān)鍵技術(shù)
隨著大數(shù)據(jù)時代的來到,要處理的數(shù)據(jù)量越來越大,傳統(tǒng)的常規(guī)數(shù)據(jù)處理技術(shù)已經(jīng)無法應(yīng)對,為了解決這些難題就需要突破傳統(tǒng)技術(shù),根據(jù)大數(shù)據(jù)的特點進行技術(shù)變革,因此就需要解決一系列針對大數(shù)據(jù)收集、存儲、管理、處理、分析和可視化等技術(shù),這些關(guān)鍵技術(shù)包括以下幾類。
(1)分布式文件系統(tǒng):該系統(tǒng)提供最底層存儲能力的支持,是支撐上層應(yīng)用的基礎(chǔ)。Google公司最早開發(fā)除了自己的文件系統(tǒng)GFS(Google File System),該系統(tǒng)主要針對文件較大,讀遠大于寫的場景,采用主從結(jié)構(gòu),通過數(shù)據(jù)分塊、追加更新等方式實現(xiàn)海量數(shù)據(jù)的高效存儲。GFS的架構(gòu)如圖1所示。另外在GFS以及在它基礎(chǔ)上衍生出來的開源分布式文件系統(tǒng)HDFS與KFS。Google公司針對GFS無法滿足新形勢需要的問題,進行了重新設(shè)計,新系統(tǒng)的名稱為Colosuss,具體實現(xiàn)尚未公開?,F(xiàn)在常用的分布式系統(tǒng)存在著對小文件的支持受限、元數(shù)據(jù)節(jié)點單一等問題。
(2)分布式數(shù)據(jù)庫系統(tǒng):由于關(guān)系模型的分布式數(shù)據(jù)庫不能應(yīng)對大數(shù)據(jù)時代大規(guī)模的壓力、不能應(yīng)對多樣化的數(shù)據(jù)類型等,相應(yīng)的提出了許多新型數(shù)據(jù)庫系統(tǒng),如Google的Bigtable、Amazon的Dynamo等等,直到現(xiàn)在形成了統(tǒng)一稱為NoSQL(not only SQL)數(shù)據(jù)庫。雖然NoSQL沒有準(zhǔn)確的定義,但一般認(rèn)為具有模式自由、簡易備份、最終一致性、支持海量數(shù)據(jù)等特征。是指那些非關(guān)系型的、分布式的、不保證遵循ACID原則的數(shù)據(jù)存儲系統(tǒng),分為key-value存儲、文檔數(shù)據(jù)庫和圖數(shù)據(jù)庫等3類。[6] NoSQL和關(guān)系型數(shù)據(jù)庫的簡單對比如表所示。[7]
典型的NoSQL包括開源的HBase、Cassandra等。本系統(tǒng)包括對應(yīng)的查詢問題,在大數(shù)據(jù)時代,針對海量數(shù)據(jù)下的結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),實現(xiàn)快速、準(zhǔn)確的查詢功能也是非常困難的,其中的難點就是索引的更新問題。目前主流查詢索引技術(shù)是以Google公司的BigTable為代表的列簇式NoSQL數(shù)據(jù)庫。但針對NoSQL數(shù)據(jù)庫上的查詢優(yōu)化技術(shù)仍有很多關(guān)鍵性問題亟待解決。
(3)數(shù)據(jù)分析:對大數(shù)據(jù)進行挖掘分析,發(fā)現(xiàn)蘊含的知識,研究社會運行的規(guī)律與發(fā)展趨勢是大數(shù)據(jù)的根本價值所在。在大數(shù)據(jù)時代,傳統(tǒng)的挖掘和計算方法在性能和效用上遇到了嚴(yán)重的瓶頸。因此需要對傳統(tǒng)的分析方法進行變革。在計算模型上最著名的為Google的MapReduce,目前,Google公司針對MapReuce的離線處理模式的不足,提出了基于Web數(shù)據(jù)級別的交互式數(shù)據(jù)分析系統(tǒng)Dremel,能夠?qū)崿F(xiàn)極短時間內(nèi)的海量數(shù)據(jù)分析。在離線與實時處理模式上,已經(jīng)出現(xiàn)了二者融合的趨勢。
(4)大數(shù)據(jù)處理工具:Hadoop是目前最為流行的大數(shù)據(jù)處理平臺,目前,將該平臺進行改進,以便應(yīng)用到各種場景是研究的熱點之一。當(dāng)然,除了Hadoop,還有其他的處理工具,這里就不一一提出。
三、大數(shù)據(jù)時代高校信息化面臨的挑戰(zhàn)
高校也是數(shù)據(jù)生產(chǎn)大戶,首先中國高校規(guī)模一般都比較大,萬人以上的大學(xué)非常多。其次,在高校里上學(xué)的學(xué)生從招生、學(xué)籍、選課、成績、飯?zhí)?、活動等等都會產(chǎn)生大量的數(shù)據(jù);教師的上課音視頻、課件、實驗數(shù)據(jù)等也會有龐大的數(shù)據(jù);校務(wù)系統(tǒng)運行、圖書館、微博、博客等都會產(chǎn)生很大的數(shù)據(jù);尤其重要的是科研和教學(xué)數(shù)據(jù),是高等教育的兩大核心功能的重要數(shù)據(jù)。在這個大數(shù)據(jù)的時代,只有用好這些數(shù)據(jù),才能更好地幫助教學(xué)、科研,做好招生推廣,學(xué)生管理等各個方面的工作,用好這些數(shù)據(jù),毋庸置疑將會大大提高高校的信息化水平。要用好大數(shù)據(jù),至少面臨以下幾個方面的挑戰(zhàn):
(1)大數(shù)據(jù)集成與分析:大數(shù)據(jù)多樣性的特點就決定了數(shù)據(jù)來源的廣泛性、復(fù)雜性,這種數(shù)據(jù)環(huán)境給大數(shù)據(jù)的處理帶來了很大的挑戰(zhàn),必須對多種數(shù)據(jù)來源進行抽取集成,首先進行數(shù)據(jù)的清洗、經(jīng)過關(guān)聯(lián)和聚合,采用統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)來存儲這些數(shù)據(jù)。大數(shù)據(jù)分析無疑是整個大數(shù)據(jù)時代的核心所在,因為大數(shù)據(jù)的價值就產(chǎn)生于數(shù)據(jù)分析過程中。當(dāng)然,數(shù)據(jù)分析是基于集成處理后的數(shù)據(jù)作為數(shù)據(jù)分析的原始數(shù)據(jù)。數(shù)據(jù)分析一般是根據(jù)不用的應(yīng)用需求從數(shù)據(jù)中的部分或者全部進行分析。傳統(tǒng)的分析技術(shù)如數(shù)據(jù)挖掘、機器學(xué)習(xí)、統(tǒng)計分析在大數(shù)據(jù)時代需要作出調(diào)整,主要原因是大數(shù)據(jù)時代的“大”字,具體的調(diào)整包括分析前數(shù)據(jù)的預(yù)處理、算法、評價質(zhì)量等等。
(2)大數(shù)據(jù)的存儲:需要研究低成本、高效率的數(shù)據(jù)存儲方式,眾所周知,低成本一般意味著低效率,但是在數(shù)據(jù)時代,如果處理效率低下,則大數(shù)據(jù)毫無意義,因此,必須打破常規(guī),要處理好大數(shù)據(jù)的存儲。另外,還要做好大數(shù)據(jù)時代數(shù)據(jù)存儲的管理問題,因為存儲空間巨大無疑給存儲硬件帶來壓力。同時,非結(jié)構(gòu)化數(shù)據(jù)存儲進行有序、高效的存儲管理也是面臨的挑戰(zhàn)。
(3)大數(shù)據(jù)的融合與使用:數(shù)據(jù)不融合就發(fā)揮不出數(shù)據(jù)的大價值,大數(shù)據(jù)面臨的一個非技術(shù)性的重要問題就是數(shù)據(jù)的融合。作為高等院校,大數(shù)據(jù)的融合應(yīng)該走在前列,必須徹底打通數(shù)據(jù)孤島,將各個業(yè)務(wù)充分整合,有效融合,只有如此,才能形成高質(zhì)量的大數(shù)據(jù),才能發(fā)揮大數(shù)據(jù)時代高等教育信息化對學(xué)校發(fā)展的具體推動作用。
四、大數(shù)據(jù)時代高校信息化建設(shè)框架
盡管大數(shù)據(jù)的來源廣泛,需求和數(shù)據(jù)類型、結(jié)構(gòu)都不相同,但最基本的處理流程是相同的。筆者們認(rèn)為:大數(shù)據(jù)時代下的高校信息化建設(shè)工作就是做好大數(shù)據(jù)的抽取、存儲、分析、管理、應(yīng)用等工作,因此大數(shù)據(jù)的處理流程才是高校信息化工作的重點。大數(shù)據(jù)的處理平臺的總體架構(gòu)如圖2所示,整個大數(shù)據(jù)的處理流程可以定義為對廣泛異構(gòu)的數(shù)據(jù)源進行數(shù)據(jù)抽取和數(shù)據(jù)集成,結(jié)果形成統(tǒng)一標(biāo)準(zhǔn)的數(shù)據(jù)進行存儲。利用合適的數(shù)據(jù)分析挖掘技術(shù)對存儲的數(shù)據(jù)進行分析挖掘,從中得到有用的知識并用適當(dāng)?shù)姆绞綄⒔Y(jié)果展現(xiàn)給終端用戶??蚣芊譃樗膶?,分別為數(shù)據(jù)提取層、分析層、展現(xiàn)層、用戶應(yīng)用層。該平臺準(zhǔn)備應(yīng)用到我校未來大數(shù)據(jù)處理平臺上,以實現(xiàn)對我校大數(shù)據(jù)的抽取、存儲、分析管理。
(1)數(shù)據(jù)提取層:上文提到大數(shù)據(jù)的一個重要特點就是多樣性,意味著數(shù)據(jù)來源廣泛、數(shù)據(jù)類型多樣,要想處理大數(shù)據(jù),必須對數(shù)據(jù)源的數(shù)據(jù)進行提取和集成。為了提取高質(zhì)量的數(shù)據(jù),首先需要獲取高質(zhì)量的數(shù)據(jù),解決從多數(shù)據(jù)源中有效地獲取高質(zhì)量的數(shù)據(jù),同時建立健全多模態(tài)大數(shù)據(jù)融合計算的理論和算法,實現(xiàn)數(shù)據(jù)的精準(zhǔn)整合,在集成前做到數(shù)據(jù)錯誤的自動檢測與修復(fù)。從學(xué)校各個系統(tǒng),本校老師學(xué)生的博客、微博,學(xué)校的公開課程視頻等等數(shù)據(jù)中進行數(shù)據(jù)的提取與集成,加工成我校統(tǒng)一標(biāo)準(zhǔn)的大數(shù)據(jù),統(tǒng)一存儲,以方便下一步數(shù)據(jù)的分析。
(2)數(shù)據(jù)分析層:數(shù)據(jù)分析是大數(shù)據(jù)處理流程的重中之重,體現(xiàn)大數(shù)據(jù)價值所在。傳統(tǒng)的分析技術(shù)和算法如聚類分析、機器學(xué)習(xí)、統(tǒng)計分析等必須作出變革才能適應(yīng)大數(shù)據(jù)時代的需要。特別是算法和分析技術(shù)在面對海量數(shù)據(jù)方面效率不足的問題需要重點解決,形成具有淺層、深層語義分析的引擎。
(3)數(shù)據(jù)展現(xiàn)層:就是將數(shù)據(jù)分析的結(jié)果如何恰當(dāng)?shù)恼故境鰜怼W詈唵蔚谋热缥谋菊故具@些初級展示技術(shù),必須引入可視化技術(shù)來展現(xiàn)大量數(shù)據(jù)分析結(jié)果,以用戶容易理解的方式進行展示,最好采用人機交互技術(shù),實現(xiàn)很高的用戶體驗度。
(4)用戶應(yīng)用層:該層主要是大數(shù)據(jù)處理一些應(yīng)用,如智慧交大應(yīng)用項目,以最終為廣大師生提供高質(zhì)量、個性化的服務(wù)。
通過建立我校大數(shù)據(jù)處理統(tǒng)一平臺,將徹底整合我校所有信息資源、形成我校統(tǒng)一的大數(shù)據(jù)提取、集成、存儲、分析、展現(xiàn)和管理的大數(shù)據(jù)處理模式,為學(xué)校領(lǐng)導(dǎo)提供及時、準(zhǔn)確的校務(wù)決策;為教職工提供便捷快速的信息查詢;為學(xué)生提供全方位、個性化的學(xué)習(xí)、生活等服務(wù)。
為了實現(xiàn)這一目標(biāo),應(yīng)對大數(shù)據(jù)時代高校信息化面臨的挑戰(zhàn),迫切需要我們研究大數(shù)據(jù)時代的各種技術(shù),切實轉(zhuǎn)變到大數(shù)據(jù)時代的思維,與學(xué)校相關(guān)計算機專家學(xué)者一道,借鑒兄弟院校和國外的成功案例,以早日實現(xiàn)這一藍圖。
五、結(jié)束語
2013年被稱為中國的大數(shù)據(jù)元年,未來的十年,將是大數(shù)據(jù)引領(lǐng)下的智慧科技時代。本文介紹了大數(shù)據(jù)的含義和特點、大數(shù)據(jù)的關(guān)鍵技術(shù)、大數(shù)據(jù)對高校信息化中的挑戰(zhàn)進行了梳理,同時提出來高校大數(shù)據(jù)處理框架。不可否認(rèn),大數(shù)據(jù)在高校中有著廣闊的應(yīng)用前景,雖然從目前的情況來看還處在起步階段,在大數(shù)據(jù)時代,將高等教育信息化做好仍有很長的路要走,但只要我們一步步的努力,大數(shù)據(jù)時代的高校信息化也必將更加強大。
參考文獻:
[1]Nature. Big Data[EB/OL].[2012-10-02].http://www.nature.com/news/specials/bigdata/index.html
[2]Manyika J,Chui M,Brown B,et al.Big data: The nextfrontier for innovation,competition ,and productivity[R/OL].[2012-10-02].http://www.mckinsey.com/Insights/MGI/Research/Tehnology_and_Innovation/Big_data_The_ next_frontier_for_innovation
[3]Big data [EB/OL].[2012-10-02].http://en.wikipedia.org/wiki/Big_data
[4]計算機行業(yè)-大數(shù)據(jù)(Big Data)專題報告[R].上海:光大證券有限公司研究所,2011.
[5]大數(shù)據(jù)分析技術(shù)的發(fā)展[EB/OL].[2012-5-16].http://tech.ccidnet.com/art/32963/20120516/3859799_1.html
[6]申德榮,于戈,王習(xí)特等. 支持大數(shù)據(jù)管理的NoSQL系統(tǒng)研究綜述[J].軟件學(xué)報,2013.
[7]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(1):146-169.
(編輯:楊馥紅)
(4)用戶應(yīng)用層:該層主要是大數(shù)據(jù)處理一些應(yīng)用,如智慧交大應(yīng)用項目,以最終為廣大師生提供高質(zhì)量、個性化的服務(wù)。
通過建立我校大數(shù)據(jù)處理統(tǒng)一平臺,將徹底整合我校所有信息資源、形成我校統(tǒng)一的大數(shù)據(jù)提取、集成、存儲、分析、展現(xiàn)和管理的大數(shù)據(jù)處理模式,為學(xué)校領(lǐng)導(dǎo)提供及時、準(zhǔn)確的校務(wù)決策;為教職工提供便捷快速的信息查詢;為學(xué)生提供全方位、個性化的學(xué)習(xí)、生活等服務(wù)。
為了實現(xiàn)這一目標(biāo),應(yīng)對大數(shù)據(jù)時代高校信息化面臨的挑戰(zhàn),迫切需要我們研究大數(shù)據(jù)時代的各種技術(shù),切實轉(zhuǎn)變到大數(shù)據(jù)時代的思維,與學(xué)校相關(guān)計算機專家學(xué)者一道,借鑒兄弟院校和國外的成功案例,以早日實現(xiàn)這一藍圖。
五、結(jié)束語
2013年被稱為中國的大數(shù)據(jù)元年,未來的十年,將是大數(shù)據(jù)引領(lǐng)下的智慧科技時代。本文介紹了大數(shù)據(jù)的含義和特點、大數(shù)據(jù)的關(guān)鍵技術(shù)、大數(shù)據(jù)對高校信息化中的挑戰(zhàn)進行了梳理,同時提出來高校大數(shù)據(jù)處理框架。不可否認(rèn),大數(shù)據(jù)在高校中有著廣闊的應(yīng)用前景,雖然從目前的情況來看還處在起步階段,在大數(shù)據(jù)時代,將高等教育信息化做好仍有很長的路要走,但只要我們一步步的努力,大數(shù)據(jù)時代的高校信息化也必將更加強大。
參考文獻:
[1]Nature. Big Data[EB/OL].[2012-10-02].http://www.nature.com/news/specials/bigdata/index.html
[2]Manyika J,Chui M,Brown B,et al.Big data: The nextfrontier for innovation,competition ,and productivity[R/OL].[2012-10-02].http://www.mckinsey.com/Insights/MGI/Research/Tehnology_and_Innovation/Big_data_The_ next_frontier_for_innovation
[3]Big data [EB/OL].[2012-10-02].http://en.wikipedia.org/wiki/Big_data
[4]計算機行業(yè)-大數(shù)據(jù)(Big Data)專題報告[R].上海:光大證券有限公司研究所,2011.
[5]大數(shù)據(jù)分析技術(shù)的發(fā)展[EB/OL].[2012-5-16].http://tech.ccidnet.com/art/32963/20120516/3859799_1.html
[6]申德榮,于戈,王習(xí)特等. 支持大數(shù)據(jù)管理的NoSQL系統(tǒng)研究綜述[J].軟件學(xué)報,2013.
[7]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(1):146-169.
(編輯:楊馥紅)
(4)用戶應(yīng)用層:該層主要是大數(shù)據(jù)處理一些應(yīng)用,如智慧交大應(yīng)用項目,以最終為廣大師生提供高質(zhì)量、個性化的服務(wù)。
通過建立我校大數(shù)據(jù)處理統(tǒng)一平臺,將徹底整合我校所有信息資源、形成我校統(tǒng)一的大數(shù)據(jù)提取、集成、存儲、分析、展現(xiàn)和管理的大數(shù)據(jù)處理模式,為學(xué)校領(lǐng)導(dǎo)提供及時、準(zhǔn)確的校務(wù)決策;為教職工提供便捷快速的信息查詢;為學(xué)生提供全方位、個性化的學(xué)習(xí)、生活等服務(wù)。
為了實現(xiàn)這一目標(biāo),應(yīng)對大數(shù)據(jù)時代高校信息化面臨的挑戰(zhàn),迫切需要我們研究大數(shù)據(jù)時代的各種技術(shù),切實轉(zhuǎn)變到大數(shù)據(jù)時代的思維,與學(xué)校相關(guān)計算機專家學(xué)者一道,借鑒兄弟院校和國外的成功案例,以早日實現(xiàn)這一藍圖。
五、結(jié)束語
2013年被稱為中國的大數(shù)據(jù)元年,未來的十年,將是大數(shù)據(jù)引領(lǐng)下的智慧科技時代。本文介紹了大數(shù)據(jù)的含義和特點、大數(shù)據(jù)的關(guān)鍵技術(shù)、大數(shù)據(jù)對高校信息化中的挑戰(zhàn)進行了梳理,同時提出來高校大數(shù)據(jù)處理框架。不可否認(rèn),大數(shù)據(jù)在高校中有著廣闊的應(yīng)用前景,雖然從目前的情況來看還處在起步階段,在大數(shù)據(jù)時代,將高等教育信息化做好仍有很長的路要走,但只要我們一步步的努力,大數(shù)據(jù)時代的高校信息化也必將更加強大。
參考文獻:
[1]Nature. Big Data[EB/OL].[2012-10-02].http://www.nature.com/news/specials/bigdata/index.html
[2]Manyika J,Chui M,Brown B,et al.Big data: The nextfrontier for innovation,competition ,and productivity[R/OL].[2012-10-02].http://www.mckinsey.com/Insights/MGI/Research/Tehnology_and_Innovation/Big_data_The_ next_frontier_for_innovation
[3]Big data [EB/OL].[2012-10-02].http://en.wikipedia.org/wiki/Big_data
[4]計算機行業(yè)-大數(shù)據(jù)(Big Data)專題報告[R].上海:光大證券有限公司研究所,2011.
[5]大數(shù)據(jù)分析技術(shù)的發(fā)展[EB/OL].[2012-5-16].http://tech.ccidnet.com/art/32963/20120516/3859799_1.html
[6]申德榮,于戈,王習(xí)特等. 支持大數(shù)據(jù)管理的NoSQL系統(tǒng)研究綜述[J].軟件學(xué)報,2013.
[7]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(1):146-169.
(編輯:楊馥紅)