文/陸以勤
華南理工大學(xué)科研大數(shù)據(jù)實(shí)踐
文/陸以勤
作為以理工見(jiàn)長(zhǎng)的華南理工大學(xué),在大數(shù)據(jù)科學(xué)和工程相關(guān)領(lǐng)域,包括大數(shù)據(jù)的整個(gè)生命周期的各個(gè)環(huán)節(jié)(數(shù)據(jù)采集、通信、海量處理、包括計(jì)算機(jī)能力、存儲(chǔ)等)的研究一直非?;钴S。有關(guān)大數(shù)據(jù)研究的科技基地就有:廣東省大數(shù)據(jù)分析與處理工程技術(shù)研究中心、廣東高校海量大數(shù)據(jù)的智能信息處理與安全工程技術(shù)研究中心、廣東省人體數(shù)據(jù)科學(xué)工程技術(shù)研究中心及廣州市人體數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室等。為了培養(yǎng)大數(shù)據(jù)的應(yīng)用創(chuàng)新人才, 學(xué)校充分發(fā)揮廣東省的產(chǎn)業(yè)優(yōu)勢(shì),與多家世界知名企業(yè)建設(shè)了如“華南大數(shù)據(jù)創(chuàng)新人才培養(yǎng)基地”“信息技術(shù)與大數(shù)據(jù)創(chuàng)新人才培養(yǎng)基地”等科研和人才培養(yǎng)基地,還設(shè)立了“云計(jì)算與大數(shù)據(jù)”碩士專(zhuān)業(yè)。為了支撐大數(shù)據(jù)的科研和教學(xué),除了通用多款統(tǒng)計(jì)分析工具,學(xué)校搭建大數(shù)據(jù)的分析平臺(tái)、大規(guī)模數(shù)據(jù)的Hadoop系統(tǒng)平臺(tái),為大數(shù)據(jù)的挖掘、存儲(chǔ)、分析提供支撐。學(xué)??蒲泻蜆I(yè)務(wù)活動(dòng)本身產(chǎn)生大量的數(shù)據(jù),例如學(xué)校的兩個(gè)附屬醫(yī)院、大數(shù)據(jù)交換中心及二級(jí)部門(mén)的業(yè)務(wù)數(shù)據(jù)等,經(jīng)過(guò)嚴(yán)格的脫敏處理,經(jīng)過(guò)數(shù)據(jù)主管單位的允許,可以提供給科研研究,另外,學(xué)校與多家企業(yè)合作,采集多個(gè)企業(yè)級(jí)數(shù)據(jù)源,其中包括社交網(wǎng)絡(luò)數(shù)據(jù)(人人網(wǎng)、開(kāi)心網(wǎng)和新浪微博的真實(shí)數(shù)據(jù)約在10T左右)、交通數(shù)據(jù)網(wǎng)(6T左右)、鋼鐵現(xiàn)貨交易第三方電商平臺(tái)、百度、阿里云等名機(jī)構(gòu)的完整的海量數(shù)據(jù),可在平臺(tái)上展開(kāi)數(shù)據(jù)信息交易、數(shù)據(jù)挖掘、數(shù)據(jù)統(tǒng)計(jì)與分析等應(yīng)用,不斷提升運(yùn)用、解釋、挖掘數(shù)據(jù)的能力。為了給大數(shù)據(jù)科研團(tuán)隊(duì)提供良好的支撐環(huán)境,學(xué)校還計(jì)劃建設(shè)“科研大數(shù)據(jù)服務(wù)平臺(tái)”。
(作者單位為華南理工大學(xué))