国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

讓科學(xué)大數(shù)據(jù)流動(dòng)起來(lái)

2014-01-29 02:33傅宇凡
中國(guó)教育網(wǎng)絡(luò) 2014年4期
關(guān)鍵詞:計(jì)算中心計(jì)算能力

文/本刊記者 傅宇凡

本期特邀編輯 王偉 王勝開(kāi)1

高性能計(jì)算機(jī)、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等信息技術(shù)飛速發(fā)展,強(qiáng)子對(duì)撞機(jī)、空間遙感等大型科學(xué)裝置和科研設(shè)施的建立與運(yùn)行,產(chǎn)生了海量的科研數(shù)據(jù)。數(shù)據(jù)密集型科研越來(lái)越成為當(dāng)代科學(xué)研究的特征,科技進(jìn)入了“大數(shù)據(jù)”時(shí)代。

2013年底,美國(guó)《自然NATURE》新聞焦點(diǎn)特別介紹了一個(gè)飽受實(shí)驗(yàn)生物學(xué)困惑的碩士研究生改行從事生物信息學(xué)研究,并獲得成功的真實(shí)故事。這則故事是現(xiàn)代科研方式發(fā)生變化的生動(dòng)注腳。

現(xiàn)代科研活動(dòng)等各個(gè)領(lǐng)域都已經(jīng)推到了一個(gè)前所未有的大數(shù)據(jù)時(shí)代,量變引起質(zhì)變,不斷增加的數(shù)據(jù)引發(fā)了人們的思維和行為方式的變革。信息化推動(dòng)全球各行各業(yè)發(fā)生顛覆性的改變,在當(dāng)前,科研信息化工作主要體現(xiàn)為對(duì)科研大數(shù)據(jù)的整合與利用。

現(xiàn)代科研活動(dòng)中,在觀察實(shí)驗(yàn)、理論分析、計(jì)算流程之后,一種被稱之為“數(shù)據(jù)科學(xué)”的學(xué)科已經(jīng)開(kāi)始顯現(xiàn)?;趯?duì)大數(shù)據(jù)的分析來(lái)更好地了解世界,解決從前難以解決的,或甚至不可解決的許多科學(xué)問(wèn)題,產(chǎn)生意料之外的科學(xué)發(fā)現(xiàn)??梢哉f(shuō)數(shù)據(jù)已成為新型戰(zhàn)略資源,是驅(qū)動(dòng)創(chuàng)新的重要因素。一個(gè)國(guó)家的科學(xué)研究水平,已越來(lái)越多地取決于其數(shù)據(jù)優(yōu)勢(shì),及將數(shù)據(jù)轉(zhuǎn)化為信息和知識(shí)的能力。

然而,伴隨海量科研數(shù)據(jù)的膨脹,國(guó)內(nèi)與之不相匹配的是數(shù)據(jù)的保守與應(yīng)用壁壘,中國(guó)工程院孫九林院士、郭華東院士等為此在各類場(chǎng)合呼吁“大數(shù)據(jù)共享”,希望科研機(jī)構(gòu)突破大數(shù)據(jù)應(yīng)用上的諸多保守機(jī)制。

業(yè)內(nèi)人士指出,無(wú)論是在科研數(shù)據(jù)的共享政策與機(jī)制,還是在對(duì)大數(shù)據(jù)的管理、分析、可視化及應(yīng)用的技術(shù)方面,目前都面臨著一系列的問(wèn)題和挑戰(zhàn)。因此,科研信息化建設(shè)亟需加強(qiáng)頂層設(shè)計(jì),面向用戶和實(shí)際應(yīng)用,統(tǒng)籌協(xié)調(diào),培養(yǎng)起一支強(qiáng)有力的專業(yè)信息化人才隊(duì)伍,同時(shí),促進(jìn)數(shù)據(jù)獲取和共享的標(biāo)準(zhǔn)規(guī)范,推動(dòng)科研大數(shù)據(jù)真正流動(dòng)起來(lái)。

計(jì)算能力需面向用戶

2013年底全球超級(jí)計(jì)算機(jī)500強(qiáng)的榜單上,天河二號(hào)蟬聯(lián)冠軍,中國(guó)占有65席,其中多數(shù)在高校。中國(guó)的超算能力正在向百億億次進(jìn)軍。但面臨的問(wèn)題卻不容忽視,業(yè)內(nèi)人士指出,如果五年內(nèi)機(jī)器使用率不高,或者效能得不到發(fā)揮,巨資投入的超算計(jì)算機(jī)將血本無(wú)歸。而“用做什么”一直是這些超算能力縈繞不去的困擾。與此同時(shí),超算能力的過(guò)于集中,造成科研領(lǐng)域閑置與稀缺的兩種極端情況存在。

國(guó)內(nèi)建立了各級(jí)高性能計(jì)算中心,而這些能力的輸送并不均衡。中國(guó)海洋大學(xué)的“海洋信息探測(cè)與處理”學(xué)科研究,常常需要大數(shù)據(jù)計(jì)算,但是,學(xué)校30億次的計(jì)算能力無(wú)法滿足其需求,因此,每次都讓學(xué)生用硬盤(pán)拷貝幾十T的數(shù)據(jù),送到北京的超算中心來(lái)進(jìn)行數(shù)據(jù)挖掘和分析。

“2000年左右,我們調(diào)查數(shù)據(jù)共享,當(dāng)時(shí)非常踴躍,但是現(xiàn)在卻在走回頭路,什么問(wèn)題呢?很多人看到數(shù)據(jù)非常重要,就不愿意共享了。現(xiàn)在對(duì)數(shù)據(jù)越抱越緊,即使是科研部門(mén)內(nèi)部,共享情況也不樂(lè)觀?!敝袊?guó)工程院孫九林院士

數(shù)據(jù)已成為新型戰(zhàn)略資源,是驅(qū)動(dòng)創(chuàng)新的重要因素。一個(gè)國(guó)家的科學(xué)研究水平,已越來(lái)越多地取決于其數(shù)據(jù)優(yōu)勢(shì),及將數(shù)據(jù)轉(zhuǎn)化為信息和知識(shí)的能力。

在蘭州大學(xué),這個(gè)情況尤其突出,蘭州大學(xué)大氣物理所的田文壽所長(zhǎng)有同樣的感受:“國(guó)家不停地建設(shè)大型計(jì)算設(shè)施,在面向用戶方面做得不夠?!碧m州大學(xué)也建設(shè)了計(jì)算中心,但因經(jīng)費(fèi)不夠,無(wú)法擴(kuò)容,已經(jīng)停止使用。

“共享粒度還是不夠,從長(zhǎng)遠(yuǎn)來(lái)看,我們還是要建設(shè)全校計(jì)算中心。另外,研究者有需求,只能從課題里出錢(qián),還要讓教授考慮電、空調(diào)這些瑣碎的問(wèn)題。類似的機(jī)制需要突破?!碧m州大學(xué)實(shí)驗(yàn)室與設(shè)備管理處處長(zhǎng)陳文波說(shuō)。

在我刊2013年底針對(duì)全國(guó)30所985/211高校的“科研信息化”調(diào)研中,問(wèn)及“是否有適當(dāng)?shù)能浻布ňW(wǎng)絡(luò)、軟件、硬件)支撐科研活動(dòng)中的計(jì)算需求”時(shí),有25所學(xué)?;卮稹坝小保?所學(xué)?;卮稹盁o(wú)”;而在問(wèn)及計(jì)算能力是否足夠時(shí),有18所學(xué)校認(rèn)為“足夠”,另外12所學(xué)校認(rèn)為“不夠”。究其原因,說(shuō)明在高校中,計(jì)算能力的共享尚有欠缺,信息化專業(yè)人才缺失,在共享粒度上應(yīng)有更細(xì)致的統(tǒng)籌安排。

美國(guó)喬治亞理工學(xué)院的胡泳濤博士十年來(lái)一直從事大氣模擬實(shí)驗(yàn)研究,他每天都要跟大量的數(shù)據(jù)打交道,氣象、氣候和環(huán)境類的研究需要高性能計(jì)算機(jī)或超級(jí)矩陣計(jì)算系統(tǒng),他認(rèn)為美國(guó)高??蒲薪⒌募?xì)粒度的共享機(jī)制值得國(guó)內(nèi)借鑒。“現(xiàn)在計(jì)算機(jī)硬件的發(fā)展很快,一般好一些的服務(wù)器應(yīng)該能夠滿足大多數(shù)的研究需要。計(jì)算能力是與人相關(guān)的,不僅機(jī)器到位,專業(yè)的人員也需要配備到位。”他說(shuō)。

在喬治亞理工學(xué)院,每個(gè)系都有一個(gè)計(jì)算機(jī)維護(hù)小組,全職的大概2~3個(gè)人,為系內(nèi)的研究小組自行購(gòu)買的設(shè)備提供軟硬件服務(wù)。當(dāng)然,要是遇到大的環(huán)境模擬時(shí),也需要用到大計(jì)算能力的服務(wù),而這些計(jì)算能力的獲取相對(duì)簡(jiǎn)單,喬治亞理工學(xué)院有自己的計(jì)算中心——PACE,本身具有學(xué)校級(jí)別的硬件投入,同時(shí)加上各個(gè)系單個(gè)研究小組的資金加入,可以形成超級(jí)計(jì)算能力。據(jù)胡博士介紹,PACE由10人左右的專職具有計(jì)算機(jī)學(xué)位的人維護(hù)和管理。

再往上一級(jí),在全國(guó)范圍內(nèi),美國(guó)也有類似PACE的超級(jí)計(jì)算中心,例如由20-30個(gè)大學(xué)以及美國(guó)自然科學(xué)基金會(huì)NSF出資共同維護(hù)的UCAR(大氣研究大學(xué)集團(tuán)),UCAR擁有77個(gè)大學(xué)聯(lián)合成員,它運(yùn)用從進(jìn)行氣候和天氣模擬的高端計(jì)算機(jī)到裝有密密麻麻儀器的飛行器,研究涉及大氣及與之相關(guān)的地球科學(xué)。UCAR同時(shí)管理著美國(guó)國(guó)家大氣研究中心NCAR?!懊恳粋€(gè)UCAR成員單位的學(xué)生或研究人員,可以得到免費(fèi)機(jī)時(shí)服務(wù)的。”胡泳濤說(shuō)。

這種層層遞進(jìn),又互相補(bǔ)位的計(jì)算能力,使得科研工作者隨時(shí)可以根據(jù)自己的需求,確定采用什么樣的計(jì)算能力。反觀國(guó)內(nèi),這種機(jī)制還有欠缺。

2013年30所985/211高??蒲行畔⒒{(diào)研

“學(xué)院的科研管理歸在科技處,但學(xué)院里連網(wǎng)絡(luò)維護(hù)專職人員都沒(méi)有,信息化只是自發(fā)的行為。高校崗位設(shè)置決定了科研人員和實(shí)驗(yàn)人員都有明確的教學(xué)任務(wù),沒(méi)有專職人員去做信息化的工作?!比A南理工大學(xué)信息辦主任陸以勤說(shuō)。多數(shù)受調(diào)研的學(xué)校也一致提出類似的問(wèn)題,計(jì)算能力的不均衡,其背后的原因更重要的是專業(yè)信息化人才的缺失。

國(guó)家高性能計(jì)算CNGRID的首席科學(xué)家錢(qián)德沛教授也看到了這一現(xiàn)狀,他提到高性能計(jì)算應(yīng)該以服務(wù)業(yè)的形式來(lái)體現(xiàn),方能盤(pán)活我國(guó)目前的計(jì)算能力。“未來(lái),中國(guó)國(guó)家網(wǎng)格服務(wù)環(huán)境CNGRID將成為IaaS和PaaS,在應(yīng)用社區(qū)和網(wǎng)格服務(wù)環(huán)境之間建立起商業(yè)模式,目的是要促進(jìn)高性能計(jì)算服務(wù)業(yè)。”他說(shuō)。

呼吁數(shù)據(jù)開(kāi)放共享

我國(guó)各大科研院校機(jī)構(gòu)中,散落著海量的科研數(shù)據(jù)。在我刊在調(diào)研中,當(dāng)問(wèn)及“學(xué)科數(shù)據(jù)庫(kù)是否為社會(huì)提供服務(wù)”時(shí),30所211高校中僅有8所學(xué)校提供了服務(wù),多數(shù)學(xué)校未能提供服務(wù)。原因主要?dú)w結(jié)為項(xiàng)目管理不規(guī)范、信息技術(shù)支持人員缺乏、數(shù)據(jù)標(biāo)準(zhǔn)不一、提供服務(wù)有障礙,等。

華南理工大學(xué)陸以勤教授認(rèn)為:“國(guó)家的科研項(xiàng)目管理過(guò)程存在問(wèn)題,國(guó)家大項(xiàng)目召開(kāi)的國(guó)際會(huì)議也不對(duì)公眾開(kāi)放,在實(shí)際科研中,都是從國(guó)外獲取資料,國(guó)外的科研項(xiàng)目過(guò)程資料都很集中和規(guī)范,而國(guó)內(nèi)項(xiàng)目材料要么不公開(kāi),要么零散,幾乎沒(méi)留下什么東西?!?/p>

當(dāng)下,大學(xué)利用數(shù)字文獻(xiàn)已經(jīng)成為一種習(xí)慣,復(fù)旦大學(xué)有一組對(duì)比數(shù)據(jù)充分說(shuō)明這一點(diǎn),2005年,復(fù)旦大學(xué)購(gòu)買文獻(xiàn)資料的經(jīng)費(fèi)中,紙版文獻(xiàn)為2053萬(wàn)元,電子文獻(xiàn)資料為505萬(wàn)元,紙版與電子的投入比例為4:1;2010年,這一比例上升為2:1,即紙版文獻(xiàn)為2100萬(wàn)元,電子文獻(xiàn)資料為1097萬(wàn)元。去年,這一比例則達(dá)到了1:1。

而與加大投入形成鮮明對(duì)比的是,文獻(xiàn)、信息數(shù)據(jù)共享壁壘重重。

如同數(shù)字圖書(shū)館的發(fā)展,由于信息數(shù)據(jù)使用缺乏相應(yīng)的機(jī)制,眾多研究機(jī)構(gòu)都在數(shù)據(jù)共享的問(wèn)題上爭(zhēng)持不下,并且,數(shù)據(jù)共享還有走回頭路的跡象。

從上世紀(jì)九十年代初起,中國(guó)工程院孫九林院士就從事地理數(shù)據(jù)的分析與利用,他對(duì)國(guó)內(nèi)科研數(shù)據(jù)的共享過(guò)程深有體會(huì):“2000年左右,我們調(diào)查數(shù)據(jù)共享,當(dāng)時(shí)非常踴躍,但是現(xiàn)在卻在走回頭路,什么問(wèn)題呢?很多人看到數(shù)據(jù)非常重要,就不愿意共享了?,F(xiàn)在對(duì)數(shù)據(jù)越抱越緊,即使是科研部門(mén)內(nèi)部,共享情況也不樂(lè)觀?!?/p>

高性能計(jì)算應(yīng)該以服務(wù)業(yè)的形式來(lái)體現(xiàn),方能盤(pán)活我國(guó)目前的計(jì)算能力。

國(guó)家高性能計(jì)算CNGRID的首席科學(xué)家錢(qián)德沛教授

蘭州大學(xué)大氣物理所所長(zhǎng)田文壽教授也一樣遇到這樣的困境:田教授2005年從英國(guó)回蘭大,他研究大氣氣溶膠,涉及到學(xué)科交叉比較多,災(zāi)害預(yù)警管理系統(tǒng)、地質(zhì)信息、大氣數(shù)據(jù)信息、人口信息、儀器設(shè)備等多個(gè)單位的數(shù)據(jù),需要很多單位的協(xié)調(diào)和共享。然而,發(fā)現(xiàn)國(guó)內(nèi)與英國(guó)在科研環(huán)境上有許多差別,尤其數(shù)據(jù)獲取的困難帶給研究工作諸多障礙。

中國(guó)海洋大學(xué)的錢(qián)教授提到:“我們遇到的挑戰(zhàn)是,在國(guó)內(nèi)獲取數(shù)據(jù)比從國(guó)外還要困難?!痹诤Q蟠髮W(xué),內(nèi)部對(duì)科研數(shù)據(jù)共享有一個(gè)期限,一兩年之內(nèi)(課題組有優(yōu)先使用權(quán)),原則上通過(guò)學(xué)校數(shù)據(jù)中心,普通教師可以獲取。(除非是保密數(shù)據(jù),需要有一定的審查。)然而,由于機(jī)制所限,中國(guó)海洋大學(xué)的科研數(shù)據(jù)原則上不提供對(duì)外服務(wù)?!安还蚕恚覀兪菬o(wú)法獲取到他人的數(shù)據(jù)的,這也是導(dǎo)致我們現(xiàn)在缺少基礎(chǔ)科學(xué)數(shù)據(jù)庫(kù)的最大原因?!卞X(qián)教授說(shuō)。

而與此形成鮮明對(duì)比的是,美國(guó)國(guó)家海洋氣象局(簡(jiǎn)稱NOAA)的氣象數(shù)據(jù),中國(guó)海洋大學(xué)基本上延遲三個(gè)小時(shí)就能獲取。美國(guó)國(guó)家海洋數(shù)據(jù)中心(簡(jiǎn)稱NODC)匯集了全球最大的并可公開(kāi)查詢的海洋數(shù)據(jù),其數(shù)據(jù)的使用基本面向科研工作者免費(fèi)開(kāi)放,無(wú)論是對(duì)提供者,還是對(duì)使用者。

據(jù)了解,美國(guó)科研機(jī)構(gòu)對(duì)數(shù)據(jù)(不論是觀測(cè)到的還是加工過(guò)的)的應(yīng)用,大致可以分為政府(包括聯(lián)邦和州)機(jī)構(gòu)制造的,比如氣象局觀測(cè)的、預(yù)報(bào)的、環(huán)保局觀測(cè)的、計(jì)算的、NASA觀測(cè)的和繁衍的,以及資源人口普查數(shù)據(jù)等等。在美國(guó),除非是機(jī)密,前兩類數(shù)據(jù)是法律規(guī)定必須公開(kāi)的。

為此,華南理工大學(xué)陸以勤教授建議,應(yīng)建立統(tǒng)一的科研項(xiàng)目管理系統(tǒng),以利于數(shù)據(jù)共享及各類數(shù)據(jù)庫(kù)的建立?!澳壳案黝愋晚?xiàng)目要求都不同,各自建設(shè),重復(fù)建設(shè)而且使用復(fù)雜。從國(guó)家層面上,項(xiàng)目管理系統(tǒng)應(yīng)該是統(tǒng)一的,項(xiàng)目管理系統(tǒng)應(yīng)具備開(kāi)放性、系統(tǒng)性和全面性,把上級(jí)部門(mén)、管理人員和科研人員很好地結(jié)合起來(lái)?!彼f(shuō)。

(注1:作者單位為中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心)

100G高速網(wǎng)

急速增長(zhǎng)的科學(xué)數(shù)據(jù)給已有的科研網(wǎng)絡(luò)帶來(lái)了巨大的壓力。近年來(lái),世界各國(guó)在高速網(wǎng)絡(luò)的研發(fā)方面成績(jī)卓著,數(shù)據(jù)傳輸能力和傳輸速度大幅提升。同時(shí),各國(guó)還在不斷增加投入,以便將網(wǎng)絡(luò)的傳輸能力提升到新的高度。

2012 年5 月,歐洲Infinera 公司和Imtech 公司贏得了歐洲科研網(wǎng)絡(luò)運(yùn)營(yíng)商DANTE 為期四年的訂單,將在泛歐科研教育網(wǎng)(GEANT)中部署先進(jìn)傳輸設(shè)備和轉(zhuǎn)換平臺(tái),全面升級(jí)長(zhǎng)達(dá)5 萬(wàn)公里的G?ANT骨干網(wǎng),支持GEANT 核心網(wǎng)絡(luò)實(shí)現(xiàn)最高達(dá)2 Tbps的傳輸能力,使歐洲數(shù)百萬(wàn)科研人員和數(shù)百萬(wàn)學(xué)生從中受益。在不久的將來(lái),太比特(Tbps)網(wǎng)絡(luò)有望得到全面部署。

美國(guó)政府則投資了6200 萬(wàn)美元啟動(dòng)“先進(jìn)網(wǎng)絡(luò)計(jì)劃(AdvancedNetworking Intiative,ANI)”,擬建設(shè)100 Gbps 網(wǎng)絡(luò)來(lái)支持大數(shù)據(jù)傳輸。ANI 計(jì)劃的核心是由美國(guó)能源部“能源科學(xué)網(wǎng)”(ESnet)和Internet2 協(xié)會(huì)合作研制的,目前連接著美國(guó)“國(guó)家能源研究計(jì)算中心”、“阿貢領(lǐng)先計(jì)算中心”和“橡樹(shù)嶺領(lǐng)先計(jì)算中心”的100 Gbps測(cè)試網(wǎng)絡(luò)。

在2012 年11 月美國(guó)鹽湖城舉行的2012 年全球超級(jí)計(jì)算大會(huì)上,由美國(guó)、加拿大的物理學(xué)家、計(jì)算機(jī)科學(xué)家和網(wǎng)絡(luò)工程師領(lǐng)導(dǎo)的國(guó)際研究團(tuán)隊(duì)創(chuàng)造了339 Gbps 的最新網(wǎng)絡(luò)數(shù)據(jù)傳輸速度紀(jì)錄。此外,科學(xué)家們還在加拿大維多利亞市與美國(guó)鹽湖城之間的一條單鏈路上實(shí)現(xiàn)了187 Gbps 的雙向數(shù)據(jù)傳輸速率,同樣打破了世界紀(jì)錄。這些成果為數(shù)據(jù)密集型科學(xué)的發(fā)展鋪平了道路。

100G技術(shù)和標(biāo)準(zhǔn)

2012年10月,中國(guó)教育和科研計(jì)算機(jī)網(wǎng)CERNET開(kāi)通了首條從武漢到CERNET北京網(wǎng)絡(luò)中心的100G長(zhǎng)途線路。截至2013年底,CERNET部署了超過(guò)40條100GbE鏈路。CERNET的骨干網(wǎng)絡(luò)能夠?qū)崿F(xiàn)國(guó)內(nèi)與國(guó)際網(wǎng)絡(luò)的互聯(lián),最大帶寬可達(dá)60Gbps,為全國(guó)兩百多座城市的兩千多所高校及科研機(jī)構(gòu),兩千萬(wàn)學(xué)生提供快速、安全和無(wú)縫的網(wǎng)絡(luò),接入到多樣的研發(fā)應(yīng)用,加強(qiáng)不同學(xué)科間合作。

猜你喜歡
計(jì)算中心計(jì)算能力
中國(guó)—東盟人工智能計(jì)算中心正式發(fā)布
淺談如何提高小學(xué)生的計(jì)算能力
厘清算理,提高學(xué)生計(jì)算能力
超級(jí)“神算”!中原人工智能計(jì)算中心上線
小學(xué)生計(jì)算能力的提高策略
面向反應(yīng)堆設(shè)計(jì)的高性能計(jì)算中心建設(shè)及應(yīng)用
騰訊云首個(gè)5G邊緣計(jì)算中心正式對(duì)外開(kāi)放
小學(xué)低年級(jí)學(xué)生計(jì)算能力的培養(yǎng)策略
小學(xué)生計(jì)算能力的培養(yǎng)
淺談小學(xué)生計(jì)算能力的培養(yǎng)