華為云存儲解決方案助CERN為諾貝爾物理學獎提供數(shù)據(jù)支撐
2013年10月,比利時理論物理學家弗朗索瓦·恩格勒、英國理論物理學家彼得·希格斯因成功預(yù)測希格斯玻色子(Higgs boson)而獲得2013年諾貝爾物理學獎。希格斯玻色子,是粒子物理學標準模型預(yù)言的一種自旋為零的玻色子。在現(xiàn)有量子物理學的研究中,科學家們建立了一種稱為“標準模型”的物理學理論。該模型把構(gòu)成物質(zhì)的亞原子分為夸克、輕子和玻色子三類,根據(jù)這一理論,1964年英國科學家希格斯預(yù)言了希格斯玻色子的存在。
標準模型共預(yù)言了62種基本粒子的存在,其中61種粒子已經(jīng)被實驗證實,而希格斯玻色子是最后一種還未被確認發(fā)現(xiàn)的基本粒子,它被認為是解釋物質(zhì)質(zhì)量之謎的最重要粒子,因此又被稱為“上帝粒子”。
2012年7月4日,歐洲核子研究組織(CERN)宣布,大型強子對撞機LHC探測到兩種新的粒子極像希格斯玻色子,此后科學家分別以兩個獨立的實驗尋找希格斯玻色子,這兩個實驗分別稱為Atlas和CMS。2013年3月14日,歐洲核子研究中心發(fā)布公告稱,通過對更多數(shù)據(jù)的分析顯示,該中心去年發(fā)現(xiàn)的一種新粒子“強有力地表明就是希格斯玻色子”。
對上帝粒子的探索和發(fā)現(xiàn)是在CERN建立的世界上最大的強子對撞機LHC上完成的, LHC可以通過高速粒子的碰撞來模擬宇宙大爆炸時的場景,然后再通過環(huán)形隧道內(nèi)分布的1.5億個感應(yīng)器來收集和傳遞實驗數(shù)據(jù)。據(jù)統(tǒng)計,碰撞實驗產(chǎn)生的海量數(shù)據(jù),經(jīng)過濾后待存儲的有效數(shù)據(jù)流達到6GB/s。而隨著實驗規(guī)模和級別的不斷提升,目前CERN自有的數(shù)據(jù)中心磁盤存儲已經(jīng)超過25PB,另有75PB的數(shù)據(jù)存放在帶庫中,存儲系統(tǒng)可用空間分別為40PB和100PB。CERN將這些海量數(shù)據(jù)通過其遍布全球的140多個計算節(jié)點進行分流和存儲。
海量數(shù)據(jù)的存儲需求使CERN的IT系統(tǒng)性能面臨巨大挑戰(zhàn);在短暫的碰撞時間內(nèi),產(chǎn)生的大量數(shù)據(jù)對存儲系統(tǒng)的吞吐能力、穩(wěn)定性也提出了較高要求。另外,實驗數(shù)據(jù)能夠靈活地跨地域訪問和共享,是支撐CERN遍布全球的研究機構(gòu)協(xié)同工作的重要基礎(chǔ),而傳統(tǒng)的存儲方式越來越無法適應(yīng)CERN在全球140多個國家和地區(qū)計算節(jié)點之間的數(shù)據(jù)流通。
2012年初,CERN與華為合作,嘗試利用云存儲架構(gòu)解決大量研究工作所面臨的數(shù)據(jù)存儲瓶頸。據(jù)華為公司企業(yè)業(yè)務(wù)中國區(qū)政府系統(tǒng)部部長孫冀平介紹,華為是中國較早建立面向未來技術(shù)創(chuàng)新和趨勢研究實驗室的公司之一,該實驗室以技術(shù)為導向,與國內(nèi)100多所高校和科研機構(gòu)在前沿技術(shù)和標準化方面進行了合作,目前研發(fā)的項目達到200個以上,先后產(chǎn)生了1200多項科研成果和技術(shù)專利。這些研究強調(diào)技術(shù)與客戶的業(yè)務(wù)系統(tǒng)深度融合,針對科研、教育、政府等用戶對大數(shù)據(jù)、移動互聯(lián)及敏捷網(wǎng)絡(luò)方面的需求提供差異化、定制化的解決方案。此次華為向CERN OpenLAB提供的0.8PB UDS存儲設(shè)備,就是希望與CERN一同探討、測試和驗證UDS在海量數(shù)據(jù)場景下的應(yīng)用能力。
UDS海量存儲分布式架構(gòu)的亮點之一是隨著節(jié)點數(shù)量的增加,系統(tǒng)吞吐性能可以持續(xù)提升。CERN分別對4K-100M的不同大小的文件進行從單一客戶端、20個、200個客戶端的長時間測試。UDS系統(tǒng)的吞吐量均達到了帶寬限制的極限:在5Gb的帶寬限制下,UDS可達到588.4MB/s的吞吐量;在18Gb的帶寬限制下,UDS達到2200MB/s的吞吐量。讀寫性能均高于用于參考比對的Open stack和CERN現(xiàn)有的EOS系統(tǒng)。
在可靠性方面,CERN分別通過多副本和擦除編碼(EC)兩種驗證方案,前者更注重性能,后者更注重成本,用戶可以根據(jù)不同業(yè)務(wù)的SLA來靈活調(diào)整可靠性方案,從而在存儲利用率和數(shù)據(jù)可靠性之間尋求最佳平衡。在長達近一年的測試驗證過程中,UDS系統(tǒng)沒有丟失任何數(shù)據(jù),CERN對于UDS可靠性的評價為“Outstanding reliability measured: 100%”。
UDS系統(tǒng)具有完善的對象存儲特性,對象的創(chuàng)建、寫入、讀取、刪除以及MDC(多數(shù)據(jù)中心統(tǒng)一資源池)、一鍵快速部署等特有功能為CERN在遍布全球的140個計算節(jié)點之間實現(xiàn)數(shù)據(jù)自由訪問和共享提供了便利。UDS海量存儲系統(tǒng)采用的ARM架構(gòu),在保證高可靠的前提下支持消費級硬盤,大幅降低了CAPEX。而整機的高集成度設(shè)計(2.1PB/)和ARM的超低功耗以及UDS的免即時維護等特性都較好的幫助CERN大幅降低運營成本。
CERN OpenLAB的總負責人鮑勃·瓊斯認為,CERN的系統(tǒng)在執(zhí)行方面正面臨極限,同華為的合作為其展現(xiàn)了一個新的途徑,云存儲優(yōu)良的架構(gòu)設(shè)計,使得CERN在應(yīng)對未來EB級數(shù)據(jù)量的挑戰(zhàn)時能夠輕松應(yīng)對。華為UDS產(chǎn)品的出色表現(xiàn)和ITC整合能力,使CERN決定與華為建立長期合作的伙伴關(guān)系,在未來三年里,UDS系統(tǒng)將繼續(xù)為CERN的數(shù)據(jù)密集型模擬和分析應(yīng)用提供支撐,為最終發(fā)現(xiàn)上帝粒子,探索人類未知的世界提供源源動力。