曾 珊 陳 剛 齊法制 張紅梅 李海波 李亞康 田浩來(lái)
(1.中國(guó)科學(xué)院高能物理研究所,北京 100049;2.國(guó)家高能物理科學(xué)數(shù)據(jù)中心,北京 100049)
科學(xué)數(shù)據(jù)是國(guó)家科技創(chuàng)新和發(fā)展的重要戰(zhàn)略資源。2018年,國(guó)務(wù)院發(fā)布了《科學(xué)數(shù)據(jù)管理辦法》,為中國(guó)科學(xué)數(shù)據(jù)工作確定了行動(dòng)綱領(lǐng),對(duì)進(jìn)一步提升中國(guó)科學(xué)數(shù)據(jù)工作水平,提高科技創(chuàng)新、經(jīng)濟(jì)社會(huì)發(fā)展和國(guó)家安全支撐保障能力具有重要的意義,是科學(xué)數(shù)據(jù)管理領(lǐng)域的一項(xiàng)重要舉措[1]。2019年,科技部、財(cái)政部認(rèn)定了20 個(gè)國(guó)家科學(xué)數(shù)據(jù)中心和30 個(gè)國(guó)家生物種質(zhì)與實(shí)驗(yàn)材料資源庫(kù),形成了國(guó)家科技資源共享服務(wù)平臺(tái)。該共享服務(wù)平臺(tái)成為我國(guó)科學(xué)數(shù)據(jù)管理與服務(wù)的重要基礎(chǔ)。
國(guó)家高能物理科學(xué)數(shù)據(jù)中心(簡(jiǎn)稱“數(shù)據(jù)中心”)是上述20 個(gè)國(guó)家科學(xué)數(shù)據(jù)中心之一,由中國(guó)科學(xué)院高能物理研究所(簡(jiǎn)稱“高能所”)建設(shè)和運(yùn)行,為國(guó)內(nèi)外高能物理及相關(guān)領(lǐng)域提供科學(xué)數(shù)據(jù)服務(wù)。高能物理科學(xué)數(shù)據(jù)是由高能物理(也稱為粒子物理)領(lǐng)域產(chǎn)生的實(shí)驗(yàn)數(shù)據(jù),用于開(kāi)展研究物質(zhì)的基本構(gòu)成以及宇宙起源等粒子物理最高能量前沿的研究,由北京數(shù)據(jù)中心和大灣區(qū)分中心等組成,以高能物理科學(xué)數(shù)據(jù)為核心進(jìn)行數(shù)據(jù)資源、軟件工具、數(shù)據(jù)分析等資源能力的匯交和共享。數(shù)據(jù)中心面向全球的科研用戶提供高能物理、中子科學(xué)、光子科學(xué)、天體物理等基礎(chǔ)研究以及多學(xué)科交叉研究服務(wù)。由于高能物理實(shí)驗(yàn)及數(shù)據(jù)的特殊性,數(shù)據(jù)中心為科學(xué)數(shù)據(jù)提供了數(shù)據(jù)匯交、數(shù)據(jù)保存、科學(xué)計(jì)算及數(shù)據(jù)處理等全方位的服務(wù)。目前,數(shù)據(jù)中心與國(guó)內(nèi)外相關(guān)領(lǐng)域的大型數(shù)據(jù)中心建立了廣泛的合作,擁有先進(jìn)的高能物理數(shù)據(jù)資源平臺(tái),提供了近20 PB存儲(chǔ)空間、數(shù)萬(wàn)CPU核的計(jì)算能力、萬(wàn)兆國(guó)際網(wǎng)絡(luò)鏈路和完善的信息化支撐系統(tǒng),擁有國(guó)內(nèi)外專業(yè)用戶數(shù)近萬(wàn)人,科學(xué)數(shù)據(jù)服務(wù)成效顯著。
本文將系統(tǒng)闡釋數(shù)據(jù)中心產(chǎn)生的背景和主要職責(zé),詳細(xì)介紹數(shù)據(jù)中心的數(shù)據(jù)采集與匯交流程、數(shù)據(jù)服務(wù)與共享方式等,并通過(guò)科學(xué)數(shù)據(jù)典型應(yīng)用案例,展示數(shù)據(jù)中心為我國(guó)高能物理及相關(guān)物質(zhì)科學(xué)領(lǐng)域提供科學(xué)數(shù)據(jù)服務(wù)的成效。
數(shù)據(jù)中心面向高能物理相關(guān)領(lǐng)域科研活動(dòng),實(shí)現(xiàn)數(shù)據(jù)資源、軟件工具、數(shù)據(jù)分析等資源能力的匯交和共享,同時(shí)支持各類科技計(jì)劃項(xiàng)目的數(shù)據(jù)匯交。采集與匯交的科學(xué)數(shù)據(jù)主要來(lái)自以下途徑但不僅僅限于此:國(guó)家財(cái)政直接全額或部分支持的科研活動(dòng),國(guó)家指導(dǎo)授權(quán)的科研活動(dòng),通過(guò)合作、委托、分包等任何方式間接獲得全額或部分國(guó)家財(cái)政資金支持的科研活動(dòng)等產(chǎn)生的論文、實(shí)驗(yàn)數(shù)據(jù)、圖像、視頻、音頻、文字、代碼等形式的科學(xué)數(shù)據(jù),以及利用社會(huì)資金等其他資金資助形成并有意匯交到數(shù)據(jù)中心的相關(guān)科學(xué)數(shù)據(jù)。
對(duì)于國(guó)家重大科技基礎(chǔ)設(shè)施及大型實(shí)驗(yàn),數(shù)據(jù)中心通常在項(xiàng)目的初期就開(kāi)始參與數(shù)據(jù)及工具等的規(guī)劃與建設(shè),從而保證了數(shù)據(jù)和服務(wù)的質(zhì)量。對(duì)于各類科技計(jì)劃項(xiàng)目匯交的科學(xué)數(shù)據(jù),則嚴(yán)格遵守?cái)?shù)據(jù)匯交流程,形成高質(zhì)量的數(shù)據(jù)資源。具體流程如圖1所示。
圖1 科學(xué)數(shù)據(jù)匯交流程
(1)編制數(shù)據(jù)匯交計(jì)劃。科學(xué)數(shù)據(jù)提交方編制具體的項(xiàng)目數(shù)據(jù)匯交計(jì)劃,梳理擬匯交科學(xué)數(shù)據(jù)的詳細(xì)清單,提交數(shù)據(jù)中心審查后確認(rèn)數(shù)據(jù)匯交方案。
(2)簽訂數(shù)據(jù)匯交協(xié)議。數(shù)據(jù)中心和科學(xué)數(shù)據(jù)提交方共同進(jìn)行數(shù)據(jù)匯交協(xié)議簽訂,雙方共同遵照協(xié)議規(guī)定進(jìn)行數(shù)據(jù)匯交。
(3)科學(xué)數(shù)據(jù)整理??茖W(xué)數(shù)據(jù)提交方按照數(shù)據(jù)中心的數(shù)據(jù)分類模式進(jìn)行數(shù)據(jù)整理和加工,經(jīng)所在單位和合作單位的審核后,向數(shù)據(jù)中心提交數(shù)據(jù)匯交申請(qǐng)。
(4)科學(xué)數(shù)據(jù)匯交。科學(xué)數(shù)據(jù)提交方依照《高能物理科學(xué)數(shù)據(jù)匯交管理辦法》和《高能物理科學(xué)數(shù)據(jù)匯交操作流程》的要求,通過(guò)數(shù)據(jù)中心數(shù)據(jù)匯交平臺(tái)(https://www.nhepsdc.cn/archive)遵照協(xié)議進(jìn)行元數(shù)據(jù)、數(shù)據(jù)實(shí)體和軟件工具的匯交,將科學(xué)數(shù)據(jù)匯交到國(guó)家高能物理科學(xué)數(shù)據(jù)平臺(tái)。
(5)出具數(shù)據(jù)匯交證明。數(shù)據(jù)中心對(duì)項(xiàng)目數(shù)據(jù)匯交協(xié)議、項(xiàng)目任務(wù)書(shū)和匯交的科學(xué)數(shù)據(jù)進(jìn)行審核,審核通過(guò)后向科學(xué)數(shù)據(jù)提交方出具正式數(shù)據(jù)匯交證明材料。
數(shù)據(jù)中心收集的數(shù)據(jù)大致可以分為兩類:一是專用高能物理研究實(shí)驗(yàn)數(shù)據(jù),主要來(lái)自國(guó)際國(guó)內(nèi)大型實(shí)驗(yàn),如對(duì)撞機(jī)實(shí)驗(yàn)、中微子實(shí)驗(yàn)、宇宙線觀測(cè)實(shí)驗(yàn)、空間科學(xué)衛(wèi)星實(shí)驗(yàn)等,這類實(shí)驗(yàn)采用合作組形式開(kāi)展實(shí)驗(yàn)建設(shè)和科學(xué)研究,如大型強(qiáng)子對(duì)撞機(jī)LHC實(shí)驗(yàn)[2]、北京正負(fù)電子對(duì)撞機(jī)[3]、大亞灣中微子實(shí)驗(yàn)[4]及高海拔宇宙線觀測(cè)實(shí)驗(yàn)[5]等。二是公共實(shí)驗(yàn)平臺(tái)和裝置,該類實(shí)驗(yàn)和裝置面向國(guó)內(nèi)外多學(xué)科用戶提供服務(wù),如上海光源[6]、中國(guó)散裂中子源[7]等。在高能物理領(lǐng)域,不同實(shí)驗(yàn)類型的科學(xué)數(shù)據(jù)共享模式則存在較大的差異。
專用高能物理實(shí)驗(yàn)數(shù)據(jù)在一定期限內(nèi)在實(shí)驗(yàn)合作組框架下對(duì)所有合作組成員開(kāi)放和共享,合作組對(duì)數(shù)據(jù)分析處理方法、處理軟件和處理結(jié)果等全流程均有嚴(yán)格的管理制度和規(guī)范。這一領(lǐng)域的科學(xué)家正在探索在合作組框架下讓部分?jǐn)?shù)據(jù)面向國(guó)內(nèi)外同行中的非合作組成員開(kāi)放,推動(dòng)科學(xué)數(shù)據(jù)的二次利用和學(xué)科發(fā)展。由于該類科學(xué)數(shù)據(jù)的分析和利用具有極強(qiáng)的專業(yè)性,為了面向領(lǐng)域科學(xué)愛(ài)好者和民眾開(kāi)放,數(shù)據(jù)中心和科學(xué)家合作,對(duì)部分?jǐn)?shù)據(jù)進(jìn)行重建和處理之后面向大眾服務(wù),以推動(dòng)高能物理相關(guān)的科普工作。
公共實(shí)驗(yàn)平臺(tái)和裝置及其科學(xué)數(shù)據(jù)面向國(guó)內(nèi)外多學(xué)科交叉用戶提供服務(wù),其實(shí)驗(yàn)數(shù)據(jù)既用于基礎(chǔ)研究 ,也用于面向國(guó)家戰(zhàn)略需求和產(chǎn)業(yè)發(fā)展的研究。在國(guó)際上,有多個(gè)同類裝置和實(shí)驗(yàn)制定了相應(yīng)的科學(xué)數(shù)據(jù)管理策略,對(duì)科學(xué)數(shù)據(jù)的所有權(quán)、管理和使用進(jìn)行了詳細(xì)規(guī)定,并提出了數(shù)據(jù)保護(hù)期的概念。在我國(guó),該類裝置和實(shí)驗(yàn)在數(shù)量和規(guī)模上都達(dá)到了國(guó)際水平,也逐漸意識(shí)到數(shù)據(jù)策略的重要性,正在依據(jù)國(guó)家相關(guān)政策推動(dòng)數(shù)據(jù)共享和利用,逐步規(guī)劃和建立專業(yè)的數(shù)據(jù)管理團(tuán)隊(duì)開(kāi)展相關(guān)研究。但總體來(lái)說(shuō),這類科學(xué)數(shù)據(jù)管理策略和共享服務(wù)研究還處于起步階段。
數(shù)據(jù)中心管理著國(guó)內(nèi)外高能物理領(lǐng)域科研活動(dòng)產(chǎn)生的海量實(shí)驗(yàn)數(shù)據(jù),具體包括粒子物理數(shù)據(jù)、中子科學(xué)數(shù)據(jù)、光子科學(xué)數(shù)據(jù)、天體物理數(shù)據(jù)以及其他相關(guān)科技項(xiàng)目匯交的數(shù)據(jù)。其中,粒子物理數(shù)據(jù)是由國(guó)內(nèi)外實(shí)驗(yàn)產(chǎn)生的數(shù)據(jù),用于高能物理前沿研究,包括上帝粒子Higgs研究、強(qiáng)子物理研究、中微子物理研究、宇宙線研究等。中子科學(xué)數(shù)據(jù)主要是依托脈沖中子源等裝置實(shí)驗(yàn)產(chǎn)生的數(shù)據(jù),用于物質(zhì)材料的物性和微觀結(jié)構(gòu)與動(dòng)態(tài)變化等研究,為物質(zhì)科學(xué)、生命科學(xué)、資源環(huán)境、新能源等領(lǐng)域的基礎(chǔ)研究和高新技術(shù)開(kāi)發(fā)提供強(qiáng)有力的支撐。光子科學(xué)數(shù)據(jù)主要是同步輻射光源等裝置實(shí)驗(yàn)產(chǎn)生的數(shù)據(jù),這類數(shù)據(jù)用于揭示微觀物質(zhì)結(jié)構(gòu)生成演化的機(jī)制,剖析微觀物質(zhì)構(gòu)成,為先進(jìn)材料、航空航天、能源、環(huán)保、醫(yī)藥、石油、化工、生物工程和微細(xì)加工等領(lǐng)域應(yīng)用提供基礎(chǔ)支撐。天體物理數(shù)據(jù)主要來(lái)自于大規(guī)模的宇宙線觀測(cè)站實(shí)驗(yàn)和空間天文衛(wèi)星,核心科學(xué)目標(biāo)是探索高能宇宙線起源以及相關(guān)的宇宙演化、高能天體演化、高能天體活動(dòng)和暗物質(zhì)的研究。截至2021年7月,數(shù)據(jù)中心的數(shù)據(jù)資源總量超過(guò)18 PB。
針對(duì)各實(shí)驗(yàn)和匯交的科學(xué)數(shù)據(jù),數(shù)據(jù)中心維護(hù)和開(kāi)發(fā)了專用的數(shù)據(jù)處理和分析軟件,實(shí)現(xiàn)了科學(xué)數(shù)據(jù)的處理、分析、加工和挖掘等功能。這些軟件支持了北京譜儀三實(shí)驗(yàn)的模擬、數(shù)據(jù)刻度、校準(zhǔn)、重建和分析;大亞灣中微子實(shí)驗(yàn)的數(shù)據(jù)分析和模擬;高海拔宇宙線觀測(cè)站實(shí)驗(yàn)的模擬、數(shù)據(jù)刻度、校準(zhǔn)、重建和分析;硬X射線調(diào)制望遠(yuǎn)鏡“慧眼”衛(wèi)星的數(shù)據(jù)處理和分析;歐洲核子中心ATLAS實(shí)驗(yàn)、CMS實(shí)驗(yàn)和LHCb實(shí)驗(yàn)的模擬、數(shù)據(jù)重建和分析;中國(guó)散裂中子源和高能同步輻射光源的實(shí)驗(yàn)數(shù)據(jù)處理和可視化。這些實(shí)驗(yàn)也共享了一些基礎(chǔ)程序庫(kù),如數(shù)據(jù)分析軟件ROOT、探測(cè)器模擬軟件GEANT4、分布式計(jì)算庫(kù)MPI、GPU加速計(jì)算庫(kù)CUDA和OpenCL,以及科學(xué)數(shù)據(jù)持久化庫(kù)HDF5 等。
數(shù)據(jù)服務(wù)的目的是為各業(yè)務(wù)系統(tǒng)獲取準(zhǔn)確數(shù)據(jù)提供便捷,為全局應(yīng)用提供安全可靠的數(shù)據(jù)支撐。數(shù)據(jù)中心圍繞高能物理數(shù)據(jù)、中子科學(xué)數(shù)據(jù)、光子科學(xué)數(shù)據(jù)、天體物理數(shù)據(jù)進(jìn)行數(shù)據(jù)服務(wù)建設(shè),統(tǒng)一數(shù)據(jù)訪問(wèn)接口,提供全局的數(shù)據(jù)應(yīng)用,充分發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)共享策略因數(shù)據(jù)性質(zhì)不同而不同。
專用型高能物理數(shù)據(jù)可供實(shí)驗(yàn)合作組有限先使用,而機(jī)構(gòu)/個(gè)人只有申請(qǐng)成為合作組成員才可獲得訪問(wèn)數(shù)據(jù)的授權(quán)。根據(jù)合作組的規(guī)劃,專用數(shù)據(jù)經(jīng)過(guò)加工后逐步釋放提供開(kāi)放共享。中子和光子科學(xué)數(shù)據(jù)所有權(quán)屬于大科學(xué)裝置,提案用戶/團(tuán)隊(duì)擁有數(shù)據(jù)的優(yōu)先使用權(quán),數(shù)據(jù)保護(hù)期屆滿后數(shù)據(jù)也將釋放提供開(kāi)放共享。數(shù)據(jù)中心在各業(yè)務(wù)系統(tǒng)之間建立安全、可管理、高性能的數(shù)據(jù)共享網(wǎng)絡(luò)和服務(wù)平臺(tái),保證數(shù)據(jù)服務(wù)和共享業(yè)務(wù)的可靠運(yùn)行。目前,數(shù)據(jù)中心的數(shù)據(jù)服務(wù)用戶近萬(wàn)人,來(lái)自國(guó)內(nèi)外數(shù)百家單位。數(shù)據(jù)共享的方式有兩種:一是數(shù)據(jù)中心支持?jǐn)?shù)據(jù)傳輸?shù)胶献鹘M單位進(jìn)行科學(xué)計(jì)算;二是支持在數(shù)據(jù)中心直接訪問(wèn)數(shù)據(jù)進(jìn)行科學(xué)計(jì)算。每年的數(shù)據(jù)訪問(wèn)量高達(dá)300 PB,以合作組的名義發(fā)表的SCI論文超過(guò)300 篇,很好地支持了科學(xué)家們的科研活動(dòng)。
宇宙線是來(lái)自宇宙空間的高能帶電粒子流的總稱。當(dāng)前宇宙線物理的核心問(wèn)題是尋找宇宙線起源。高海拔宇宙線觀測(cè)站(Large High Altitude Air Shower Observatory,LHAASO)是目前世界上海拔最高、規(guī)模最大、靈敏度最強(qiáng)的宇宙射線探測(cè)裝置,其核心科學(xué)目標(biāo)是探索高能宇宙線起源并開(kāi)展相關(guān)的高能輻射、天體演化乃至暗物質(zhì)分布等基礎(chǔ)科學(xué)的研究。LHAASO每年產(chǎn)生的數(shù)據(jù)量超過(guò)6 PB,按照10年實(shí)驗(yàn)周期來(lái)計(jì)算,再加上模擬數(shù)據(jù)、分析數(shù)據(jù)等,至少需要能夠支持60 PB以上的數(shù)據(jù)管理系統(tǒng)。
數(shù)據(jù)中心為L(zhǎng)HAASO實(shí)驗(yàn)提供了集高性能計(jì)算集群、海量存儲(chǔ)系統(tǒng)、高速傳輸網(wǎng)絡(luò)、分布式數(shù)據(jù)共享于一體的科學(xué)數(shù)據(jù)服務(wù)平臺(tái),為宇宙線研究提供了技術(shù)支撐。
在稻城在站小型數(shù)據(jù)中心部署了登錄節(jié)點(diǎn)、計(jì)算集群和磁盤存儲(chǔ),支持水切倫科夫探測(cè)器陣列(WCDA)在線處理、過(guò)濾噪聲、壓縮數(shù)據(jù)等操作,并實(shí)時(shí)獲取平方公里探測(cè)器陣列(KM2A)和廣角切倫科夫望遠(yuǎn)鏡陣列(WFCTA)的實(shí)驗(yàn)數(shù)據(jù),實(shí)時(shí)通過(guò)專線網(wǎng)絡(luò)傳輸?shù)礁吣芩?。在高能所大型?shù)據(jù)中心部署了登錄節(jié)點(diǎn)、計(jì)算集群、磁盤存儲(chǔ)和磁帶存儲(chǔ),支持大規(guī)模的數(shù)據(jù)處理,包括數(shù)據(jù)存儲(chǔ)、模擬、解碼、重建、事例符合、分析等任務(wù)。KM2A、WFCTA的原始數(shù)據(jù)及WCDA的初步重建數(shù)據(jù)從稻城傳輸?shù)礁吣芩螅⒓醋?cè)到數(shù)據(jù)管理系統(tǒng)的數(shù)據(jù)庫(kù)中,將數(shù)據(jù)文件保存到高能所的磁盤存儲(chǔ)系統(tǒng)中,并定期保存到磁帶庫(kù),實(shí)現(xiàn)數(shù)據(jù)的長(zhǎng)期保存。
根據(jù)LHAASO的數(shù)據(jù)處理需求,數(shù)據(jù)中心采用HTCondor作為作業(yè)調(diào)度系統(tǒng),采用EOS作為磁盤分布式文件系統(tǒng),采用CERN CASTOR作為磁帶庫(kù)管理系統(tǒng)。整個(gè)平臺(tái)的核心是一個(gè)高速、高可靠的網(wǎng)絡(luò),其他子系統(tǒng)連接到這個(gè)核心網(wǎng)絡(luò)上,包括前端登錄集群、存儲(chǔ)集群、計(jì)算節(jié)點(diǎn)集群、備份與分級(jí)存儲(chǔ)系統(tǒng)、支撐管理系統(tǒng)等。如圖2所示,前端登錄集群直接面向用戶提供服務(wù),后端的計(jì)算與存儲(chǔ)等系統(tǒng)以虛擬資源池的形式通過(guò)前端系統(tǒng)展現(xiàn)給用戶。系統(tǒng)采用計(jì)算和存儲(chǔ)分離的模式。計(jì)算節(jié)點(diǎn)構(gòu)成計(jì)算集群,通過(guò)高性能網(wǎng)絡(luò)從存儲(chǔ)系統(tǒng)中讀取數(shù)據(jù),計(jì)算過(guò)程中和計(jì)算結(jié)束后均會(huì)將結(jié)果寫(xiě)回到存儲(chǔ)系統(tǒng)。存儲(chǔ)系統(tǒng)采用集群結(jié)構(gòu),構(gòu)成分布式的海量磁盤存儲(chǔ)系統(tǒng)。系統(tǒng)通過(guò)作業(yè)調(diào)度軟件將大量計(jì)算節(jié)點(diǎn)上的CPU資源整合起來(lái),形成計(jì)算集群,對(duì)用戶提供單一系統(tǒng)映像。作業(yè)調(diào)度系統(tǒng)對(duì)多用戶提交的任務(wù)進(jìn)行統(tǒng)一安排,避免沖突,并對(duì)用戶訪問(wèn)資源進(jìn)行授權(quán)。由于LHAASO數(shù)據(jù)量大,且要求長(zhǎng)期保存,系統(tǒng)采用了基于磁盤—磁帶的分級(jí)存儲(chǔ)系統(tǒng),將磁盤、磁帶庫(kù)等多種異構(gòu)介質(zhì)的存儲(chǔ)設(shè)備整合起來(lái),構(gòu)建了統(tǒng)一共享的文件名字空間。對(duì)于用戶來(lái)說(shuō),磁盤和磁帶上的數(shù)據(jù)都是在線的,可以隨時(shí)訪問(wèn)。
圖2 離線計(jì)算環(huán)境架構(gòu)
LHAASO實(shí)驗(yàn)采用邊建設(shè)邊取數(shù)的運(yùn)行方式。自2019年實(shí)驗(yàn)開(kāi)始取數(shù)以來(lái),數(shù)據(jù)中心平臺(tái)已積累了超過(guò)7 PB實(shí)驗(yàn)數(shù)據(jù),并建設(shè)了一套40 PB的分布式磁盤存儲(chǔ)系統(tǒng)和25 PB的磁帶存儲(chǔ)系統(tǒng)。截至2021年9月,數(shù)據(jù)中心平臺(tái)上已運(yùn)行7 500 萬(wàn)個(gè)LHAASO實(shí)驗(yàn)作業(yè),提供了6 300 萬(wàn)個(gè)CPU機(jī)時(shí)。依托LHAASO數(shù)據(jù)處理平臺(tái),基于LHAASO已經(jīng)建成的1/2 規(guī)模探測(cè)裝置,通過(guò)在2020年的11 個(gè)月內(nèi)觀測(cè)數(shù)據(jù),LHAASO在銀河系內(nèi)發(fā)現(xiàn)大量超高能宇宙加速器,并記錄到能量達(dá)1.4 拍電子伏的伽馬光子(拍=千萬(wàn)億),這是人類觀測(cè)到的最高能量光子,突破了人類對(duì)銀河系粒子加速的傳統(tǒng)認(rèn)知,開(kāi)啟了 “超高能伽馬天文學(xué)”時(shí)代[8]。
空間天文學(xué)是利用空間飛行器在地球稠密大氣外進(jìn)行天文觀測(cè)和研究的一門學(xué)科。利用國(guó)內(nèi)空間天文衛(wèi)星能夠穿過(guò)星際物質(zhì)的遮擋“看”到宇宙中的射線,開(kāi)展高能天體演化、黑洞、伽馬射線暴和引力波電磁對(duì)應(yīng)體等方面的科學(xué)研究。數(shù)據(jù)中心為空間天文衛(wèi)星項(xiàng)目提供了集數(shù)據(jù)傳輸、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理、數(shù)據(jù)分析與共享服務(wù)于一體的科學(xué)數(shù)據(jù)服務(wù)平臺(tái)(圖3),支持并實(shí)現(xiàn)了觀測(cè)任務(wù)提出、觀測(cè)任務(wù)執(zhí)行、數(shù)據(jù)接收、數(shù)據(jù)預(yù)處理、數(shù)據(jù)高級(jí)處理和數(shù)據(jù)分析的全生命周期管理,為空間科學(xué)研究提供支撐。
圖3 空間天文衛(wèi)星數(shù)據(jù)服務(wù)平臺(tái)
在觀測(cè)任務(wù)提出階段,由科學(xué)家提出科學(xué)觀測(cè)提案,經(jīng)過(guò)科學(xué)評(píng)估和技術(shù)評(píng)估生成觀測(cè)計(jì)劃,轉(zhuǎn)入觀測(cè)任務(wù)執(zhí)行階段,科學(xué)數(shù)據(jù)下傳后通過(guò)VPN網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)傳輸,實(shí)現(xiàn)衛(wèi)星科學(xué)數(shù)據(jù)的在線和離線存儲(chǔ)。對(duì)于近實(shí)時(shí)數(shù)據(jù)流產(chǎn)生的在線數(shù)據(jù)進(jìn)行快視分析,實(shí)現(xiàn)對(duì)機(jī)遇目標(biāo)(爆發(fā)源、新源等)的監(jiān)測(cè);對(duì)于離線數(shù)據(jù)進(jìn)行去除傳輸錯(cuò)誤、解幀、分路、排重、數(shù)據(jù)拼接、轉(zhuǎn)換等預(yù)處理過(guò)程,生成初級(jí)數(shù)據(jù)產(chǎn)品,對(duì)載荷源包數(shù)據(jù)和工程輔助數(shù)據(jù)等進(jìn)行解包、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)分解、內(nèi)容重組、格式標(biāo)準(zhǔn)化等處理步驟,生成用戶能夠使用的高級(jí)數(shù)據(jù)產(chǎn)品。為了保障數(shù)據(jù)的質(zhì)量和可追溯性,對(duì)數(shù)據(jù)處理過(guò)程中產(chǎn)生的各類數(shù)據(jù)進(jìn)行分類存儲(chǔ)與統(tǒng)一管理,采用標(biāo)準(zhǔn)的編目規(guī)則制作數(shù)據(jù)集和數(shù)據(jù)卷存放到科學(xué)數(shù)據(jù)產(chǎn)品庫(kù)[9]。依據(jù)數(shù)據(jù)策略,將數(shù)據(jù)匯交到數(shù)據(jù)中心。
在數(shù)據(jù)共享服務(wù)方面,平臺(tái)采用容器技術(shù)構(gòu)建實(shí)時(shí)快速數(shù)據(jù)處理集群,集成衛(wèi)星專業(yè)數(shù)據(jù)分析軟件和工具,依據(jù)數(shù)據(jù)共享策略,為用戶提供一站式數(shù)據(jù)與分析的集成服務(wù)(圖4),推動(dòng)數(shù)據(jù)的深層次共享。
圖4 空間天文衛(wèi)星數(shù)據(jù)分析服務(wù)技術(shù)架構(gòu)
利用該平臺(tái)支持HXMT和GECAM衛(wèi)星開(kāi)展各類觀測(cè)達(dá)1 000 多次,處理了關(guān)于黑洞、中子星、伽馬射線暴乃至引力波暴等觀測(cè)數(shù)據(jù)約400 TB,生成了超過(guò)30 TB的科學(xué)數(shù)據(jù)產(chǎn)品,支持國(guó)內(nèi)外天文學(xué)家的聯(lián)合觀測(cè)和科學(xué)研究。運(yùn)用數(shù)據(jù)中心的數(shù)據(jù)與分析的集成服務(wù),支持產(chǎn)生了一系列具有國(guó)際影響力的科學(xué)成果。2020年,國(guó)際學(xué)術(shù)期刊《高能天體物理學(xué)期刊》以專輯形式發(fā)布了中國(guó)首顆X射線天文衛(wèi)星“慧眼”的部分技術(shù)和科學(xué)結(jié)果,共發(fā)表了21 篇學(xué)術(shù)論文。
中微子物理是當(dāng)今粒子物理、天體物理與宇宙學(xué)的交叉與熱點(diǎn),存在大量未解之謎,是發(fā)現(xiàn)新物理的突破口與關(guān)鍵。大亞灣中微子實(shí)驗(yàn)數(shù)據(jù)來(lái)自大亞灣反應(yīng)堆中微子實(shí)驗(yàn),通過(guò)對(duì)該數(shù)據(jù)的分析研究可精確測(cè)定具有重大物理意義的參數(shù)——中微子混合角θ13。該數(shù)值的大小決定了未來(lái)中微子物理的發(fā)展方向,對(duì)宇宙起源、粒子物理大統(tǒng)一理論以及未來(lái)中微子物理的發(fā)展方向等均有極為重要的意義。大亞灣中微子實(shí)驗(yàn)自運(yùn)行以來(lái)每年產(chǎn)生原始數(shù)據(jù)約100 TB,重建及模擬數(shù)據(jù)量維持在每年100 TB。
數(shù)據(jù)中心為大亞灣中微子實(shí)驗(yàn)提供了數(shù)據(jù)全生命周期的管理,包括數(shù)據(jù)傳輸與共享、離線數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理與分析平臺(tái)等。
在大亞灣實(shí)驗(yàn)現(xiàn)場(chǎng)和數(shù)據(jù)中心均部署了數(shù)據(jù)傳輸系統(tǒng),如圖5所示。現(xiàn)場(chǎng)的數(shù)據(jù)傳輸系統(tǒng)通過(guò)查詢?cè)诰€數(shù)據(jù)獲取系統(tǒng)(以下簡(jiǎn)稱“DAQ”)的磁盤列表,將新產(chǎn)生的實(shí)驗(yàn)原始數(shù)據(jù)拷貝至現(xiàn)場(chǎng)的本地磁盤存儲(chǔ)中,供在線數(shù)據(jù)分析系統(tǒng)進(jìn)行在線數(shù)據(jù)分析,同時(shí)傳輸至數(shù)據(jù)中心的離線存儲(chǔ)系統(tǒng),供離線數(shù)據(jù)處理與分析系統(tǒng)進(jìn)行分析。數(shù)據(jù)傳輸系統(tǒng)將原始數(shù)據(jù)存放至離線存儲(chǔ)系統(tǒng)后,則會(huì)把原始數(shù)據(jù)轉(zhuǎn)發(fā)至位于LBNL的存儲(chǔ)空間[10]。依托高效的數(shù)據(jù)傳輸系統(tǒng)和數(shù)據(jù)中心可靠的網(wǎng)絡(luò)通信鏈路,原始數(shù)據(jù)從大亞灣現(xiàn)場(chǎng)產(chǎn)生到數(shù)據(jù)中心離線存儲(chǔ)系統(tǒng)的延時(shí)只有10 ~15 分鐘,到LBNL的離線存儲(chǔ)系統(tǒng)的延時(shí)只有15 ~20 分鐘,原始數(shù)據(jù)采集并打包成文件后,30 分鐘左右就已經(jīng)傳輸?shù)街忻纼蓢?guó)的離線服務(wù)器上,使離線分析人員可以在第一時(shí)間檢查數(shù)據(jù)狀態(tài),進(jìn)行探測(cè)器刻度。
圖5 數(shù)據(jù)傳輸系統(tǒng)部署架構(gòu)圖
為保證數(shù)據(jù)永久可靠保存,并考慮到實(shí)施成本,數(shù)據(jù)中心為大亞灣中微子實(shí)驗(yàn)的原始數(shù)據(jù)提供了磁盤存儲(chǔ)和磁帶存儲(chǔ)相結(jié)合的模式。磁盤存儲(chǔ)采用基于Lustre 分布式文件系統(tǒng)搭建,通過(guò)元數(shù)據(jù)和數(shù)據(jù)分離的架構(gòu)實(shí)現(xiàn)讀寫(xiě)吞吐率的線性可擴(kuò)展性。元數(shù)據(jù)服務(wù)器集群包括多臺(tái)Lustre 元數(shù)據(jù)服務(wù)器,通過(guò)SAN 存儲(chǔ)交換網(wǎng)絡(luò)連接一個(gè)高性能全閃盤陣。同時(shí),系統(tǒng)還設(shè)計(jì)了一個(gè)低速盤陣來(lái)異步拷貝全閃盤陣中的數(shù)據(jù),進(jìn)一步保證元數(shù)據(jù)的可靠性。每個(gè)磁盤陣列配置兩個(gè)以上的控制器以及RAID 6 以上的數(shù)據(jù)冗余和快速數(shù)據(jù)重建能力。磁帶存儲(chǔ)則采用CERN CASTOR 磁帶管理系統(tǒng)。系統(tǒng)包括請(qǐng)求隊(duì)列、磁帶驅(qū)動(dòng)器、磁帶服務(wù)器和名字服務(wù)器等組件。磁帶服務(wù)器可以通過(guò)FC 通道驅(qū)動(dòng)磁帶庫(kù)的機(jī)械手,并且通過(guò)HBA卡連接磁帶驅(qū)動(dòng)器讀寫(xiě)數(shù)據(jù)。通過(guò)CASTOR 提供的數(shù)據(jù)訪問(wèn)接口和API,用戶可以順序地讀寫(xiě)磁帶中的數(shù)據(jù)文件。
數(shù)據(jù)中心為大亞灣中微子實(shí)驗(yàn)提供了離線的數(shù)據(jù)處理與分析平臺(tái),包括2 000 多個(gè)CPU核,選用適合高通量計(jì)算的HTCondor調(diào)度器進(jìn)行計(jì)算資源的調(diào)度,并基于不同數(shù)據(jù)處理和分析的需求提供不同時(shí)長(zhǎng)的計(jì)算作業(yè)調(diào)度。數(shù)據(jù)中心為大亞灣實(shí)驗(yàn)提供了長(zhǎng)期穩(wěn)定的數(shù)據(jù)服務(wù),為發(fā)現(xiàn)和精確測(cè)量中微子第三種振蕩模式等世界級(jí)科學(xué)成果作出重要貢獻(xiàn)。
中國(guó)散裂中子源是國(guó)家“十一五”期間重點(diǎn)建設(shè)的十二大科學(xué)裝置之首,為我國(guó)材料科學(xué)技術(shù)、物理、化學(xué)化工、生命科學(xué)、資源環(huán)境和新能源等提供了一個(gè)先進(jìn)、功能強(qiáng)大的科研平臺(tái)。散裂中子源就像“超級(jí)顯微鏡”,是研究物質(zhì)微觀結(jié)構(gòu)的理想探針。中國(guó)散裂中子源裝備有多臺(tái)中子譜儀,數(shù)據(jù)中心為這些實(shí)驗(yàn)譜儀組成的材料科學(xué)研究平臺(tái)提供了全方位的數(shù)據(jù)服務(wù)。
材料科學(xué)數(shù)據(jù)平臺(tái)主要包括用戶管理系統(tǒng)、實(shí)驗(yàn)提案系統(tǒng)、實(shí)驗(yàn)元數(shù)據(jù)管理系統(tǒng)、模擬計(jì)算系統(tǒng)、虛擬實(shí)驗(yàn)系統(tǒng)、實(shí)驗(yàn)數(shù)據(jù)訪問(wèn)系統(tǒng)和數(shù)據(jù)分析與可視化系統(tǒng),涵蓋了賬號(hào)注冊(cè)、提案申請(qǐng)、虛擬實(shí)驗(yàn)、實(shí)驗(yàn)數(shù)據(jù)/元數(shù)據(jù)存儲(chǔ)與訪問(wèn)、數(shù)據(jù)分析的完整用戶流程。平臺(tái)針對(duì)不同數(shù)據(jù)模擬環(huán)境和大科學(xué)裝置不同譜儀的具體數(shù)據(jù)處理需求分別開(kāi)發(fā)了模擬軟件、事例重建軟件、后期數(shù)據(jù)分析軟件和數(shù)據(jù)可視化軟件,并實(shí)現(xiàn)與分布式存儲(chǔ)、云計(jì)算資源的整合,營(yíng)造了一站式的數(shù)據(jù)管理與數(shù)據(jù)分析環(huán)境。平臺(tái)整體架構(gòu)如圖6所示。
圖6 材料科學(xué)數(shù)據(jù)平臺(tái)整體架構(gòu)
材料科學(xué)數(shù)據(jù)平臺(tái)支撐中國(guó)散裂中子源完成200 多項(xiàng)用戶課題,發(fā)表用戶實(shí)驗(yàn)成果論文50 多篇。其中,香港大學(xué)機(jī)械工程系黃明欣教授團(tuán)隊(duì)研發(fā)的超級(jí)鋼,在保證低成本的前提下達(dá)到前所未有的2.2 GPa屈服強(qiáng)度和16%的均勻延伸率。其成果發(fā)表在國(guó)際學(xué)術(shù)期刊《Science》上。本次在CSNS通用粉末衍射儀(GPPD)成功開(kāi)展的淬火配分鋼(QP 鋼)的中子衍射研究,不僅獲得了高強(qiáng)鋼在不同組織結(jié)構(gòu)及不同變形條件下亞穩(wěn)奧氏體與位錯(cuò)等的重要微觀參數(shù),而且識(shí)別了析出碳化物信息?;跀?shù)據(jù)中心的材料科學(xué)數(shù)據(jù)平臺(tái),該實(shí)驗(yàn)為深入理解第三代超高強(qiáng)鋼的變形、強(qiáng)化及斷裂機(jī)理提供了關(guān)鍵的數(shù)據(jù)支持,對(duì)推動(dòng)高強(qiáng)度級(jí)別淬火配分鋼的產(chǎn)業(yè)應(yīng)用具有積極的作用。
高能物理科學(xué)數(shù)據(jù)的特點(diǎn)是數(shù)據(jù)規(guī)模巨大、結(jié)構(gòu)復(fù)雜,對(duì)于不同的實(shí)驗(yàn),其數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)處理的工具和方法也不同。對(duì)于大科學(xué)裝置項(xiàng)目,為了提供高質(zhì)量的科學(xué)數(shù)據(jù)服務(wù),數(shù)據(jù)中心采取走出去的方式在科學(xué)實(shí)驗(yàn)設(shè)計(jì)建造、實(shí)驗(yàn)數(shù)據(jù)采集和分析的每個(gè)階段都與科學(xué)項(xiàng)目建立緊密的合作,幫助科學(xué)項(xiàng)目建立全生命周期的數(shù)據(jù)服務(wù)系統(tǒng),這樣確保了科學(xué)項(xiàng)目產(chǎn)生數(shù)據(jù)時(shí)就直接將數(shù)據(jù)匯交到數(shù)據(jù)中心,并依托數(shù)據(jù)中心提供數(shù)據(jù)訪問(wèn)和處理的服務(wù)。另外,數(shù)據(jù)中心建立了一套科學(xué)數(shù)據(jù)匯交、管理、共享的全鏈條數(shù)據(jù)服務(wù)體系,努力為我國(guó)高能物理及相關(guān)物質(zhì)科學(xué)領(lǐng)域提供科學(xué)數(shù)據(jù)服務(wù),為國(guó)家科學(xué)發(fā)現(xiàn)與技術(shù)創(chuàng)新作出應(yīng)有的貢獻(xiàn)。