王濤 童英 丁毅 郭磊 黃河1, 范潤龍 王朝陽 張穎慧 曹光躍 張建軍
21世紀是大數(shù)據(jù)的時代(Lynch, 2008),大數(shù)據(jù)引發(fā)的第二次科學(xué)革命改變了傳統(tǒng)的科學(xué)研究范式,“數(shù)據(jù)+模型”驅(qū)動下的科學(xué)研究新范式與知識發(fā)現(xiàn)正逐漸成為當今科學(xué)領(lǐng)域新的發(fā)展趨勢(Ahmed, 2017;翟明國等,2018;Wangetal., 2021)。同時,地球科學(xué)也在經(jīng)歷向地球系統(tǒng)科學(xué)轉(zhuǎn)變的重大轉(zhuǎn)型,需要不同學(xué)科以數(shù)據(jù)為紐帶的深入融合。在此背景下,中國科學(xué)家率先提出“深時數(shù)字地球”(Deep-time Digital Earth,簡稱DDE) 國際大科學(xué)計劃,并由十幾個國際組織與機構(gòu)共同發(fā)起和參與,經(jīng)國際地球科學(xué)聯(lián)合會(IUGS)執(zhí)委會投票通過,正式成為IUGS第一項認可的國際大科學(xué)計劃,并已于2019年2月在北京正式啟動。DDE將聚焦于地球過去數(shù)十億年的深時演化歷史,通過整合百年人類工業(yè)革命所積累的海量地學(xué)數(shù)據(jù),在大數(shù)據(jù)驅(qū)動下重建地球生命、地理、物質(zhì)和氣候的演化,識別全球礦產(chǎn)資源與能源的宏觀分布規(guī)律,更有效地防止和控制可能突發(fā)的災(zāi)害對人類所造成的損害。這一計劃將面向全球數(shù)百萬研究人員和科技專業(yè)用戶,為其提供一個跨越學(xué)科領(lǐng)域和國界的虛擬科研環(huán)境,使其能夠存儲、共享和復(fù)用科研數(shù)據(jù)(Wangetal., 2021)。
地球科學(xué)基礎(chǔ)學(xué)科數(shù)據(jù)庫的建設(shè)是該大科學(xué)計劃的核心內(nèi)容和重要支柱。巖石(巖漿巖)是研究地球物質(zhì),特別是深部物質(zhì)的基礎(chǔ)學(xué)科。巖漿巖來源于地球深部,提供了深部物質(zhì)與動力學(xué)信息,承擔(dān)著深時數(shù)字“深部”地球研究的重任(Deep-time Digital Deep Earth, DDDE)。DDE-巖石(巖漿巖)工作組,即DDE-OnePetrology是首批啟動(2019年)的6個DDE學(xué)科工作組之一,負責(zé)構(gòu)建巖漿巖數(shù)據(jù)庫,并探索構(gòu)建科學(xué)研究平臺和服務(wù)應(yīng)用體系,搭建全球巖石學(xué)與其他學(xué)科專家合作交流的平臺,開展相關(guān)科學(xué)研究,推動地球科學(xué)(巖漿巖)在大數(shù)據(jù)時代的創(chuàng)新發(fā)展,探索古板塊格局重建、大陸聚散過程,地殼生長、地球深部物質(zhì)組成與演化等重大地球科學(xué)問題。目前初步構(gòu)建了數(shù)據(jù)庫結(jié)構(gòu)框架,入庫了一批數(shù)據(jù)并公開上線,嘗試開展應(yīng)用研究。
本文將以巖漿巖知識體系為基礎(chǔ),以數(shù)據(jù)(數(shù))+編圖(圖)+研究(文)三位一體的建庫思路,簡要介紹數(shù)據(jù)庫的基本結(jié)構(gòu)、功能及初步應(yīng)用情況,展望未來的應(yīng)用前景。該研究工作在推動數(shù)據(jù)驅(qū)動的巖漿巖研究方面將起到促進作用。期待更多地質(zhì)學(xué)科工作者關(guān)注、參與、使用該數(shù)據(jù)庫,并提出修改完善建議。
隨著地質(zhì)學(xué)科特別是測試技術(shù)的不斷發(fā)展,巖石(巖漿巖)測試數(shù)據(jù)(相關(guān)的巖石學(xué)、地球化學(xué)、年代學(xué)、同位素等數(shù)據(jù)等)呈爆發(fā)式增長。國內(nèi)外多個國家機構(gòu)都高度重視這些基礎(chǔ)數(shù)據(jù),各自建立了國家級或全球規(guī)模的數(shù)據(jù)庫,包括一些專業(yè)的巖石數(shù)據(jù)庫(張穎慧等,2020)。例如,美國的EarthChem數(shù)據(jù)庫(巖石學(xué)、地球化學(xué)、年代學(xué)),其先后納入了PetDB、NAVDAT等專業(yè)巖石數(shù)據(jù)庫;德國Mainz大學(xué)的Max Planck化學(xué)研究所建立的GEOROC巖石地球化學(xué)數(shù)據(jù)庫;加拿大自然資源部建立的GeoGratis數(shù)據(jù)庫(地質(zhì)圖、巖石地球化學(xué)、年代學(xué)、文章);英國地質(zhì)調(diào)查局建立的OpenGeoscience數(shù)據(jù)庫(地質(zhì)圖、地球物理、礦產(chǎn)、古生物、巖石薄片照片等);澳大利亞建立的Earth BYTE數(shù)據(jù)庫(年代學(xué)、地球化學(xué)、古地磁、同位素、礦產(chǎn)等)。部分科學(xué)家也建立了一些地區(qū)性的數(shù)據(jù)庫,并取得了很好的研究成果(Chapman and Kapp, 2017;Vlasceanuetal., 2021)。國內(nèi)中國科學(xué)院、中國地質(zhì)科學(xué)院等研究機構(gòu)和學(xué)者也建立(過)一些巖漿巖相關(guān)的數(shù)據(jù)庫,但目前除不斷更新和完善的地質(zhì)生物多樣性數(shù)據(jù)庫(GBDB)之外,其他一些學(xué)科的數(shù)據(jù)庫都已基本停止更新和運行。
目前,國際上與巖石學(xué)、地球化學(xué)有關(guān)的、運行最好的是EarthChem和GEOROC數(shù)據(jù)庫,下面對其進行簡單介紹。
EarthChem(Geochemical Databases for the Earth,www.earthchem.org)數(shù)據(jù)庫是目前最常用和最活躍的巖漿巖數(shù)據(jù)庫和數(shù)據(jù)檢索源。其成立最初是通過建立統(tǒng)一的網(wǎng)絡(luò)平臺將PetDB、GEOROC和NAVDAT三個主要的數(shù)據(jù)庫連接起來。2005年,EarthChem數(shù)據(jù)庫開始建立自己的數(shù)據(jù)管理系統(tǒng),將部分其他數(shù)據(jù)庫的數(shù)據(jù)統(tǒng)一存放于自己的數(shù)據(jù)庫中;同時,開始研究數(shù)據(jù)的可視化及數(shù)據(jù)分析工具。目前,EarthChem數(shù)據(jù)庫的主要功能包括:數(shù)據(jù)查詢、下載、位置Google Earth導(dǎo)出、在線地圖顯示,并可對查詢結(jié)果提供在線的TAS圖解和Harker圖解可視化分析工具。
EarthChem數(shù)據(jù)庫運行一套數(shù)據(jù)系統(tǒng),幫助地球科學(xué)家訪問、共享和使用地球化學(xué)、巖石學(xué)和地質(zhì)年代學(xué)數(shù)據(jù),建立了固體地球的地球化學(xué)數(shù)據(jù)綜合管理和信息系統(tǒng),加強不同數(shù)據(jù)庫間的協(xié)作,共享數(shù)據(jù)管理經(jīng)驗和管理工具(Walkeretal., 2005)。EarthChem數(shù)據(jù)庫系統(tǒng)可確保提供開放和持久的數(shù)據(jù),并為數(shù)據(jù)挖掘和數(shù)據(jù)分析提供高級功能,從而服務(wù)于不同的科學(xué)研究,產(chǎn)生了很好的效果,很多高質(zhì)量文章都引用了該數(shù)據(jù)庫的數(shù)據(jù)。
GEOROC(Geochemistry of Rocks of the Oceans and Continents)數(shù)據(jù)庫是大陸和海洋巖石地球化學(xué)數(shù)據(jù)庫,由德國Max Planck化學(xué)研究所的B?rbel Sarbas博士研究小組負責(zé)建設(shè)和維護。GEOROC包括板內(nèi)洋島火山巖以及匯聚板塊邊緣和大火成巖省的火山巖數(shù)據(jù), 2023年6月1日更新后數(shù)據(jù)庫共包括樣品 640100件,文獻 21370 篇,分析數(shù)據(jù)2402280條,單個的數(shù)據(jù)值35116090個。GEOROC可支持按作者文獻、地質(zhì)環(huán)境、地理坐標(經(jīng)緯度)、化學(xué)元素(包括主量、微量、稀土元素和放射性同位素)含量、巖石類型等多種查詢方式。GEOROC的特色服務(wù)在于預(yù)先按各種不同專題對數(shù)據(jù)進行了整編,形成csv文件,可供直接下載,方便使用。目前,GEOROC已經(jīng)鏈接到EarthChem數(shù)據(jù)庫中。
除上述2個數(shù)據(jù)庫之外,國內(nèi)外還有一些其他有關(guān)的數(shù)據(jù)庫。例如,美國地質(zhì)調(diào)查局(USGS)數(shù)據(jù)庫中含有巖漿巖地球化學(xué)數(shù)據(jù)庫(包括National Geochemical Database: Rock),其目前共有414304條樣品記錄,其中巖漿巖地球化學(xué)數(shù)據(jù)約占1/2。中國在二十世紀八、九十年代就開始了巖漿巖數(shù)據(jù)庫建設(shè)(尚如相等,1989;徐偉昌等,1991;陸松年等,1997;尚如相,1999),也出現(xiàn)過研究機構(gòu)和學(xué)者建立的一些巖漿巖數(shù)據(jù)庫(王曉蕊,2008;張聰?shù)?2012;錢莉莉等,2015),例如,中國地質(zhì)科學(xué)院初步構(gòu)建了中國及全球火成巖數(shù)據(jù)庫和中國同位素地質(zhì)年代基礎(chǔ)數(shù)據(jù)、中國地質(zhì)調(diào)查局“地質(zhì)云”上的相關(guān)數(shù)據(jù)庫和中國科學(xué)院數(shù)據(jù)云上的一些巖漿巖地球化學(xué)和年代學(xué)數(shù)據(jù)集(包括中國科學(xué)院廣州地球化學(xué)研究所、青藏高原研究所等)等。但這些數(shù)據(jù)庫較分散,且為靜態(tài)的數(shù)據(jù)集,缺乏系統(tǒng)的集成、持續(xù)的更新維護和交互接口,難以保證提供穩(wěn)定的在線服務(wù)。有關(guān)數(shù)據(jù)庫的詳細情況見張穎慧等(2020)。近年來,中國科學(xué)院也開始設(shè)立了公益學(xué)術(shù)平臺。該平臺首期集成了中國科學(xué)院的科技成果資源、科技出版資源和學(xué)術(shù)交流資源,目前通過平臺可檢索的科技文獻資料約1.7億篇。
從國內(nèi)外巖石地球化學(xué)相關(guān)數(shù)據(jù)庫的現(xiàn)狀來看,目前還存在一些主要問題:(1)多個數(shù)據(jù)庫已不再更新,或近期少有更新,幾乎為停止狀態(tài);(2)專業(yè)性不強,系統(tǒng)性不夠,不少同位素數(shù)據(jù)僅僅是原始數(shù)據(jù)的匯總,信息不全,沒有依據(jù)有關(guān)信息給出真正實用的參數(shù);(3)共享和開放不夠;(4)缺少數(shù)據(jù)互聯(lián)、整合的平臺(多用戶協(xié)同的數(shù)字化科研平臺);(5)缺乏研究平臺,特別是缺少數(shù)據(jù)庫+數(shù)字編圖+綜合研究一體化的科研平臺,難以開展數(shù)據(jù)挖掘和深入集成分析。
因此,在“深時數(shù)字地球”國際大科學(xué)計劃的推動下,建立開放、共享、統(tǒng)一的巖漿巖數(shù)據(jù)庫及研究平臺,整合各學(xué)科基礎(chǔ)數(shù)據(jù)開展全球協(xié)作,運用大數(shù)據(jù)分析和人工智能解決關(guān)鍵科學(xué)問題,極為必要。
目前,DDE-巖漿巖數(shù)據(jù)庫初步構(gòu)建了數(shù)據(jù)庫框架,入庫了一批數(shù)據(jù)。
構(gòu)建數(shù)據(jù)庫首先需要數(shù)據(jù),高質(zhì)量的數(shù)據(jù)是構(gòu)建數(shù)據(jù)庫的基石。DDE-巖漿巖數(shù)據(jù)庫,數(shù)據(jù)主要來源有4種:(1)公開發(fā)表的文獻;(2)本項目組研究團隊獲得的測試數(shù)據(jù);(3)實驗室測試共享數(shù)據(jù);(4)一些國際組織(如大洋鉆探計劃)提供的數(shù)據(jù)和已有數(shù)據(jù)庫的數(shù)據(jù),特別是“長尾”數(shù)據(jù)。此外,還設(shè)置有志愿者貢獻數(shù)據(jù)平臺,貢獻者可以提供數(shù)據(jù)。
2.1.1 文獻數(shù)據(jù)
公開發(fā)表的文獻數(shù)據(jù)是目前DDE-巖漿巖數(shù)據(jù)庫的主要數(shù)據(jù)來源,其數(shù)據(jù)質(zhì)量有保證,便于核查。數(shù)據(jù)獲取方式主要是人工與AI相結(jié)合。首先,利用所在單位購買的出版商數(shù)據(jù)庫及DDE平臺上的Deep Scholar收集巖漿巖文獻及其相關(guān)信息。然后,采用Deep Shovel和自主開發(fā)的Pdf表格數(shù)據(jù)提取軟件,從文獻表格和文字中獲取數(shù)據(jù),并應(yīng)用DDE信息化團隊和本團隊開發(fā)的軟件工具,進行數(shù)據(jù)及表格融合處理。借用信息化技術(shù),搜集、整理、補全、校對和入庫有關(guān)數(shù)據(jù)。
本數(shù)據(jù)庫關(guān)鍵的數(shù)據(jù)都提供相應(yīng)的經(jīng)緯度,但大量的年代學(xué)、地球化學(xué)數(shù)據(jù)并沒有經(jīng)緯度信息,需要到文章中去查找,或者從圖件中讀取。目前采用的是項目組開發(fā)的地質(zhì)圖經(jīng)緯度自動讀取軟件,且已經(jīng)集成到Knowledgefusion中,正在進行標注,通過機器學(xué)習(xí)后可以自動獲取經(jīng)緯度。后期將利用DDE平臺地理信息相互校正,也期望原始文獻作者能提供精確的信息。
未來,對一些非結(jié)構(gòu)化數(shù)據(jù),將采用Human-AI Collaboration 框架,并實現(xiàn)在線支持?;凇叭嗽诨芈贰彼枷?利用已有文獻和上海交通大學(xué)建立的文獻庫,采用自然語言處理(NLP)與計算機視覺技術(shù),依據(jù)知識體系和知識圖譜,自動識別、抽提多模態(tài)地球科學(xué)文檔中與巖漿知識節(jié)點相關(guān)的圖片、表格和描述文字,并對提取后信息結(jié)構(gòu)化數(shù)據(jù)進行補齊。
2.1.2 團隊實測數(shù)據(jù)
巖漿巖數(shù)據(jù)庫項目組參與團隊包括國內(nèi)有關(guān)高校和研究機構(gòu)的眾多專家和研究團隊。該團隊長期從事巖漿巖方面的研究,有長期的積累和持續(xù)不斷的新研究,產(chǎn)出了很多新的數(shù)據(jù),除部分已發(fā)表數(shù)據(jù)外,存量數(shù)據(jù)及時入庫,成為主要的新數(shù)據(jù)來源。此外,還有一些國外合作團隊,他們的新數(shù)據(jù)也會及時入庫。
2.1.3 實驗室測試數(shù)據(jù)
在送樣人員自愿的前提下,實驗室測試數(shù)據(jù)將動態(tài)自動入庫,實現(xiàn)了將實驗室產(chǎn)生的測試數(shù)據(jù)和樣品背景信息快速、準確地更新到特定數(shù)據(jù)庫的功能,從源頭保證了實驗測試數(shù)據(jù)的完整性和權(quán)威性,避免了后續(xù)研究人員耗費大量時間精力搜集數(shù)據(jù)的工作;同時也提高了實驗測試數(shù)據(jù)的利用率,加快了巖漿巖數(shù)據(jù)庫的更新工作。
2.1.4 有關(guān)零散數(shù)據(jù)(庫)
經(jīng)過調(diào)研,發(fā)現(xiàn)網(wǎng)絡(luò)上存在很多散落在各個領(lǐng)域和角落的數(shù)據(jù)。一類數(shù)據(jù)是存儲于一些數(shù)據(jù)庫中,而這些數(shù)據(jù)庫已經(jīng)長期未更新,也鮮為人知和使用;另一類是一些個人網(wǎng)站上儲存的數(shù)據(jù),這些數(shù)據(jù)長期被人忽視,未能發(fā)揮作用,成為“長尾”數(shù)據(jù)。
本數(shù)據(jù)庫借用DDE Geoscience DataExpo,開展全球數(shù)據(jù)巡航,明確了一些長尾數(shù)據(jù)。這些數(shù)據(jù)經(jīng)過整理入庫,并注明了數(shù)據(jù)來源,以便更多人引用與標注。
此外,大洋鉆探國際組織向DDE提供了IODP的原始文本等資料。本次花費大量人力,閱讀報告等文獻和鉆探測試數(shù)據(jù)材料,摘錄出巖漿巖方面的數(shù)據(jù),并通過重新標定位置,給每個航次和鉆孔賦予了經(jīng)緯度信息。目前,從這些材料中,補充完善了航次、鉆探中的1000條數(shù)據(jù)。
2.1.5 志愿者貢獻數(shù)據(jù)
本數(shù)據(jù)庫設(shè)置有志愿者貢獻數(shù)據(jù)的途徑。有2種途徑貢獻數(shù)據(jù):一是,志愿者在設(shè)置的數(shù)據(jù)“收發(fā)室”,錄入數(shù)據(jù)。數(shù)據(jù)管理人員進行核驗后,合格數(shù)據(jù)錄入相應(yīng)的數(shù)據(jù)庫。數(shù)據(jù)庫收發(fā)室將自動標注數(shù)據(jù)來源和貢獻者信息,記錄貢獻的數(shù)據(jù)量,并給予積分,數(shù)據(jù)庫將給予不同類型的獎勵(包括物質(zhì)獎勵);二是,使用者將自己的數(shù)據(jù),入庫到研究平臺,形成個性化專題庫;同時調(diào)用數(shù)據(jù)庫有關(guān)數(shù)據(jù),在平臺上分析處理。其結(jié)果包括從數(shù)據(jù)庫調(diào)用的數(shù)據(jù)都可以申請下載;同時,在使用者授權(quán)公開、共享這些數(shù)據(jù)時,數(shù)據(jù)將進入總庫,以此實現(xiàn)數(shù)據(jù)庫數(shù)據(jù)量滾雪球式的增長。用戶越多,數(shù)據(jù)越多。
目前,初步構(gòu)建的DDE-巖漿巖數(shù)據(jù)庫數(shù)據(jù)類型主要包括:(1)巖漿巖巖石(樣品)基本屬性,包括類型、產(chǎn)狀、構(gòu)造、空間信息(經(jīng)緯度、地理位置)、地質(zhì)背景等;(2)測試數(shù)據(jù),例如鋯石U-Pb年代學(xué)、元素地球化學(xué)、全巖Rb-Sr-Sm-Nd-Pb-Hf-Li同位素、非傳統(tǒng)同位素、礦物Hf-O-U-Th-He、低溫?zé)崮甏鷮W(xué)等。數(shù)據(jù)量約30萬多條,涉及全球重要造山帶、克拉通以及部分海洋(大洋鉆探樣品巖漿巖數(shù)據(jù))等。今后,還將不斷補充完善數(shù)據(jù)類型和數(shù)據(jù)量。
此外,為了發(fā)揮各地區(qū)、各領(lǐng)域?qū)<业淖饔煤蛢?yōu)勢,依據(jù)已有的工作基礎(chǔ),已設(shè)立了22個專題數(shù)據(jù)庫。包括兩大類:一類是地域性的,如阿巴拉契亞、阿拉伯地盾、中亞(北疆)、特提斯(青藏高原)、華北克拉通、華南等;另一類是學(xué)科領(lǐng)域性,如非傳統(tǒng)同位素、火山巖(中國)、蛇綠巖、堿性巖、巖漿巖鋯石微量、巖漿捕獲鋯石、實驗?zāi)M、巖漿巖低溫?zé)崮甏鷮W(xué)、大洋(鉆探)巖漿巖、實驗測試、鋯石微量元素、同位素、巖漿有關(guān)關(guān)鍵金屬礦產(chǎn)。
本數(shù)據(jù)庫建設(shè)基于巖漿巖知識體系,以樣品為核心,應(yīng)用“數(shù)-圖-文”三位一體的科研理念,采用“云+端”的模式進行構(gòu)建。
(1)建立巖漿巖知識體系。知識體系可以理解為有上下邏輯(歸屬)關(guān)系的巖漿巖地質(zhì)科學(xué)大詞典。建立的巖漿巖知識體系由2600多個節(jié)點(巖漿巖詞匯)構(gòu)成,涵蓋了絕大多數(shù)巖漿巖術(shù)語,特別是巖石類型的術(shù)語。巖石類型的分類采用了國際地球科學(xué)聯(lián)合會推薦的分類系統(tǒng),并參考了最新的教科書,補充了新的術(shù)語。
(2)基于知識體系及其巖石分類,以樣品為核心,設(shè)計數(shù)據(jù)庫結(jié)構(gòu)。巖漿巖大量的數(shù)據(jù)基本都是巖石學(xué)(樣品)描述和樣品的測試數(shù)據(jù)。因此,數(shù)據(jù)庫建設(shè)以樣品為核心,便于以此為依據(jù)查詢數(shù)據(jù),應(yīng)用數(shù)據(jù)。
(3)構(gòu)建數(shù)字化編圖平臺和科學(xué)研究平臺。DDE-巖漿巖數(shù)據(jù)庫的建設(shè)目標,除為使用者提供數(shù)據(jù)服務(wù)外,最重要的目的是進行科學(xué)研究。因此,本數(shù)據(jù)庫構(gòu)建了研究平臺,并突出巖漿巖時空演化的研究特點,構(gòu)建了數(shù)字化編圖平臺,形成“數(shù)-圖-文”三位一體的數(shù)據(jù)庫與研究平臺,即增加基于數(shù)據(jù)的數(shù)字化編圖和數(shù)據(jù)分析研究的平臺。這是本數(shù)據(jù)庫的特點,也是有別于目前的GEOROC、EarthChem等數(shù)據(jù)庫之處。
圖1 巖漿巖數(shù)據(jù)庫主頁頁面(https://petrology.deep-time.org/)Fig.1 Web of the DDE-OnePetrology database(https://petrology.deep-time.org/)
數(shù)據(jù)庫網(wǎng)站(https://petrology.deep-time.org/)也充分體現(xiàn)了“數(shù)-圖-文”三位一體的特色和設(shè)計思路(圖1)。除數(shù)據(jù)庫一般的基本要素外(如介紹、數(shù)據(jù)、圖件和出版物等欄目),在主頁左側(cè)欄,展示主要數(shù)據(jù)類型,包括主庫及22個專題數(shù)據(jù)庫。在右側(cè)欄,提供各類巖漿巖圖件,包括數(shù)字化的亞洲巖漿巖圖、全球巖漿巖圖等一系列圖件。在下方,提供各類軟件,包括桌面研究平臺系統(tǒng)。中間展示的是數(shù)據(jù)點及基于時代的巖漿巖分布圖。此外,還提供二次開發(fā)接口,面向國內(nèi)外涉及巖漿巖的數(shù)據(jù)庫,實現(xiàn)和各類已有數(shù)據(jù)庫的相互調(diào)用,進行跨庫檢索和數(shù)據(jù)共享,實現(xiàn)巖漿巖數(shù)據(jù)的增長、融合與應(yīng)用。
數(shù)據(jù)庫利用“云+端”的混合云模式搭建,充分利用“開源軟件+自研”構(gòu)建了具有自主知識產(chǎn)權(quán)的巖漿巖數(shù)據(jù)庫系統(tǒng)(DDE-OnePetrology)。以樣品為核心,設(shè)置了172多個字段,給出其關(guān)聯(lián)屬性(圖2)。本數(shù)據(jù)庫結(jié)構(gòu)構(gòu)建創(chuàng)新之處是,采用“Arangodb+PostGIS+DSpace”技術(shù)構(gòu)建,科研人員可依據(jù)需求,自行設(shè)計數(shù)據(jù)結(jié)構(gòu),即增加欄目,不影響已有結(jié)構(gòu)與數(shù)據(jù),從而降低學(xué)科專家建庫的門檻。利用桌面端軟件,學(xué)科專家可以通過自主編輯知識樹來自行建庫,并自動具備以知識樹為核心的數(shù)據(jù)與知識一體化管理、模板生成、入庫查重、投圖與編圖研究等功能,而不用自己編制代碼,可以極大地提高學(xué)科專家建庫的效率,只需要關(guān)注本學(xué)科研究即可。
本數(shù)據(jù)庫構(gòu)建采用“Arangodb+PostGIS+DSpace”技術(shù),存儲全部過程中的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);采用FastAPI開發(fā)服務(wù)端API,通過Nginx搭建服務(wù)集群提供云端訪問服務(wù);通過JS、PyQT等技術(shù)構(gòu)建Web端和桌面端科研工作平臺。其中,利用DSpace技術(shù)構(gòu)建的機構(gòu)知識庫子系統(tǒng)用來存儲和管理科技文獻和科研成果;Arangodb用來存儲非結(jié)構(gòu)化數(shù)據(jù),通過知識樹編輯提供一站式建庫功能,實現(xiàn)知識與數(shù)據(jù)的一體化存儲與訪問;PostGIS用來存儲提取的空間數(shù)據(jù)。三者有機結(jié)合,實現(xiàn)每一條數(shù)據(jù)的可查詢、可追溯和可視化功能。此外,發(fā)揮云平臺高可擴展性、高可用性和資源分發(fā)等特點,消除人員、硬件、軟件的重復(fù)配置,增加傳統(tǒng)數(shù)據(jù)庫的存儲能力,借鑒實時GIS時空數(shù)據(jù)模型,實現(xiàn)對巖漿巖時空大數(shù)據(jù)模型的動態(tài)管理。
數(shù)據(jù)庫技術(shù)架構(gòu)主要包括四部分(1云+3端):(1)后臺服務(wù)(云端):知識體系、數(shù)據(jù)與知識一體化管理、WebGIS服務(wù)等。通過微服務(wù)實現(xiàn)服務(wù)聚合與管理,為巖漿巖數(shù)據(jù)庫提供圖件發(fā)布、數(shù)據(jù)查詢、專業(yè)投圖等功能的后臺服務(wù)。(2)網(wǎng)站(Web端):對外宣傳展示門戶網(wǎng)站,網(wǎng)址為https://petrology.deep-time.org. 用來提供數(shù)據(jù)訪問和科研工具軟件(數(shù)據(jù)投圖、分析等)Web訪問入口。(3)科研工作平臺(桌面端):C/S端桌面程序,可用于數(shù)據(jù)處理、高性能計算和科學(xué)研究。首次操作,可通過主頁進行下載,后續(xù)可在程序內(nèi)自動更新。基于本地的特點,其內(nèi)容比Web端功能更加豐富。(4)移動端App(移動端):基于位置服務(wù)的“庫-圖-文”三位一體化推送,便于野外開展研究。目前正在DDE統(tǒng)一規(guī)劃下建設(shè)中。
在巖漿巖數(shù)據(jù)庫的基礎(chǔ)上,利用大數(shù)據(jù)技術(shù),依據(jù)研究目的,提取關(guān)鍵屬性;依據(jù)相關(guān)制(編)圖規(guī)范,編制基于屬性驅(qū)動的數(shù)字化圖件,開展屬性分類的數(shù)字化編圖與綜合研究。該平臺目前有2個功能。
圖2 DDE巖漿巖數(shù)據(jù)庫總體架構(gòu)Fig.2 Structure of the DDE-OnePetrology database
3.3.1 服務(wù)功能
提供了不同比例尺造山帶、全球及地區(qū)的系列巖漿巖圖(圖1)。這些圖件包括全球巖漿巖圖、亞洲巖漿巖圖、中國侵入巖圖、亞洲中生代巖漿巖圖、中亞造山帶巖漿巖圖、青藏高原巖漿巖圖等重要造山帶的巖漿巖圖(見數(shù)據(jù)庫網(wǎng)站)。與深部物質(zhì)探測及動力學(xué)研究相結(jié)合,還初步提供了重要造山帶Nd、Hf等多元同位素圖,可揭示深部物質(zhì)和地殼生長。與大陸聚合研究結(jié)合還編制提供了深時巖漿巖圖,即恢復(fù)到古構(gòu)造、古地理的巖漿巖圖,如三疊紀、侏羅紀、白堊紀亞洲深時巖漿巖圖3個案例。
特別是提供了數(shù)字化的亞洲巖漿巖圖,方便使用者選取工作區(qū)后,自動獲取該區(qū)域的數(shù)字化巖漿巖圖,并以此為基礎(chǔ),根據(jù)自己的研究進行二次編輯修改。同時,本數(shù)據(jù)庫將提供與該區(qū)圖件相對應(yīng)的已有數(shù)據(jù)資源,使用者可以依據(jù)數(shù)據(jù)編制新的巖漿巖圖,并對數(shù)據(jù)進行分析。鼓勵使用者將自己的數(shù)據(jù)和數(shù)據(jù)庫提供的數(shù)據(jù),統(tǒng)一放在平臺上進行分析、作圖等研究,并將自己的數(shù)據(jù)有償提供或貢獻給數(shù)據(jù)庫。數(shù)據(jù)庫將給予一定的獎勵。
3.3.2 編圖功能
該功能是以本庫數(shù)據(jù)為基礎(chǔ)的巖漿巖成圖分析技術(shù),將實現(xiàn)智能化(半自動化-自動化)編圖,即以巖漿巖數(shù)據(jù)、板塊數(shù)據(jù)和巖漿巖演化和巖漿巖知識為基礎(chǔ),充分利用高精度年代學(xué)數(shù)據(jù),采用巖漿巖數(shù)據(jù)綜合處理和制圖表達專業(yè)模型為基礎(chǔ)的編圖、分析技術(shù),通過數(shù)據(jù)、知識模型和推理分析,將實現(xiàn)樣品采樣點年齡數(shù)據(jù)、巖漿巖巖體(圖元)數(shù)據(jù)的自動化、智能化編譯、處理、分析、表達和編圖應(yīng)用。
圖3 中亞和阿巴拉契亞兩大增生造山帶巖漿巖地球化學(xué)特征對比數(shù)據(jù)來源見DDE-巖漿巖數(shù)據(jù)庫;(a、b)分別為中亞造山帶、阿巴拉契亞造山帶巖漿巖TAS圖解;(c、d)分別為中亞造山帶、阿巴拉契亞造山帶A/NK-A/CNK圖Fig.3 Comparison of geochemistry of magmatic rocks from the Central Asia and Appalachian orogenic beltsThe data from the databases in the DDE-OnePetrology; (a, b) TAS diagrams of magmatic rocks in the Central Asian and the Appalachian orogenic belts, respectively; (c, d) A/NK vs. A/CNK diagrams of magmatic rocks in the Central Asian and the Appalachian orogenic belts, respectively
具體已經(jīng)或?qū)崿F(xiàn)以下功能:(1)特定區(qū)域的編圖功能,使用者確定區(qū)域,平臺自動給出該地區(qū)的數(shù)字化巖漿巖圖(包括圖例、比例尺等基本要素)和相應(yīng)的所有關(guān)聯(lián)數(shù)據(jù)信息(如年代學(xué)、地球化學(xué)、同位素地球化學(xué)等)。使用者可以再編輯,形成自己的基礎(chǔ)性研究圖件;(2)巖漿巖圖件的自動更新功能,依據(jù)一定范圍的新數(shù)據(jù),自動-半自動更新巖漿巖圖,如依據(jù)年齡更新巖漿巖的時代(圖元顏色依據(jù)更新的時代自動更替),據(jù)自動生成顏色、花紋等圖示,以及圖名、圖例、比例尺等基本元素;(3)編制深時巖漿巖圖,給出一定的區(qū)域和巖漿巖圖,依據(jù)提供的大陸拼合模式,回溯到原始時代,繪制出深時巖漿巖圖;(4)巖漿巖圖的智能融合,對不同來源、不同比例尺的多類巖漿巖圖經(jīng)智能化分析、拼接、合并、綜合后,形成成新的巖漿巖圖件;(5)巖漿巖專題圖的全息表達,基于巖漿巖空間數(shù)據(jù)庫等,自動地按照巖漿巖的多個屬性或組合進行全維度的信息表達,用顏色、花紋、明暗、結(jié)構(gòu)等表達各類屬性等圖面信息,如巖漿巖(體)為顏色單元的Nd同位素圖。
研究平臺初步集成了GeoPyTool(Yuetal.,2019)的部分投圖功能等,且正在進一步集成和開發(fā)新的投圖功能,可作為專業(yè)研究人員進行大數(shù)據(jù)綜合分析可視化圖解的有效工具。對于數(shù)據(jù)統(tǒng)計分析平臺,可以依據(jù)需求,從數(shù)據(jù)庫提取數(shù)據(jù)或參數(shù),直接分析成圖,給出不同參數(shù)之間的關(guān)系(圖3)。
使用者從數(shù)據(jù)庫選取區(qū)域或數(shù)據(jù)類型后,點擊各種類型的巖漿巖數(shù)據(jù)分析圖解,如巖石分類圖、SiO2-K2O圖、TAS圖解、Pearce圖解、年齡-同位素參數(shù)(如Nd、tDM等)等,即可得到有關(guān)圖解;也可以依據(jù)研究目的,檢索出相關(guān)數(shù)據(jù),選擇相應(yīng)的參數(shù)并成圖。優(yōu)點是,可以對巨量數(shù)據(jù)快速給出各類參數(shù)及其相互關(guān)系圖,對在海量數(shù)據(jù)中尋找可能的數(shù)據(jù)及其參數(shù)的相關(guān)性具有極高的工作效率和準確性,為開展大數(shù)據(jù)研究,尋找可能存在的科學(xué)現(xiàn)象和規(guī)律提供了技術(shù)支撐。而且,大量數(shù)據(jù)可以分組(如按年齡分組、或按地區(qū))投點成圖,尋找可能存在的時空演化規(guī)律。另外,對于數(shù)據(jù)空間分布等值線及分布密度分析與作圖,可以選定一個空間范圍,給出數(shù)據(jù)和參數(shù),如Nd同位素的模式年齡(tDM),也可以給出其等值線圖。
如圖3所示,筆者分析對比了中亞和阿巴拉契亞造山帶。這兩個造山帶通常作為古生代典型的增生造山帶的代表。但是,這兩大增生造山帶有什么異同?特別是在增生造山最終的結(jié)果即物質(zhì)組成及其架構(gòu)方面是否相同或相似?這是人們關(guān)注的問題。顯然,這些重大問題的回答,需要統(tǒng)攬、觀察這兩個整個造山帶,需要大量的數(shù)據(jù)。
圖4 中亞和阿巴拉契亞兩大增生造山帶Nd同位素特征對比(數(shù)據(jù)來源見DDE-巖漿巖數(shù)據(jù)庫)Fig.4 Comparison of Nd isotope geochemistry of magmatic rocks from the Central Asia and the Appalachian orogenic belts(The data from the databases in the DDE-OnePetrology)
圖5 阿巴拉契亞造山帶志留紀-泥盆紀主造山階段巖漿巖地球化學(xué)“順時針”演變軌跡揭示同俯沖增生到后增生的構(gòu)造環(huán)境演變Fig.5 The “clockwise” geochemical evolution trajectory of the magmatic rocks in the main Silurian-Devonian orogeny of in the Appalachian orogen, revealing the tectonic environment evolution from syn-subduction accretion to post-accretion
筆者初步應(yīng)用該數(shù)據(jù)庫數(shù)據(jù)初步分析對比了中亞增生造山帶、阿巴拉契亞造山帶巖漿巖年齡、地球化學(xué)和同位素特征,從數(shù)千個數(shù)據(jù)分析可以看出,中亞造山帶巖漿巖類型多樣,準鋁質(zhì)和過鋁質(zhì)各占1/2;阿巴拉契亞造山帶巖漿巖主體為花崗閃長巖、二長花崗巖和堿長花崗巖,多數(shù)為過鋁質(zhì)。在同位素組成方面,兩大造山帶差異更明顯(圖4):中亞造山帶具有高的εNd(t)值和年輕的二階段模式年齡(tDM2),具有顯著的年輕地殼組成特點;而阿巴拉契亞造山帶相對具有較低的εNd(t)值和較老的模式年齡(tDM2)。這很好地說明盡管這兩大造山帶都作為典型的增生造山帶,但是,中亞造山帶具更多有年輕地殼,顯示了更強的增生造山特點,是最典型的增生造山,可以作為增生造山帶的端元;而阿巴拉契亞造山帶更多顯示有古老陸塊特點,顯示了眾多古老微陸塊的拼貼作用,可以作為一般的增生造山帶。本文通過同位素填圖,定量確定了年輕地殼比例,給出了定量確定和劃分造山帶類型的指標和圖件,還提出了從物質(zhì)角度定量刻畫和分類造山帶,即物質(zhì)造山帶概念(Wangetal., 2023c,詳見下文)。
另外,該數(shù)據(jù)庫還有分組投圖分析功能。例如,針對阿巴拉契亞志留紀-泥盆紀主造山階段的巖漿巖,將地球化學(xué)數(shù)據(jù)按年齡分三個圖,分析顯示,在Peace圖解上顯示了“順時針”演變的趨勢(圖5)。這種統(tǒng)計出來的巖漿成分的演變可以揭示構(gòu)造環(huán)境及其演變(王濤等,2017),即揭示了從同造山(俯沖增生)到后增生碰撞的構(gòu)造環(huán)境。
圖6 紐芬蘭島阿巴拉契亞造山帶阿克利巨型花崗巖基地球化學(xué)填圖及剖面(底圖據(jù)王朝陽等,2022)Fig.6 Chemical mapping and section of the Akeley granitic plutons of the Newfoundland Appalachian orogenic belt (after Wang et al., 2022)
重要的是,本數(shù)據(jù)庫初步具有數(shù)據(jù)的空間分析功能,即用數(shù)據(jù)繪制某些元素或參數(shù)的等值線圖如地球化學(xué)元素填圖。例如,阿巴拉契亞阿克利巨型花崗巖基的SiO2、K/Rb、F、Rb/Sr地球化學(xué)填圖(王朝陽等,2022),顯示巖基從東、西緣向礦化發(fā)生的南緣演化程度越來越高。LILE (Rb)、REE (Y)、HFSEs (Nb、Th、U)和揮發(fā)性元素顯示了自北向南的演化趨勢,例如Rb/Sr比值越大(>20),顯示W(wǎng)-Sn-Mo成礦越好(圖6)。這些為揭示成礦規(guī)律,開展成礦預(yù)測提供了依據(jù)。同理,該方法用于區(qū)域同位素填圖,可以和上述研究實例一樣,揭示區(qū)域深部物質(zhì)組織架構(gòu)及其時空演變。
應(yīng)用巖漿巖數(shù)據(jù)庫及其大量數(shù)據(jù)分析,已經(jīng)在揭示超大陸聚散、循環(huán)和動力學(xué)機制(Evansetal., 2016;Condieetal., 2017;Lietal., 2019;Huangetal., 2022)、板塊俯沖樣式轉(zhuǎn)變(Liuetal., 2019))、地殼生長(Meert, 2005; Dhuimeetal., 2018; Wangetal., 2023b, c)、巖漿巖的分布、命名分類和大地構(gòu)造環(huán)境識別(周永章等,2018;張旗等,2019)等方面取得了重要進展和成果(詳見張穎慧等,2020)。
本文依據(jù)數(shù)據(jù)庫和數(shù)字化編圖,采用“庫-圖-文”三位一體的研究范式,通過巖漿巖時空演化和物源分析,在揭示陸塊聚合、大地構(gòu)造體制時空范圍、地殼生長、深部物質(zhì)架構(gòu)及造山帶物質(zhì)類型等方面也初步取得了一些研究進展。
現(xiàn)有板塊理論很好地解釋了具有規(guī)則邊界的大洋閉合、2個不同板塊的碰撞。但是,同一個板塊下的不規(guī)則的大洋如何關(guān)閉?現(xiàn)代大洋中很多山彎構(gòu)造的命運如何?這些問題還未得到很好的解釋。我們利用新獲得的和收集的2660個巖漿巖鋯石U-Pb年齡,通過數(shù)字化編圖(圖7),在中亞造山系東部鑒別出“緊閉褶皺”的多條巖漿巖帶,并發(fā)現(xiàn)它們向縫合帶方向變年輕,很好地揭示了蒙古-鄂霍茨克洋從早期后撤式俯沖,到晚期剪刀狀閉合,并最終形成蒙古-鄂霍茨克山彎構(gòu)造的整個過程。據(jù)此,提出了該大洋閉合的機制和模型,即西伯利亞克拉通旋轉(zhuǎn)和大洋后撤俯沖聯(lián)合作用,大洋北側(cè)安第斯型大陸邊緣向南后撤旋轉(zhuǎn),南側(cè)東西方向的洋內(nèi)弧向北后撤旋轉(zhuǎn)(Wangetal., 2022b)。Cawood(2022)對此評價到:“其大數(shù)據(jù)分析在破解造山帶和地球發(fā)育歷史方面越來越顯示出重要性”,“這項研究為未來的研究開辟了新的道路”。
圖7 中亞造山系花崗巖等巖漿巖鋯石年齡分布(據(jù)Wang et al., 2022b)插圖中的紅色、綠色點均為鋯石年齡點Fig.7 Distribution of zircon ages of the magmatic rocks (granitoids) of the Central Asian orogenic system (after Wang et al., 2022b)All red and green plots are zircon ages insert map
在上述基礎(chǔ)上,筆者編制了基于ArcGIS的屬性驅(qū)動數(shù)字化亞洲巖漿巖圖,揭示了亞洲重要造山帶巖漿時空演化規(guī)律,根據(jù)巖漿帶的時空遷移,系統(tǒng)厘定了古老大洋的閉合和陸塊拼合過程,以及多種構(gòu)造體系的時空分布范圍和疊合過程,提出了亞洲大陸5個階段的聚合過程(Wangetal., 2023a)。此外,還揭示亞洲大陸的聚集和/或生長是主要通過2種基本方式,一是增生造山,二是碰撞造山。前者以中亞造山系為代表,以含年輕物源花崗巖類為特征,發(fā)育山彎構(gòu)造;后者以中央造山系和青藏高原為代表,以再造物源過鋁質(zhì)花崗巖為特征。前者的年輕地殼生長在亞洲大陸的聚集過程中發(fā)揮了重要作用。
大陸地殼生長是地球科學(xué)最重要的科學(xué)問題之一。國際主流觀點認為,陸殼主要形成于前寒武紀。顯生宙是否有巨量陸殼生長一直存有疑問。依據(jù)全巖Nd同位素和鋯石Hf同位素數(shù)據(jù)庫的建立,本文第一作者在中亞造山帶開展了全造山帶尺度的Nd+Hf同位素聯(lián)合示蹤填圖研究(Wangetal., 2009, 2023b),圈定新生地殼空間范圍,確定中亞為全球最大的、最年輕的顯生宙陸殼省,年輕地殼約占50%以上,量化地殼生長量,首創(chuàng)定量估算地殼生長量方法,確證中亞存在地殼巨量生長,澄清了中亞造山帶是否存在巨量地殼生長的質(zhì)疑(Kr?neretal., 2014, 2017)。通過全球8個典型造山帶的同位素填圖的佐證(詳見下文),科學(xué)地證明了顯生宙板塊體制下仍可以發(fā)生并保存巨量陸殼生長。
圖8 中亞造山系巖漿巖Nd+Hf聯(lián)合同位素填圖揭示中亞造山系深部物質(zhì)組成三維架構(gòu)及四維演變(據(jù)Wang et al., 2023b)Fig.8 Nd+Hf isotope joint mapping of magmatic rocks of the Central Asian Orogenic Belt reveal the three-dimensional lithospheric architecture and its four-dimensional evolution (after Wang et al., 2023b)
這種大陸的新生地殼的形成與保存,顯示了典型增生造山帶的組成特點。我們還進一步通過長英質(zhì)巖石同位素示蹤填圖確定下地殼的物質(zhì)分布架構(gòu),依據(jù)基性巖的同位素示蹤填圖確定了上地幔的物質(zhì)架構(gòu),進而刻畫了巖石圈三維物質(zhì)架構(gòu)(3D),并分時間切片,確定同造山期的物質(zhì)架構(gòu)與后造山的物質(zhì)架構(gòu),從而進一步厘定了巖石圈物質(zhì)架構(gòu)的演變(4D;圖8)。在此基礎(chǔ)上,本文第一作者依據(jù)大量礦產(chǎn)數(shù)據(jù)的分析,確定了每個同位素省(地殼省)的各類礦產(chǎn)的分布數(shù)量的密度,定量確定了各類礦產(chǎn)在不同的地殼類型分布的特征和量,并提出受控于年輕地殼、再造地殼和混合過渡地殼3種深部物質(zhì)制約的成礦類型(圖9;Wangetal., 2023b)。
此外,地球深部物質(zhì)探測一直是深部探測的軟肋,主要是缺乏有效的技術(shù)方法。筆者等應(yīng)用巖石“探針”和同位素示蹤填圖,研究深部物質(zhì)架構(gòu)(侯增謙和王濤,2018;王濤和侯增謙,2018;王濤等,2022;Wangetal., 2023b)。即依據(jù)大量數(shù)據(jù)如同位素示蹤數(shù)據(jù),采用“巖石探針+同位素填圖”為關(guān)鍵核心的技術(shù),可以示蹤巖石圈深部物質(zhì)架構(gòu),即不同屬性物質(zhì)的時空分布。這為深部物質(zhì)探測提供了新思路和方法,成為深部物質(zhì)探測發(fā)展新方向。
造山帶是認識地球形成演化的關(guān)鍵,是地殼生長的重要場所。長期以來,對造山帶主要從結(jié)構(gòu)構(gòu)造和幾何學(xué)、運動學(xué)等角度進行分類研究(如增生、碰撞端元類型),但常有爭議。在上述同位素填圖基礎(chǔ)上,我們從造山帶“物質(zhì)演化”的角度,開展全球造山帶對比研究(如IGCP662等項目),從地殼生長量刻畫造山帶物質(zhì)演變的新視角,通過全球8個造山帶同位素填圖與研究(圖10、圖11),獲得以下認識:(1)提出“物質(zhì)造山帶”新概念,發(fā)現(xiàn)不同造山帶具有不同的新生物質(zhì)占比(從>70%到<10%),創(chuàng)新性地提出了造山帶物質(zhì)分類:年輕地殼比例>30%的造山帶對應(yīng)增生造山帶,<30%的對應(yīng)碰撞造山帶,進而定量刻畫了造山帶從增生到碰撞物質(zhì)演化。(2)依據(jù)地殼生長量變化,追索不同類型造山帶在威爾遜旋回中的演化軌跡。該研究開辟了從深部物質(zhì)角度研究造山帶新途徑,特別是建立了刻畫造山帶物質(zhì)演化的定量化指標,推動了造山帶研究向定量化發(fā)展,為開展地殼深部物質(zhì)探測提供了新思路和研究實例(Wangetal., 2023c)。
圖9 中亞造山系巖漿巖Nd+Hf聯(lián)合同位素填圖揭示深部物質(zhì)組織架構(gòu)及其成礦制約(據(jù)Wang et al., 2023b)Fig.9 Nd+Hf isotope joint mapping of magmatic rocks of the Central Asian Orogenic Belt reveal the lithospheric architecture and its controls on mineralization(after Wang et al., 2023b)
圖10 全球典型的8個造山帶的Nd同位素數(shù)據(jù)(εNd(t))等值線圖顯示其空間變化、同位素省及年輕地殼的分布范圍與面積(據(jù)Wang et al., 2023c)(a)阿爾泰構(gòu)造拼合體(中亞造山帶);(b)北美科迪勒拉;(c)紐芬蘭-阿巴拉契亞;(d)拉克蘭;(e)特提斯西藏;(f)加里東;(g)海西;(h)秦嶺-大別. 數(shù)字地形圖來自https://services.arcgisonline.comFig.10 εNd(t) contour maps of the typical eight orogens in the world, showing spatial variations of εNd(t) values, distribution of Nd isotopic provinces and the distribution and areas of juvenile crustal domains (after Wang et al., 2023c)(a) Central Asian Orogenic Belt; (b) North American Cordillera; (c) Newfoundland Appalachians; (d) Lachlan; (e) Tethyan Tibet; (f) Caledonides; (g) Variscides; (h) Qinling-Dabie orogens. The digit topographic map comes from https://services.arcgisonline.com
圖11 造山帶物質(zhì)組成架構(gòu)定量分類及其特征圖紅色符號是依據(jù)通過大量Nd同位素數(shù)據(jù)的填圖(定量確定的新生地殼量和比例)確定的全球8個典型造山帶; 扇區(qū)代表了從高度原始(100%新生或年輕地殼)到高度演化的連續(xù)過渡(新生地殼~0%)成分; 對數(shù)坐標的同心圓表示造山帶的年齡范圍即造山帶的形成時間Fig.11 Classification and characteristics of orogens in terms of their compositional architecture (areal percent of juvenile compositions) and ages of orogensThe red symbols show the eight typical orogenic belts of the world identified by mapping (quantitatively determined amount and proportion of new crust) of a large number of Nd isotope data. Sectors represent a continuous transition from highly primitive (juvenile crust 100%) to highly evolved (juvenile crust ~0%) compositions. Concentric semi-circles with logarithmic coordinates denote the age range of the orogens
綜上所述,與目前國際最好的、應(yīng)用最廣的數(shù)據(jù)庫如GEOROC、EarthChem數(shù)據(jù)庫相比,本數(shù)據(jù)庫具有以下優(yōu)勢:(1)設(shè)計理念突出了“數(shù)-圖-文”三位一體,并以巖漿巖知識體系為基礎(chǔ),既有一般的數(shù)據(jù)庫服務(wù)功能,還擁有編圖和研究平臺,更有利于開展數(shù)據(jù)驅(qū)動的科學(xué)研究,更好地體現(xiàn)了DDE“共享全球地學(xué)知識,創(chuàng)新地學(xué)研究范式”的目標和愿景;(2)組織了建庫、編圖和研究一體化團隊,開展了22個專題數(shù)據(jù)建設(shè),使更多的一線專家參與數(shù)據(jù)庫建設(shè),數(shù)據(jù)類型更加多樣化和專業(yè)化,彌補了現(xiàn)有數(shù)據(jù)庫的不足;在某些地域和領(lǐng)域(如中亞、非傳統(tǒng)同位素等)形成優(yōu)勢,更好地突顯了專業(yè)研究的數(shù)據(jù)庫特點;(3)核心數(shù)據(jù)如同位素數(shù)據(jù)更加齊全、專業(yè)和可用,即對數(shù)據(jù)都盡可能補充了年齡、經(jīng)緯度等時空信息(開發(fā)了相應(yīng)的技術(shù)軟件和方法,從圖上獲取、補充經(jīng)緯度數(shù)據(jù)),特別是給出了計算參數(shù)(如εNd(t)值、tDM2等),使用者可以直接在數(shù)據(jù)庫中分析成圖(而EarthChem等數(shù)據(jù)庫中的50%以上的Nd同位素沒有這些參數(shù)和年齡,難以直接使用),從而更有利于開展巖漿巖及其揭示的地球深部物質(zhì)的時空演化;(4)創(chuàng)建了學(xué)科專家可以依據(jù)新的發(fā)展和需求及時調(diào)整數(shù)據(jù)庫結(jié)構(gòu)的技術(shù)與功能,不必從頭再來,而且,科研人員可以自行設(shè)計完善,無需編碼;(5)有強大的DDE平臺支持支撐,包括數(shù)據(jù)獲取技術(shù)等支撐及多種學(xué)科一體化的融合發(fā)展,構(gòu)成了DDE的“超級航空母艦”,可與國際已有數(shù)據(jù)庫互聯(lián)互通,形成聯(lián)盟,并有望發(fā)展為以DDE為核心的數(shù)據(jù)聯(lián)盟。
因此,雖然目前巖漿巖數(shù)據(jù)庫的構(gòu)建僅是初步的,數(shù)據(jù)量與國際最好的數(shù)據(jù)庫還有差距。但是,由于具有上述優(yōu)勢,本數(shù)據(jù)庫將有望建成國內(nèi)外最新、最強、最全的巖漿巖數(shù)據(jù)庫,并打造國際化、有特色的、高水平的巖漿巖研究平臺,吸引國際更多同行借助平臺開展科學(xué)研究,共享全球巖漿巖演化數(shù)據(jù),推動巖漿巖等地球科學(xué)研究變革。為此,下一步將加強以下方面的工作。
(1)實現(xiàn)數(shù)據(jù)爆發(fā)式、持續(xù)增長。需要及時入庫最新出版的國內(nèi)外已發(fā)表的數(shù)據(jù);同時,突出專題數(shù)據(jù)庫建設(shè),特別是一些備受關(guān)注的重要造山帶、重大巖漿巖省等地域性專題數(shù)據(jù)庫和學(xué)科性的專題數(shù)據(jù)庫,如傳統(tǒng)同位素、非傳統(tǒng)同位素、巖漿礦物數(shù)據(jù)庫等。增加、完善數(shù)據(jù)的使用功能,吸引更多團隊和科學(xué)家使用和貢獻數(shù)據(jù)。另外,很多地質(zhì)調(diào)查報告擁有眾多新的測試數(shù)據(jù)。本數(shù)據(jù)庫將努力挖掘這些長期被遺忘的“長尾數(shù)據(jù)”,使得本數(shù)據(jù)庫在數(shù)據(jù)覆蓋范圍和領(lǐng)域方面具有優(yōu)勢。
(2)進一步研發(fā)智能編圖系統(tǒng),開展多屬性系列數(shù)據(jù)編圖,特別是編制深時巖漿巖圖。首次編著以新的數(shù)據(jù)庫為基礎(chǔ)的數(shù)字化全球巖漿巖圖,進一步完善數(shù)字化亞洲巖漿巖圖,編制不同比例尺配套的系列洲際到區(qū)域的巖漿巖圖,為使用者提供更多的圖件服務(wù),為科學(xué)研究提供基礎(chǔ)圖件。
(3)加強數(shù)據(jù)庫平臺建設(shè)。在DDE支撐下,開發(fā)有關(guān)軟件技術(shù),實現(xiàn)從野外研究、樣品采集、數(shù)字化編圖、成果推送到數(shù)據(jù)分析成圖、科學(xué)推理分析一體化的科研活動都能在平臺上實現(xiàn),打造國際一流的巖漿巖研究平臺。在此基礎(chǔ)上,加強與其他已有數(shù)據(jù)庫的交流和學(xué)習(xí),完善數(shù)據(jù)標準和接口;力爭2~3年內(nèi),與GEOROC、EarthChem等數(shù)據(jù)庫實現(xiàn)互聯(lián)互通,構(gòu)建巖漿巖數(shù)據(jù)庫聯(lián)盟。
(4)在“庫-圖-文”三位一體方面產(chǎn)出高水平研究成果。包括應(yīng)用大數(shù)據(jù)、智能化編圖等技術(shù),進一步揭示全球巖漿巖時空演化規(guī)律,揭示中國巖漿成礦時空演化規(guī)律及其成礦制約,探索提出新的地殼生長模式,構(gòu)建完善地球深部物質(zhì)探測技術(shù)方法體系,開展地球深部物質(zhì)組成架構(gòu)與演變的研究,為探索研究深時數(shù)字地球做出貢獻。
此外,本數(shù)據(jù)庫特別是研究平臺將及時應(yīng)用機器學(xué)習(xí)、人工智能等最新發(fā)展的技術(shù)接入本數(shù)據(jù)庫的數(shù)字化編圖平臺和科學(xué)研究平臺,特別是DDE推出和發(fā)布的GeoGPT的接入。
以巖漿巖知識體系為基礎(chǔ),初步構(gòu)建了巖漿巖數(shù)據(jù)庫。其結(jié)構(gòu)包括:(1)后臺服務(wù)(云端);(2)網(wǎng)站(Web端);(3)科研工作平臺(桌面端);(4)移動端(App)。數(shù)據(jù)來源包括:公開發(fā)表的文獻、研究團隊測試數(shù)據(jù)、實驗室測試數(shù)據(jù)、有關(guān)數(shù)據(jù)庫的互聯(lián)互通及志愿者貢獻數(shù)據(jù)。
數(shù)據(jù)類型主要包括巖漿巖樣品的基本屬性(空間信息、構(gòu)造信息、數(shù)據(jù)來源信息等)、年代學(xué)、地球化學(xué)、全巖Rb-Sr-Sm-Nd-Pb-Hf-Li同位素,礦物Hf-O-U-Th-He等同位素數(shù)據(jù)。數(shù)據(jù)量約40萬多條,涉及全球重要造山帶、克拉通及部分海洋數(shù)據(jù)等。此外,為了發(fā)揮各地區(qū)、各領(lǐng)域?qū)<业淖饔煤蛢?yōu)勢,依據(jù)已有的工作基礎(chǔ),設(shè)立了22個專題數(shù)據(jù)庫。包括兩大類:一類是地域性的,如阿巴拉契亞、阿拉伯地盾、中亞(北疆)、特提斯(青藏高原)、華北克拉通、華南等;另一類是學(xué)科領(lǐng)域性,如非傳統(tǒng)同位素、鋯石微量、實驗?zāi)M等。此外,還包括實驗室測試數(shù)據(jù)專題數(shù)據(jù)庫。
與國際最常用的有關(guān)數(shù)據(jù)庫相比,本數(shù)據(jù)庫具有下優(yōu)勢:(1)“數(shù)-圖-文”三位一體的設(shè)計思路,擁有編圖和研究平臺,更有利于支撐科學(xué)研究,計劃實現(xiàn)絕大多數(shù)巖漿巖研究工作均可在本平臺上完成;(2)組織構(gòu)建了22個專題數(shù)據(jù)建設(shè),更多一線專家參與建設(shè),突出了某些地域(如中亞等)和領(lǐng)域(如非傳統(tǒng)同位素等)的專業(yè)優(yōu)勢;(3)數(shù)據(jù)都盡可能挖掘、補充了年代學(xué)、經(jīng)緯度等時空信息,更有利于開展巖漿巖時空變化特征及其深時數(shù)字深部地球的時空演化研究;(4)創(chuàng)建了學(xué)術(shù)專家可以依據(jù)新的發(fā)展和需求及時調(diào)整數(shù)據(jù)庫結(jié)構(gòu)的技術(shù)與功能;(5)有強大的DDE平臺支持,為與國際有關(guān)數(shù)據(jù)庫互聯(lián)互通提供了有利條件。
依據(jù)有關(guān)(年代學(xué)、同位素等)核心數(shù)據(jù),在探索復(fù)雜大陸拼合過程、地殼生長、地球深部物質(zhì)組成架構(gòu)與演化等重大地球科學(xué)問題方面取得研究進展。
致謝本項工作得到DDE及有關(guān)負責(zé)人王成善、侯增謙、成秋明、沈樹忠、周成虎、翟明國、陳駿、楊樹鋒、李獻華院士的大力支持和幫助。感謝王新兵、閭海榮等DDE信息化團隊在數(shù)據(jù)抓取、整理方面的幫助。感謝兩位審稿人提出的修改建議。