劉小久,何遠(yuǎn)德
( 西南民族大學(xué)計(jì)算中心,四川 成都 610041)
隨著信息技術(shù)的不斷進(jìn)步,計(jì)算材料學(xué)經(jīng)過(guò)幾十年的發(fā)展,已經(jīng)從最初的對(duì)已知材料電子結(jié)構(gòu)和基本特性的近似計(jì)算發(fā)展到能對(duì)材料新結(jié)構(gòu)、組成進(jìn)行準(zhǔn)確預(yù)測(cè),并發(fā)現(xiàn)材料未知的構(gòu)效關(guān)系等.近年來(lái)我國(guó)對(duì)材料基因組計(jì)劃[1]也有了自己的規(guī)劃,將材料計(jì)算列為與制備和表征同等重要的地位.該計(jì)劃已經(jīng)從以前的對(duì)已有材料的物性解釋與實(shí)驗(yàn)對(duì)照,發(fā)展到指導(dǎo)實(shí)驗(yàn)研究與材料合成方向的作用.要達(dá)到這樣的目的,材料的高通量計(jì)算將是最關(guān)鍵的手段.材料性能的高通量計(jì)算[2],已經(jīng)在新材料的發(fā)現(xiàn)中展示了巨大的作用.同時(shí),我們看到在高通量計(jì)算的基礎(chǔ)上,利用大數(shù)據(jù)相關(guān)技術(shù)[3],特別是機(jī)器學(xué)習(xí)[4-6]的方法、理論,為材料性能快速預(yù)測(cè)提供了新的途徑和方法.材料數(shù)據(jù)科學(xué)[7]以及其相關(guān)的材料信息學(xué)[8-9]正在發(fā)展成為一門(mén)新的學(xué)科,助力材料相關(guān)研究,為新材料的研發(fā)提供全新、快捷、高效的手段.
材料的高通量計(jì)算是材料信息學(xué)的重要手段和基礎(chǔ),它包含三個(gè)要素[10]:材料物性的可算性、數(shù)據(jù)輸入和輸出的自動(dòng)化以及計(jì)算任務(wù)的并行化.所謂物性的可算性,即要求材料的相關(guān)性質(zhì)能夠通過(guò)計(jì)算可靠地獲得,它可以是能夠直接計(jì)算的物理性質(zhì)或者可以通過(guò)計(jì)算的物理量直接決定的特性.前者如材料的基態(tài)特性:晶體晶格常數(shù)、彈性常數(shù)以及磁化強(qiáng)度等等[11],這些物理量可以方便地通過(guò)基于電子密度泛函的理論計(jì)算獲得;后者如拓?fù)浣^緣體的判斷,可以通過(guò)材料在相對(duì)論情況下和非相對(duì)論情況下的能帶比較得到[12].自動(dòng)化和并行化,是為了解決大量的計(jì)算任務(wù)提出的,只有實(shí)現(xiàn)了這兩點(diǎn),才能在有限的時(shí)間內(nèi)對(duì)材料進(jìn)行快速計(jì)算和篩選.比如,受電聲耦合機(jī)制所決定的材料的電阻率,原則上可以通過(guò)計(jì)算的方式進(jìn)行估計(jì)[13],但在目前階段,該計(jì)算仍然需要大量的計(jì)算資源,因而無(wú)法快速地進(jìn)行海量材料的計(jì)算.鑒于以上三點(diǎn),目前通過(guò)高通量計(jì)算建立的數(shù)據(jù)庫(kù),主要包括合金的力學(xué)性能、化學(xué)特性[14]、Heusler化合物的輸運(yùn)特性[15-16],材料光催化等方面[17].除了進(jìn)行第一性原理計(jì)算外,某些數(shù)據(jù)庫(kù)也提供了多尺度的材料仿真和設(shè)計(jì),實(shí)現(xiàn)了從材料微觀到宏觀性能的自動(dòng)計(jì)算預(yù)測(cè)[18-19].
在實(shí)現(xiàn)高通量計(jì)算過(guò)程中,有必要對(duì)材料的元數(shù)據(jù)進(jìn)行規(guī)范化,以便不同代碼間實(shí)現(xiàn)數(shù)據(jù)的共享,實(shí)現(xiàn)計(jì)算代碼的異質(zhì)集成,以及材料的跨尺度計(jì)算.歐洲的NOMAD在材料電子結(jié)構(gòu)的元數(shù)據(jù)標(biāo)準(zhǔn)化方面提供了一個(gè)參考[20].美國(guó)的Materials Commons[21]提供了結(jié)構(gòu)材料數(shù)據(jù)的共享規(guī)范,美國(guó)國(guó)家標(biāo)準(zhǔn)局也在材料基因工程的框架下構(gòu)建了材料信息學(xué)平臺(tái)及相關(guān)規(guī)范(MDCS)[22].我國(guó)以北京科技大學(xué)為牽頭單位也建設(shè)了材料數(shù)據(jù)庫(kù)及公共服務(wù)平臺(tái)[23].
為實(shí)現(xiàn)材料的高通量計(jì)算以及不同尺度的材料計(jì)算設(shè)計(jì)集成,需要開(kāi)發(fā)相應(yīng)的計(jì)算平臺(tái),以實(shí)現(xiàn)對(duì)數(shù)據(jù)及計(jì)算過(guò)程的自動(dòng)高效管理.MIT的Ceder小組建議了一種支持高通量計(jì)算的計(jì)算基礎(chǔ)平臺(tái)以及元數(shù)據(jù)設(shè)計(jì),并在Materials Projects平臺(tái)中給出了應(yīng)用的示范[24].類似的平臺(tái)如美國(guó)的AFLOW[25-26],Granda MI等系統(tǒng).中國(guó)科學(xué)院信息中心開(kāi)發(fā)了材料計(jì)算平臺(tái)Matcloud[27],主要用于二元合金的高通量計(jì)算.Material explore公司在其材料集成計(jì)算軟件MedeA中也開(kāi)發(fā)了相應(yīng)的高通量計(jì)算模塊MedeA-HT[28].以上計(jì)算平臺(tái)的第一性原理計(jì)算引擎均是商業(yè)化代碼VASP[29].王果等人對(duì)材料數(shù)據(jù)高性能計(jì)算數(shù)據(jù)庫(kù)分配策略[30]做了相應(yīng)研究,該研究著手于優(yōu)化高通量計(jì)算過(guò)程中的數(shù)據(jù)庫(kù)分配方案.PWscf作為一款開(kāi)源的基于密度泛函理論的材料電子結(jié)構(gòu)計(jì)算軟件,由于其功能全面、高效可靠的特點(diǎn),得到了廣泛的應(yīng)用,然而,基于其開(kāi)發(fā)的集成計(jì)算環(huán)境以及高通量計(jì)算接口卻很少,目前僅僅在AFLOW中實(shí)現(xiàn)了其集成化.由于開(kāi)源代碼的靈活性以及商業(yè)上的廉價(jià),利用開(kāi)源代碼的計(jì)算平臺(tái)將具有更大的市場(chǎng)優(yōu)勢(shì)及開(kāi)發(fā)價(jià)值.
因而,我們基于PWscf作為計(jì)算引擎,開(kāi)發(fā)了實(shí)現(xiàn)高通量計(jì)算的自動(dòng)計(jì)算平臺(tái).在該平臺(tái)中,實(shí)現(xiàn)了計(jì)算輸入的準(zhǔn)備、計(jì)算任務(wù)的調(diào)度管理以及數(shù)據(jù)信息的提取與分析等功能.并以二維半導(dǎo)體材料作為應(yīng)用示范,通過(guò)自動(dòng)計(jì)算,獲得優(yōu)化后的原子位置、生成的材料電子能帶、態(tài)密度,自動(dòng)計(jì)算導(dǎo)帶低和價(jià)帶頂?shù)碾娮雍涂昭ㄔ诓煌较虻挠行з|(zhì)量.同時(shí),我們對(duì)材料的相關(guān)性能進(jìn)行了統(tǒng)計(jì)分析,為材料構(gòu)效關(guān)系的建立奠定了基礎(chǔ).
本系統(tǒng)為高通量的二維材料原子位置優(yōu)化、電子性能計(jì)算數(shù)據(jù)管理系統(tǒng).具有可視化交互式材料原子位置錄入、晶體結(jié)構(gòu)顯示、電子結(jié)構(gòu)顯示以及材料關(guān)鍵輸運(yùn)參數(shù).如帶隙大小及類型,電子和空穴有效質(zhì)量自動(dòng)地計(jì)算功能.針對(duì)高通量的材料計(jì)算及新材料初始結(jié)構(gòu)產(chǎn)生,我們采用原子的組合替換方法.系統(tǒng)能夠?qū)崿F(xiàn)計(jì)算任務(wù)的自動(dòng)生成和管理,計(jì)算過(guò)程的監(jiān)控以及計(jì)算結(jié)果的提取、分析和收集入庫(kù)的功能.
在總體設(shè)計(jì)上以數(shù)據(jù)庫(kù)為核心,包括如下三大功能部分:材料基本信息數(shù)據(jù)庫(kù),計(jì)算節(jié)點(diǎn)控制作業(yè)調(diào)度管理,以及輸入輸出信息解析.其主要的構(gòu)件及信息/數(shù)據(jù)流如下圖1所示,圖中箭頭的方向表明數(shù)據(jù)的流向,橫線定義了平臺(tái)界面、軟件和硬件.在該設(shè)計(jì)中,計(jì)算服務(wù)器和存儲(chǔ)服務(wù)器由相互獨(dú)立的硬件承擔(dān).計(jì)算代碼和數(shù)據(jù)庫(kù)條目之間的信息交換通過(guò)文件進(jìn)行:由專門(mén)的腳本分析不同計(jì)算代碼的輸入輸出文件,并利用關(guān)鍵字檢索的方法,形成數(shù)據(jù)庫(kù)條目.數(shù)據(jù)庫(kù)作為數(shù)據(jù)交換的樞紐,不同代碼的數(shù)據(jù)讀取和存放均通過(guò)與數(shù)據(jù)庫(kù)中間件的API交互完成.我們采用瀏覽器與數(shù)據(jù)庫(kù)的交互,實(shí)現(xiàn)相關(guān)數(shù)據(jù)的增、刪、改、查的工作以及數(shù)據(jù)的統(tǒng)計(jì)分析及后續(xù)處理.
圖1 系統(tǒng)的總體架構(gòu)示意圖
根據(jù)材料基本屬性的構(gòu)成,我們選擇關(guān)系數(shù)據(jù)庫(kù)MySQL作為材料的關(guān)鍵信息存儲(chǔ)平臺(tái).主要基于以下三點(diǎn)考慮:首先從材料的數(shù)據(jù)級(jí)別上來(lái)看本系統(tǒng)屬于百萬(wàn)級(jí)數(shù)據(jù)量,但元數(shù)據(jù)構(gòu)成復(fù)雜;其次材料計(jì)算周期長(zhǎng),數(shù)據(jù)的成本高昂,數(shù)據(jù)需要考慮容災(zāi)備份;最后系統(tǒng)能夠方便進(jìn)行數(shù)據(jù)建模和遷移,具備未來(lái)和Hadoop大數(shù)據(jù)平臺(tái)對(duì)接的基礎(chǔ).
根據(jù)材料基因數(shù)據(jù)的系統(tǒng)相關(guān)性,建立基礎(chǔ)數(shù)據(jù)表general_data,以此為基礎(chǔ)建立空穴、電子、帶隙、贗勢(shì)文件(UPF文件)等數(shù)據(jù)信息表等,見(jiàn)下圖2.整個(gè)系統(tǒng)主要完成兩個(gè)核心流程:
1)自動(dòng)計(jì)算流程
“計(jì)算任務(wù)運(yùn)維中心”基于輸入條件生成批量計(jì)算腳本,“計(jì)算調(diào)度中心”收到計(jì)算任務(wù)之后分發(fā)到計(jì)算集群,由集群管理系統(tǒng)(PBS)完成計(jì)算任務(wù)指派和計(jì)算資源分配,并調(diào)用PWscf的相關(guān)計(jì)算模塊進(jìn)行計(jì)算;計(jì)算調(diào)度中心實(shí)時(shí)跟蹤計(jì)算任務(wù)狀態(tài),并回報(bào)運(yùn)維中心,在瀏覽器頁(yè)面顯示.
2)結(jié)果分析流程
在PBS腳本中,實(shí)現(xiàn)計(jì)算完成之后,回調(diào)到計(jì)算結(jié)果分析中心,對(duì)計(jì)算結(jié)果進(jìn)行解讀,解析計(jì)算輸出文件.該流程主要獲得相關(guān)體系不同k點(diǎn)的能量本征值,帶隙以及本征能級(jí)的占據(jù)數(shù)等信息,并由計(jì)算調(diào)度中心將解析結(jié)果傳遞給計(jì)算運(yùn)維中心,回寫(xiě)到數(shù)據(jù)庫(kù)中.
本系統(tǒng)涉及數(shù)據(jù)查看、查找、篩選、數(shù)據(jù)統(tǒng)計(jì)、材料母體結(jié)構(gòu)輸入、原子組合替換、原子位置優(yōu)化以及材料電子結(jié)構(gòu)及物性計(jì)算等過(guò)程.
為實(shí)現(xiàn)跨軟件的計(jì)算平臺(tái),在準(zhǔn)備計(jì)算任務(wù)的數(shù)據(jù)表示中,我們采用XML結(jié)構(gòu),將計(jì)算控制信息用偽代碼表示,在生成具體計(jì)算任務(wù)時(shí),再映射為相應(yīng)的計(jì)算代碼輸入文件.在對(duì)輸出信息提取時(shí),我們直接讀取分析PWscf所生成結(jié)果中的XML文件信息.在該文件中,包含了所有的計(jì)算輸入和輸出信息,包括晶格常數(shù)、原子坐標(biāo)、晶體對(duì)稱性等結(jié)構(gòu)信息以及不同k點(diǎn)的本征值、Fermi能級(jí)及相應(yīng)本征態(tài)的占據(jù)數(shù)等電子結(jié)構(gòu)信息.它具有格式統(tǒng)一的特性,以及不同版本間數(shù)據(jù)結(jié)構(gòu)差異小等特征,便于相關(guān)代碼的編寫(xiě)及重用.
為實(shí)現(xiàn)交互式原子輸入及更新內(nèi)容,我們采用JMOL提供的晶體顯示插件顯示晶體結(jié)構(gòu).在原子位置信息表示中,我們采用較通用的POSCAR文件格式.該插件提供了對(duì)顯示畫(huà)面的旋轉(zhuǎn),縮放,長(zhǎng)度和角度測(cè)量等功能,便于直觀檢查輸入的正確性.其顯示效果如圖3所示.
圖3 基于JMOL的晶體結(jié)構(gòu)顯示和交互界面
為實(shí)現(xiàn)高通量的計(jì)算并能夠比較不同計(jì)算的結(jié)果,需要對(duì)計(jì)算精度和能帶結(jié)構(gòu)的輸出信息做統(tǒng)一控制.對(duì)于PWscf,其主要的精度控制是通過(guò)控制平面波的截?cái)鄤?dòng)能,以及不可約布里淵區(qū)(IBZ)劃分密度,即k點(diǎn)的間距決定.我們主要采用控制k點(diǎn)間距的方法,將缺省的k點(diǎn)間距控制在0.2 ?-1,這樣的缺省值相當(dāng)于在正空間的邊長(zhǎng)為3 nm立方體原胞,可以滿足通常二維材料在厚度方向相互作用可以忽略的間距要求.另外,本平臺(tái)同時(shí)提供自由的腳本編輯和修改功能,能夠方便地根據(jù)需要設(shè)定相關(guān)的計(jì)算控制參數(shù).
在材料的設(shè)計(jì)和計(jì)算中,材料的組合計(jì)算是產(chǎn)生海量不同材料的有效方法,它在新材料的發(fā)現(xiàn)中有重要的作用.通過(guò)計(jì)算機(jī)自動(dòng)產(chǎn)生不同位置的元素替代,并結(jié)合第一性原理的計(jì)算,可以快速尋找到合適的材料.在二維材料中,我們也利用該方法進(jìn)行新材料的產(chǎn)生.與通常的合金或化合物材料不同,在二維材料的生長(zhǎng)過(guò)程中,如利用原子層沉積工藝(ALD)[31],我們能夠控制新加入的原子種類,實(shí)現(xiàn)原子按層生長(zhǎng),在第三維進(jìn)行材料原子剪裁.因而,在我們系統(tǒng)設(shè)計(jì)中,考慮到與實(shí)驗(yàn)的結(jié)合,采用分組的方法,實(shí)現(xiàn)原子替換:即將原子按原子層分組,相同分組的原子作為同一分組,同時(shí)替換.這樣減少了替換的組合數(shù),實(shí)現(xiàn)高效快速的計(jì)算,同時(shí)能夠?yàn)閷?shí)驗(yàn)的材料合成提供更直接相關(guān)參考.
在本數(shù)據(jù)庫(kù)中,計(jì)算并存儲(chǔ)特了定方向的有效質(zhì)量m[ijk],其中[ijk]為晶向指數(shù),其缺省值為[100]、[010]及[001]三個(gè)正交的方向.態(tài)密度有效質(zhì)量
(1)
(2)
二維半導(dǎo)體是目前研究的熱點(diǎn),目前,自然存在的已經(jīng)發(fā)現(xiàn)及合成的材料僅僅幾十種[32].我們可以通過(guò)不同元素的合理替代,形成新的二維材料,同時(shí),由于不同材料在z方向弱的相互作用,這為我們利用不同的二維材料構(gòu)成異質(zhì)結(jié)提供了基礎(chǔ),因而可以利用組合的方法形成所謂的van der Waals異質(zhì)結(jié)材料[33-35],為材料的特性調(diào)控中增加了新的手段和方法.利用材料組合的自動(dòng)計(jì)算技術(shù)我們能迅速對(duì)材料的基本性能進(jìn)行計(jì)算,并對(duì)性能變化的規(guī)律和關(guān)聯(lián)性進(jìn)行分析.
本數(shù)據(jù)庫(kù)中我們對(duì)總共兩千多種可能的單層二維材料及幾類典型的van der Waals異質(zhì)結(jié)二維材料進(jìn)行了計(jì)算.這些單層的二維材料結(jié)構(gòu)分別為MX2型, MX3型,K-C6型以及MXene,異質(zhì)結(jié)材料由1H-MX2組合構(gòu)成.
在本文中,我們以典型的MX2型材料為例,分析其計(jì)算獲得的信息及相關(guān)統(tǒng)計(jì)結(jié)果.
MX2型的二硫過(guò)渡金屬化合物是目前研究的熱點(diǎn)材料,其結(jié)構(gòu)如圖4(a)所示:在兩層硫族元素(X)中間,是過(guò)渡元素(M),根據(jù)結(jié)構(gòu)是否具有中心反演對(duì)稱,可以分為1H型和1T型.在平面內(nèi),MX2型二維材料的晶格為正六邊形.為獲得在晶格參數(shù)優(yōu)化過(guò)程中的穩(wěn)定性,我們采用正交的超原胞晶格.在平面內(nèi),該四邊形超原胞與原來(lái)的六邊形原胞的變換對(duì)應(yīng)關(guān)系如圖4(b)所示.
(a)結(jié)構(gòu)示意圖
在組合替代時(shí),上下兩層的硫族原子同時(shí)做不同的元素替換,同時(shí)過(guò)渡金屬也在3d和4d元素中變化,形成X1-M-X2的化合物,這樣可以獲得金屬到半導(dǎo)體(包括直接帶隙和間接帶隙半導(dǎo)體)不同帶隙人工設(shè)計(jì)的新材料.并且對(duì)這些不同材料進(jìn)行結(jié)構(gòu)優(yōu)化:包括平面內(nèi)xy方向晶格常數(shù)的優(yōu)化以及原子位置在z方向的弛豫以獲得新材料的晶格常數(shù),并更新數(shù)據(jù)庫(kù)中用弛豫后的結(jié)構(gòu)獲得的電子結(jié)構(gòu)、態(tài)密度、電子和空穴有效質(zhì)量以及帶隙等信息.這樣我們可以得到材料的性能的統(tǒng)計(jì)信息如下:
1)物性關(guān)聯(lián)
同一結(jié)構(gòu)化合物的電子和空穴有效質(zhì)量分布見(jiàn)圖5(a).由圖可見(jiàn),有效質(zhì)量具有關(guān)于45度線的對(duì)稱性.從而我們可以獲得電子和空穴有效質(zhì)量類似的材料.同時(shí)有效質(zhì)量分布具有明顯的聚類特征:分布集中在圖片的左下角,意味著在二維半導(dǎo)體中,大多數(shù)材料的電子和空穴有效質(zhì)量均很小,為性能材料的選擇提供了一定的空間.因?yàn)閷?duì)于二維材料,粒子態(tài)密度正比于有效質(zhì)量的平方根,因而,說(shuō)明該體系的粒子態(tài)密度較低,這是sp電子主導(dǎo)的態(tài)密度的重要特征.
(a)電子和空穴平均有效質(zhì)量
所計(jì)算的二維材料,其電子的有效質(zhì)量和帶隙關(guān)系的散點(diǎn)圖如圖5(b)所示.從圖中可以看到,MX2型二維材料有效質(zhì)量絕大部分集中在5 me以下.同時(shí),二維材料的帶隙最高可以到1.8 eV,在紅光和紅外光范圍內(nèi),因而該類材料可能成為紅外探測(cè)材料的很好候選.同時(shí)空穴有效質(zhì)量普遍高于電子的有效質(zhì)量,這也是通常半導(dǎo)體材料的共性.
2)特性統(tǒng)計(jì)分布
通過(guò)我們的計(jì)算,對(duì)于MX2型材料,其在[100]方向的空穴和電子的有效質(zhì)量分布如圖6(a)所示.從圖中可以看出,材料的有效質(zhì)量分布隨往小的有效質(zhì)量聚集,隨著有效質(zhì)量的增加呈明顯的衰減.這個(gè)分布規(guī)律預(yù)示著我們可以在多數(shù)二維材料中獲得較高的高載流子遷移率,因?yàn)樵陬愃频牟牧现?其電聲耦合的相互作用所形成的形變勢(shì)變化在相同量級(jí)[36-37],因而,有效質(zhì)量決定了材料的載流子遷移率.
(a)電子和空穴的有效質(zhì)量分布
對(duì)于其帶隙值的分布也可以做類似的統(tǒng)計(jì)信息,如圖6(b).可以看到帶隙大小為0.3~0.4 eV時(shí)具有最可幾分布.我們知道,在共價(jià)化合物半導(dǎo)體中,其帶隙通常由原子的成鍵軌道和反成鍵軌道的能量差決定,而這個(gè)能量差由陰離子間相互作用決定,這種相互作用對(duì)于同族的原子相差不大,因而帶隙在某一值附近獲得最可幾分布.
文章介紹了本團(tuán)隊(duì)開(kāi)發(fā)的以PWscf為計(jì)算引擎的二維半導(dǎo)體材料高通量計(jì)算平臺(tái)的設(shè)計(jì)、實(shí)現(xiàn)及測(cè)試過(guò)程.該平臺(tái)能夠?qū)崿F(xiàn)對(duì)計(jì)算任務(wù)的管理和調(diào)度、材料的組合計(jì)算、結(jié)構(gòu)優(yōu)化、基本輸運(yùn)性能計(jì)算,能夠以友好的圖形交互界面完成材料結(jié)構(gòu)的輸入與查看.通過(guò)在二維材料中的應(yīng)用,展示了其任務(wù)管理和數(shù)據(jù)管理的功能.經(jīng)過(guò)簡(jiǎn)單的數(shù)據(jù)統(tǒng)計(jì),能夠發(fā)現(xiàn)一些材料性能的變化規(guī)律,隨著數(shù)據(jù)量的不斷積累,有望通過(guò)數(shù)據(jù)挖掘技術(shù)、機(jī)器學(xué)習(xí)等,獲得半導(dǎo)體關(guān)鍵性能的構(gòu)效關(guān)系.隨著材料信息學(xué)的發(fā)展以及材料大數(shù)據(jù)挖掘技術(shù)的發(fā)展和應(yīng)用,平臺(tái)功能的進(jìn)一步完善和補(bǔ)充,必將為新材料的研發(fā)做出應(yīng)有的貢獻(xiàn).