王 濤,胡雙林
上海超級計算中心,上海 230026
材料科學(xué)中的高性能計算*
王 濤+,胡雙林
上海超級計算中心,上海 230026
高性能計算是研究材料的成分-結(jié)構(gòu)-性質(zhì)三者之間關(guān)系的有力工具。材料科學(xué)中的計算模擬主要使用密度泛函理論研究原子到微米尺度的材料,其并行實現(xiàn)方式主要分為并行k點、并行能帶和并行平面波,具有較高的并行效率和大量的軟件實現(xiàn)。并行k點方式具有較好的擴展性,但不適合于計算大晶胞體系;并行能帶方式對于中小晶胞體系效率較高;并行平面波方式適合于大晶胞體系,但對全局通訊的依賴性較高,并行擴展性較差。充分利用最新的硬件技術(shù),如加速卡、眾核技術(shù)等,改寫或重新設(shè)計材料科學(xué)計算軟件已成為最近的發(fā)展趨勢。
高性能計算應(yīng)用;材料科學(xué);并行計算
材料科學(xué)是一個高度跨學(xué)科的領(lǐng)域,它主要研究原子尺度的基本物理化學(xué)性質(zhì)與工程應(yīng)用材料宏觀性質(zhì)之間的關(guān)系。這種關(guān)系不僅由化學(xué)成分決定,還與材料的微觀結(jié)構(gòu)密切相關(guān)。計算模擬是研究材料的成分-結(jié)構(gòu)-性質(zhì)三者之間關(guān)系的有力工具。材料科學(xué)研究的對象有各種不同的劃分標(biāo)準(zhǔn)。根據(jù)化學(xué)鍵和電子結(jié)構(gòu)的類型,材料可分為金屬(無能帶隙)、半導(dǎo)體、陶瓷、聚合物(有限能帶隙)等。半導(dǎo)體與陶瓷的分界并不清晰,常常根據(jù)應(yīng)用方向分類,比如同一種材料在電子和光電子應(yīng)用中可被認(rèn)為是半導(dǎo)體類,在力學(xué)應(yīng)用中,可被稱為陶瓷類。另一種方法是根據(jù)原子排布是否高度有序以及微觀結(jié)構(gòu)的尺度或規(guī)則性進行分類。比如完美的體晶(例如硅基微電子)、多晶(由多個單晶顆粒組成,尺寸范圍從10納米到幾百微米)、無定形材料(如玻璃)、軟物質(zhì)(如聚合物)、復(fù)合材料(如生物材料)、納米結(jié)構(gòu)等。此外,材料還可以分為功能材料和結(jié)構(gòu)材料。功能材料是指具有除力學(xué)性能以外的其他特殊物理性能(例如電學(xué)、磁學(xué)、光學(xué)、熱學(xué)、聲學(xué)、化學(xué)、生物醫(yī)學(xué)等功能)的材料。結(jié)構(gòu)材料是具有較好的力學(xué)性能(比如強度、韌性及高溫性能等)用作結(jié)構(gòu)件的材料。材料科學(xué)研究的主題一般包括化學(xué)有序和無序的塊體材料、點缺陷(本征缺陷、雜質(zhì)或摻雜)、線缺陷(位錯)、面缺陷(內(nèi)表面或外表面、同質(zhì)或異質(zhì)界面、晶界、層錯)、準(zhǔn)零維缺陷(沉積物、量子點)等。
對材料科學(xué)而言,計算模擬是必不可少的研究手段。目前,物理和化學(xué)領(lǐng)域的基礎(chǔ)理論和算法實現(xiàn)已較為成熟,已經(jīng)可以對材料進行較為準(zhǔn)確的預(yù)言性計算研究。此外,很多材料很難或還沒有被實驗制備出來,因而無法測量性質(zhì);有些材料比較危險,對人體健康有害;有些材料需要了解其在某些極端條件(如高壓、超低溫、強磁場等)下的性質(zhì)時,實驗測量很難實現(xiàn)或耗費巨大。所有這些都凸顯了計算模擬的重要性和必要性。
對材料的計算研究,可以從空間尺度上進行劃分,也相應(yīng)地發(fā)展了不同的計算模型和方法。在原子分子層次(埃到數(shù)百納米的量級,10-10m到10-7m),人們可以了解材料的電子、光學(xué)、磁性、熱學(xué)、力學(xué)等基本物理化學(xué)性質(zhì)。在這個尺度內(nèi),量子力學(xué)效應(yīng)顯著,第一性原理計算和分子動力學(xué)是成熟而廣泛應(yīng)用的方法,蒙特卡洛方法也常有應(yīng)用。在納米到數(shù)百微米的尺度(10-9m到10-4m)范圍內(nèi),分子力場和分子動力學(xué)是常用的工具,用來研究晶體缺陷(摻雜、位錯、晶界等)、材料生長、有機分子自組裝等物理化學(xué)現(xiàn)象。從微米尺度(10-6m)向上,由于體系粒子數(shù)增多,出現(xiàn)了新的物理作用機制,涌現(xiàn)出很多復(fù)雜的多體作用效應(yīng),因而需要新的理論和模型來描述。從這個尺度開始一直到宏觀尺度,很多工程力學(xué)上的方法得以應(yīng)用,從而對材料進行合適的模型化,屏蔽更小尺度的細(xì)節(jié)。一般意義上的材料科學(xué)領(lǐng)域處在原子到微米尺度,更大尺度的研究通常歸屬于工程或結(jié)構(gòu)的范疇。此外,對材料的研究還包括對外場的響應(yīng)以及動態(tài)性質(zhì),例如信息能源材料中的光電轉(zhuǎn)換、各種壓電和熱傳導(dǎo)效應(yīng)、材料的生長過程、新的催化材料的尋找和性能優(yōu)化等。對此類研究,計算模擬需要考慮時間尺度。一般聲子振動在飛秒皮秒量級(10-14s到10-12s),蛋白質(zhì)折疊在微秒到毫秒量級(10-6s到10-3s),腐蝕過程等在年(約107s)的量級。此類計算模擬一般采用分子動力學(xué)方法處理皮秒到微秒量級的動態(tài)過程。
材料的空間時間尺度劃分并不是絕對的。要做成一個實際可用的材料,需要了解從原子層次到工業(yè)生產(chǎn)應(yīng)用的尺度,材料的特殊性能是否能夠真正保持。這通常需要進行多尺度研究,即把兩個相鄰的不同空間時間尺度連接起來。人們可以采用某種重整化的策略,即用第一性原理計算得到的參數(shù)直接提供給高一級的粗粒度方法使用,或者是用精確耗時的方法訓(xùn)練更高一級方法的參數(shù),來進行快速大體系的計算,而又不太損失精度。另外一種有效手段是分而治之的策略,即將體系分成若干區(qū)域,重要的部分(如催化、光化學(xué)反應(yīng)中心等)使用高精度的方法,外圍相連的不太重要的部分(如酶催化反應(yīng)中心以外的蛋白質(zhì)、水分子等)使用低精度的方法。常用的方法包括QM/MM(quantum mechanics/molecular mechanics)方法、第一性原理/有效介質(zhì)近似與有限元方法的結(jié)合等。
目前,計算材料科學(xué)已成為高性能計算應(yīng)用特別廣泛特別活躍的領(lǐng)域。該領(lǐng)域研究和應(yīng)用的快速發(fā)展不僅歸功于理論、算法和軟件進步,更得益于計算機硬件能力的指數(shù)性增長,包括處理器速度和數(shù)目的增加、內(nèi)存容量和速度的增長、大規(guī)模并行處理能力的提高等。隨著計算機硬件和算法軟件的發(fā)展,高性能計算機的計算能力飛速提高,材料科學(xué)應(yīng)用領(lǐng)域也大步前進。越來越大體系的第一性原理計算,長時間尺度的分子動力學(xué),更詳盡精確的模型計算都成為可能。材料科學(xué)的計算結(jié)果也越來越接近現(xiàn)實,發(fā)揮了越來越大的作用。
對一個現(xiàn)實材料的理論模擬,考慮到研究成本和時間等因素,在計算量相似的前提下,計算方法的選擇與模型體系的尺度等因素密切相關(guān)。對于幾個原子數(shù)的分子或團簇體系,人們可以使用高精度的量子化學(xué)方法,包括Hartree-Fock、MP2、CC、CI、MCSCF等從頭算(ab initio)方法,研究小分子的物理化學(xué)性質(zhì)、化學(xué)反應(yīng)、勢能面等,此類研究一般歸于量子化學(xué)范疇[1]。對于幾十個甚至幾百上千個原子的體系,人們使用密度泛函理論(density functional theory,DFT)[2-3]進行模擬,并有大量的軟件實現(xiàn)。對于幾百到更大的成千上萬原子的體系,則一般采用分子動力學(xué)方法[4]。這類方法直接以原子或離子為處理對象,使用實驗或以上兩類計算(從頭算和DFT)中得到的參數(shù)來擬合力場數(shù)據(jù),然后進行分子動力學(xué)模擬、蒙特卡洛計算、解析求解經(jīng)驗公式等。這類方法的計算精度依賴于力場的準(zhǔn)確程度和可遷移性。另一種方法是使用分子力學(xué)和量子力學(xué)結(jié)合的QM/ MM方法[5-6],將關(guān)鍵反應(yīng)位置用高精度量子力學(xué)描述,環(huán)境用分子力學(xué)描述。此外,還可以不直接處理這么多原子,而綜合運用以上各種方法得到的參數(shù),計算某種大體系性質(zhì)。例如合金理論自動工具包(alloy theoretic automated toolkit,ATAT)[7]綜合使用第一性原理、蒙特卡洛方法、團簇擴展方法等研究合金性質(zhì)。工業(yè)中的材料粒子數(shù)一般都在阿佛加德羅常數(shù)(6×1023)量級,這種體系含有大量缺陷、晶界等,不能近似成上述各種較小的模型。在現(xiàn)有的計算條件下,用分子力學(xué)或量子力學(xué)直接處理這么大體系的粒子是不現(xiàn)實的。通常做法是進一步抽象和模型化,使用晶界動力學(xué)、相場模型等理論方法,或者使用有限元、有限差分法等求宏觀尺度下的平均性質(zhì)。
比較狹義的高性能計算的材料科學(xué)應(yīng)用,是指使用DFT和分子動力學(xué)方法的計算模擬。對于具有空間周期性的晶體體系,DFT方法是最好的選擇,原因包括:(1)DFT只依賴于單粒子波函數(shù),可以直接實現(xiàn)周期性;(2)使用平面波和贗勢的DFT對于材料科學(xué)體系的典型尺度(幾百個原子)具有較好的計算復(fù)雜性,其計算復(fù)雜性約為O(N2)~O(N3),N為原子數(shù)目[8-9]。對于非常大的體系(超出1 000原子),單粒子波函數(shù)正交化,復(fù)雜度為O(N3),是計算最耗時的部分。對于這樣的體系,人們發(fā)展了各種線性標(biāo)度(O(N)復(fù)雜度)的DFT方法、緊束縛近似方法(density functional based tight binding,DFTB)等[10-11]。此外,DFT方法還可與其他方法相結(jié)合,用于材料科學(xué)的計算模擬。例如,與分子動力學(xué)相結(jié)合,使用Bohn-Oppenheimer近似,將原子近似為在電子勢能面上運動的BOMD(Bohn-Oppenheimer molecular dynamics)方法[12-13];Car和Parrinello提出的把電子波函數(shù)作為虛擬質(zhì)量和原子核運動同樣處理的CPMD(Car-Parrinello molecular dynamics)方法等[14-15]。
2.1 DFT方法
密度泛函理論(DFT)是一種處理多電子問題的單電子近似方法,它既有較為準(zhǔn)確的計算結(jié)果,又有較高的計算效率,因此得到了非常廣泛的應(yīng)用,尤其是在材料科學(xué)領(lǐng)域中。DFT的基本方程是Kohn-Sham方程(KS方程)。在DFT中,多電子相互作用被處理成與電子密度相關(guān)的交換相關(guān)項,一般來說,這個交換相關(guān)項是非局域化的。DFT中的關(guān)鍵問題就是處理這個交換相關(guān)項。盡管DFT在形式上是確切的,但在實際實現(xiàn)中,主要依賴于對電荷密度交換相關(guān)泛函的近似。人們提出了很多近似方法,包括純密度形式的局域密度近似(local-density approximation,LDA)[16-17]和廣義梯度近似(generalgradientapproximation,GGA)[18-19](如PW91、BLYP、PBE96等),以及更復(fù)雜的雜化形式(如B3LYP、PBE0、CAM-B3LYP等)。材料科學(xué)中最主要采用的泛函是LDA和GGA,這兩類泛函都具有較高的準(zhǔn)確性和較好的數(shù)值性能。與Hartree-Fock類方法(可以通過擴展多粒子波函數(shù)來提高精度)不同的是,系統(tǒng)性地改進交換相關(guān)泛函盡管在理論上是可能的[20],但在數(shù)值計算上是不可行的。因此,目前并沒有判斷泛函性能好壞的統(tǒng)一標(biāo)準(zhǔn)。通過實驗數(shù)據(jù)來檢查各種泛函的準(zhǔn)確性和預(yù)測能力是非常重要的。
DFT方程原則上可以數(shù)值求解,但實際上都是用基組展開的方式求解。人們已經(jīng)發(fā)展了大量的基組方法,這些方法可以分為兩類,一類是局域基組方法,另一類是平面波方法,兩類方法各有優(yōu)缺點。在材料科學(xué)領(lǐng)域中,由于計算體系的典型尺度為幾百個原子,使用平面波和贗勢的DFT對于這個尺度具有較好的計算復(fù)雜性,從而平面波方法應(yīng)用更為廣泛。在平面波方法中,電子軌道用平面波基組表示,因此可以無縫地結(jié)合周期性邊界條件(periodic boundary conditions,PBC),并使用快速傅里葉變換(fast Fourier transform,F(xiàn)FT)算法快速計算能量和力。但是平面波基組也有其缺點:不能充分描述原子核附近區(qū)域或原子實區(qū)域的電子波函數(shù)。價電子波函數(shù)在這個區(qū)域變化非???,而在成鍵區(qū)域變化要慢得多。準(zhǔn)確描述波函數(shù)在原子實區(qū)域的快速變化需要非常大的平面波基組。贗勢平面波方法(pseudo-potential plane-wave,PSPW)可以很好地解決這個問題[21-22]。在該方法中,原子勢能快速變化的原子實區(qū)域和實電子被去除或用變化平緩的贗勢來偽裝和替代。贗勢產(chǎn)生的贗原子和真實原子具有相同的散射性質(zhì)[23-24]。贗勢的根本原理在于成鍵時波函數(shù)的變化僅僅在價電子區(qū)域,因而適當(dāng)?shù)厝コ討?yīng)該不會影響體系成鍵性質(zhì)的預(yù)測。投影增強型平面波(projector augmented wave,PAW)方法[25-26]是對贗勢的進一步改進,改善了傳統(tǒng)PSPW方法的缺陷。平面波是固體應(yīng)用的天然選擇,因為晶體易于用周期性邊界條件來表示。在平面波中,分子軌道可以表示成:
其中,Ω是晶胞的體積。因為系統(tǒng)是周期性的,所以平面波展開必須僅由具有晶格周期性的平面波eiG·r構(gòu)成,進而可以由下式限制:
其中,L是Bravais晶格矢量;G為倒晶格矢量。在典型的平面波計算中,平面波展開截斷處的倒晶格矢量的動能低于預(yù)設(shè)的最大截斷能量。
實空間和倒易空間表示的變換可以采用高效的FFT算法。在平面波理論框架中,KS方程一般使用共軛梯度算法或CPMD算法求解。
2.2 并行實現(xiàn)
目前,已有很多方式來并行實現(xiàn)平面波DFT程序[26-29],一般包括3類并行方式:并行k點、并行能帶、并行平面波。
對于許多固體計算來說,計算可以分布在布里淵區(qū)采樣空間(并行k點)。k點并行的方式來源于所研究體系的平移對稱性[30]。這種對稱性也存在于一個給定k點的操作(不是全部),是獨立于其他k點的相關(guān)操作的,因而具有天然的并行性。這種并行方式擴展性很好[31],也很容易實現(xiàn),但也有其局限性。首先,不是所有的操作都和k點有關(guān),因而對擴展性有影響;其次,某些物理量,例如femi能級,不能很好地通過k點并行;再次,k點并行也會帶來一定的通訊和同步開銷;最后,也是最大的限制是,該方法的有效性和所研究體系的尺寸大小有關(guān)。隨著晶胞尺寸的增加,計算收斂所需的k點數(shù)減少,因而該方法不能用于大晶胞的Γ點(k=0)計算。
另外一種方法是將單電子軌道在CPU上分發(fā)(并行能帶)。這種方法的缺點是對角化和正交化等線性代數(shù)操作將需要傳遞大量消息,增加通訊負(fù)載。此外,對于非常大的截斷能量(使用大量平面波來描述單電子軌道),該方法在節(jié)點內(nèi)存較小的并行計算機上無法使用,因為每一個節(jié)點都必須存儲完全的單電子波函數(shù),因而該方法對于大晶胞的CPMD模擬是不可行的。但是,如果與RMM-DIIS(residual minimization scheme,direct inversion in the iterative subspace)方法[32]結(jié)合,該方法對于中等尺度晶胞或較小截斷能量的計算具有較高的效率。
并行化CPMD方法的另外一種直接方式是空間分解單電子軌道(并行平面波)[26,28]。該方法用途廣泛,容易實現(xiàn),很適合對大的晶胞體系和截斷能量進行CPMD模擬。此外,非局域贗勢和正交化的并行實現(xiàn)也并不困難,它可以使用簡單的全局回收操作來實現(xiàn)。這種方法的缺點是要使用并行的三維FFT,這種三維的FFT在使用的CPU或核數(shù)超過FFT網(wǎng)格點數(shù)開立方的時候,并行效率很差,無法擴展。因此,在設(shè)計平面波DFT并行實現(xiàn)時,需要注意:在計算的每個主要部分,能有效使用的CPU數(shù)是有限的,因為它依賴于對所有CPU的全局操作。因此平面波DFT的整個并行算法都應(yīng)該設(shè)計成在計算中避免全局通訊。目前已有一些軟件實現(xiàn)了這種做法[33-34]。
由于計算模擬的重要以及計算方法的完善,材料科學(xué)領(lǐng)域內(nèi)的高性能計算軟件[8-9,33-49](包括商業(yè)化和非商業(yè)化軟件)非常豐富,并擁有大量的用戶,是全球各大超級計算中心的主要應(yīng)用軟件。這些軟件一方面及時跟進利用物理、數(shù)學(xué)等領(lǐng)域的最新研究成果;另一方面又充分利用高性能計算軟硬件技術(shù)的發(fā)展,已形成一個開發(fā)活躍、功能豐富、風(fēng)格多樣、用戶廣泛的軟件群體。下面以最為常見、使用最為廣泛的幾種材料科學(xué)高性能計算軟件為例進行介紹。
VASP(Vienna Ab-initio simulation package)是研究材料電子結(jié)構(gòu)比較成熟和廣泛使用的軟件包[8]。它使用密度泛函理論、平面波基組、超軟贗勢或投影綴加波方法以及周期性邊界條件。該軟件的優(yōu)點包括:實現(xiàn)了多種密度泛函和方法,功能比較齊全;官方提供比較精確的贗勢;文檔比較詳盡,和物理性質(zhì)聯(lián)系得較好;以源碼包形式發(fā)布;結(jié)構(gòu)優(yōu)化能力較強;新的功能和方法實現(xiàn)比較快。缺點有輸入文件較多,參數(shù)定義不夠直觀,前后數(shù)據(jù)處理相對比較麻煩等。但它有很多第三方的可視化軟件和前后處理軟件,如p4vasp、vaspview、VESTA等。
DMol3是Accelrys公司商業(yè)軟件Materials Studio套件中的一個閉源的密度泛函理論組件[35]。它以數(shù)值原子軌道為基組,既可以進行全電子計算,也可以使用贗勢,既可以使用周期性邊界條件,也可以使用非周期性邊界條件。它的優(yōu)點包括:Materials Studio套件在Windows下的圖形界面簡單易用,參數(shù)設(shè)置友好;前后處理方便;計算速度較快,常用來做體系的預(yù)優(yōu)化,也能夠較快地尋找過渡態(tài)。其他特色包括可以考慮溶劑效應(yīng)等。缺點有基組不夠完備,磁盤使用隨著并行進程數(shù)增加而增加等。
CASTEP(Cambridge sequential total energy package)是Materials Studio套件中另外一個密度泛函理論組件[36],對英國學(xué)者免費提供源碼發(fā)布。它使用周期性邊界條件、平面波基組、超軟贗勢、模守恒贗勢,還能夠在計算時生成贗勢。此外,它還可以計算芯能級光譜和核磁共振譜。
WIEN2K是使用密度泛函理論進行電子結(jié)構(gòu)計算的軟件包[9],包含很多互相配合的模塊,計算的前后處理結(jié)合比較緊密。它的特色是使用了完全勢線性綴加平面波和局域軌道方法,是能帶結(jié)構(gòu)計算最精確的方法之一。它常被用來處理晶體的電子結(jié)構(gòu)和磁性質(zhì)、旋軌耦合等,但計算體系相對較小。
SIESTA(spanish initiative for electronic simulations with thousands of atoms)是一個比較流行的開源軟件包[37],開發(fā)目的是用線性標(biāo)度的方法計算較大原子數(shù)的體系。它使用密度泛函理論、數(shù)值原子軌道基組和贗勢方法,進行電子結(jié)構(gòu)計算和從頭算分子動力學(xué)模擬。它的優(yōu)點包括參數(shù)比較簡單易懂,能夠進行較快的大體系計算,開源代碼。此外,它還可以用非平衡格林函數(shù)計算電子輸運。缺點則包括原子基組不是完備基組,收斂性能較差,精度不高,贗勢庫不夠全面可靠,文檔不夠詳細(xì)等。
QUANTUM ESPRESSO(open-source package for research in electronic structure,simulation,and optimization)也是廣為流行的開源軟件套件[38]。它包含電子結(jié)構(gòu)計算、分子動力學(xué)(包括CPMD和BOMD)、聲子和電子輸運計算等很多組件,有很多較有特色的功能,常被用來計算電聲相互作用、介電張量等響應(yīng)性質(zhì),以及X射線吸收譜、電子激發(fā)等光譜性質(zhì)。其優(yōu)點在于開放友好的接口,新方法實現(xiàn)快,提供的算例比較有代表性。缺點有文檔不夠完備,參數(shù)意義較難理解,缺少可靠贗勢庫,速度較慢等。
ABINIT是一個較早實現(xiàn)準(zhǔn)粒子計算GW方法和較早有投影綴加波方法的開源軟件包[39]。它使用密度泛函理論、周期性邊界條件、平面波基組和贗勢方法,較多地被用來計算宏觀極化、介電常數(shù)、電聲相互作用等響應(yīng)函數(shù)性質(zhì)。此外,它還可以確定DFT+ U的Hubbard U值。缺點是文檔組織、參數(shù)定義等都偏向于從開發(fā)者出發(fā),對用戶不太方便。
CPMD是一個從頭算的電子結(jié)構(gòu)和分子動力學(xué)的開源程序[40]。它使用平面波基組和贗勢,既能計算孤立分子,也能計算周期性邊界條件。它主要實現(xiàn)Car-Parrinello發(fā)明的將電子波函數(shù)和離子一起進行動力學(xué)模擬的CPMD方法,以及路徑積分分子動力學(xué)(path integral molecular dynamics,PIMD)。該軟件功能強大,能處理多種系綜,也包含線性響應(yīng)理論、含時密度泛函、QM/MM等比較新的方法。此外,它的并行效率較高,常被用于作為高性能計算機的基準(zhǔn)測試程序。CPMD理論方法本身不太適合金屬體系。
CP2K是一個開源程序[41],可用于計算固體、液體、分子和生物體系,也支持圖形處理單元(graphics processing unit,GPU)。它的特點是使用高斯和平面波混合基組,兼顧速度和精度。它包括密度泛函理論、密度泛函緊束縛方法、分子力場和QM/MM方法,可以用于X射線吸收譜、核磁共振等光譜計算。缺點是文檔比較粗略,沒有直接的技術(shù)支持。
LAMMPS(large-scale atomic/molecular massively parallel simulator)是使用分子力學(xué)和分子動力學(xué)方法研究材料最流行的開源軟件[42]。它能夠處理多種模型體系;實現(xiàn)了很多力場,包括描述化學(xué)鍵形成和斷裂的反應(yīng)性力場reaxff;支持多種系綜,多種不同邊界條件;并行效率高,并且支持圖形處理單元和Intel Xeon Phi平臺。它可以模擬很多實驗過程,例如壓痕、拉伸、濺射、沉積、晶界等,并且更接近現(xiàn)實的模型,較多地用來計算力學(xué)性質(zhì)、化學(xué)反應(yīng)等。郵件列表非常活躍,開發(fā)者和用戶的交流直接快速,交流成果能非常快地體現(xiàn)在最新版的軟件發(fā)布中。
目前,材料科學(xué)已成為高性能計算應(yīng)用領(lǐng)域最活躍,成果最豐富的領(lǐng)域之一。在理論和算法方面,人們發(fā)展了大量的計算模擬方法并不斷改進,解決了很多挑戰(zhàn)性問題和限制,例如半導(dǎo)體材料的能帶隙問題,基態(tài)計算絕對零度限制等。人們已經(jīng)逐漸能夠模擬現(xiàn)實空間尺度和時間尺度的材料。在計算硬件技術(shù)方面,材料領(lǐng)域的研究人員不斷跟進最新硬件發(fā)展,改寫或重新設(shè)計軟件,以充分利用最新硬件特性[50-61],例如利用ClearSpeed加速卡的大規(guī)模并行DFT軟件[50-51],VASP在GPU上的移植[59],利用多核系統(tǒng)的特性加速DFT計算[60]等。隨著計算資源的進一步豐富,計算能力的飛速提高,材料科學(xué)的高性能計算應(yīng)用也將獲得巨大進步。
[1]Jensen F.Introduction to computational chemistry[M].Chichester:John Wiley&Sons Ltd,1999.
[2]Dreizler R,Gross E.Density functional theory[M].New York: Plenum Press,1995.
[3]Parr R G,Yang W T.Density-functional theory of atoms and molecules[M].NewYork:Oxford University Press,1989.
[4]Larsson P,Hess B,Lindahl E.Algorithm improvements for molecular dynamics simulations[J].Wiley Interdisciplinary Reviews:Computational Molecular Science,2011,1(1):93-108.
[5]Friesner1 R A,Guallar V.Ab initio quantum chemical andmixed quantum mechanics/molecular mechanics(QM/MM) methods for studying enzymatic catalysis[J].Annual Review of Physical Chemistry,2005,56:389-427.
[6]Gao J,Truhlar D G.Quantum mechanical methods for enzyme kinetics[J].Annual Review of Physical Chemistry, 2002,53:467-505.
[7]van de Walle A.Multicomponent multisublattice alloys,nonconfigurational entropy and other additions to the alloy theoretic automated toolkit[J].Calphad,2009,33(2):266-278.
[8]Kresse G,Furthüller J.Efficiency of ab-initio total energy calculations for metals and semiconductors using a planewave basis set[J].Computational Materials Science,1996,6 (1):15-50.
[9]Blaha P,Schwarz K,Sorantin P,et al.Full-potential,linearized augmented plane-wave programs for crystalline systems[J].Computer Physics Communications,1990,59(2): 399-415.
[10]Bowler D R,Fattebert J L,Gillan M J,et al.Introductory remarks:linear scaling methods—preface[J].Journal of Physics:Condensed Matter,2008,20(29):290301.
[11]Bowler D R,Miyazaki T.O(N)methods in electronic structure calculations[J].Reports on Progress in Physics,2012, 75(3):036503.
[12]Cheng H P.The motion of protons in water-ammonia clusters[J].The Journal of Chemical Physics,1996,105(16): 6844-6855.
[13]Mao Keke,Li Lei,Zhang Wenhua,et al.A theoretical study of single-atom catalysis of CO oxidation using Au embedded 2D h-BN monolayer:a co-promoted O2activation[J].Scientific Reports,2014,4:5441.
[14]Car R,Parrinello M.Unified approach for molecular dynamics and density-functional theory[J].Physical Review Letters,1985,55(22):2471-2474.
[15]Kühne T,Krack M,Mohamed F,et al.Efficient and accurate Car-Parrinello-like approach to Born-Oppenheimer molecular dynamics[J].Physical Review Letters,2007,98(6): 066401.
[16]Ceperley D M,Alder B J.Ground-state of the electron gas by a stochastic method[J].Physical Review Letters,1980, 45(7):566-569.
[17]Perdew J P,Zunger A.Self-interaction correction to densityfunctional approximations for many-electron systems[J]. Physical Review B,1981,23(10):5048-5079.
[18]Perdew J P,Chevary J A,Vosko S H,et al.Atoms,molecules,solids,and surfaces-applications of the generalized gradient approximation for exchange and correlation[J]. Physical Review B,1992,46(11):6671-6687.
[19]Perdew J P,Burke K,Ernzerhof M.Generalized gradient approximation made simple[J].Physical Review Letters,1996, 77(18):3865-3868.
[20]Gorling A,Levy M.Exact Kohn-Sham scheme based on perturbation theory[J].Physical Review A,1994,50(1): 196-204.
[21]Austin B J,Sham L J,Heine V.General theory of pseudopotentials[J].Physical Review,1962,127(1):276-276.
[22]Yin M T,Cohen M L.Theory of ab initio pseudopotential calculations[J].Physical Review B,1982,25(12):7403-7412. [23]Bachelet G B,Hamann D R,Schluter M.Pseudopotentials that work:from H to Pu[J].Physical Review B,1982,26 (8):4199-4228.
[24]Hamann D R.Generalized norm-conserving pseudopotentials[J].Physical Review B,1989,40(5):2980-2987.
[25]Bl?chl P E.Projector augmented-wave method[J].Physical Review B,1994,50(24):17953-17979.
[26]Bylaska E J,Valiev M,Kawai R,et al.Parallel implementation of the projector augmented plane wave method for charged systems[J].Computer Physics Communications, 2002,143(1):11-28.
[27]Clarke L J,Stich I,Payne M C.Large-scale ab initio total energy calculations on parallel computers[J].Computer Physics Communications,1992,72(1):14-28.
[28]Nelson J S,Plimpton S J,Sears M P.Plane-wave electronicstructure calculations on a parallel supercomputer[J].Physical Review B,1993,47(4):1765-1774.
[29]Wiggs J,Jonsson H.A parallel implementation of the Car-Parrinello method by orbital decomposition[J].Computer Physics Communications,1994,81(1/2):1-18.
[30]Ashcroft N W,Mermin N D.Solid state physics[M].Philadelphia:Holt Saunders,1976.
[31]Bush I J,Tomi? S,Searle B G,et al.Parallel implementation of the ab initio CRYSTAL program:electronic structure calculations for periodic systems[J].Proceedings of the Royal SocietyA,2011,467(2131):2112-2126.
[32]Hamilton T P,Pulay P.Direct inversion in the iterative sub-space(DIIS)optimization of open-shell,excited-state,and small multiconfiguration SCF wave functions[J].The Journal of Chemical Physics,1986,84(10):5728-5734.
[33]Gygi F.Architecture of Qbox:a scalable first-principles molecular dynamics code[J].IBM Journal of Research and Development,2008,52(1/2):137-144.
[34]Canning A,Raczkowski D.Scaling first-principles planewave codes to thousands of processors[J].Computer Physics Communications,2005,169(1/3):449-453.
[35]Delley B.From molecules to solids with the DMol3approach[J].The Journal of Chemical Physics,2000,113(18): 7756-7764.
[36]Clark S J,Segall M D,Pickard C J,et al.First principles methods using CASTEP[J].Zeitschrift für Kristallographie-Crystalline Materials,2005,220(5/6):567-570.
[37]Artacho E,Anglada E,Diéguez O,et al.The SIESTA method: developments and applicability[J].Journal of Physics:Condensed Matter,2008,20(6):064208.
[38]Giannozzi P,Baroni S,Bonini N,et al.QUANTUM ESPRESSO:a modular and open-source software project for quantum simulations of materials[J].Journal of Physics: Condensed Matter,2009,21(39):395502.
[39]Gonze X,Amadon B,Anglade P-M,et al.ABINIT:firstprinciples approach to material and nanosystem properties [J].Computer Physics Communications,2009,180(12): 2582-2615.
[40]Andreoni W,CurioniA.New advances in chemistry and materials science with CPMD and parallel computing[J].Parallel Computing,2000,26(7/8):819-842.
[41]Hutter J,Iannuzzi M,Schiffmann F,et al.CP2K:atomistic simulations of condensed matter systems[J].Wiley Interdisciplinary Reviews:Computational Molecular Science,2014, 4(1):15-25.
[42]Plimpton S.Fast parallel algorithms for short-range molecular dynamics[J].Journal of Computational Physics,1995, 117(1):1-19.
[43]Metz S,K?estner J,Sokol A A,et al.ChemShell—a modular software package for QM/MM simulations[J].Wiley Interdisciplinary Reviews:Computational Molecular Science, 2014,4(2):101-110.
[44]Barbatti M,Ruckenbauer M,Plasser F,et al.Newton-X:a surface-hopping program for nonadiabatic molecular dynamics [J].Wiley Interdisciplinary Reviews:Computational Molecular Science,2014,4(1):26-33.
[45]Geudtner G,Calaminici P,Carmona-Espíndola J,et al.de-Mon2k[J].Wiley Interdisciplinary Reviews:Computational Molecular Science,2012,2(4):548-555.
[46]Bochevarov A D,Harder E,Hughes T F,et al.Jaguar:a high-performance quantum chemistry software program with strengths in life and materials sciences[J].International Journal of Quantum Chemistry,2013,113(18):2110-2142.
[47]Aprà E,Bylaska E J,Dean D J,et al.NWChem for materials science[J].Computational Materials Science,2003,28(2): 209-221.
[48]Skylaris C K,Haynes P D,Mostofi M C,et al.Introducing ONETEP:linear-scaling density functional simulations on parallel computers[J].The Journal of Chemical Physics, 2005,122(8):084119.
[49]VandeVondele J,Krack M,Mohamed F,et al.Quickstep: fast and accurate density functional calculations using a mixed Gaussian and plane waves approach[J].Computer Physics Communications,2005,167(2):103-128.
[50]Brown P,Woods C,McIntosh-Smith S,et al.Massively multicore parallelization of Kohn-Sham theory[J].Journal of Chemical Theory and Computation,2008,4(10):1620-1626.
[51]Brown P,Woods C J,McIntosh-Smith S,et al.A massively multicore parallelization of the Kohn-Sham energy gradients[J].Journal of Computational Chemistry,2010,31(10): 2008-2013.
[52]Yasuda K.Two-electron integral evaluation on the graphics processor unit[J].Journal of Computational Chemistry,2008, 29(3):334-342.
[53]Yasuda K.Accelerating density functional calculations with graphics processing unit[J].Journal of Chemical Theory and Computation,2008,4(8):1230-1236.
[54]Vogt L,Olivares-Amaya R,Kermes S,et al.Accelerating resolution-of-the-identity second-order Moller-Plesset quantum chemistry calculations with graphical processing units[J]. The Journal of Physical Chemistry A,2008,112(10):2049-2057.
[55]Ufimtsev I S,Martinez T J.Graphical processing units for quantum chemistry[J].Computing in Science and Engineering, 2008,10(6):26-34.
[56]Ufimtsev I S,Martinez T J.Quantum chemistry on graphical processing units 1.Strategies for two-electron integral evaluation[J].Journal of Chemical Theory and Computation,2008,4(2):222-231.
[57]Ufimtsev I S,Martinez T J.Quantum chemistry on graphical processing units 2.Direct self-consistent field implementation[J].Journal of Chemical Theory and Computation,2009,5(4):1004-1015.
[58]Ufimtsev I S,Martinez T J.Quantum chemistry on graphical processing units 3.Analytical energy gradients and first principles molecular dynamics[J].Journal of Chemical Theory and Computation,2009,5(10):2619-2628.
[59]Hacene M,Anciaux-Sedrakian A,Rozanska X,et al.Accelerating VASP electronic structure calculations using graphic processing units[J].Journal of Computational Chemistry, 2012,33(32):2581-2589.
[60]Woods C J,Brown P S,Manby F R.Multicore parallelization of Kohn-Sham theory[J].Journal of Chemical Theory and Computation,2009,5(7):1776-1784.
[61]Leang S S,Rendell A P,Gordon M S.Quantum chemical calculations using accelerators:migrating matrix operations to the NVIDIA Kepler GPU and the Intel Xeon Phi[J].Journal of Chemical Theory and Computation,2014,10(3):908-912.
WANG Tao was born in 1977.He received the Ph.D.degree in chemistry from University of Science and Technology of China in 2003.Now he is a senior engineer at Shanghai Supercomputer Center,and the member of CCF.His research interests include computational chemistry and high performance computing,etc.
王濤(1977—),男,江西九江人,2003年于中國科學(xué)技術(shù)大學(xué)獲得博士學(xué)位,現(xiàn)為上海超級計算中心高級工程師,CCF會員,主要研究領(lǐng)域為計算化學(xué),高性能計算等。
HU Shuanglin was born in 1982.He received the Ph.D.degree in materials science from University of Science and Technology of China in 2009.His research interest is materials science.
胡雙林(1982—),男,江蘇泰興人,2009年于中國科學(xué)技術(shù)大學(xué)獲得博士學(xué)位,主要研究領(lǐng)域為材料科學(xué)。
High Performance Computing in Materials Science*
WANG Tao+,HU Shuanglin
Shanghai Supercomputer Center,Shanghai 230026,China
+Corresponding author:E-mail:taowang328@hotmail.com
High performance computing is a powerful tool to understand composition-structure-property relationships in materials.Density functional theory is mainly used to study the materials from atomistic scale to micrometer scale in the computational simulation of materials science,and is parallelized overk-points,bands and plane wave in many computing softwares of materials science with high parallel efficiency.Paralleling overk-points can be scaled well but has poor performance for big unit cell.Paralleling over bands has better efficiency for small or middle size of unit cell.Paralleling over plane wave has better performance but poor scalability for big size of unit cell,and relies on global communication over whole CPU.Rewriting or redesigning computing softwares of materials science to take full advantage of the latest hardware technology such as accelerator or many-core technology has become a recent trend.
high performance computing application;materials science;parallel computing
10.3778/j.issn.1673-9418.1512053
A
:O641.12;O246
*The National High Technology Research and Development Program of China under Grant No.2014AA01A302(國家高技術(shù)研究發(fā)展計劃(863計劃)).
Received 2015-10,Accepted 2015-12.
CNKI網(wǎng)絡(luò)優(yōu)先出版:2015-12-22,http://www.cnki.net/kcms/detail/11.5602.TP.20151222.1017.004.html
WANG Tao,HU Shuanglin.High performance computing in materials science.Journal of Frontiers of Computer Science and Technology,2017,11(2):185-193.