何曉凱,曹意林,劉英哲
(1.西安近代化學研究所,陜西 西安 710065;2.西安市液晶與有機光電轉(zhuǎn)換材料重點實驗室,陜西 西安 710065)
含能材料是一類含有爆炸性基團或含有氧化劑和可燃物、能獨立進行化學反應(yīng)并輸出能量的化合物或混合物,是軍用炸藥、發(fā)射藥和火箭推進劑配方的重要組成部分(本文中如無特殊說明,含能材料的內(nèi)涵僅為化合物)。能量和感度是含能材料最重要的性能標度,但二者之間通常具有一定矛盾,即隨著能量的升高,感度往往呈現(xiàn)下降趨勢。因此,開發(fā)能夠平衡能量和感度關(guān)系的新型含能材料是當前的難點問題[1-10]。
含能材料能量和安全性能是由多個結(jié)構(gòu)尺度因素共同決定的。在分子層面,化學儲能鍵往往是最先發(fā)生分解反應(yīng)的鍵,因此導致能量和安全性能間的矛盾不可避免的出現(xiàn)于分子層面[8]。在晶體層面,通過特定的晶體堆積模式能夠一定程度上緩解能量和安全性能間的矛盾。例如,常溫常壓下CL-20存在3種單質(zhì)晶型(β、γ和ε型),其中ε-CL-20因其最高的密度(2.04 g/cm3)和堆積系數(shù)(0.77)[11],表現(xiàn)出優(yōu)于其他晶型的爆轟性能和感度性能。因此,低感高能含能材料的設(shè)計在分子層面較難實現(xiàn),需面向晶體尺度設(shè)計含能材料。
層狀含能材料是一類由平面有機含能分子通過氫鍵、π-π堆垛等分子間作用形成的具有層狀堆積特性的晶體含能材料,是極具潛力的低感高能材料[12-21]。主要原因有3個方面:一是層狀堆積含能晶體通常具有較高的堆積系數(shù),能夠提升晶體密度、減少自由體積,有助于改善爆轟性能與撞擊感度[22-24]。二是層與層之間還可通過滑移來緩沖外界的機械刺激。例如,TATB是典型的層狀含能材料(見圖1),具有極低的撞擊感度(撞擊能>60 J),但爆速僅為8 100 m/s左右,能量水平相對較低[25]。三是層狀含能材料的熱穩(wěn)定性較好。本課題組[23]從1 000多個實驗測量的硝基晶體中篩選出了5種具有層狀堆積特點的多晶型化合物,通過計算發(fā)現(xiàn),同一晶型中層狀堆積結(jié)構(gòu)的初始熱分解反應(yīng)表觀活化能最高。因此,層狀含能材料具有天然的機械刺激不敏感性,若在結(jié)構(gòu)設(shè)計中輔以能量提升,便能夠在晶體層面上較好地平衡能量與機械感度。
圖1 典型層狀含能材料TATB結(jié)構(gòu)示意圖
鑒于分析分子間復雜相互作用和精確預(yù)測晶體結(jié)構(gòu)的困難,層狀含能晶體的理性設(shè)計仍然是一個挑戰(zhàn)[26-29]。當前,層狀含能材料的設(shè)計主要集中在分子層面,例如不同骨架(如苯和噁二唑)與基團(如硝基、氨基和疊氮基)之間的組合設(shè)計[30-34]。在大多數(shù)情況下,分子的微小修飾會改變晶體的結(jié)構(gòu)和性能(特別是機械感度)[35],從而增加了構(gòu)建層狀含能晶體的難度。
因此,層狀含能材料的發(fā)展較為緩慢,在已經(jīng)發(fā)現(xiàn)的含能材料中,層狀含能材料的種類屈指可數(shù)。為了加快層狀含能材料的創(chuàng)制,亟需深入理解含能晶體中分子間的相互作用,并創(chuàng)新含能材料設(shè)計理論與方法。為此,本文綜述了近年來層狀含能材料設(shè)計方法研究進展,以期為相關(guān)研究人員提供參考借鑒。
近年來,國內(nèi)外成功獲得了若干新型層狀含能材料。其中,具有代表性的結(jié)構(gòu)如圖2所示。這些含能材料具有完美的層狀堆積特征,均表現(xiàn)出了較低的撞擊感度(見表1)。值得一提的是,NAPTO具有與HMX相近的爆轟性能,但撞擊感度卻顯著降低,達到了能量與感度的較好平衡[14]。與傳統(tǒng)含能材料相比,在設(shè)計層狀含能材料時,除了要考慮平面含能分子的結(jié)構(gòu)組成之外,還要考慮層狀堆積結(jié)構(gòu)的精準構(gòu)筑。目前,層狀含能材料的設(shè)計思路重點圍繞堆積結(jié)構(gòu)特點開展,其設(shè)計策略可以分為三類:一是基于經(jīng)驗,二是基于計算,三是基于機器學習(見圖3)。
表1 近年來合成出的層狀含能材料代表的綜合性能
圖2 近年來合成的典型層狀含能材料
圖3 層狀含能材料設(shè)計策略匯總
通過分析一些已有層狀含能晶體的堆積規(guī)律[36-37],獲得可能形成層狀堆積的影響因素,比如分子平面性、空間對稱性、氫鍵/π-π堆垛作用等,把這種依賴規(guī)律性的方法歸結(jié)為基于經(jīng)驗驅(qū)動的設(shè)計策略,主要分為增強分子內(nèi)大π鍵[12-13,19,38-39]、調(diào)控分子間相互作用[14,18,25,40-44]。
制備層狀材料的關(guān)鍵是合成平面分子,因FOX-7中同C原子上兩個NO2間的空間位阻破壞了分子的平面性,導致FOX-7具有波浪狀晶體結(jié)構(gòu),并不是較為平整的層狀結(jié)構(gòu)。將FOX-7分子中的一個NH2和一個NO2基團分別替換為聯(lián)胺和四唑環(huán),形成的平面分子HTz-FOX具有層狀晶體結(jié)構(gòu),其感度(IS=10 J)和能量性能(D=8 883 m/s)優(yōu)于RDX[19,38,45]。
內(nèi)環(huán)化反應(yīng)也是一種提高分子平面性的重要方式。如圖4(a)所示,Tang等[12]利用碘苯二乙酸酯在二甲基甲酰胺溶液中氧化分子4-氨基-N-(二氨基乙烯)-1,2,5-噁二唑-3-甲酰胺,得到化合物5-(4-氨基-1,2,5-噁二唑-3-基)-1,2,4-噁二唑-3-胺,反應(yīng)前后分子內(nèi)參與共軛的原子比例增加,共軛效應(yīng)增強,最終晶體呈現(xiàn)層狀堆積模式,表現(xiàn)出優(yōu)于TNT的能量(D=7 495 m/s)和安全性能(IS>40 J)。Yang的團隊[13]通過分子內(nèi)環(huán)化反應(yīng)同時制備了兩種層狀含能化合物(見圖4(b)),其中化合物4,6-二硝基-(1H-四唑-基)-1H-吲唑表現(xiàn)出較好的爆轟性能(D=8 518 m/s)和安全性能(Td=316℃、IS=27 J)。
圖4 通過環(huán)化反應(yīng)合成層狀含能材料
在調(diào)控分子間相互作用方面,Feng等[14]利用HBs(氫鍵)和偶極-偶極相互作用,創(chuàng)造了一種很有前途的含能材料NAPTO。NAPTO具有超長二維層狀結(jié)構(gòu)(層間π-π緊密堆積,層間距為2.883 ?),還具有較高的爆轟性能(D=9.12 km/s,P=35.1 GPa)、良好的熱穩(wěn)定性(203.3℃)和良好的對外界刺激的低機械感度(IS=18.0 J,FS=325 N,EDS: 0.32 J)。NAPTO的二維層狀結(jié)構(gòu)可以有效緩沖外界刺激,從而平衡了NAPTO的高能量和良好的機械感度。
層內(nèi)HBs和層間π-π作用是層狀含能晶體堆積結(jié)構(gòu)的主要構(gòu)成要素。Shreeve等[40]提出了一種“層內(nèi)氫鍵配對方法”的快速且簡單的策略,通過逐層堆疊來組織含能分子,從而獲得具有目標特性可調(diào)的含能材料。同時,該團隊[42]還報道了一種合成3-氨基-5-硝基-1,2,4-噁二唑的有效方法,其硝基和氨基在同一個基團上。單晶x射線結(jié)構(gòu)顯示了層狀氫鍵對以及水分子的存在。此外,Feng等[18]提出了一種氫鍵“受體-供體分離”的新策略,通過定向氫鍵來控制含能分子的逐層堆積:即氫鍵的供體和受體位于不同的含能片段,其中至少有一個具有共軛平面結(jié)構(gòu),可使含能片段在二維平面上無限擴展,形成目標層狀結(jié)構(gòu)。
北京理工大學Pang等[46]提出了榫卯策略,以作為“榫”的無環(huán)化合物(二硝基脲的氨基胍鹽)和與之匹配的對應(yīng)化合物(卯)為結(jié)合體,以氫鍵作用為結(jié)合力,構(gòu)建了一個二維的氫鍵環(huán)骨架,從而實現(xiàn)了無環(huán)化合物的層狀堆積。并通過與之對應(yīng)的W型堆積結(jié)構(gòu)進行比較,發(fā)現(xiàn)穩(wěn)定性顯著提高。
利用理論計算方法對含能分子二聚體、團簇甚至晶體堆積進行能量計算或結(jié)構(gòu)預(yù)測,可以從微觀角度推斷層狀結(jié)構(gòu)形成的可能性,從而為實驗合成提供目標化合物,這種設(shè)計思路稱為計算驅(qū)動設(shè)計模式。由于含能分子間的作用較弱,使得分子堆積的結(jié)構(gòu)種類較多,通常需要較多的計算耗時。
中物院Zhang等[47]高通量計算了1,3,5-三硝基苯及其衍生物分子二聚體的相互作用能,嘗試利用熱力學穩(wěn)定的二聚體構(gòu)型關(guān)聯(lián)對應(yīng)晶體結(jié)構(gòu)的堆積模式。結(jié)果發(fā)現(xiàn),平行堆積的二聚體在熱力學上是最穩(wěn)定的,其次是T型、共面型和交叉型。Li[48]利用此類方法,在設(shè)計出的一系列富氮稠環(huán)分子中挑選出數(shù)種性能優(yōu)異的層狀化合物候選分子。
Zhang的團隊[16]提出了一種“共面構(gòu)型搜索”和“點-鏈-面”分子間自組裝的方法(見圖5)來設(shè)計和合成層狀含能晶體。其具體原理為:在二聚體中的分子共面排列情況下,搜尋能量最低的二聚體用于組裝成分子“鏈”,并進一步組裝成分子“面”,其中每一步的組裝都需要判斷其構(gòu)型是否合理,能量是否最低。最終,貫通了從分子、二聚體、分子“鏈”到分子“面”的組裝,成功從426個分子中篩選出層狀化合物DADNP(2-疊氮-5-硝基嘧啶-4,6-二胺)。
圖5 “共面構(gòu)型搜索”和“點-鏈-面”分子間自組裝的方法[16]
本課題組[49]提出了一種從分子到晶體層次的多層級結(jié)構(gòu)設(shè)計策略(見圖6)。受到實驗中已知的具有特定NH2…NO2分子間基序的高能晶體的啟發(fā),通過系統(tǒng)分析結(jié)構(gòu)/組成-性能關(guān)系,建立了一套基于H2N-C-C-NO2部分的設(shè)計和篩選潛在目標分子的識別模式。隨后,利用進化算法USPEX結(jié)合最近開發(fā)的含能分子可極化力場,對可能的晶體結(jié)構(gòu)進行了精確搜索。理論結(jié)果表明,B1(4,4′-二氨基-3,3′-二硝基-[5,5′-二異噁唑]2,2′-二氧化)和C2[(E)-3,3′-(重氮-1,2-二基)雙(4-氨基-5硝基異噁唑-2-氧化物)]是具有良好機械感度(優(yōu)于TNT)和爆轟性能(優(yōu)于FOX-7)的先進層狀含能材料的候選物。
圖6 從分子到晶體層次的多層級結(jié)構(gòu)設(shè)計策略[49]
上述方法在設(shè)計層狀含能晶體中取得了較大進展,但平面分子與堆積模式間的關(guān)聯(lián)尚未建立,特別是在高通量設(shè)計和篩選分子時,無法快速判斷其晶體結(jié)構(gòu)是否為層狀堆積結(jié)構(gòu)。因此,建立分子結(jié)構(gòu)和層狀堆積模式間的關(guān)聯(lián),對于設(shè)計特定堆積結(jié)構(gòu)的含能晶體具有重要指導意義。
當前,在其他領(lǐng)域的簡單體系中已建立了平面分子和堆積模式間的關(guān)聯(lián)。例如,在有機半導體中[51-55],研究發(fā)現(xiàn)當并五苯類的分子表面靜電勢都為正值時,對應(yīng)晶體為人字形堆積結(jié)構(gòu),其O—、N—、F—取代物分子中因具有HBs的受體單元,從而表現(xiàn)出層狀或交叉狀堆積結(jié)構(gòu)。Zhang等[37]通過研究10種分子具有D2h或D3h對稱結(jié)構(gòu)并且晶體為層狀堆積的化合物,提出了一種基于強氫鍵和高對稱分子準則設(shè)計層狀晶體結(jié)構(gòu)的策略。此外,Han等[55]開發(fā)的“Autopack”軟件也被用于自動識別平面分子的堆積模式,并在大樣本空間中研究化學組成與堆積模式間的關(guān)系。
如何準確地預(yù)測層狀晶體結(jié)構(gòu)是基于計算驅(qū)動的重要研究內(nèi)容,但較為困難[26]。原因主要有:分子在高維空間中的不同排列方式導致晶體結(jié)構(gòu)樣本數(shù)量龐大、缺少準確晶格能排序的計算方法以及無法考慮實際結(jié)晶過程中的動力學因素等。此外,在大多數(shù)的晶體結(jié)構(gòu)預(yù)測方法中,往往難以兼顧計算速度和計算精度。
基于高精度分子力場預(yù)測晶體結(jié)構(gòu)是一種能夠兼顧計算速度與計算精度的有效途徑。Rice等[56]開發(fā)了Sorescu-Rice-Thompson(SRT)力場,并用以預(yù)測174個CHON類晶體結(jié)構(gòu),其中成功預(yù)測出149個晶體,但是SRT力場無法準確描述CL-20的分子間相互作用。Pakhnova等[57]利用反應(yīng)力場ReaxFF和進化算法USPEX預(yù)測了PETN、TATB、HMX、TNT、CL-20以及它們的共晶結(jié)構(gòu),其中只成功預(yù)測出PETN、TATB和HMX的晶體結(jié)構(gòu)。
Neumann[58]提出了一種針對每個分子所建立的定制力場(TalilorMade Force Field,TMFF),可成功用于預(yù)測多種化合物的晶體結(jié)構(gòu)。Podeszwa等[59]基于對稱匹配微擾理論(symmetry adapted perturbation theory)計算RDX二聚體的結(jié)合能用于擬合分子間力場,其擬合出的力場成功預(yù)測出RDX晶體結(jié)構(gòu)。Xue[60]針對每個分子建立專屬的力場(OPLS-AA),并成功預(yù)測出3種CL-20晶型(ε-、β-和γ-)。然而,上述過程涉及到繁瑣的二聚體大量抽樣與計算過程以及力場參數(shù)優(yōu)化過程。
本課題組采用AMOEBA可極化力場框架,基于第一性原理計算結(jié)果,開發(fā)了含能材料高精度可極化力場(EMS-PFF)。與COMPASS、DREIDING等經(jīng)典力場相比,EMS-PFF具有更高的計算精度[61]。結(jié)合先進的進化算法,對9種典型硝基平面分子的堆積模式進行了預(yù)測。如圖7所示,其中8種硝基晶體的堆積模式能夠被準確預(yù)測出來,說明EMS-PFF結(jié)合進化算法具有較高的預(yù)測精度[49],可以適用于層狀含能材料的晶體結(jié)構(gòu)預(yù)測。
圖7 九種典型硝基平面分子晶體結(jié)構(gòu)及預(yù)測結(jié)構(gòu)的疊加圖,紅色為實驗結(jié)構(gòu)、藍色為預(yù)測結(jié)構(gòu)[49]
近年來,隨著計算機硬件和大數(shù)據(jù)科學的高速發(fā)展,機器學習有望成為一種變革材料領(lǐng)域傳統(tǒng)“試錯”研發(fā)模式的新興方法。利用機器學習可以從數(shù)據(jù)中自動地歸納規(guī)則或總結(jié)規(guī)律,從而建立材料影響因素與目標性質(zhì)之間的映射關(guān)系,實現(xiàn)性能的預(yù)測與新材料的發(fā)現(xiàn),并輔助科學家從不同的維度深入認知材料的機理特征。
在含能材料領(lǐng)域,機器學習研究的最新熱潮可認為興起于2018年,美國馬里蘭大學Elton等[62]建立了含能材料典型性質(zhì)的多種預(yù)測模型,證明了機器學習從小樣本數(shù)據(jù)集中獲取含能材料信息的能力。2021年,中物院化材所Zhang的團隊[68]利用機器學習實現(xiàn)了新型熔鑄炸藥載體材料的快速發(fā)現(xiàn),通過隨機森林等算法構(gòu)建了5種含能材料性質(zhì)的預(yù)測模型,從近4 000個候選分子中快速篩選出136個目標分子,并成功合成出其中8種,為新型含能材料的快速研發(fā)提供了一種新范式。
當前,機器學習主要用于含能材料結(jié)構(gòu)與性質(zhì)關(guān)聯(lián)模型的構(gòu)建[70-72],以實現(xiàn)目標性質(zhì)的快速預(yù)估,包括晶體密度[62-69]、生成焓[62,63,66]、爆轟性能[6,62,63,67,68,73-76]、熱分解溫度[6,68]、撞擊感度[77]等。其中,晶體密度是決定含能材料爆轟性能的關(guān)鍵參數(shù),但鑒于準確預(yù)測晶體結(jié)構(gòu)比較困難,通常采用基于量化計算的分子體積結(jié)合靜電勢修正的方法(DFT-QSPR)進行預(yù)估[69],平均絕對偏差約為0.044 g/cm3。因晶體密度具有相對較多的實驗數(shù)據(jù),受到了機器學習研究的較大關(guān)注。
如表2所示,研究人員通過不同的特征變量與算法構(gòu)建了多種晶體密度的預(yù)測模型,計算精度可以達到與DFT-QSPR方法相當?shù)某潭?甚至更優(yōu)。更為重要的是,與DFT-QSPR方法的耗時相比,機器學習預(yù)測模型的計算代價十分低廉,非常適用于高通量的虛擬篩選,從而加速新型含能材料的發(fā)現(xiàn)。例如,新加坡南洋理工大學等[66]利用建立的密度與生成焓機器學習模型,從含有約1.5億個分子的PubChem數(shù)據(jù)庫篩選出56個高能分子。加拿大麥吉爾大學Hong Guo等[78]通過建立爆熱的機器學習模型,從PubChem和ICSD數(shù)據(jù)庫中篩選出29個能量水平約為1.8倍TNT的候選分子。
表2 機器學習在含能材料晶體密度預(yù)測中的典型應(yīng)用*
值得注意的是,這些晶體密度預(yù)測模型中的特征變量僅與分子結(jié)構(gòu)信息相關(guān),說明機器學習算法可以在不知道晶體堆積結(jié)構(gòu)的情況下較為準確地預(yù)測晶體密度。最近,四川大學Pu等[80]發(fā)展了一種新的圖神經(jīng)網(wǎng)絡(luò)架構(gòu),可以僅基于兩個分子的結(jié)構(gòu)拓撲信息,預(yù)測二者能否形成共晶。通過對含能共晶、藥物共晶、π-π共晶的獨立測試,結(jié)果顯示模型的預(yù)測準確率高達96%,并實驗合成出一種新的CL-20基含能共晶。這表明機器學習能夠基于實驗已有數(shù)據(jù)自動建立分子結(jié)構(gòu)與晶體堆積之間的關(guān)聯(lián),并快速準確地判斷不同分子之間能否形成有效堆積結(jié)構(gòu)。
在其他領(lǐng)域,基于圖神經(jīng)網(wǎng)絡(luò)的機器學習被用于預(yù)測多環(huán)芳烴化合物的堆積模式,其模型準確率為76%,測試準確率為64%[81],為層狀晶體的快速識別與篩選提供了一種新思路。2022年2月,中物院化材所Zhang的團隊[79]在Engineering期刊上在線報道了機器學習指導合成層狀含能材料的最近進展。該團隊首先利用核嶺回歸算法構(gòu)建了含能分子與密度、爆速、爆壓、熱分解溫度等性質(zhì)的機器學習模型,從25 112個分子中篩選出99個理論爆速大于8 400 m/s和熱分解溫度大于280℃的目標分子。此外,基于22個層狀堆積和365非層狀堆積實驗晶體數(shù)據(jù),借助SMILES生成的獨熱編碼,利用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建了晶體堆積模式的打分函數(shù),用于預(yù)測形成“類石墨”堆積模式的概率,并進一步鎖定了5個合成目標物(晶體堆積模式的打分均在0.5以上)。最終,成功指導實驗合成出ICM-104。其晶體結(jié)構(gòu)上具有顯著的層狀堆積特點,展示出了優(yōu)異的綜合性能(見圖8)。由上述成功案例可見,利用機器學習進行層狀含能材料的理性設(shè)計是一種極具潛力的策略。
圖8 機器學習指導合成“類石墨”含能材料ICM-104[79]
當前,新型層狀含能材料正快速發(fā)展,但其中大部分結(jié)構(gòu)為離子鹽或溶劑化物的多組分晶體,類似TATB的單分子層狀含能晶體的構(gòu)建仍然是重要挑戰(zhàn)。為此,可從數(shù)據(jù)驅(qū)動的角度出發(fā),深入理解層狀晶體的堆積規(guī)律,發(fā)展基于機器學習的高通量設(shè)計方法。
為實現(xiàn)從百萬量級的晶體數(shù)據(jù)庫中快速識別層狀晶體結(jié)構(gòu),基于層狀晶體結(jié)構(gòu)的特點,建議從分子結(jié)構(gòu)和晶體堆積兩方面,從有機晶體數(shù)據(jù)庫中對平面分子進行篩選,篩選判據(jù)可以從元素組成、物理性質(zhì)以及構(gòu)建的平面分子定量化表征和層狀晶體結(jié)構(gòu)定量化表征幾個方面考慮。例如,本課題組通過如圖9(a)所示的篩選流程,從CCDC數(shù)據(jù)庫中的約106個晶體中,篩選出2 000個左右的晶體,篩選條件如下:
圖9 (a)層狀含能材料的篩選流程;(b)部分篩選得到的層狀含能晶體
(1)包含CHON元素;
(2)是單質(zhì)晶體,去除無序結(jié)構(gòu)、聚合物和離子化合物;
(3)密度ρ≥1.5 g/cm3。
然后,從滿足以上3個篩選條件的2 000個左右數(shù)據(jù)中,篩選得到形狀指數(shù)(SI)≤0.01的360個具有平面分子形狀的晶體,最后通過堆積取向系數(shù)PO(接近1)篩選得到62個層狀堆積的晶體,部分結(jié)果如圖9(b)所示。通過數(shù)據(jù)庫的高通量篩選,有助于深入理解層狀堆積含能材料的構(gòu)效關(guān)系,也可為含能材料的機器學習設(shè)計策略提供足夠的數(shù)據(jù)驅(qū)動力。
隨著各類機器學習和深度學習算法的不斷開發(fā),研究人員一方面可以嘗試利用先進的算法訓練獲得較高精度的模型,另一方面可以通過提取特征分子描述符進一步提高預(yù)測精度。在層狀含能晶體的預(yù)測模型中,主要為常見的特征描述符,例如氫鍵的供體和受體數(shù)目、π鍵等。最近,本課題組[82]通過研究10種分子結(jié)構(gòu)相似的CHONF類含能化合物,提取出導致晶體堆積模式差異的主要因素O…C和O…N分子間相互作用。通過識別其在分子結(jié)構(gòu)的結(jié)合位點,結(jié)合靜電勢表面分析發(fā)現(xiàn),該位置為π軌道缺電子區(qū)域,即π-hole(如圖10所示)。鄰近的富電子NO2基團可形成π-hole分子間相互作用,因該種作用具有獨特的方向性,導致了非層狀晶體結(jié)構(gòu)的形成。因此,未來可嘗試將π-hole作為關(guān)鍵特征描述符用于模型訓練。此外,探索挖掘更多的含能分子特征描述符可作為重要的研究方向之一。
圖10 10種CHONF平面分子的表面靜電勢圖,箭頭所指為π-hole區(qū)域的極大值
除特征描述符外,數(shù)據(jù)增強也是實現(xiàn)機器學習高效預(yù)測的重要因素。目前,層狀含能材料的數(shù)量十分有限,因此,可以考慮引入合理的分子生成手段。本課題組建立了基于碎片組合的含能材料高通量分子生成方法,通過制定骨架與基團的鍵聯(lián)規(guī)則,利用SMILES編碼實現(xiàn)碎片結(jié)構(gòu)之間的快速枚舉組合,從而生成大量新型含能分子[30,83-85]。例如,本課題組曾以噁二唑等5個骨架、氧化偶氮橋連鍵、氟代偕二硝基等11個基團為碎片,通過限定骨架連接個數(shù)等規(guī)則,以單鍵鍵聯(lián)的方式將不同碎片之間快速重組,共計生成了超過12萬個多環(huán)CHONF含能分子[83]。這些高通量的分子生成策略可擴充層狀含能材料的數(shù)據(jù)集,有望實現(xiàn)較好的機器學習訓練效果。
本文從經(jīng)驗直覺、理論計算、機器學習3個方面綜述了當前層狀含能材料的主要設(shè)計策略,為后續(xù)層狀含能材料設(shè)計理論與方法的豐富完善提供了參考,有助于加速新型層狀含能材料的創(chuàng)制。更為重要的是,通過對層狀含能材料的理論設(shè)計研究,將發(fā)展出晶體結(jié)構(gòu)預(yù)測等新方法新技術(shù),促進推動含能材料設(shè)計水平從分子層面提升至晶體層面,從而實現(xiàn)面向晶體尺度的含能材料理性設(shè)計。建議未來發(fā)展方向和研究重點如下:
(1)建立層狀含能材料特征的定量化計算方法,實現(xiàn)數(shù)據(jù)庫的高通量篩選,基于統(tǒng)計規(guī)律,深入理解構(gòu)效關(guān)系;
(2)構(gòu)建適合層狀含能材料的特征描述體系,提升機器學習模型預(yù)測精度,實現(xiàn)高通量設(shè)計與篩選。