朱宏偉
清華大學(xué) 材料學(xué)院,北京 100084
2023年12月,DeepMind團(tuán)隊及合作者在英國《自然》雜志上連續(xù)發(fā)表了兩篇關(guān)于人工智能(artificial intelligence, AI)輔助合成新材料的論文[1-2]。研究人員首先利用圖神經(jīng)網(wǎng)絡(luò)來預(yù)測和篩選新材料,然后通過分析大量的材料數(shù)據(jù)對新材料的穩(wěn)定性和物理化學(xué)特性進(jìn)行評估。這不僅加速了新材料的發(fā)現(xiàn)過程,也為理解復(fù)雜材料體系提供了新視角。研究人員進(jìn)一步搭建了一個名為“A-Lab”的自動化實驗室,利用深度學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù),在兩周半的時間內(nèi)篩選并制備出數(shù)十種新材料,極大地提高了合成效率,并顯著降低了研發(fā)成本。這兩項研究可以看作是此前兩項類似工作的“升級版”[3-4],系統(tǒng)展示了AI技術(shù),尤其是深度學(xué)習(xí)與生成式模型在材料科學(xué)領(lǐng)域的應(yīng)用潛力。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個分支,主要通過構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)數(shù)據(jù)的表示和模式[5]。所謂“深度”,即該模型通常由多層神經(jīng)網(wǎng)絡(luò)構(gòu)成(圖1(a)),每一層包含一系列“神經(jīng)元”(或“節(jié)點”)。模型從大量輸入數(shù)據(jù)中提取特征并進(jìn)行學(xué)習(xí),無需人工設(shè)計和選擇。目前,深度學(xué)習(xí)已廣泛應(yīng)用于圖像識別、語音處理、自然語言理解等多種任務(wù),其中的圖神經(jīng)網(wǎng)絡(luò)已成功用于預(yù)測和分析材料的結(jié)構(gòu)與性能,為設(shè)計具有特定功能的新材料鋪平了道路。
圖1 (a)深度神經(jīng)網(wǎng)絡(luò);(b)生成式模型
生成式模型是一種用于學(xué)習(xí)數(shù)據(jù)分布并生成新數(shù)據(jù)的模型[6]。該模型通過捕捉數(shù)據(jù)的內(nèi)在結(jié)構(gòu),進(jìn)而生成與輸入數(shù)據(jù)類似的新數(shù)據(jù)(圖1(b))。最早的生成式模型是“生成對抗網(wǎng)絡(luò)”,由生成器和判別器組成。生成器負(fù)責(zé)生成數(shù)據(jù),判別器負(fù)責(zé)判斷數(shù)據(jù)是來自真實數(shù)據(jù)集還是生成器。通過競爭學(xué)習(xí),生成器逐漸學(xué)會創(chuàng)建逼真的數(shù)據(jù)。變分自編碼器是目前最受關(guān)注的一種生成式模型,利用自編碼器學(xué)習(xí)數(shù)據(jù)的潛在表示,由此生成新數(shù)據(jù)。還有一種條件生成式模型,在給定條件下生成特定類型的數(shù)據(jù)。生成式模型在多種場景中具有廣泛應(yīng)用,如圖像和視頻合成、語音生成、風(fēng)格轉(zhuǎn)換、數(shù)據(jù)增強(qiáng)等。
基于深度學(xué)習(xí)的生成式模型可以有效地預(yù)測新材料的性質(zhì)、合成路徑和穩(wěn)定性,在發(fā)現(xiàn)新材料的同時也能預(yù)測其實驗室合成的可能性,在合成之前即可對材料進(jìn)行初步評估。這對于加速材料的研發(fā)進(jìn)程具有重要意義。
生成式AI善于學(xué)習(xí)和模擬復(fù)雜的數(shù)據(jù)分布。在材料科學(xué)中,這意味著可以從已知的材料數(shù)據(jù)中學(xué)習(xí),再生成全新的、尚未存在的材料結(jié)構(gòu)。這不僅提高了材料設(shè)計的效率,同時增強(qiáng)了研究人員探索未知空間的能力。
如圖2(a)所示,與圖神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)計算方法(如密度泛函理論)結(jié)合,生成式AI通過分析已有材料的物理化學(xué)特性,進(jìn)一步提出新的材料組合和結(jié)構(gòu)(所預(yù)測的數(shù)量比已有實驗結(jié)果高1個數(shù)量級)。生成式AI可以幫助研究人員預(yù)測材料的特定性能,并據(jù)此優(yōu)化材料的化學(xué)組成。此外,生成式AI還能夠提供關(guān)于如何合成這些新材料的建議,從而指導(dǎo)實驗室的合成工作。傳統(tǒng)的材料發(fā)現(xiàn)方法依賴于逐個測試不同組合,過程既費(fèi)時又費(fèi)力。生成式AI通過智能算法預(yù)測可行方案,為實驗提供明確的方向,從而加速新材料的發(fā)現(xiàn)過程,大幅度降低了試錯次數(shù)和實驗成本。
圖2 (a)材料設(shè)計流程;(b)自動化實驗室
自動化實驗室結(jié)合了先進(jìn)的自動化技術(shù)(如機(jī)器人技術(shù))和AI技術(shù)(圖2(b)),徹底改變了科學(xué)研究的范式。自動化實驗室的核心特點包括:
(1)高效的實驗流程:通過機(jī)器人技術(shù)和計算機(jī)控制的實驗裝置,實現(xiàn)實驗流程的高度自動化。從樣品處理到數(shù)據(jù)收集,幾乎所有步驟都可以在無人干預(yù)的情況下自主進(jìn)行。
(2)快速的數(shù)據(jù)處理:結(jié)合深度學(xué)習(xí)算法,快速分析大量實驗數(shù)據(jù)并進(jìn)行模式識別,預(yù)測實驗結(jié)果并提出新的假設(shè)。
(3)精準(zhǔn)的實驗設(shè)計:基于現(xiàn)有數(shù)據(jù)和預(yù)測模型來設(shè)計新實驗,優(yōu)化反應(yīng)條件,提高實驗的成功率和效率。
在材料科學(xué)領(lǐng)域,自動化實驗室可用于快速篩選、合成和測試新材料(如能源材料、信息材料、催化材料、復(fù)合材料等),其普遍應(yīng)用預(yù)示著一個更加高效和智能的科學(xué)研究時代的來臨。隨著技術(shù)的不斷進(jìn)步,自動化實驗室將能夠處理更復(fù)雜的任務(wù),更深入地探索未知的科學(xué)領(lǐng)域,在藥物開發(fā)、環(huán)境監(jiān)測、食品安全、極端作業(yè)等更廣泛的領(lǐng)域發(fā)揮重要作用。
隨著研發(fā)需求的進(jìn)一步提升,下一代生成式AI的發(fā)展趨勢是在現(xiàn)有生成式模型基礎(chǔ)上引入“可解釋性”。可解釋AI (explainable artificial intelligence, XAI)指的是那些不僅能夠提供預(yù)測和決策,且以人類可以理解的方式解釋其決策過程和結(jié)果的AI系統(tǒng)[7]。這種解釋能力使AI的決策過程更加透明,即用戶可以理解AI是如何工作的,以及輸出是基于什么原理(圖3)。表1列出了XAI的主要特點。
表1 XAI的主要特點
圖3 AI與XAI對比:從“黑箱”到“白箱”
XAI在材料科學(xué)領(lǐng)域的應(yīng)用預(yù)示著一個更加深入、高效和透明的研究新時代。XAI將在以下幾個關(guān)鍵方面進(jìn)一步助力材料科學(xué)發(fā)展:①加深對材料行為的理解:提供材料性能和行為背后的深層機(jī)理,協(xié)助研究人員更好地設(shè)計實驗,調(diào)控材料性能,甚至發(fā)現(xiàn)新規(guī)律;②提升實驗設(shè)計的效率:在材料合成和表征過程中,XAI可以推薦特定合成路徑和實驗條件,幫助研究人員做出更明智的決策;③加速新材料的發(fā)現(xiàn):通過解讀AI的預(yù)測結(jié)果,研究人員可以快速識別那些有潛力的新材料組合,加速從理論到實驗室的轉(zhuǎn)化;④提高材料性能預(yù)測準(zhǔn)確性:可解釋性提高了AI模型的透明度,使研究人員能夠更準(zhǔn)確地預(yù)測材料的性質(zhì);⑤提高跨學(xué)科合作的效率:XAI可為非專家提供通俗易懂的解釋,促進(jìn)不同學(xué)科之間的交流和合作;⑥確保研究的可靠性和合規(guī)性:在面臨嚴(yán)格的科研合規(guī)性要求時,XAI提供的詳細(xì)決策過程記錄有助于驗證研究的合法性和科學(xué)性;⑦加強(qiáng)模型的改進(jìn)和迭代:當(dāng)AI模型輸出不準(zhǔn)確或意外的結(jié)果時,可解釋性有助于研究人員快速識別和修正模型中的錯誤,從而不斷優(yōu)化模型。綜上,XAI不但能加速新材料的發(fā)現(xiàn)和性能優(yōu)化,還能提高整個研究過程的透明度和可信度,將逐漸成為材料科學(xué)未來發(fā)展的關(guān)鍵動力。
深度學(xué)習(xí)、生成式模型和自動化實驗室等先進(jìn)AI技術(shù)的飛速發(fā)展,不僅極大地推動了新材料的設(shè)計和合成方法的創(chuàng)新,也為下一代基于智能材料的計算架構(gòu)的構(gòu)建奠定了基礎(chǔ)[8-10]。隨著AI的應(yīng)用越來越廣泛,從技術(shù)到道德、法律層面,具有可解釋性的生成式AI的重要性將不斷顯現(xiàn)。XAI為解決能源、環(huán)境、信息等領(lǐng)域的挑戰(zhàn)提供了強(qiáng)大的工具。從實驗室到工業(yè)應(yīng)用,從基礎(chǔ)研究到實際產(chǎn)品,AI技術(shù)正引領(lǐng)人類走向一個更加先進(jìn)、可持續(xù)的未來。