禹新良,李明旺,吳旨進,謝 健,黃小可,黃賽金
(湖南工程學(xué)院 材料與化工學(xué)院,湘潭 411104)
有機發(fā)光二極管(OLED)已經(jīng)應(yīng)用于商業(yè)展示,被認為是下一代照明技術(shù)重要的候選材料[1-2].OLED 面板結(jié)構(gòu)通常由陽極、空穴注入層、空穴傳輸層、有機發(fā)光層、電子傳輸層、電子注入層、陰極及基板組成.發(fā)光層是OLED 的核心部件,有機發(fā)光材料能將電子轉(zhuǎn)換成光源[3-4].
熱應(yīng)力對OLED 器件性能的影響還未得到廣泛研究[5-6].OLED 受到的熱應(yīng)力來自設(shè)備運行或外部環(huán)境,有報道表明暴露在較高溫度的環(huán)境中可能導(dǎo)致OLED 性能的顯著下降[6-7].OLED 性能在熱應(yīng)力下的退化可能與發(fā)光層出現(xiàn)從玻璃態(tài)向高彈態(tài)轉(zhuǎn)變,繼而使器件層形貌結(jié)構(gòu)發(fā)生改變有關(guān).因為形貌結(jié)構(gòu)的變化會導(dǎo)致電荷注入和傳輸?shù)牟黄胶?,從而減少激子的形成、影響輻射衰減[8-10].因此,為了實現(xiàn)OLED 器件的穩(wěn)定,有必要發(fā)展高玻璃化轉(zhuǎn)變溫度(Tg)的OLED 器件發(fā)光層有機材料[9-10].
玻璃化轉(zhuǎn)變溫度(Tg)是材料從玻璃態(tài)向高彈態(tài)轉(zhuǎn)變的溫度.Tg值可以通過各種實驗技術(shù)測定,如差示掃描量熱法(DSC)、熱機械分析(TMA)和動態(tài)機械分析(DMA).不同的測量可能會得出不同的結(jié)果,例如,DSC 方法在測量BNpA-1T 的Tg中,Tg值可以取為360 K、364 K、369 K,分別對應(yīng)于玻璃化轉(zhuǎn)變溫度DSC 曲線中的起始點、中點、終點[11].此外,在DSC 測量中,所獲得的Tg值還受到加熱速率等其他因素影響.
定量結(jié)構(gòu)-性能關(guān)系(QSPR)模型可用于估算材料的Tg值.QSPR 研究基于的假設(shè)是分子結(jié)構(gòu)決定分子的性質(zhì),具有相似結(jié)構(gòu)的分子具有相似的性質(zhì).QSPR 的主要目標是基于統(tǒng)計方法建立分子結(jié)構(gòu)參數(shù)與性質(zhì)的定量關(guān)系式及模型.一旦模型得以建立,就可以預(yù)測分子的性質(zhì),哪怕是實驗室尚未合成的物質(zhì)[11].
已有學(xué)者采用QSPR 模型對OLED 中有機發(fā)光材料Tg進行了預(yù)測.YIN 等[12]、XU 等[13]分別建立了有機發(fā)光材料Tg的含6 個分子參數(shù)和5 個分子參數(shù)的QSPR 模型.使用線性回歸方法建立的兩個模型都較精確,R2分別為0.927 0[12]和0.930 4[13].Barbosa da Silva 等[14]利用支持向量機(SVM)算法建立了66 種有機發(fā)光材料logTg的QSPR.該模型雖然精確(R2=0.962 6),但模型包含的分子參數(shù)(m=20)太多,因為在QSPR 研究中要求樣本(n)和分子參數(shù)(m)之間的比率(n/m)應(yīng)該大于5,顯然該模型不滿足此要求.QSPR 模型中使用的分子參數(shù)過多可能會增加模型的復(fù)雜性.最近,Zhao 等[11]構(gòu)建了一個包含1 944 種有機發(fā)光材料Tg的QSPR 模型.使用LightGBM 算法開發(fā)的模型,其均方根誤差為24.63 K,決定系數(shù)R2為0.77.雖然模型精確性有待提高,但所建模型具有統(tǒng)計意義.本文將采用隨機森林回歸方法建立以Tg/MW作為因變量更為精確的QSPR 模型.
從文獻[11]得到1 944 種有機發(fā)光材料及其Tg值.將Tg值轉(zhuǎn)換成Tg/MW值(MW為化合物分子量),按照該值大小進行升序排列,新序號是5 的倍數(shù)的樣本作為測試集(n=388),剩余樣本為訓(xùn)練集(n=1 556).從訓(xùn)練集得到QSPR 模型,測試集對模型進行檢驗.
采用ChemDraw Ultra 8.0 軟件構(gòu)建分子的二維結(jié)構(gòu),用Chem3D Ultra 8.0 將其轉(zhuǎn)換成3D 結(jié)構(gòu),并采用其中的AM1 方法對分子結(jié)構(gòu)進行優(yōu)化.最后采用Dragon 6.0 對分子進行參數(shù)計算,每個分子分別計算4 885 個分子參數(shù).對那些參數(shù)值接近常數(shù)或偏相關(guān)性系數(shù)大于0.9 的參數(shù)予以剔除,最終得到472 個分子參數(shù)用于逐步回歸分析.
以計算所得的472 個分子參數(shù)作為自變量,1 944 種樣本的Tg/MW作為因變量,用SPSS 19.0 對它們進行逐步回歸分析.表1為模型概要,以R2≥0.005作為模型引進新參數(shù)標準,得到7 個分子參數(shù),其定義見表2.基于所得參數(shù)子集,從訓(xùn)練集得到線性模型,決定系數(shù)R2為0.874,模型系數(shù)見表3.然后對測試集388 個樣本進行預(yù)測,其相關(guān)系數(shù)R2為0.875.測試集與訓(xùn)練集R2值接近,模型不存在過擬合問題.此外,所得模型決定系數(shù)R2>0.87,大于文獻報道值R2=0.77,且大于模型接受標準R2>0.5,具有統(tǒng)計意義.Tg/MW實驗值與線性模型計算值關(guān)系如圖1所示.
圖1 Tg/MW實驗值與線性模型計算值關(guān)系圖
表1 模型概要
表2 挑選的分子參數(shù)、類別及定義
表3 模型系數(shù)
考慮到分子結(jié)構(gòu)參數(shù)與因變量Tg/MW可能存在非線性關(guān)系,本文采用隨機森林回歸建立它們的非線性模型.基于程序包RandomForest 在MATLAB R2014a 平臺運行得到[15-16].由于參數(shù)nodesize(決策樹節(jié)點的最小個數(shù))一般對模型預(yù)測性能影響不大,本文取其默認值(nodesize=5).先固定mtry(構(gòu)建決策樹分支時隨機抽樣的變量個數(shù))=2,決策樹數(shù)目ntree從100 變動到600,步長為100,結(jié)果顯示ntree=200,mtry=2 時產(chǎn)生的結(jié)果較理想.接著,固定參數(shù)nodesize=5,ntree=200,從1 變化到6,步長設(shè)置為1.最終結(jié)果顯示,nodesize=5,ntree=200,mtry=2 為最佳模型參數(shù),所得隨機森林回歸模型產(chǎn)生的訓(xùn)練集R2=0.979,測試集R2=0.893,高于線性回歸結(jié)果.因此,本文所用分子結(jié)構(gòu)參數(shù)與因變量Tg/MW確實存在非線性關(guān)系.實驗與隨機森林模型計算Tg/MW值關(guān)系如圖2 所示.
圖2 Tg/MW實驗值與隨機森林模型計算值關(guān)系圖
比較圖1 與圖2 可以發(fā)現(xiàn),圖2 散點更接近對角線,意味著隨機森林模型預(yù)測值更準確.
|t|值大小反映參數(shù)對因變量Tg/MW的貢獻程度.根據(jù)表3中的t檢驗,參數(shù) ||t值按照以下順序遞減:HATS4i、SM04-AEAdm、R2i、RBN、Chi-DDt、SpMax5-Bhm、Yindex,它們的顯著性也是照此順序遞減.表3 顯示,所有參數(shù)的Sig.值(p值)均小于0.001,接近0,表明參數(shù)均為顯著性參數(shù);另外,參數(shù)的膨脹因子VIF值小于10,表明參數(shù)間共線性問題不嚴重.
參數(shù)SM04_AEAdm是基于偶極矩加權(quán)的、從邊緣鄰接矩陣計算得到的4 階譜矩.該參數(shù)能反映分子碎片圖連接方式.參數(shù)SM04-AEAdm越大,表明分子體積越大,鏈的旋轉(zhuǎn)就越困難,分子玻璃化轉(zhuǎn)變溫度越高.另一方面,分子體積越大,其分子量也越大,MW值越大,從而Tg/MW值降低.因此SM04-AEAdm與Tg/MW相關(guān).
參數(shù)RBN定義為分子中旋轉(zhuǎn)鍵的數(shù)目,該參數(shù)能反映分子單鍵數(shù)目,但不包含C-N 單鍵,因為其具有高的旋轉(zhuǎn)勢能.分子旋轉(zhuǎn)單鍵數(shù)目越多,分子柔性越好,玻璃化溫度就越低,因而RBN與Tg/MW負相關(guān).
參數(shù)HATS4i能反映分子中原子i與j之間相互作用、分子對稱性等信息,并且能反映同系物中分子的差異.而對稱性是影響分子玻璃化溫度的一個重要因素,對稱性越好,分子旋轉(zhuǎn)越容易,Tg越低.因此Tg與HATS4i負相關(guān).
參數(shù)Chi_DDt基于分子圖理論,從距離矩陣導(dǎo)出.Chi_DDt能反映分子成環(huán)信息.通常分子的環(huán)結(jié)構(gòu)如苯環(huán)、苯并噻唑、苯并噁唑都是剛性環(huán).這些環(huán)結(jié)構(gòu)的存在能增加分子的玻璃化轉(zhuǎn)變溫度Tg.因此,Chi_DDt與Tg正相關(guān).
參數(shù)SpMax5_Bhm基于分子鍵序與分子圖的Burden矩陣.該類參數(shù)常用于描述大數(shù)據(jù)集中分子相似性或差異性.SpMax5_Bhm與參數(shù)SM04_AEAdm類似,較大的SpMax5_Bhm值表示分子體積越大,從而影響分子的旋轉(zhuǎn),并增大玻璃化轉(zhuǎn)變溫度Tg.
參數(shù)R2i與HATS4i類似,同屬于GETAWAY(GEometry,Topology,and Atom-Weights AssemblY)參數(shù),反映分子形狀與大小.但參數(shù)R2i反映分子幾何、拓撲圖中原子之間的距離.分子量MW越大,經(jīng)電離勢加權(quán)的R2i越大.由于R2i反映的特征如基團或碎片如-C(=O)N-在空間的有效位置,而這些基團屬于剛性基團,從而影響分子的玻璃化轉(zhuǎn)變溫度Tg.
參數(shù)Yindex能反映分子在空間的拓撲距離.與HATS4i相似,能反映分子中原子i與j之間相互作用、分子對稱性等信息.較小的分子如(No.513)CCCC(C)(C)[Si](C)(C)N1C(=O)C=CC1=O 及樣本(No.1591)CC(C)(C)[Si](C)(C)N1C(=O)C=CC1=O,對稱性低,但其玻璃化轉(zhuǎn)變溫度Tg卻高,分別為477.15K、489.15K.
本文將1 944種用于OLED 的有機發(fā)光材料分成訓(xùn)練集和測試集.從訓(xùn)練集(1 556 種)得到的線性回歸方程決定系數(shù)R2=0.874,測試集(388 種)R2=0.875.而基于隨機森林回歸模型(nodesize=5,ntree=200,mtry=2)產(chǎn)生的訓(xùn)練集R2=0.979,測試集R2=0.893,分別高于線性回歸模型結(jié)果,表明所選參數(shù)與Tg/MW存在非線性關(guān)系.且本文模型精度均高于文獻報道值,表明所選參數(shù)能反映影響Tg/MW或Tg的結(jié)構(gòu)因素.