張帥帥, 郭俊華, 劉華東, 張穎莉, 肖相國, 梁海鋒*
1. 西安工業(yè)大學(xué)光電工程學(xué)院, 陜西 西安 710021
2. 西安應(yīng)用光學(xué)研究所, 陜西 西安 710065
亞波長光柵的周期比入射光小的多, 只有零級衍射光波, 其他級次的光都為倏逝波。 在光學(xué)、 光電子學(xué)等許多領(lǐng)域被廣泛應(yīng)用, 成為現(xiàn)代儀器儀表中不可或缺的重要功能器件。 亞波長光柵體積小、 偏振性能好、 允許入射角度大、 易于集成等優(yōu)點, 被廣泛的應(yīng)用在傳感[1], 濾光片光譜調(diào)控[2]和太陽能光伏吸收薄膜等領(lǐng)域[3]。 通過調(diào)節(jié)光柵的幾何結(jié)構(gòu), 可以對入射光譜進(jìn)行調(diào)控。 亞波長光柵的這種特性被深入研究, 并廣泛應(yīng)用于陷波濾光片。
傳統(tǒng)的設(shè)計方法是, 通過給定光柵幾何結(jié)構(gòu), 模擬出其光譜特性, 經(jīng)過優(yōu)化迭代給出光譜響應(yīng)曲線, 稱為正向模擬設(shè)計; 設(shè)計中主要使用嚴(yán)格耦合波分析法(RCWA), 時域有限差分法(FDTD), 有限元建模(FEM)等求解麥克斯韋方程組來計算光譜曲線。 但是根據(jù)需求的光譜曲線逆向設(shè)計并求解光柵的幾何參數(shù), 經(jīng)典設(shè)計理論遇到瓶頸。 相比于正向模擬設(shè)計, 真正的逆向模擬設(shè)計方法和理論鮮有報道。
在光柵設(shè)計優(yōu)化方面, 傳統(tǒng)數(shù)值優(yōu)化方法, 如遺傳算法, 最速下降法, Newton法和共軛梯度法等, 有相對較快的收斂速度, 計算精度高, 但求得的是局部最優(yōu)解。 對全局優(yōu)化問題, 下降軌線法, 隧道法等收斂快, 計算效率高, 但算法復(fù)雜, 求得全局極值的概率不大[4]。 Monte-Carlo隨機(jī)試驗法, 模擬退火算法[5]等容易實現(xiàn), 但收斂較慢, 效率低。 上述算法都需要大量的計算, 消耗大量的時間才能找到一種合適的設(shè)計, 且每次針對新的光柵設(shè)計時所需的資源消耗是疊加的, 且只保留最優(yōu)結(jié)果, 在優(yōu)化過程中先前生成的數(shù)據(jù)都會被摒棄, 耗費大量的資源。 原因是, 上述優(yōu)化算法依然取決于求解麥克斯韋方程組, 根據(jù)設(shè)計目標(biāo), 引入評價函數(shù)和優(yōu)化策略, 其本質(zhì)仍然屬于正向設(shè)計的一部分。
最近, 深度學(xué)習(xí)已經(jīng)被引入到光學(xué)領(lǐng)域的諸多方面。 在將光學(xué)器件的設(shè)計優(yōu)化與深度學(xué)習(xí)相結(jié)合的探索中, 國外的研究者率先展開了研究。 2020年Han[6]等基于卷積神經(jīng)網(wǎng)絡(luò), 在可見光范圍內(nèi)對不規(guī)則的二維亞波長光柵結(jié)構(gòu)進(jìn)行了研究, 將隨機(jī)生成的光柵形狀與周期作為輸入變量, 分別設(shè)計了正向模擬網(wǎng)絡(luò)與逆向設(shè)計網(wǎng)絡(luò), 實現(xiàn)了快速高效的高自由度的逆設(shè)計, 其中正向模擬網(wǎng)絡(luò)完成訓(xùn)練之后, 消耗時間僅為RCWA數(shù)值模擬的1/20 000。 2018年Liu[7]在0.4~1.2 μm范圍內(nèi), 對于16層膜系結(jié)構(gòu)進(jìn)行了網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計, 同時提出了一種串聯(lián)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu), 首先訓(xùn)練一個正向設(shè)計網(wǎng)絡(luò), 將設(shè)計映射到光學(xué)響應(yīng)。 然后, 將該訓(xùn)練好的前向網(wǎng)絡(luò)連接到逆向設(shè)計網(wǎng)絡(luò)的輸出, 并將前向預(yù)測誤差作為監(jiān)視信號。 通過在這種串聯(lián)網(wǎng)絡(luò)中進(jìn)行間接的訓(xùn)練, 解決了數(shù)據(jù)不一致性導(dǎo)致的深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練無法擬合的問題。 John Peurifoy[8]等使用神經(jīng)網(wǎng)絡(luò)模擬計算多層納米粒子的光散射, 從模型中獲得的分析梯度用于結(jié)構(gòu)優(yōu)化, 給出了光譜中的特定要求; 在深度學(xué)習(xí)的分析指導(dǎo)下, 核殼納米粒子的單帶高散射效應(yīng)可以得到有效優(yōu)化。 并分別對深度神經(jīng)網(wǎng)絡(luò)和內(nèi)點法, 在相同的誤差閾值下運行時間進(jìn)行了比較, 結(jié)果表明神經(jīng)網(wǎng)絡(luò)的運行時間比內(nèi)點法短兩個數(shù)量級。 Takashi Asano[9]等使用卷積神經(jīng)網(wǎng)絡(luò)分析光子晶體的Q因子, 使用反向傳播優(yōu)化納米腔的位置, 使得Q因子從3.8×10-9提高至1.6×10-9, 由于共振的各種模式, 光譜和光信號在時域中會有各種線形。 而RNN適用于對時域中具有特定線形的光信號或光譜建模。 與CNN結(jié)合使用時, RNN也用于改善圖像中表示的納米結(jié)構(gòu)的光學(xué)響應(yīng)的近似值。 Christopher等[10]2020年在4~12 μm的中紅外波段內(nèi), 將二維光柵的結(jié)構(gòu)設(shè)置為十字結(jié)構(gòu), 通過調(diào)整結(jié)構(gòu)的大小與位置得到不同的吸收光譜, 以此為訓(xùn)練數(shù)據(jù)設(shè)計了串聯(lián)神經(jīng)網(wǎng)絡(luò)。 Jiang[11]等在2019年探索了將生成對抗網(wǎng)絡(luò)與伴隨優(yōu)化算法框架耦合在一起的方法。 已經(jīng)證明可以在標(biāo)記拓?fù)鋬?yōu)化的亞光柵設(shè)計上有效訓(xùn)練條件GAN, 以快速生成大量的高效器件設(shè)計, 與傳統(tǒng)的拓?fù)鋬?yōu)化相比, GAN輔助優(yōu)化的效率高出5倍。
上述工作證實了深度學(xué)習(xí)在設(shè)計特定光譜應(yīng)用中潛力巨大, 由于受深度學(xué)習(xí)方法的限制, 對某一類應(yīng)用, 需要特定學(xué)習(xí)集, 經(jīng)過訓(xùn)練后實現(xiàn)特定的功能。 陷波濾光片是一類特殊的光學(xué)應(yīng)用, 受最近工作的啟發(fā), 提出了一種基于深度學(xué)習(xí)的一維周期性的亞波長光柵設(shè)計, 如圖1所示。 所設(shè)計的亞波長光柵濾光片由亞波長光柵層, 以及玻璃基板上的均勻波導(dǎo)層組成。 其中H1表示光柵深度,H2表示均勻波導(dǎo)層的厚度,F(xiàn)為光柵占空比,Λ為光柵周期,N為光柵以及波導(dǎo)層折射率。
圖1 一維亞波長光柵結(jié)構(gòu)圖
為了克服傳統(tǒng)亞波長光柵設(shè)計優(yōu)化所面臨的核心問題, 分別設(shè)計了正向神經(jīng)網(wǎng)絡(luò)(不需要計算Maxswell方程組), 逆向設(shè)計網(wǎng)絡(luò)以及串聯(lián)神經(jīng)網(wǎng)絡(luò), 以實現(xiàn)高精度, 高效率, 響應(yīng)時間快的特性。 其中正向神經(jīng)網(wǎng)絡(luò)模擬光譜響應(yīng), 逆向神經(jīng)網(wǎng)絡(luò)設(shè)計光柵參數(shù)。 設(shè)計完成的神經(jīng)網(wǎng)絡(luò)通過學(xué)習(xí)RCWA數(shù)值模擬的仿真數(shù)據(jù), 不需要再次求解麥克斯韋方程組便能預(yù)測出亞波長光柵的光譜響應(yīng), 并且能精確的逆向設(shè)計光柵結(jié)構(gòu), 無需迭代優(yōu)化, 可將優(yōu)化設(shè)計時間縮短多個數(shù)量級。
為了設(shè)計亞波長光柵結(jié)構(gòu)的窄帶陷波濾光片, 設(shè)計了圖2所示神經(jīng)網(wǎng)絡(luò)。 正向模擬的網(wǎng)絡(luò)結(jié)構(gòu)如圖2(a), 包括輸入層, 多個隱藏層以及輸出層。
圖2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
輸入層5個節(jié)點分別為, 光柵高度H1(0.01~0.09 μm), 波導(dǎo)層厚度H2(0.09~0.19 μm), 光柵周期Λ(0.2~0.4 μm), 光柵折射率N(1.5~2.4), 占空比F(0.4~0.75)。 對不同個數(shù)的隱藏層以及隱藏層中包含的不同個數(shù)的神經(jīng)節(jié)點進(jìn)行測試以及比對。 層數(shù)為5層時, 網(wǎng)絡(luò)無法收斂, 均方誤差較大; 層數(shù)為3層時, 雖然消耗時間較少, 但均方誤差為4層時的十倍。 最終設(shè)置網(wǎng)絡(luò)的隱藏層個數(shù)為4, 4個隱藏層的神經(jīng)元個數(shù)分別為(50, 200, 500, 200), 詳細(xì)評價指標(biāo)列于表1, 表2。 輸出層26個節(jié)點, 對應(yīng)可見光范圍0.45~0.7 μm內(nèi)的26個點, 步長為0.01 μm, 作為光譜響應(yīng)特征曲線。 Batch_szie為網(wǎng)絡(luò)每一次訓(xùn)練所選取的樣本數(shù), 影響著模型的優(yōu)化程度和速度。 Batch_szie設(shè)置過小訓(xùn)練精度高, 但消耗時間越長需要的迭代次數(shù)越高, 可能造成內(nèi)存爆炸。 Batch_szie過大消耗時間少, 但是過大可能會導(dǎo)致迭代無法收斂。 因此需要選取合適的Batch_szie使得網(wǎng)絡(luò)達(dá)到最優(yōu)。 合適的Batch_szie選取可以使得梯度下降更加準(zhǔn)確, 達(dá)到良好的訓(xùn)練效果, 通過對不同大小的測試, 最終選取Batch_size大小為128, 詳細(xì)評價列于表3。
表1 不同隱藏層層數(shù)的評價指標(biāo)
表2 不同網(wǎng)絡(luò)結(jié)構(gòu)的評價指標(biāo)
表3 不同Batch_size的評價指標(biāo)
正向模擬的作用是根據(jù)輸入的光柵幾何結(jié)構(gòu)參數(shù)來迅速, 精確的得到光譜響應(yīng)曲線。 而逆向設(shè)計的作用是根據(jù)期望光譜響應(yīng)快速設(shè)計出光柵的幾何結(jié)構(gòu)。 逆向設(shè)計的網(wǎng)絡(luò)結(jié)構(gòu)如圖2(b), 網(wǎng)絡(luò)結(jié)構(gòu)與正向模擬的網(wǎng)絡(luò)結(jié)構(gòu)相反, 輸入層為期望光譜曲線量化的26個點, 輸出為光柵的5個結(jié)構(gòu)參數(shù)。
為了使網(wǎng)絡(luò)能夠良好的運行并達(dá)到預(yù)期的效果, 基于RCWA模擬仿真生成數(shù)據(jù)集, 數(shù)據(jù)集的建立包括光柵的幾何結(jié)構(gòu)參數(shù), 其對應(yīng)的光譜響應(yīng)曲線, 以及數(shù)據(jù)標(biāo)簽。 光柵的幾何結(jié)構(gòu)如圖1, 以Si2O為光柵基底, 入射光為TE偏振光, 垂直入射光柵表面。 通過改變光柵層以及波導(dǎo)層的折射率、 高度、 周期、 占空比, 得到不同的數(shù)據(jù)。 取可見光波段0.45~0.7 μm的波長范圍, 每0.01 μm取一個點, 總共取26個點來量化光柵的反射光譜響應(yīng)T(t1,t2,t3, …,t26)。 將訓(xùn)練好的數(shù)據(jù)集80%作為訓(xùn)練集, 20%作為測試集, 設(shè)置網(wǎng)絡(luò)的損失函數(shù)為
(1)
(2)
Zl=Wlal-1+bl
(3)
al-1=σ(Zl-1)
(4)
Sigmoidσ=1/(1+e-Z)
(5)
ReLUσ=max(0,Z)
(6)
其中σ為激活函數(shù), 激活函數(shù)的作用是加入非線性因素, 提高神經(jīng)網(wǎng)絡(luò)對模型的表達(dá)能力, 解決線性模型不能解決的問題。 隱藏層的激活函數(shù)設(shè)置為ReLU函數(shù), 具有收斂速度快的優(yōu)點。 輸出層設(shè)置為Sigmoid激活函數(shù), 適用于線性回歸層。Z為網(wǎng)絡(luò)的神經(jīng)節(jié)點; 輸入層的神經(jīng)節(jié)點為5, 隱藏層的輸出節(jié)點分別為(50, 200, 500, 200)。W為網(wǎng)絡(luò)的權(quán)值,b為網(wǎng)絡(luò)的偏置,l為網(wǎng)絡(luò)層數(shù), 包含輸入層, 輸出層以及四個隱藏層, 輸入層為第0層。
訓(xùn)練過程中使用Adam梯度下降算法, 進(jìn)行參數(shù)優(yōu)化
(7)
(8)
(9)
(10)
(11)
同理
(12)
其中t為當(dāng)前迭代次數(shù),β1和β2為控制兩個指數(shù)加權(quán)平均值的超參數(shù), 一般設(shè)置為0.9, 0.999。α為學(xué)習(xí)率, 其初始值設(shè)置為0.002。ε用于避免分母為零, 一般為1×10-8。 通過計算之前梯度的指數(shù)加權(quán)平均值, 和之前梯度平方的指數(shù)加權(quán)平均值。 分別將其存儲在變量ν(偏差校正前),νcorrected(偏差校正后)和s(偏差校正前),scorrected(偏差校正后)之中。 通過Adam梯度下降算法不斷的更新W,b, 得到最佳值。
為了使網(wǎng)絡(luò)運行達(dá)到預(yù)期的目標(biāo), 建立了23 100組數(shù)據(jù)。 在訓(xùn)練過程中發(fā)現(xiàn), 正向模擬訓(xùn)練效果良好, 收斂速度快, 如圖3(a)所示。 在逆向設(shè)計的時候, 由于數(shù)據(jù)集中數(shù)據(jù)量龐大, 有相似的光譜響應(yīng)對應(yīng)不同的光柵結(jié)構(gòu)參數(shù), 造成單輸入對應(yīng)多輸出的問題, 使得網(wǎng)絡(luò)無法找到最優(yōu)解, 迭代無法收斂, 如圖3(b)所示。 例如兩個不同的光柵結(jié)構(gòu)Ma和Mb, 有相似的光譜響應(yīng)曲線, 當(dāng)神經(jīng)網(wǎng)絡(luò)在訓(xùn)練的過程中有兩個數(shù)據(jù)(Ma,T)與(Mb,T)時訓(xùn)練將難以收斂, 因為這兩個數(shù)據(jù)為網(wǎng)絡(luò)提供了兩個不同的答案, 使得網(wǎng)絡(luò)無法達(dá)到訓(xùn)練的目的。 神經(jīng)網(wǎng)絡(luò)的調(diào)控是通過最小化Loss函數(shù)來完成訓(xùn)練目的的, 在逆向設(shè)計中Loss函數(shù)為
圖3 (a)正向模擬損失函數(shù)曲線; (b) 逆向設(shè)計損失函數(shù)曲線
(13)
為了克服數(shù)據(jù)的非唯一性導(dǎo)致的迭代無法收斂的問題, 使用一種串聯(lián)的神經(jīng)網(wǎng)絡(luò)(TNN)[9]如圖4, 將先前建立的正向模擬神經(jīng)網(wǎng)絡(luò)(紅框部分)與逆向設(shè)計網(wǎng)絡(luò)連接在一起, 中間層為光柵的結(jié)構(gòu)參數(shù)D(藍(lán)色部分), 整個串聯(lián)網(wǎng)絡(luò)的輸入為目標(biāo)光譜R, 串聯(lián)網(wǎng)絡(luò)的輸出是根據(jù)逆向設(shè)計得到的光柵結(jié)構(gòu)參數(shù)D′, 輸入已經(jīng)訓(xùn)練完成的正向模擬網(wǎng)絡(luò)所得到的預(yù)測光譜響應(yīng)R′。 在串聯(lián)網(wǎng)絡(luò)運行之前, 先將訓(xùn)練好的正向網(wǎng)絡(luò)的權(quán)重Wf與偏置bf設(shè)定。 然后通過Loss函數(shù)調(diào)整逆向設(shè)計網(wǎng)絡(luò)的權(quán)重Wi與偏置bi。 與先前兩種網(wǎng)絡(luò)不同的是, 串聯(lián)網(wǎng)絡(luò)的損失函數(shù)計算的是輸入光譜R與輸出光譜R′之間的均方誤差
(14)
該Loss函數(shù)定義為預(yù)測光譜響應(yīng)和目標(biāo)光譜響應(yīng)之間的均方誤差。 這種網(wǎng)絡(luò)結(jié)構(gòu)克服了逆向設(shè)計網(wǎng)絡(luò)的非唯一性問題, 因為網(wǎng)絡(luò)的設(shè)計結(jié)果不需要與訓(xùn)練樣本中的實際設(shè)計相同。 相反, 只要生成的幾何結(jié)構(gòu)參數(shù)和實際設(shè)計的幾何結(jié)構(gòu)參數(shù)具有相似的響應(yīng), Loss函數(shù)就會很低。
為了測試串聯(lián)網(wǎng)絡(luò)的逆向設(shè)計能力, 使用RCWA數(shù)值模擬任意三個光柵的光譜響應(yīng)曲線, 并將光譜曲線輸入串聯(lián)網(wǎng)絡(luò), 得到光柵結(jié)構(gòu)參數(shù), 將串聯(lián)網(wǎng)絡(luò)給出的結(jié)構(gòu)參數(shù)與RCWA數(shù)值模擬的結(jié)構(gòu)參數(shù)列于表4, 并作出串聯(lián)神經(jīng)網(wǎng)絡(luò)的Loss函數(shù)圖, 如圖5所示。
表4 結(jié)構(gòu)參數(shù)對比
圖5 串聯(lián)網(wǎng)絡(luò)Loss函數(shù)曲線
為了驗證神經(jīng)網(wǎng)絡(luò)正向模擬的準(zhǔn)確性以及可行性, 查閱參考文獻(xiàn)[12], 將文獻(xiàn)中的設(shè)計參數(shù)以及光譜響應(yīng)曲線與正向模擬網(wǎng)絡(luò)進(jìn)行對比。 文獻(xiàn)中以SiO2為基底層, 光柵以及波導(dǎo)層選用Si3N4。 在0.45~0.7 μm分別對紅、 綠、 藍(lán)三色陷波濾光片進(jìn)行驗證, 三種陷波濾波片的結(jié)構(gòu)參數(shù)列于表5。 將表5中光柵的結(jié)構(gòu)參數(shù)輸入正向模擬網(wǎng)絡(luò), 所得到的光譜響應(yīng)曲線與文獻(xiàn)中的曲線比較如圖6所示。
分別將文獻(xiàn)中的數(shù)據(jù)與正向模擬所設(shè)計的光譜響應(yīng)進(jìn)行相關(guān)性計算, 計算兩者之間的歐氏距離
(15)
相關(guān)系數(shù)r=1/(1+d), 計算紅、 綠、 藍(lán)三色的相關(guān)系數(shù)分別為0.763 82, 0.835 87, 0.890 88, 將3個相關(guān)系數(shù)與表6中的評價指標(biāo)進(jìn)行比對, 驗證其相關(guān)性為強(qiáng)相關(guān)。
表6 相關(guān)系數(shù)評價指標(biāo)[13]
驗證串聯(lián)網(wǎng)絡(luò)的逆向設(shè)計的可行性, 將未經(jīng)訓(xùn)練的光譜曲線數(shù)據(jù)輸入串聯(lián)神經(jīng)網(wǎng)絡(luò), 輸入的目標(biāo)響應(yīng)光譜曲線為0.45~0.7 μm范圍內(nèi)的高斯曲線
(16)
分別設(shè)置x0為0.48, 0.55, 0.61,σ設(shè)置為0.005。 將三條中心波長分別在0.48, 0.55與0.61 μm, 且峰值反射率達(dá)到100%的紅, 綠, 藍(lán)光譜響應(yīng)曲線輸入串聯(lián)網(wǎng)絡(luò), 并將逆向設(shè)計輸出的幾何結(jié)構(gòu)參數(shù)(表7)使用RCWA數(shù)值模擬, 得出設(shè)計結(jié)構(gòu)參數(shù)對應(yīng)的真實光譜響應(yīng)。 將目標(biāo)響應(yīng)光譜與真實光譜的結(jié)果相比較, 如圖7。
圖7 串聯(lián)網(wǎng)絡(luò)逆向設(shè)計
表7 逆向設(shè)計結(jié)構(gòu)參數(shù)
在訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)中進(jìn)行各個目標(biāo)光譜的設(shè)計, 僅需1.35 s。 極大的提高了陷波濾光片的設(shè)計效率, 且峰值反射率都能達(dá)到99%以上。
基于深度學(xué)習(xí)搭建了可以同時實現(xiàn)正向模擬與逆向設(shè)計的串聯(lián)神經(jīng)網(wǎng)絡(luò), 并基于RCWA數(shù)值模擬生成23100組數(shù)據(jù)。 將兩者相結(jié)合應(yīng)用在亞波長光柵陷波濾光片的結(jié)構(gòu)設(shè)計, 可以快速精確的得到最優(yōu)光柵結(jié)構(gòu)參數(shù), 輸入特定的響應(yīng)光譜曲線可以在1.35 s內(nèi)給出光柵的幾何結(jié)構(gòu)參數(shù)。 通過計算驗證, 所設(shè)計曲線與目標(biāo)曲線的相關(guān)系數(shù)大于0.5, 屬于強(qiáng)相關(guān)。 為亞波長光柵的設(shè)計提供了新方法和思路, 相比于傳統(tǒng)的優(yōu)化設(shè)計方法極大的提高了亞波長光柵的設(shè)計效率。 同時以光柵濾光片為例提出了一種深度學(xué)習(xí)法, 不僅僅適用于亞波長光柵的結(jié)構(gòu)設(shè)計, 也可用于光學(xué)的其他領(lǐng)域, 例如膜系設(shè)計, 圖像處理, 光學(xué)系統(tǒng)設(shè)計等。