尤瀚庭 樊港
(東華理工大學(xué)機(jī)械與電子工程學(xué)院 江西省南昌市 330013)
能譜識別技術(shù)作為核與輻射探測領(lǐng)域的關(guān)鍵性技術(shù),國內(nèi)外相關(guān)專家一直致力于該技術(shù)的理論研究與技術(shù)創(chuàng)新。由于探測器性能、背景噪聲等因素的影響[1],傳統(tǒng)核素識別在處理復(fù)雜能譜數(shù)據(jù)時,誤差較大,識別率較低[2]。為了克服這個難題,近年來針對能譜這種高維度、非線性的數(shù)據(jù),全譜分析方法逐漸得到發(fā)展,主要工具有人工神經(jīng)網(wǎng)絡(luò)、粒子群算法、K-L 變換等[3]。
近年來計算機(jī)技術(shù)飛速發(fā)展,為了使機(jī)器設(shè)備在處理復(fù)雜數(shù)據(jù)時具有智能思維能力,人工神經(jīng)網(wǎng)絡(luò)(ANN)在最近三十年中不斷發(fā)展。目前,基于神經(jīng)網(wǎng)絡(luò)的全譜分析方法受到重視。1991年,Olmos 等人[4]首次提出了在伽馬能譜分析中使用人工神經(jīng)網(wǎng)絡(luò)。1995年,Keller等人[5]使用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行核素識別,從結(jié)果可以看出,人工神經(jīng)網(wǎng)絡(luò)提高了核素識別速度與準(zhǔn)確度。2015年劉議聰?shù)热薣6]提出了基于人工神經(jīng)網(wǎng)絡(luò)的核素識別方法,使用主成分分析法(Principal component analysis,PCA)提取主要特征,實現(xiàn)數(shù)據(jù)降維。2019年Liang 等人應(yīng)用空間填充曲線將1*1024 的伽馬能譜轉(zhuǎn)化為32*32的二維數(shù)據(jù),具有更快的收斂速度和更小的損失函數(shù)[7]。2020年,王瑤等學(xué)者通過濾波平滑等數(shù)據(jù)處理方法處理放射性核素能譜數(shù)據(jù),研究長短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)算法[8]在核素識別領(lǐng)域的應(yīng)用。
由此可見,神經(jīng)網(wǎng)絡(luò)解決伽馬能譜分析問題已經(jīng)成為該領(lǐng)域的熱點(diǎn)。本文主要使用神經(jīng)網(wǎng)絡(luò)處理PGNAA技術(shù)探測銅礦后產(chǎn)生的特征伽馬能譜。由于實測數(shù)據(jù)不足,采用MCNP 仿真軟件構(gòu)建數(shù)據(jù)集,通過設(shè)計卷積神經(jīng)網(wǎng)絡(luò)模型完成對模擬伽馬能譜的分析。
圖1:礦石與相關(guān)概念的關(guān)聯(lián)[9]
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練需要大量數(shù)據(jù),實驗獲取的數(shù)據(jù)數(shù)量不足以支撐神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,故需要采用模擬的方法構(gòu)建數(shù)據(jù)集。本文采用MCNP 軟件,基于蒙特卡羅方法生成伽馬能譜。MCNP 軟件是國際公認(rèn)的分析中子和伽馬射線輸運(yùn)問題的程序,其主要輸入文件有柵元卡(定義構(gòu)成整個系統(tǒng)的各個基本介質(zhì)單元及相應(yīng)的物理信息)、曲面卡(定義組成柵元的曲面信息)、數(shù)據(jù)卡(包含反應(yīng)類型、源描述、材料描述等其他信息)。使用MCNP 方法構(gòu)建數(shù)據(jù)集的難點(diǎn)在于MCNP 是基于統(tǒng)計理論的軟件,如果輸入文件的數(shù)據(jù)卡中礦石元素含量不發(fā)生變化,則基于伯努利大數(shù)定律,最后的結(jié)果會非常接近,不利于提升神經(jīng)網(wǎng)絡(luò)的魯棒性。因此使用MCNP構(gòu)建數(shù)據(jù)集將礦石樣本不足的問題轉(zhuǎn)變?yōu)殂~礦石元素含量如何構(gòu)成。
礦石一般由礦石礦物和脈石礦物組成。礦石礦物又稱有用礦物,是可以被利用的金屬或非金屬礦物。脈石是指與有用礦物伴生的無有用組分且沒有可用性能的礦物,又稱為無用礦物[9]。因此,銅礦其實是有用礦物和脈石的組合。本研究選取江西銅礦相關(guān)研究記錄的350條金屬礦物的電子探針探測結(jié)果,300 條各種脈石的化學(xué)成分分析結(jié)果,通過按照不同比例混合脈石與金屬礦物得到了1600 條模擬銅礦數(shù)據(jù)。
根據(jù)我國的采礦技術(shù),銅礦邊界品位一般為0.2%,工業(yè)品位為0.4-0.5%,0.5-1.4%的為低品位礦石,1.4-2%的為中等品位礦石,2%以上的為高品位礦石[10]。由于數(shù)據(jù)集類別不均衡,將脈石與低于邊界品位的銅礦作為第一類,邊界品位到工業(yè)品位(0.2-0.5%)礦石合并為第二類,將低品位礦石與中等品位礦石(0.5-2%)合并作為第三類,銅礦品位超過2%的作為第四類,以此為標(biāo)準(zhǔn)設(shè)立多分類標(biāo)簽。
此外,銅礦床中常伴生有鉛、鋅、鐵等元素,當(dāng)伴生元素達(dá)到一定含量時不可以忽略其經(jīng)濟(jì)價值,需要進(jìn)行綜合評價和回收考慮。伴生礦物隨主礦產(chǎn)一同開采加工,不會格外產(chǎn)生采礦、運(yùn)輸、破碎等費(fèi)用,但伴生礦物需要分離與提取,某些情況下需要特殊的生產(chǎn)裝置,故需要在核算經(jīng)濟(jì)成本的條件下合理回收。
基于表1,對每個模擬數(shù)據(jù)中上述元素含量大于綜合利用標(biāo)準(zhǔn)的設(shè)為正類,反之為負(fù)類,構(gòu)建標(biāo)簽數(shù)為5的多標(biāo)簽數(shù)據(jù)集。
表1:常見伴生礦物工業(yè)綜合利用標(biāo)準(zhǔn)[10]
能譜數(shù)據(jù)與時間序列存在一定相似性。目前,空間填充曲線法、格拉姆角場和馬爾科夫轉(zhuǎn)移場常用于將一維數(shù)據(jù)轉(zhuǎn)換成二維數(shù)據(jù)。其中,格拉姆角場的優(yōu)點(diǎn)是其主對角線包含原始值與時間信息,因此可以通過主對角線重建序列。本文采用此方法進(jìn)行能譜數(shù)據(jù)二維轉(zhuǎn)換[11]。
對于一個待轉(zhuǎn)化的銅礦伽馬能譜序列Y={y1,y2,…,yN},N=1,2,…,1024, 首先將能譜序列Y={y1,y2,…,yN} 中的每一個值都進(jìn)行規(guī)范化,規(guī)范化后記為中的每一個值 都在[-1,1]的區(qū)間內(nèi)。規(guī)范化公式如下所示:
使用反三角函數(shù)將每個 變?yōu)闃O坐標(biāo)系下的角度φi,φi的區(qū)間為[0,π]。對應(yīng)的極坐標(biāo)半徑ri采用其所在道址數(shù)ni和道址總數(shù)N 的比值表示,因此ri處于(0,1]的區(qū)間內(nèi)。具體公式如下:
利用式(1)和式(2)對能譜序列進(jìn)行縮放后,將直角坐標(biāo)系中的能譜序列使用極坐標(biāo)表示,通過每個點(diǎn)之間的角度和來進(jìn)行格拉姆求和角場(Gramian Angular Summation Fields,GASF)定義,GASF 如下所示:
通過GASF 矩陣,一維的銅礦伽馬能譜轉(zhuǎn)化為二維形式,且包含伽馬能譜不同道址的信息之間的聯(lián)系。但從上式可以得知,GASF 矩陣大小為N×N(本文數(shù)據(jù)N為1024,即1024×1024)。對于銅礦伽馬能譜數(shù)據(jù)來說,采樣道址總數(shù)為1024,導(dǎo)致GASF 矩陣維度極大,不利于后續(xù)處理[12]。
從圖2 中可以看到,能譜數(shù)據(jù)中前200 道的計數(shù)遠(yuǎn)超其他道,在變?yōu)楦窭非蠛徒菆鰰r,其他道址的數(shù)值由于經(jīng)過壓縮導(dǎo)致GASF 矩陣中200 至1024 道的信息損失嚴(yán)重。為此,借鑒NLP的分詞思想,將能譜進(jìn)行分割,提出分段式GASF 變換。將1024 道的能譜信號分為16個64 道的信號,并采用k=2 的PAA 算法[11]進(jìn)行壓縮。此外,由于900 道之后探測器的探測效率極低,900 道之后對應(yīng)的能量段內(nèi)的特征峰幾乎都被統(tǒng)計漲落淹沒,因此897道至1024道共128道的數(shù)據(jù)采用k=4進(jìn)行壓縮。1024 道的能譜數(shù)據(jù)最終轉(zhuǎn)換為15*32*32 的矩陣,與直接轉(zhuǎn)變相比,該方法可以將GASF 矩陣的數(shù)據(jù)大小縮小約60 倍且保留大部分信息。能譜經(jīng)過變換后第449~832道的能譜圖像如圖3。
圖2:對1024 道進(jìn)行GASF 變換的結(jié)果
圖3:能譜449 ~832 道變換結(jié)果
對比圖2 與圖3,由于分段GASF 方法以每段中數(shù)值最大與最小的點(diǎn)為標(biāo)準(zhǔn)進(jìn)行縮放,避免了不同譜段數(shù)值差距過大導(dǎo)致的GASF 方法變換過程中帶來的信息損失。同時,所有數(shù)據(jù)都被限制到[-1,1]之間,相當(dāng)于對所有數(shù)據(jù)進(jìn)行了一次規(guī)范化,保證了所有數(shù)據(jù)處于同一數(shù)量級下,避免數(shù)值過大的數(shù)據(jù)占據(jù)過大的權(quán)重,有利于神經(jīng)網(wǎng)絡(luò)的收斂。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)可以在監(jiān)督模式下自動學(xué)習(xí)訓(xùn)練權(quán)重,并不斷從樣本數(shù)據(jù)中提取特征,其對于圖像識別有很好的效果。卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)特性包括稀疏連接、權(quán)值共享、時間或空間上的下采樣。卷積神經(jīng)網(wǎng)絡(luò)主要由卷積層、子采樣層和全連接層組成。卷積運(yùn)算后,樣本特征將映射到下一層,然后使用該層提取數(shù)據(jù)特征。卷積層和采樣層交替形成輸入層的特征提取層,然后將特征提取后的數(shù)據(jù)用作新的輸入層,繼續(xù)提取特征。最后,這些特征信息在經(jīng)過作為分類器的全連接層計算后,在輸出層得到分類結(jié)果。
在卷積神經(jīng)網(wǎng)絡(luò)中,設(shè)I(t)為模型輸入,s(t)為卷積映射,K(t)為卷積核,那么卷積運(yùn)算如下所示:
基于卷積神經(jīng)網(wǎng)絡(luò)的銅礦品位分類是多分類問題,有益組分識別是多標(biāo)簽問題。通過one-hot 編碼,多分類任務(wù)標(biāo)簽可以轉(zhuǎn)換為標(biāo)簽個數(shù)為4 的多標(biāo)簽形式。因此兩個任務(wù)的損失函數(shù)均選用二元交叉熵?fù)p失函數(shù)(Binary Cross Entropy Loss,BCELoss),其定義如下:
其中yi是第i 個樣本的真實標(biāo)簽,值為0 或1,pi表示預(yù)測第i 個樣本為正例的概率。使用BCELoss,要求樣本必須屬于[0,1],故本文模型的全連接層全部使用Sigmoid 激活函數(shù)。在Pytorch 架構(gòu)下使用BECWithLogitsLoss,該損失函數(shù)在進(jìn)行損失計算之前自動對全連接層的輸出進(jìn)行Sigmoid 操作。
經(jīng)過分段格拉姆角場變換后,神經(jīng)網(wǎng)絡(luò)的輸入從1*1024 轉(zhuǎn)變?yōu)?5*32*32,通過Pytorch 構(gòu)建如圖4所示的ResNet 神經(jīng)網(wǎng)絡(luò),Resblock1 維持通道數(shù)與圖片高寬不變,Resblock2 則將通道數(shù)翻倍、圖片高寬減半,Resblock2 與最大池化層的不同在于最大池化層只會使圖片的高寬減半而不增加通道數(shù)。由于圖片高寬僅有32*32,因此在最大池化層與Resblock2 一共5 次圖片高寬減半的作用下,最后可以得到480*1*1 的塊,通過兩次全連接得到最終的結(jié)果。
圖4:ResNet 網(wǎng)絡(luò)結(jié)構(gòu)
ResNet 在多分類與多標(biāo)簽任務(wù)上的準(zhǔn)確率如圖5所示,由圖中可以看出銅礦中多種有益組分識別任務(wù)比銅礦石品位分類任務(wù)的準(zhǔn)確率低,且模型收斂速度更慢。銅礦品位分類任務(wù)在230 多個epoch 左右模型即收斂,準(zhǔn)確率在450epoch 時達(dá)到94.9%。有益組分識別任務(wù)在300epoach 左右仍有較大波動,在訓(xùn)練中還出現(xiàn)了準(zhǔn)確率大幅下降的情況,最終識別準(zhǔn)確率為93.9%。
圖5:ResNet 對兩種任務(wù)的準(zhǔn)確率
除了ResNet 網(wǎng)絡(luò),本文還使用了一些常用的機(jī)器學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對比,結(jié)果如表2。
表 2:各種算法識別準(zhǔn)確率
從表2 中可以看出,深度學(xué)習(xí)對比傳統(tǒng)機(jī)器學(xué)習(xí)具有較大的優(yōu)勢,而本文提出的分段格拉姆角場變換聯(lián)合ResNet 神經(jīng)網(wǎng)絡(luò)進(jìn)行銅礦能譜識別的方法準(zhǔn)確率最高。
本文通過MCNP 仿真軟件構(gòu)建了1600 條銅礦伽馬能譜。由于伽馬能譜各道址之間的計數(shù)差距極大,提出分段格拉姆角場二維化方法,將一維的能譜數(shù)據(jù)轉(zhuǎn)變?yōu)榘嫈?shù)與道址信息的二維數(shù)據(jù),并聯(lián)合ResNet 神經(jīng)網(wǎng)絡(luò)對伽馬能譜進(jìn)行分析。經(jīng)過實驗,該方法的準(zhǔn)確率最高,對于MCNP 模擬銅礦伽馬能譜進(jìn)行的銅礦品位分類與有益組分識別任務(wù)準(zhǔn)確率分別達(dá)到94.9%和93.9%。