劉 倩, 秦曄瓊, 劉 曙*, 李 晨, 朱志秀, 閔 紅, 邢彥軍
1. 東華大學(xué)化學(xué)化工與生物工程學(xué)院生態(tài)紡織教育部重點(diǎn)實(shí)驗(yàn)室, 上海 201620 2. 上海海關(guān)工業(yè)品與原材料檢測(cè)技術(shù)中心, 上海 200135
銅精礦是低品位含銅原礦石經(jīng)過(guò)選礦工藝處理達(dá)到一定質(zhì)量指標(biāo)的精礦, 是冶煉銅及其合金的基礎(chǔ)工業(yè)原料。 全球銅礦資源主要分布于北美, 拉丁美洲和中非三地。 按國(guó)家分布主要集中在智利、 秘魯、 美國(guó)、 菲律賓等國(guó)家。 不同產(chǎn)地來(lái)源的銅精礦由于地質(zhì)成因差異, 主次元素含量存在著一定的區(qū)域特征。 中國(guó)是全球最大的銅精礦進(jìn)口國(guó), 2018年進(jìn)口量為1 972萬(wàn)噸, 同比增長(zhǎng)13.7%。 進(jìn)口銅精礦偽報(bào)、 摻雜、 有害元素超標(biāo)案件多發(fā), 已危害到了國(guó)家經(jīng)濟(jì)安全。 基于歷年銅精礦的口岸檢測(cè)數(shù)據(jù), 建立入境銅精礦產(chǎn)地識(shí)別方法, 將有助于風(fēng)險(xiǎn)分級(jí)、 預(yù)警, 對(duì)保障入境銅精礦的安全, 具有重要意義。
梅燕熊[1]等根據(jù)全球銅礦資源地質(zhì)構(gòu)造背景與成礦特征, 劃分了4大成礦域以及21個(gè)巨型成礦區(qū)帶。 其中位于安第斯成礦帶的智利和秘魯, 東亞成礦帶的菲律賓屬于環(huán)太平洋成礦域, 地中海成礦帶的西班牙和阿爾巴尼亞、 中南半島成礦帶的馬來(lái)西亞及西亞成礦帶的伊朗屬于亞特提斯成礦域。 環(huán)太平洋成礦域和亞特提斯成礦域的成礦地質(zhì)構(gòu)造背景主要是顯生宙造山帶, 其次是新生代風(fēng)化殼。 位于非洲-阿拉伯成礦區(qū)的納米比亞屬于岡瓦納成礦域, 其成礦地質(zhì)構(gòu)造背景主要以前寒武紀(jì)地塊及疊加其上的顯生宙沉積盆地和構(gòu)造帶, 其次是新生代風(fēng)化殼。 由于礦床的成因極其復(fù)雜, 導(dǎo)致了礦床的地理位置的不同在銅礦樣品的產(chǎn)地識(shí)別中具有較大的難度, 以至于到目前為止, 還未見(jiàn)進(jìn)口銅精礦產(chǎn)地識(shí)別的相關(guān)報(bào)道。
神經(jīng)網(wǎng)絡(luò)是一種有監(jiān)督的模式識(shí)別方法, 在光譜分析應(yīng)用領(lǐng)域方面日益廣泛。 Giulio Binetti[2]等應(yīng)用近紅外光譜和核磁共振光譜與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法對(duì)不同品種的特級(jí)初榨橄欖油進(jìn)行品種和產(chǎn)地鑒定。 Moncayo[3]等應(yīng)用激光誘導(dǎo)擊穿光譜與人工神經(jīng)網(wǎng)絡(luò)相結(jié)合建立一種對(duì)紅酒原產(chǎn)地保護(hù)分級(jí)的方法。 孟海東[4]等利用不同礦產(chǎn)品的礦物形態(tài), 物理化學(xué)性質(zhì)不同的特點(diǎn)與BP神經(jīng)網(wǎng)絡(luò)結(jié)合對(duì)銅礦石和鐵礦石進(jìn)行分類識(shí)別。 人工神經(jīng)網(wǎng)絡(luò)作為一種具有高度非線性映射能力的計(jì)算模型, 能進(jìn)行全局優(yōu)化, 提高資源預(yù)測(cè)的準(zhǔn)確率[5]。 陰江寧[6]等應(yīng)用神經(jīng)網(wǎng)絡(luò)對(duì)化探數(shù)據(jù)進(jìn)行金礦床規(guī)模和銅礦床類型的分類。 Navid Khajehzadeh[7]等應(yīng)用X射線熒光光譜結(jié)合神經(jīng)網(wǎng)絡(luò)對(duì)赤鐵礦、 磁鐵礦、 石英和鐵礬礦進(jìn)行識(shí)別。 目前, 尚未發(fā)現(xiàn)光譜分析結(jié)合神經(jīng)網(wǎng)絡(luò), 應(yīng)用于銅精礦產(chǎn)地識(shí)別的報(bào)道。
本課題組應(yīng)用判別分析對(duì)X射線熒光光譜檢測(cè)的鐵礦石進(jìn)行產(chǎn)地及品牌識(shí)別, 其模型對(duì)建模樣品, 交叉驗(yàn)證和預(yù)測(cè)樣品的識(shí)別準(zhǔn)確率分別為97.4%, 95.3%, 95.5%和100%, 97%, 100%, 顯示出XRF結(jié)合化學(xué)計(jì)量學(xué)在礦產(chǎn)品識(shí)別上的可行性, 但Fieher判別分析對(duì)于線性不可分的情況無(wú)法確定分類。 因此本文引入了一種反向傳播人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法, 可看作是Fisher線性判別的一種非線性多維推廣。 通過(guò)采集來(lái)自全國(guó)主要銅精礦進(jìn)出口口岸的智利、 秘魯、 菲律賓、 西班牙、 納米比亞、 伊朗、 馬來(lái)西亞和阿爾巴尼亞8個(gè)國(guó)家280批進(jìn)口銅精礦代表性樣品(見(jiàn)表1), 應(yīng)用波長(zhǎng)色散-X射線熒光光譜無(wú)標(biāo)樣分析法共計(jì)檢出53種元素, 選擇17種元素含量用于判別分析與BP神經(jīng)網(wǎng)絡(luò)建模, 對(duì)比了這兩種方法對(duì)銅精礦產(chǎn)地識(shí)別的適用性, 討論不同國(guó)別銅精礦的化學(xué)成分差異, 通過(guò)建模樣品驗(yàn)證、 交叉驗(yàn)證以及預(yù)測(cè)樣品驗(yàn)證, 可確證模型的準(zhǔn)確性和適用性。
根據(jù)SN/T 4111—2015《進(jìn)口銅礦石取樣和制樣方法》, 從我國(guó)主要的銅精礦進(jìn)口口岸采集并制備來(lái)自8個(gè)國(guó)家的進(jìn)口銅精礦化學(xué)分析樣品, 共280批次樣品。 采集的樣品容量大, 分布地域廣, 具有一定的獨(dú)立性和代表性, 包含了我國(guó)進(jìn)口銅精礦主要來(lái)源國(guó)。 樣品信息如表1所示, 所在地理位置如圖1所示。
表1 銅精礦樣品信息
圖1 銅精礦國(guó)別分布圖
將樣品分裝到干燥瓶中于105 ℃下烘干4 h。 采用壓片機(jī)對(duì)烘干樣品進(jìn)行壓片, 壓片前用乙醇清洗模具, 使用聚乙烯環(huán)將粉末樣品聚攏, 壓制樣品在30 t壓力下維持30 s。 檢查壓制樣品表面均勻且無(wú)裂紋、 脫落現(xiàn)象, 測(cè)量前用洗耳球吹凈樣品表面。
使用德國(guó)布魯克公司S8 Tiger波長(zhǎng)色散-X射線熒光光譜儀中的無(wú)標(biāo)樣分析方法檢測(cè)銅精礦中的元素含量。 無(wú)標(biāo)樣分析也稱半定量分析, WDXRF譜儀半定量分析方法最大的特點(diǎn)是快速。 檢測(cè)中使用銠靶光管、 三個(gè)分析儀晶體(XS-55, PET, LiF200)、 流氣計(jì)數(shù)器(FC)、 閃爍計(jì)數(shù)器(SC)等元件。
1.3.1 逐步判別-費(fèi)歇爾判別分析
逐步判別分析屬于有監(jiān)督的分類方式, 先對(duì)已知的樣品進(jìn)行分類來(lái)建立模型, 再對(duì)未知樣品進(jìn)行預(yù)測(cè)分類。 在逐步判別分析中通過(guò)費(fèi)歇爾分?jǐn)?shù)(F-score)算法[9]進(jìn)行變量評(píng)估和特征選擇, 其本質(zhì)是選取類內(nèi)差異小, 類間差異大的特征。 具體描述如給定訓(xùn)練樣本集Xk∈Rm,K=1, 2, …,n, 其中正類和負(fù)類的樣本數(shù)分別為n+和n-, 則訓(xùn)練樣本第i個(gè)特征的F-score值定義為
(1)
Fisher判別分析的基本原理是投影, 將高維數(shù)據(jù)投影到某個(gè)方向, 使組與組之間區(qū)別最大, 組內(nèi)區(qū)別最小, 采用方差分析的思想建立判別函數(shù), 因此只要計(jì)算出每個(gè)樣品在典型變量維度上的具體坐標(biāo)位置, 再比較它們分別離各類中心的距離, 就可得知它們的分類結(jié)果[11]。
本文分析來(lái)自我國(guó)主要銅精礦進(jìn)口口岸的8個(gè)國(guó)別280個(gè)銅精礦樣品, 應(yīng)用SPSS 23.0軟件建立判別分析模型, 建模過(guò)程中選取226個(gè)樣品作為訓(xùn)練集, 54個(gè)預(yù)測(cè)樣品用于檢驗(yàn)?zāi)P偷臏?zhǔn)確性。 訓(xùn)練樣品及預(yù)測(cè)樣品的選取如表1所示。 建立銅精礦產(chǎn)地溯源模型, 首先采用逐步判別分析對(duì)O, Mg, Al, Si, P, S, K, Ca, Ti, Fe, Cu, Zn, Mn, As, Mo, Ag和Pb共17個(gè)元素進(jìn)行變量篩選, 變量能否進(jìn)入模型主要取決于協(xié)方差的F檢驗(yàn)的顯著性水平, 當(dāng)F-score大于指定值時(shí)保留該變量, 而F-score小于指定值時(shí), 該變量從模型中剔除。 選取合適的F-score可用最少的變量達(dá)到最佳判別效果。 本文選取的F-score為3.84, 經(jīng)過(guò)逐步判別分析, O, Mg, Al, Si, P, S, K, Ca, Cu, Zn, Mo, Ag, Pb共13個(gè)元素留在模型中用于建立判別函數(shù), Ti, Fe, Mn, As因未通過(guò)F檢驗(yàn)(F值<3.84)而從模型中剔除, 因此可用13個(gè)元素建立Fisher判別分析模型。
1.3.2 反向傳播人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)簡(jiǎn)稱神經(jīng)網(wǎng)絡(luò), 是一種基于連接學(xué)說(shuō)構(gòu)造的智能仿生模型, 由大量神經(jīng)元組成的非線性大規(guī)模自適應(yīng)動(dòng)力系統(tǒng)[12]。 目前, 應(yīng)用最廣泛的是反向傳播人工神經(jīng)網(wǎng)絡(luò)(back propagation artificial neutal networks, BP-ANN), 屬于有監(jiān)督的學(xué)習(xí)方式, 包括了輸入層, 隱含層和輸出層[13]。 神經(jīng)網(wǎng)絡(luò)拓?fù)鋱D如圖2所示。
圖2 神經(jīng)網(wǎng)絡(luò)拓?fù)鋱D
利用MATLAB R2018a軟件平臺(tái)中的神經(jīng)網(wǎng)絡(luò)模式識(shí)別工具箱對(duì)銅精礦進(jìn)行分類分析, 在神經(jīng)網(wǎng)絡(luò)模式識(shí)別進(jìn)行數(shù)據(jù)分析前, 將8個(gè)國(guó)家共280份樣品按8: 2的比例分為兩部分: 226個(gè)建模集和54個(gè)預(yù)測(cè)集。 在建模的過(guò)程中, 為確保模型的隨機(jī)性, 226個(gè)樣品由計(jì)算機(jī)按比例自動(dòng)隨機(jī)抽取訓(xùn)練集, 校正集與驗(yàn)證集分別為: 70%(138個(gè)樣品)、 15%(34個(gè)樣品)、 15%(34個(gè)樣品), 建立模型, 再利用建立的模型對(duì)54份預(yù)測(cè)樣品進(jìn)行識(shí)別。
將X射線熒光光譜測(cè)得的O, Mg, Al, Si, P, S, K, Ca, Ti, Fe, Cu, Zn, Mn, As, Mo, Ag和Pb共17種元素含量建立銅精礦識(shí)別模型。 由于神經(jīng)網(wǎng)絡(luò)模型中的輸入層對(duì)輸出層的結(jié)果起決定性作用, 因此考慮將通過(guò)逐步判別分析F值篩選的O, Mg, Al, Si, P, S, K, Ca, Cu, Zn, Mo, Ag和Pb共13種元素含量作為輸入層建立另一個(gè)銅精礦識(shí)別模型。 8個(gè)不同國(guó)別作為輸出層, 建立了兩個(gè)具有10個(gè)隱藏層的三層人工神經(jīng)網(wǎng)絡(luò), 即輸入層-隱藏層-輸出層分別為: 17-10-8, 13-10-8。
全球銅礦山主要集中分布在北美科迪勒拉銅礦帶、 南美安第斯銅礦帶、 地中海銅礦帶、 岡底斯銅礦帶、 西亞銅礦成礦帶等銅礦帶上。 世界銅礦類型較多, 主要有斑巖型, 砂頁(yè)巖型、 矽卡巖型、 火山成因塊狀硫化物(VMS)等[8]。
斑巖型銅礦是一類與淺成, 超淺成中酸性侵入體(斑巖)有關(guān)的規(guī)模大, 品位低的銅礦床。 集中于環(huán)太平洋成礦域、 古特提斯成礦域和古亞洲成礦域。 斑巖型銅礦是目前世界上最主要的銅礦類型, 占世界銅礦資源和產(chǎn)量的一半以上, 如智利(33-42Ma)、 秘魯(10-20Ma)和菲律賓等國(guó)的80%~90%的銅資源來(lái)自斑巖型銅礦。 大型的矽卡巖型銅礦通常與斑巖銅礦伴生, 如秘魯?shù)陌菜准{是主要的矽卡巖型銅礦, 與斑巖侵入系統(tǒng)伴生。 火山成因塊狀硫化物型銅礦礦床(VMS)是指與海底火山作用有一定聯(lián)系的含大量黃鐵礦和一定數(shù)量銅, 鉛, 鋅的礦床。 如西班牙的里奧延托(銅450×104t, 銅品位0.9%)。 因此位于同一成礦域不同產(chǎn)地的銅精礦具有相同的成礦類型, 使不同產(chǎn)地的銅精礦識(shí)別難度增加。
本文收集8個(gè)國(guó)別的銅精礦樣品中除西班牙成礦類型為VMS型, 其余7個(gè)國(guó)別的銅精礦的成礦類型均含有斑巖型銅礦, 建立識(shí)別模型有一定的難度。
采用波長(zhǎng)色散-X射線熒光光譜無(wú)標(biāo)樣分析方法對(duì)收集的280份已知產(chǎn)地國(guó)的銅精礦樣品進(jìn)行檢測(cè), 結(jié)果表明, 收集銅精礦樣品共計(jì)能檢出53種元素。 這些元素在280個(gè)樣品中的檢出情況為: 100%檢出的元素有O, Al, Si, S, Fe和Cu, 檢出數(shù)量大于85%以上的元素有Mg, Ca, K, Mn, Zn, Ti, Mo, Pb, As和P, 檢出比例分別為: 99.29%, 99.29%, 98.93%, 98.57%, 98.57%, 96.07%, 95.36%, 92.50%, 87.50%和87.14%, 檢出數(shù)量比例低于85%的元素有Ni, Sr, Ag, Se, Er, Cr, Zr, Na, Cl, Bi, V, Sb, Ba, Rb, Cd, Gd, W, Co, Ho, Ce, Sn, Hf, F, Hg, Br, Ga, Nb, Rh, Ir, La, Tl, Sc, Ge, Lu, Te, Eu和Y, 檢出比例分別為: 79.64%, 77.86%, 77.50%, 76.43%, 76.43%, 68.57%, 64.29%, 60.71%, 60.71%, 39.29%, 31.79%, 26.43%, 24.64%, 23.57%, 14.29%, 13.57%, 9.64%, 7.86%, 7.14%, 7.14%, 4.29%, 2.50%, 2.14%, 1.43%, 1.07%, 1.07%, 1.07%, 0.71%, 0.71%, 0.71%, 0.36%, 0.36%, 0.36%, 0.36%, 0.36%, 0.36%和0.36%。 建立銅精礦產(chǎn)地識(shí)別模型, 考慮到實(shí)際應(yīng)用, 應(yīng)選擇銅精礦樣品中檢出比例盡量高的元素, 因此選擇280個(gè)銅精礦樣品中檢出比例大于85%以上的O, Mg, Al, Si, P, S, K, Ca, Ti, Fe, Cu, Zn, Mn, As, Mo和Pb共16種元素含量作為特征變量, Ag雖檢出比例為77.50%, 但確是銅精礦檢測(cè)合同規(guī)格中的必檢元素之一, 因此也一并提取, 以上17種元素含量, 如涉及到未檢出, 均用檢出限含量進(jìn)行代替。
圖3 銅精礦樣本的元素均值含量條形圖
由圖3中17種元素8個(gè)國(guó)別銅精礦含量的均值對(duì)比分析表明: 阿爾巴尼亞中的Fe和S含量分別比伊朗的高了約3倍和5.3倍。 菲律賓中的O和Si含量分別比納米比亞的高了約4倍和13倍, 菲律賓As含量高于其余7個(gè)國(guó)家, Ti含量?jī)H次于伊朗。 馬來(lái)西亞中的Cu含量?jī)H次于納米比亞, Mg和Ca含量均高于其余7個(gè)國(guó)別。 馬來(lái)西亞的K和Ti含量均低于伊朗。 秘魯中的Mo含量比其余7個(gè)國(guó)別的含量要高出10~100個(gè)百分點(diǎn)。 納米比亞Fe, Cu和S含量均高于其他7個(gè)國(guó)家的含量, O, Si, Al, Zn, K和As相對(duì)其他國(guó)家含量偏低。 西班牙Zn和Pb, 含量均比其余國(guó)家的含量高出100~1 000的百分點(diǎn)。 伊朗O, Al, K, Mo, P和Ti, 含量均比其余國(guó)家要高, 且O和Al在納米比亞中相對(duì)于其他國(guó)別而言含量最低。
綜合以上元素分析, 阿爾巴尼亞中的Fe和S含量較高, Cu和Ca含量較低; 菲律賓中的O, Si, As和Ti, 含量較高, Cu含量較低; 馬來(lái)西亞中的Cu, Mg和Ca含量較高; 納米比亞中的Fe, Cu, S和Al含量較高, O, Si, Zn, K和As, 含量較低; 西班牙中的Zn和Pb, 秘魯中的Mo, 均高于其余7個(gè)國(guó)別, 智利銅精礦檢測(cè)的含量用肉眼很難與其他國(guó)家進(jìn)行比較。 不同國(guó)別間的元素含量不同, 對(duì)判別分析模型的貢獻(xiàn)度不同, 因此后文對(duì)這17種元素采用了費(fèi)歇爾分?jǐn)?shù)對(duì)變量進(jìn)行篩選。
針對(duì)不同進(jìn)口國(guó)別銅精礦建立產(chǎn)地溯源模型, 用O, Mg, Al, Si, P, S, K, Ca, Cu, Zn, Mo, Ag和Pb共13個(gè)元素建立Fisher判別分析模型, 得到7個(gè)判別函數(shù)和相應(yīng)的組質(zhì)心處的函數(shù)。 取前兩個(gè)判別函數(shù)和組質(zhì)心處的函數(shù)作圖如圖4所示。
F1=0.069X1+0.251X2-0.213X3-0.045X4-18.201X5+0.033X6-1.529X7-0.033X8+0.138X9+0.001X10+4.499X11-13.889 5X12+2.686X13-3.625
F2=-0.047X1+0.536X2-0.327X3-0.045X4-6.618X5-0.1X6+1.494X7+0.011X8+0.16X9+0.464X10+2.196X11+73.322X12-3.636X13-4.144
F3=0.105X1+0.205X2-0.509X3-0.273X4+13.51X5-0.063X6+3.058X7+0.011X8+0.154X9+0.371X10-0.513X11-40.253X12+2.393X13-4.342
F4=0.056X1-0.012X2+0.111X3+0.14X4-1.643X5-0.096X6-1.048X7-0.161X8-0.03X9+0.626X10+4.268X11+9.56X12+0.659X13-0.668
F5=-0.203X1+0.289X2+0.165X3+0.095X4+4.196X5-0.018X6+0.412X7-0.156X8-0.059X9+0.417X10+4.484X11-25.523X12-0.261X13+3.121
F6=0.237X1-0.117X2-0.736X3-0.255X4+2.821X5+0.144X6+1.591X7+0.139X8-0.131X9+0.364X10+1.444X11+12.061X12-1.055X13-1.539
F7=-0.155X1+0.243X2-0.174X3+0.25X4+28.721X5-0.008X6-1.632X7-0.004X8+0.24X9+0.148X10-2.185X11-15.951X12+0.203X13+0.338
式中,X1—X13分別代表O, Mg, Al, Si, S, P, K, Ca, Cu, Zn, Mo, Ag和Pb含量。
用判別函數(shù)1和判別函數(shù)2的判別得分作散點(diǎn)圖(圖4), 判別函數(shù)1得分為橫坐標(biāo), 判別函數(shù)2得分為縱坐標(biāo), 可以看出模型中的伊朗, 西班牙, 菲律賓, 阿爾巴尼亞質(zhì)心間的距離較遠(yuǎn), 馬來(lái)西亞和秘魯, 智利和納米比亞質(zhì)心間的距離較近, 在對(duì)智利的銅精礦識(shí)別中有少數(shù)樣品落在離納米比亞, 馬來(lái)西亞和秘魯質(zhì)心更接近的位置。 其原因可能是由于此次分析的樣品均為斑巖型銅礦, 成礦類型較為相似, 且智利銅礦的元素特征較不明顯, 故被判到其他國(guó)別的可能性增加。 用于建模樣品的準(zhǔn)確率達(dá)94.2%, 交叉驗(yàn)證準(zhǔn)確率達(dá)92.8%, 預(yù)測(cè)樣品準(zhǔn)確率達(dá)96.7%。 說(shuō)明此模型可以對(duì)銅精礦有較好的識(shí)別, 具體的分類結(jié)果如表2所示。
圖4 判別函數(shù)散點(diǎn)圖
表2 銅精礦建模的分類結(jié)果
利用神經(jīng)網(wǎng)絡(luò)模式識(shí)別建立銅精礦產(chǎn)地識(shí)別模型, 模型結(jié)構(gòu)為17-10-8和模型結(jié)構(gòu)為13-10-8的226份樣品的訓(xùn)練集, 校正集, 驗(yàn)證集以及建模樣品識(shí)別準(zhǔn)確率分別為100%, 97.1%, 94.1%, 98.2%與100%, 97.1%, 100%, 99.6%, 且兩個(gè)模型均對(duì)54份預(yù)測(cè)樣品100%識(shí)別正確; 具體的分類結(jié)果如表2所示。
從兩次神經(jīng)網(wǎng)絡(luò)模式識(shí)別的具體分類結(jié)果來(lái)看, 輸入層為17時(shí), 校正集中一個(gè)為智利的樣品被識(shí)別為秘魯, 驗(yàn)證集中有一個(gè)智利的樣本被識(shí)別為西班牙。 在地理位置上智利和秘魯接壤, 且均位于南美洲的南美安第斯斑巖銅礦成礦帶, 本次檢測(cè)的樣品可能是來(lái)自同一礦脈下的樣品, 礦石元素含量相近, 所以出現(xiàn)識(shí)別錯(cuò)誤的情況。 輸入層為13時(shí), 校正集中一個(gè)為菲律賓的樣品被識(shí)別為智利。 菲律賓位于環(huán)太平洋的東亞成礦帶, 智利位于南美安第斯成礦帶, 兩者雖在礦帶之間沒(méi)有聯(lián)系, 但本次檢測(cè)的樣品可能均為斑巖型銅礦, 礦石成因相似, 元素含量相近, 因此識(shí)別錯(cuò)誤。
對(duì)比3次建模的結(jié)果如表2, 3次建模的結(jié)果均高于90%以上, 可知對(duì)這8個(gè)國(guó)別的銅精礦樣品的識(shí)別效果很好。 對(duì)比神經(jīng)網(wǎng)絡(luò)模式識(shí)別與Fisher-判別分析, 發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模式識(shí)別比Fisher-判別分析具有更高的識(shí)別準(zhǔn)確度, 其原因在于神經(jīng)網(wǎng)絡(luò)可以逼近任何連續(xù)的非線性曲線, 具有自適應(yīng)性, 自組織性, 容錯(cuò)性的優(yōu)點(diǎn), 相比Fisher-判別分析體現(xiàn)出更佳的識(shí)別率。 比較兩個(gè)輸入變量不同的神經(jīng)網(wǎng)絡(luò)模型的結(jié)果可知, 經(jīng)過(guò)F值篩選元素后的準(zhǔn)確率更高一些, 其原因可能是因?yàn)镕值的篩選能減少特征變量個(gè)數(shù), 選擇差異大的信號(hào)特征, 從而提高識(shí)別率。
利用波長(zhǎng)色散-X射線熒光光譜無(wú)標(biāo)樣分析法測(cè)定8個(gè)國(guó)家280份銅精礦樣品的元素含量, 選擇226個(gè)樣品作為訓(xùn)練樣本, 54個(gè)樣品作為預(yù)測(cè)樣本, 建立不同國(guó)別的分類模型。 比較三次模型的結(jié)果, 兩次神經(jīng)網(wǎng)絡(luò)模式識(shí)別的結(jié)果都要優(yōu)于逐步-Fisher判別分析的結(jié)果, 從算法上來(lái)看, 機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的非線性判別要優(yōu)于Fisher的線性判別。 兩次神經(jīng)網(wǎng)絡(luò)模式識(shí)別的結(jié)果都很好, 由于逐步分析具有特征提取的作用, 因此建議采用F-score篩選出O, Mg, Al, Si, P, S, K, Ca, Cu, Zn, Mo, Ag和Pb共13種元素含量作為特征變量, 減少變量個(gè)數(shù), 建立對(duì)銅精礦國(guó)別的產(chǎn)地溯源模型。 該模型為不同國(guó)別銅精礦元素含量提供了基礎(chǔ)數(shù)據(jù)與理論依據(jù), 通過(guò)X射線熒光光譜無(wú)標(biāo)樣分析測(cè)定銅精礦樣品的13種元素含量建立神經(jīng)網(wǎng)絡(luò)模式識(shí)別模型, 可以快速識(shí)別銅精礦國(guó)別。 模型識(shí)別準(zhǔn)確率與模型樣品的產(chǎn)地及建模樣品數(shù)量存在很大關(guān)系, 隨著后續(xù)收集樣品數(shù)量增加, 模型的穩(wěn)定性將得到進(jìn)一步的提升。 當(dāng)然, 無(wú)標(biāo)樣分析方法畢竟是一種半定量分析方法, 定量分析方法的應(yīng)用必將進(jìn)一步提升產(chǎn)地識(shí)別模型的普適性。