陳紹杰, 劉久潭,汪 鋒,周景奎,唐鵬飛,高宗軍
(1.山東科技大學(xué) 能源與礦業(yè)工程學(xué)院,山東 青島 266590; 2.山東能源龍口礦業(yè)集團(tuán) 梁家煤礦,山東 龍口 265700;3.山東科技大學(xué) 地球科學(xué)與工程學(xué)院,山東 青島 266590)
我國煤礦水文地質(zhì)條件復(fù)雜,煤炭開采過程中礦井水害時(shí)有發(fā)生,嚴(yán)重威脅著煤礦的安全生產(chǎn),因此,開展礦井水水源識(shí)別研究意義重大[1-3]。 地下水在徑流過程中,與周圍巖土發(fā)生著復(fù)雜的水文地球化學(xué)反應(yīng),其水化學(xué)組分含量也會(huì)相應(yīng)變化,形成了特有的物理化學(xué)特征,這些水化學(xué)特征承載著含水層的大量信息,可為礦井水水源判別提供重要依據(jù)[4-6]。
目前,水源識(shí)別的方法較多,主要包括水溫水位法[7]、水 化 學(xué) 分 析 法[8-9]和 數(shù) 理 統(tǒng) 計(jì) 分 析 法[10-11]等。 通常,在水文地質(zhì)條件分析的基礎(chǔ)上,利用水化學(xué)進(jìn)行水源識(shí)別簡單而有效[12]。 近年來,不少學(xué)者利用水化學(xué)數(shù)據(jù),基于新技術(shù)和新的數(shù)學(xué)方法,建立了水源識(shí)別模型,為煤礦水害的防治工作做出了很大貢獻(xiàn)。 王亞等[13]利用激光誘導(dǎo)熒光技術(shù)獲取水樣的熒光光譜并提取特征信息后,基于極限學(xué)習(xí)機(jī)構(gòu)建了水源的快速識(shí)別模型。 王心義等[12]在熵權(quán)法和模糊可變集理論的基礎(chǔ)上,建立了礦井突水水源識(shí)別模型。 楊中元等[10]結(jié)合主成分分析(PCA)和灰色關(guān)聯(lián)分析(GRA),建立了PCA-GRA 突水水源判別模型。 然而,不同礦區(qū)水文地質(zhì)條件復(fù)雜程度不同,不同識(shí)別方法均存在一定的優(yōu)勢和局限性[12,14]。
筆者以我國最大的濱海煤礦龍口梁家煤礦為例,利用礦井水的主要離子測試數(shù)據(jù),基于水化學(xué)和主成分分析-殘差分析(PCA-RA)識(shí)別礦井水補(bǔ)給來源的數(shù)量和類型,為濱海煤礦區(qū)的水害防治提供科學(xué)參考。
梁家煤礦(圖1)位于山東省龍口市,西至龍口渤海,北與北皂煤礦相鄰,東北與桑園井田相接,東靠洼東煤礦,面積47.49 km2。 礦區(qū)內(nèi)地形平坦,由東南向西北逐漸降低。 流經(jīng)該區(qū)的地表水系主要有中村河和小恒河,均為季節(jié)性河流。
煤田內(nèi)的含水層由上而下主要有:第四系砂礫層、泥灰?guī)r、泥巖與泥灰?guī)r互層、煤1、煤2 及底板砂巖、煤3 至煤4 間砂巖等。 第四系砂礫石層由細(xì)、中、粗砂及礫石組成,富水性極強(qiáng)。 泥灰?guī)r和砂巖等含水層富水性弱或中等,水化學(xué)類型主要為HCO3-Na、HCO3·Cl-Na 或Cl·HCO3-Na。 區(qū)內(nèi)各煤層內(nèi)生節(jié)理較發(fā)育,局部因構(gòu)造影響裂隙發(fā)育,使煤巖中儲(chǔ)存著裂隙水,但裂隙率小補(bǔ)給量不大,富水性弱。含煤地層的底部無強(qiáng)富水性含水層。 區(qū)域內(nèi)煤系地層含水層不直接接受大氣降水的補(bǔ)給,主要接受南、東面山區(qū)基巖裂隙水側(cè)向補(bǔ)給,煤田內(nèi)部斷裂雖較發(fā)育,但斷裂帶多被泥質(zhì)巖類充填,其富水性和導(dǎo)水性弱,而各含水層的富水性也較弱,地下水從南、東向西北徑流極為緩慢,正常情況下泄入渤海。 礦井排水為煤系地層直接充水含水層的主要排泄途徑。
利用主成分分析-殘差分析(PCA-RA)確定水源數(shù)量和類型[6],思路如下:先基于PCA 法將水化學(xué)數(shù)據(jù)進(jìn)行壓縮,確定主成分?jǐn)?shù)量。 然后利用RA將PCA 結(jié)果以重構(gòu)離子濃度的形式表現(xiàn)出來,并與原始濃度進(jìn)行相關(guān)性分析。 若離子濃度殘差均表現(xiàn)為隨機(jī)分布特征,說明已提取所有的有效信息。 最后,對(duì)每個(gè)主成分進(jìn)行合理解釋,確定礦井水的補(bǔ)給來源類型。
圖1 梁家煤礦位置及取樣點(diǎn)分布Fig.1 Location of Liangjia Coal Mine and sampling points
2.2.1 主成分分析(PCA)
PCA 是利用數(shù)學(xué)手段對(duì)原始水質(zhì)數(shù)據(jù)進(jìn)行降維,并提取水質(zhì)數(shù)據(jù)多變量中的關(guān)鍵信息,用少數(shù)的新變量表征原始變量,但獲得的新變量之間無相關(guān)關(guān)聯(lián),是廣泛應(yīng)用于多種學(xué)科的多元統(tǒng)計(jì)分析方法[15-17]。 PCA 的數(shù)學(xué)模型[15]如下:
假設(shè)原始數(shù)據(jù)矩陣X的p個(gè)向量的線性組合為Y=AX,即
簡化為:Yi=a1ix1+a2ix2+…+apixp
其中,Yi,Yj之間互不相關(guān)(i≠j;i,j=1, 2,…,p),且各方差之間滿足如下關(guān)系:Y1>Y2,Y2>Y3,Y3>Y4,以此類推。
PCA 包括5 個(gè)步驟:①數(shù)據(jù)標(biāo)準(zhǔn)化處理,②計(jì)算相關(guān)系數(shù)矩陣,③計(jì)算特征值,④選取主成分,⑤計(jì)算主成分得分。 在進(jìn)行PCA 時(shí),應(yīng)首先確定其適用性,可采用Kaiser -Meyer -Olkin(KMO) 和Bartlett 球度檢驗(yàn)進(jìn)行適用性確定。 Bartlett 球度檢驗(yàn)法是以相關(guān)系數(shù)矩陣為基礎(chǔ),而KMO 檢驗(yàn)統(tǒng)計(jì)量則是比較變量間簡單相關(guān)系數(shù)和偏相關(guān)系數(shù)的指標(biāo),表明原始變量的整體性,KMO 檢驗(yàn)計(jì)算公式[18]如下:
式中:rij為變量之間簡單相關(guān)系數(shù);pij為偏相關(guān)系數(shù)。
2.2.2 殘差分析(RA)
在運(yùn)用PCA 法解決實(shí)際問題時(shí),常常會(huì)面臨保留幾個(gè)主成分來表征原始數(shù)據(jù)的問題。 通常是以保留特征值大于1 或方差的累計(jì)貢獻(xiàn)率大于85%的主成分為準(zhǔn)則,但可能會(huì)導(dǎo)致原始數(shù)據(jù)中有價(jià)值的信息被遺漏,所選取的主成分不能很好地表征原始信息[6]。 因此,可利用RA 法來檢驗(yàn)保留主成分?jǐn)?shù)量的合理性[19],其計(jì)算公式如下:
其中:x′ij為標(biāo)準(zhǔn)化的水質(zhì)數(shù)據(jù),xij為原始數(shù)據(jù);為第j個(gè)指標(biāo)的平均含量;Sj為j個(gè)指標(biāo)含量的標(biāo)準(zhǔn)差。 將水質(zhì)數(shù)據(jù)表示在主成分分析的前m維子空間上,如下:
圖2 不同水體離子濃度Fig.2 Ion concentration in different water bodies
3.2.1 主成分分析適用性檢驗(yàn)
圖3 不同水體水化學(xué)類型Durov 圖Fig.3 Durov diagram of different water bodies
表1 Kaiser-Meyer-Olkin 和Bartlett 球度檢驗(yàn)Table 1 Test of Kaiser-Meyer-Olkin and Bartlett
3.2.2 結(jié)果分析
主成分特征值和方差貢獻(xiàn)率見表2。 由表2 知共有3 個(gè)主成分的特征值超過1,因此基于特征值大于1 的準(zhǔn)則可得到前3 個(gè)主成分。 該3 個(gè)主成分解釋了81.103%的原始數(shù)據(jù)信息。
然而,將3 個(gè)主成分投影到平面上(圖4),根據(jù)平面上點(diǎn)的空間分布特征,可以看出3 個(gè)主成分并不能很好地表征原始數(shù)據(jù)的信息,應(yīng)該還有另外2 個(gè)主成分。 由表2 知,基于累計(jì)方差貢獻(xiàn)率大于85%的準(zhǔn)則,也僅能得到前4個(gè)主成分。
圖4 礦井水樣品在PC1-PC3 平面和PC2-PC3 平面上的投影Fig.4 Projection of mine water sample on PC1-PC3 and PC2-PC3 planes
為進(jìn)一步識(shí)別水源數(shù)量,在主成分分析的基礎(chǔ)上,進(jìn)行殘差分析。 選用逐漸增加主成分?jǐn)?shù)量的方法對(duì)離子濃度進(jìn)行重構(gòu),并計(jì)算殘差。當(dāng)殘差呈現(xiàn)出明顯的結(jié)構(gòu)性特征時(shí),表明所提取的主成分?jǐn)?shù)量不足以表征原始數(shù)據(jù)的全部信息[6]。
表2 主成分分析結(jié)果Table 2 Results of principal component analysis
圖5 保留第1 個(gè)主成分(紅色)和前兩個(gè)主成分(綠色)后殘差與原始離子質(zhì)量濃度的相關(guān)性Fig.5 Correlation between residual and original ion concentration after retaining the first PC (red) and the first two PCs (green)
綜上所述,PCA 中僅基于特征值大于1 或是累計(jì)方差貢獻(xiàn)率大于85%的準(zhǔn)則,不能很好地表征原始數(shù)據(jù)的全部信息。
利用PCA-RA 法,確定5 個(gè)主成分,可解釋94.28%的原始數(shù)據(jù)信息,即梁家煤礦礦井共有5 個(gè)補(bǔ)給來源,分別為海水、富HCO3基巖水、塌陷區(qū)積水、混合水(海水、第四系水和塌陷區(qū)積水)和第四系水。 基于水化學(xué)和PCA-RA 法,可有效處理和表征原始水質(zhì)數(shù)據(jù)信息,可更加合理地確定礦井水的補(bǔ)給來源類型和數(shù)量。
圖6 保留前三個(gè)(藍(lán)色)、前四個(gè)(粉色)和前五個(gè)(黃色)主成分后殘差與原始離子質(zhì)量濃度的相關(guān)性Fig.6 Correlation between residual and original ion concentration after retaining the first three PCs (blue), first four PCs (pink) and first five PCs (yellow)
1)梁家煤礦區(qū)內(nèi)第四系水、地表塌陷區(qū)積水和礦井水中的主要化學(xué)組分含量差別較大,Cl-和Na+為優(yōu)勢陰、陽離子,水化學(xué)類型以Na-Cl 型為主,且受到了海水入侵作用的影響。
2)在PCA 中,僅依據(jù)特征值大于1 或累計(jì)方差貢獻(xiàn)率大于85%的準(zhǔn)則來確定主成分的數(shù)量,并不能很好地表征原始數(shù)據(jù)的全部信息。
3)選取礦井水的主要離子濃度數(shù)據(jù),利用水化學(xué)和PCA-RA 法,確定了梁家煤礦礦井水共有5 個(gè)補(bǔ)給來源,即海水、富HCO3基巖水、塌陷區(qū)積水、混合水和第四系水。
4)基于水化學(xué)和PCA-RA 法,可有效地處理和表征原始水質(zhì)數(shù)據(jù)的有效信息,可更加合理地確定礦井水的補(bǔ)給來源類型和數(shù)量。