孫雅楠 劉 星 葛 祥
(1.安徽理工大學(xué)測繪學(xué)院,安徽省淮南市,232000;2.安徽理工大學(xué)地球與環(huán)境學(xué)院,安徽省淮南市,232000)
近年來,對應(yīng)分析方法逐漸發(fā)展起來,它是一種多元相依變量統(tǒng)計的分析技術(shù),廣泛應(yīng)用于地學(xué)領(lǐng)域。多元統(tǒng)計分析是經(jīng)典統(tǒng)計學(xué)的一個新興分支,能夠在多個對象和多個指標(biāo)相互關(guān)聯(lián)的情況下分析它們之間的統(tǒng)計規(guī)律。而對應(yīng)分析方法通過一定的數(shù)學(xué)轉(zhuǎn)換與計算,能夠?qū)悠泛妥兞客瑫r投影在一張平面圖上,即因子載荷圖。相對于傳統(tǒng)的方法,對應(yīng)分析可以將樣本和變量結(jié)合起來,確定主要的影響因子,更全面深入地挖掘數(shù)據(jù)信息,是一種直觀、簡單、方便的多元統(tǒng)計方法。對應(yīng)分析在地學(xué)領(lǐng)域的應(yīng)用主要是研究地下水的主要污染物以及水質(zhì)狀況、煤礦的重金屬污染物質(zhì)、環(huán)境評價以及農(nóng)業(yè)利用類型等。而本次研究主要將對應(yīng)分析方法應(yīng)用在尋找煤層厚度的主要控制因素方面。
聚煤作用的發(fā)生是古植物、古氣候、古地理環(huán)境和古構(gòu)造等地質(zhì)因素綜合作用的結(jié)果,這些因素在一定地區(qū)或一定條件下都可能成為聚煤作用的決定性因素。如果將這些因素看作變量,煤田的地面觀測點(diǎn)看作樣本,那么研究一個區(qū)域的主要控煤因素實(shí)質(zhì)上就是研究這個區(qū)域變量與變量、樣本與樣本以及變量與樣本之間的關(guān)系,通過對應(yīng)分析的方法能夠?qū)⒆兞亢蜆颖局庇^地表現(xiàn)在一張圖上,從而找出該區(qū)域控制煤層厚度的主要因素。
淮南煤田位于華北石炭—二疊紀(jì)聚煤盆地的南緣,為海陸相交替,其良好的聚煤環(huán)境使該區(qū)煤層發(fā)育良好且煤層層位相對穩(wěn)定。區(qū)內(nèi)煤炭及煤層氣資源豐富,是我國煤層氣高產(chǎn)富集區(qū)帶。本區(qū)含煤地層由上石炭統(tǒng)太原組、下二疊統(tǒng)山西組和下石盒子組、上二疊統(tǒng)上石盒子組構(gòu)成。數(shù)據(jù)采集區(qū)為潘集煤礦外圍,該區(qū)主要位于淮南市潘集區(qū)和鳳臺縣境內(nèi),東北部位于蚌埠市懷遠(yuǎn)縣境內(nèi),區(qū)內(nèi)煤炭資源豐富,是淮南礦區(qū)最重要的接替資源。該區(qū)域含煤地層主要為石炭系上統(tǒng)太原組和二疊系山西組與
上、下石盒子組。其中石炭系上統(tǒng)太原組含煤不穩(wěn)定,主要含煤地層為山西組與上下石盒子組。區(qū)內(nèi)褶皺構(gòu)造以陳橋—潘集背斜為主,軸向?yàn)镹WW向,多斷裂構(gòu)造,明龍山斷層與F66斷層是區(qū)內(nèi)的主要斷層。
數(shù)據(jù)來源于潘集煤礦外圍西南的35個鉆孔數(shù)據(jù),從中分別提取8#煤層的6個變量做對應(yīng)分析。研究區(qū)概況圖、8#煤層的厚度等值線圖以及8#煤層的厚度變化如圖1、圖2和圖3所示。
圖1 研究區(qū)概況圖
圖2 8#煤層厚度等值線圖
煤層的聚集與形成受多種因素影響,如地殼整體沉降、由多種原因(縱彎、橫彎) 引起的差異沉降和古地形低洼處的壓實(shí)沉降三者的綜合效應(yīng)(主要反映為煤系基底的沉降速度) 與造煤物質(zhì)堆積速度之間的補(bǔ)償關(guān)系、古地理環(huán)境中的水動力條件以及后期構(gòu)造變動等等,所以這6個變量分別是太原組頂面高程(C3t0_DG)、山西組厚度(P2s0_H)、下石盒子組底面高程(P1x0_DG)、下石盒子組下含煤段厚度(P1x0_H)、砂泥比(P1x0_YB)以及8#煤層厚度(8_MH)。其中太原組頂面高程(C3t0_DG)與山西組厚度(P2s0_H)反映古地形,下石盒子組下含煤段厚度(P1x0_H)反映同沉積構(gòu)造,煤系底面標(biāo)高(P1x0_DG)與太原組頂面高程(C3t0_DG)反映現(xiàn)在構(gòu)造部位,下含煤段砂泥比(P1x0_YB)反映巖相古地理與水動力條件 ,8#煤層厚度(8_MH)為含煤性指標(biāo)。
圖3 8#煤層厚度變化圖
由于原始數(shù)據(jù)中不同變量的量綱不同,因此在做對應(yīng)分析之前,需將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,本文選用的數(shù)據(jù)標(biāo)準(zhǔn)化處理方法是規(guī)范化方法。其計算公式為:
(1)
式中: min{xj}——樣本數(shù)據(jù)的最小值;
max{xj}——樣本數(shù)據(jù)的最大值。
對應(yīng)分析也叫對應(yīng)因子分析,在因子分析的基礎(chǔ)上發(fā)展而來,因子分析方法包括R型因子分析和Q型因子分析兩種。R型因子分析是對變量(指標(biāo))作因子分析,研究的是變量之間的相互關(guān)系;Q型因子分析是對樣品作因子分析,研究的是樣品之間的相互關(guān)系,而R型因子和 Q型因子是分開研究的。但實(shí)際情況下,研究的問題錯綜復(fù)雜,有時不僅要分析變量之間的關(guān)系和樣品之間的關(guān)系,還需要研究變量與樣品之間的對應(yīng)關(guān)系。這就需要一種統(tǒng)計方法來解決這一難題。1970年法國統(tǒng)計學(xué)家J.P.Beozecri提出了對應(yīng)分析,解決了上述的問題,并且在地質(zhì)、地理學(xué)科等方面得到了廣泛的應(yīng)用。對應(yīng)分析綜合了R型因子分析和Q型因子分析的優(yōu)點(diǎn),它不僅能將變量和樣品進(jìn)行聚類,而且能將變量和樣品投影在因子平面(主成分平面) 上,使得變量和樣品之間的關(guān)系也一目了然。
在因子平面上, 變量和樣品的圖形可提供如下的信息:
(1)鄰近的變量點(diǎn)表示這些變量的關(guān)系密切,它們有成因上的聯(lián)系。
(2)鄰近的樣品點(diǎn)表示樣品同屬一種類型,可以解釋為同一地質(zhì)過程的產(chǎn)物。
(3)同一類型的樣品點(diǎn)由它們鄰近的變量所表征,這一點(diǎn)對樣品類型的解釋很有幫助。同時通過樣品在空間的分布可以了解地質(zhì)過程在空間的關(guān)系。
其基本步驟如下:
(1)建立鉆孔點(diǎn)的原始數(shù)據(jù)矩陣X。設(shè)有n個樣本點(diǎn),每個樣本點(diǎn)有p個變量,則組成原始數(shù)據(jù)矩陣X=[xij],其中xij中的下標(biāo)中i=1,2,3…n,代表樣本點(diǎn)序號;j=1,2,3…p,代表變量序號。xij代表第i個樣本點(diǎn)第j個變量點(diǎn)的測量值。
(2)對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,標(biāo)準(zhǔn)化處理方法見式(1)。
(3)將X矩陣變換為概率矩陣P=[pij],并計算Z矩陣,其中:
(2)
令
(3)
分別計算概率矩陣P的行和與列和:
行和:
(4)
列和:
(5)
變換原始數(shù)據(jù)為Z矩陣,使Z=[Zij]
(6)
(4)計算Z的p×p協(xié)方差陣R,并提取它的特征值λk與特征向量Uk。
R=ZTZ
(7)
(5)計算Z的n×n協(xié)方差陣Q,并提取它的特征值λk(其非零特征值與R的非零特征值相同)與特征向量Vk。
Q=ZZT
(8)
(6)計算R型因子的載荷陣F與Q型因子的載荷陣G。
求出協(xié)方差陣的特征值λk后,將特征值由大到小排序,即λ1≥λ2≥…≥λm≥0。一般取前k個貢獻(xiàn)率大于80%的特征值及其相應(yīng)的特征向量U1,U2,…Uk(V1,V2,…Vk)。分別得到R型和Q型因子的載荷陣F、G。其中:
(7)在二維因子軸上作圖。 將變量點(diǎn)和樣品點(diǎn)同時放在同一因子圖上表現(xiàn)出來,根據(jù)接近程度,對變量點(diǎn)和樣品點(diǎn)同時進(jìn)行分類。這樣R型分析結(jié)果與Q型分析結(jié)果同時反映在一張圖上。其中變量點(diǎn)距離越近,它們的關(guān)系越密切;而樣本點(diǎn)距離越近,表示它們相似或同類;如果變量點(diǎn)靠近樣本點(diǎn),說明這些變量對這些樣本點(diǎn)具有某種因果關(guān)系,其相關(guān)程度可以由它們之間的距離來刻畫,距離越近表示關(guān)系越密切。變量與樣品個數(shù)越多,對應(yīng)分析的優(yōu)勢越明顯。
上述對應(yīng)分析的計算過程全部利用Matlab軟件編程實(shí)現(xiàn),分別得到R型和Q型因子載荷,以及因子載荷圖。其結(jié)果如下:
前4個因子的方差貢獻(xiàn)及R型分析結(jié)果如表1和表2所示:
表1 前4個因子的方差貢獻(xiàn)表
表2 R型分析結(jié)果
由表1和表2可知,前兩個因子可解釋的方差貢獻(xiàn)為80.01%,前3個因子占方差貢獻(xiàn)的90.85%,可以說前3個因子幾乎能夠代表了所有的原始信息。這里選取前兩個主要因子進(jìn)行解釋。
F1-F2因子載荷圖見圖4。由圖4可以看出,變量C3t0_DG與變量P1x0_DG相距最近,說明這兩個變量具有相似的形成過程,兩者共同表征現(xiàn)在構(gòu)造部位。變量8_MH與變量P1x0_H相距最近,并且呈顯著的正相關(guān),說明8#煤層的形成過程與同沉積構(gòu)造相似,具有成因上的聯(lián)系。
圖4 F1-F2因子載荷圖
另外,從表2和圖4可以看出,第一因子的方差貢獻(xiàn)為48.62%,載荷絕對值最大的是變量8_MH(0.2081)、P2s0_H(-0.1373)和P1x0_DG(-0.1301),而載荷絕對值反映其與不同因子軸的相關(guān)性。8_MH為含煤指標(biāo),因此在第一因子軸上,起主導(dǎo)作用的變量是變量P2s0_H和變量P1x0_DG。其中8_MH與變量P2s0_H和變量P1x0_DG呈明顯的負(fù)相關(guān),即8#煤層的形成過程變量P2s0_H和變量P1x0_DG的形成過程是相反的,也就是在古地形低洼處形成了良好的聚煤環(huán)境,而現(xiàn)在構(gòu)造繼承了原始的古地形,具有相似的聚煤環(huán)境。當(dāng)現(xiàn)在構(gòu)造部位比較低的時候,山西組的沉積厚度比較薄,相對來說,也是一個低洼的聚煤環(huán)境,有利于聚煤作用的持續(xù)進(jìn)行。這說明了影響該地區(qū)煤層形成的主要因素是古地形和現(xiàn)代構(gòu)造部位。
第二因子方差貢獻(xiàn)為31.39%,對聚煤作用的影響低于第一因子,載荷絕對值最大的是P1x0_YB(0.1776)和P2s0_H(-0.1383),說明該因子軸上影響聚煤作用的主要因素是古地形和水動力條件。在第二因子軸上,變量P1x0_YB和變量P2s0_H呈負(fù)相關(guān)關(guān)系,如圖5所示,變量8_MH與變量P1x0_YB呈負(fù)相關(guān),與變量P2s0_H呈正相關(guān),說明水動力條件好不利于沉積物沉積,也就不利于聚煤作用的進(jìn)行,如圖6所示。由圖6可以發(fā)現(xiàn),8#煤層厚度較大的點(diǎn)聚集在砂泥比為0.5~1之間,這就說明了巖相古地理的水動力條件對聚煤作用的影響。
圖5 P2s0-H與P1x0-YB的對應(yīng)關(guān)系
圖6 P1x0-YB與8_MH的對應(yīng)關(guān)系
Q型因子載荷表示樣本點(diǎn)在不同軸上的變異程度,根據(jù)因子平面圖,明顯可以將35個鉆孔點(diǎn)分成3個點(diǎn)群。
(1)第一點(diǎn)群。包括9個鉆孔點(diǎn),均無山西組沉積,出現(xiàn)地層缺失,煤系基底面比較低。下含煤段厚度4.43~18.71 m,平均厚度11.67 m。8#煤層厚度1.68~4.14 m,平均厚度2.49 m,且大部分鉆孔8#煤層厚度在2 m以上。
(2)第二點(diǎn)群。包括13個鉆孔點(diǎn),山西組沉積厚度40.44~78.66 m,平均厚度68.85 m,下含煤段厚度為10.05~19.35 m,平均厚度15.29 m。8#煤層厚度為2.07~4.6 m,所有鉆孔點(diǎn)的8#煤層厚度都在2 m以上,平均厚度為2.74 m。
(3)第三點(diǎn)群。包括13個鉆孔點(diǎn),山西組沉積厚度34.19~81.14 m,平均厚度69.12 m,下含煤段厚度為9.31~18.93 m,平均厚度14.41 m。8#煤層厚度為0.97~2.79 m,平均厚度為1.81 m,大部分鉆孔8#煤層厚度不足2 m。
觀察因子平面圖可知,第一點(diǎn)群位于變量P2s0_H和P1x0_DG、C3t0_DG之間,說明第一點(diǎn)群的成煤因素與這3個變量密切相關(guān),雖然該點(diǎn)群無山西組沉積,地層發(fā)育不完整,但是煤系基底面相對其他點(diǎn)群比較低,其表現(xiàn)如圖7所示。由圖7可知,第一點(diǎn)群鉆孔點(diǎn)的下石盒子組底面高程都比較低,說明該區(qū)域的現(xiàn)在構(gòu)造在古地形的基礎(chǔ)上發(fā)育有向斜,有利于聚煤作用的持續(xù)進(jìn)行。第二點(diǎn)群位于第一點(diǎn)群和第三點(diǎn)群之間,距離變量P1x0_DG、C3t0_DG和變量P1x0_H比較近,說明該點(diǎn)群的聚煤作用受這3個變量的影響。聚煤作用與同沉積構(gòu)造和現(xiàn)代構(gòu)造部位密切相關(guān),且該點(diǎn)群的下含煤段厚度與山西組沉積厚度都比較大,說明該點(diǎn)群所在的地區(qū)沉積環(huán)境好,加上煤系基底面持續(xù)下沉,且其下沉速度小于等于造煤物質(zhì)的堆積速度,便形成了該區(qū)域的富煤區(qū)。第三點(diǎn)群距離變量P1x0_H與P1x0_YB比較近,所在區(qū)域位于古地形高地,容易被侵蝕與尖滅,其構(gòu)造條件不利于煤炭沼澤的發(fā)育,聚煤作用微弱,而且由于受到陳橋—潘集背斜影響,區(qū)內(nèi)發(fā)育有層滑構(gòu)造,出現(xiàn)煤層薄化。
(1)通過對應(yīng)分析發(fā)現(xiàn),不論是在哪個因子軸上,起主導(dǎo)作用的變量都是P2s0_H,也就是說古地形是控制該地區(qū)煤層厚度的主要因素。除此之外,變量P1x0_YB與變量P1x0_H載荷絕對值的貢獻(xiàn)率也很大,這就說明合適的水動力條件和良好的同沉積構(gòu)造也會持續(xù)不斷地影響聚煤作用。
(2)上述的對應(yīng)分析結(jié)果只是對前兩個主要因子作出了解釋,需要注意的是第三個因子和第四個因子分別占方差總貢獻(xiàn)的10.84%、9.14%,包含的信息量同樣是不可以忽略的。第三個因子中載荷絕對值最大的是變量8_MH與變量P1x0_H,顯然兩者呈負(fù)相關(guān),說明該區(qū)域的同沉積構(gòu)造不利于煤層的聚集。而第四個因子中載荷絕對值最大的是變量P1x0_YB與變量P2s0_H,也就是古地形和巖相古地理的水動力條件是控制這一因子軸的主要因素,這正好與之前在變量之間的關(guān)系里的論述相對應(yīng)。
(3)利用對應(yīng)分析的方法分析了淮南市潘集煤礦外圍控制煤層厚度的影響因素,把R型分析結(jié)果與Q型分析結(jié)果有機(jī)地結(jié)合在一起,并呈現(xiàn)在一張平面圖上,其直觀性、高效性是主成分分析和因子分析所不能夠做到的。對應(yīng)分析法大大地提高了工作效率,能夠快速地找到控制煤層厚度的主要因素,并且有效地揭示了變量與樣品之間的關(guān)系。但是由于本文的數(shù)據(jù)量比較少,沒能夠很有效地體現(xiàn)對應(yīng)分析的優(yōu)越性。而數(shù)據(jù)量大的時候能最大程度地體現(xiàn)對應(yīng)分析的高效性和直觀性,其分布特征將會表現(xiàn)得更明顯,結(jié)果就會更精確,并且數(shù)據(jù)量大的時候可以對其所在區(qū)域進(jìn)行地質(zhì)分區(qū),而數(shù)據(jù)量少的時候地質(zhì)分區(qū)不具有代表性,故文章沒有進(jìn)行地質(zhì)分區(qū)。
圖7 煤系基底面P1x0_DG等值線圖及鉆孔平面投影圖