徐睿澤
(中國地質(zhì)大學(xué)(北京) 信息工程學(xué)院,北京100083)
地質(zhì)鉆探是礦產(chǎn)勘探和地質(zhì)調(diào)查的直接手段,但經(jīng)常面臨缺乏全面完整的大數(shù)據(jù)支撐[1],受地質(zhì)鉆孔成本及研究區(qū)地質(zhì)環(huán)境等因素的影響,已有的鉆孔點(diǎn)一般是離散不規(guī)則的,需要通過空間插值的方法利用有限的鉆孔數(shù)據(jù)模擬連續(xù)的地質(zhì)體曲線[2],進(jìn)而滿足分析研究區(qū)巖石分布深度隨空間變化的需求.因此,如何獲取巖石的空間分布在理論和實(shí)際應(yīng)用上都具有十分重要的意義.而空間插值是獲取地理要素空間信息的常用方法,該方法能夠?qū)㈦x散分布的鉆孔點(diǎn)轉(zhuǎn)換為連續(xù)分布的曲面數(shù)據(jù).但受時(shí)空效應(yīng)、模型算法和樣本數(shù)據(jù)屬性等因素的影響,各種模型的精度均存在差異[3],“包插百量”的最優(yōu)差之方法是不存在的[4].因此,需要針對數(shù)據(jù)屬性和研究區(qū)的地理位置比較不同的空間插值方法,進(jìn)而選出最優(yōu)的插值模型.
利用鉆孔數(shù)據(jù)進(jìn)行插值重構(gòu)工作,對明確礦區(qū)內(nèi)礦體的賦存空間和找礦工作具有參考價(jià)值和實(shí)踐意義.然而,針對興海縣賽什塘礦區(qū),大量研究多集中于該地區(qū)的礦床地質(zhì)特征[5-6]、礦床成因[7-8]和礦床富集規(guī)律[9],有關(guān)該礦區(qū)內(nèi)各巖石深度的空間分布及變化規(guī)律的研究卻少有報(bào)道.因此本文基于賽什塘礦區(qū)已有的鉆孔數(shù)據(jù),以矽卡巖為研究對象,比較不同插值方法的預(yù)測誤差及區(qū)域內(nèi)的分布趨勢,進(jìn)而結(jié)合最優(yōu)插值模型進(jìn)行空間分布研究,旨在為相關(guān)部門及研究人員掌握賽什塘礦區(qū)內(nèi)矽卡巖深度分布提供幫助,同時(shí)為該礦區(qū)內(nèi)礦床礦體流體特征的深入研究和分析提供基礎(chǔ)與保障.
賽什塘礦區(qū)的地理坐標(biāo)是北緯35°18′00″,東經(jīng)99°47′00″,地處鄂拉山地區(qū)的東南部,隸屬于青海省興??h.該礦區(qū)所處的地質(zhì)環(huán)境十分復(fù)雜,內(nèi)部以褶皺構(gòu)造為主,斷裂構(gòu)造為輔,其西北向的構(gòu)造控制著研究區(qū)內(nèi)巖石的分布特點(diǎn).礦區(qū)的總面積達(dá)3.435 km2,且礦區(qū)內(nèi)礦種豐富,是整個(gè)青海省的重要礦帶.
以青海省興??h賽什塘礦區(qū)為研究區(qū)域,統(tǒng)計(jì)研究區(qū)1970~2009年內(nèi)共計(jì)498個(gè)鉆孔點(diǎn),其中鉆孔的經(jīng)緯度和鉆孔中包含的主要巖性數(shù)據(jù)均來源于全國重要地質(zhì)鉆孔數(shù)據(jù)庫服務(wù)平臺.同時(shí),篩選出含有矽卡巖的鉆孔點(diǎn),并利用孔口高程與該巖性的深度做差來消除地形影響,從而獲得矽卡巖分布的相對深度.
主要借鑒易湘生[10]等人針對土壤厚度的空間插值研究方法和徐存東[11]等人針對地下水埋深的空間插值研究方法,同時(shí)參考了氣象數(shù)據(jù)[12]、降水量數(shù)據(jù)[13-14]的空間插值研究方法,將地統(tǒng)計(jì)學(xué)的空間插值方法引用到本文針對矽卡巖深度的空間分布探究中.
探索性空間數(shù)據(jù)分析旨在探究數(shù)據(jù)是否具有空間相關(guān)性,是進(jìn)行空間插值的前提.本文利用ArcGIS軟件的地統(tǒng)計(jì)學(xué)分析模塊進(jìn)行矽卡巖深度的趨勢分析和變異性分析,同時(shí)利用Geo Da軟件進(jìn)行鉆孔點(diǎn)的空間自相關(guān)分析.
克里金插值是以空間自相關(guān)性為基礎(chǔ),利用原始數(shù)據(jù)和半方差函數(shù)的結(jié)構(gòu)性,對區(qū)域化變量的未知采樣點(diǎn)進(jìn)行無偏估計(jì)的插值方法,是地統(tǒng)計(jì)學(xué)的主要內(nèi)容之一[10].為科學(xué)地篩選出相對最優(yōu)模型,本研究首先在控制半方差函數(shù)為球狀模型和插值方法的普通克里金插值條件下比較一階與二階多項(xiàng)式的優(yōu)劣,進(jìn)而比較三角函數(shù)、球面函數(shù)、指數(shù)函數(shù)、高斯函數(shù)四種半方差函數(shù)模型,最終通過比較普通克里金、泛克里金、簡單克里金、指示克里金插值方法篩選出最為適合的相對最優(yōu)模型.
利用交叉驗(yàn)證法進(jìn)行模型檢驗(yàn)與比較,進(jìn)而篩選出該研究區(qū)域中矽卡巖深度分布的相對最優(yōu)模型.采用平均誤差(ME)、平均標(biāo)準(zhǔn)誤差(ASE)、標(biāo)準(zhǔn)化均方根誤差(RMSSE)、標(biāo)準(zhǔn)化平均誤差(MSE)、均方根誤差(RMSE)對插值結(jié)果進(jìn)行比較.其中,以下各插值結(jié)果作為較為良好的效果:ME絕對值接近0;ASE與RMSE較為接近;RMSSE接近于1;MSE較為接近0;RMSE越小其插值效果越理想.
將鉆孔點(diǎn)數(shù)據(jù)進(jìn)行Log變化后,偏度更接近于0,且數(shù)據(jù)的平均值與中位數(shù)更加接近,數(shù)據(jù)基本符合正態(tài)分布.研究區(qū)中部地區(qū)的采樣點(diǎn)與鄰域數(shù)值呈高高聚集,西北地區(qū)呈低低聚集,反應(yīng)累積分布函數(shù)p≤0.05,初步判斷數(shù)據(jù)符合空間自相關(guān)性.
表1 不同步長值及步長數(shù)下的指示克里金插值的預(yù)測誤差
按鉆孔點(diǎn)的分布位置均勻地刪除9個(gè)點(diǎn),并對其進(jìn)行克里金插值,將刪除點(diǎn)前與刪除點(diǎn)后的插值結(jié)果進(jìn)行減法運(yùn)算,發(fā)現(xiàn)刪除點(diǎn)后的插值圖與原圖差別不大,因此認(rèn)為選取的鉆孔點(diǎn)符合平穩(wěn)性假設(shè).同時(shí),在進(jìn)行數(shù)據(jù)的差異性分析中,通過改變步長值和步長數(shù),能夠有效減小誤差(表1,88頁),得到更加準(zhǔn)確的插值結(jié)果.
圖1 中,Y軸表示正北方向,X軸表示正東方向,Z軸表示各個(gè)采樣點(diǎn)矽卡巖深度的空間趨勢圖,XY軸平面上的豎直線代表每個(gè)采樣點(diǎn)矽卡巖的深度及其所在的空間位置,兩個(gè)豎直投影平面上的曲線分別對應(yīng)南北和東西的趨勢效應(yīng)變化情況.結(jié)果表明,塞什塘礦區(qū)矽卡巖深度分布在兩個(gè)方向上基本呈一階或輕微的二階多項(xiàng)式的變化趨勢.在后續(xù)的研究中通過兩種趨勢效應(yīng)的比較,可以更科學(xué)準(zhǔn)確地進(jìn)行趨勢判斷.
3.2.1 趨勢判斷
在選用普通克里金插值的前提下,針對四種函數(shù)分別選用一階多項(xiàng)式和二階多項(xiàng)式的趨勢效應(yīng),從而比較不同趨勢效應(yīng)的插值效果.由表2可以看出,二階的ASE和RMSE的值更接近,且二階趨勢的RMSSE比一階趨勢稍大,誤差值更接近1.由交叉驗(yàn)證的結(jié)果可以看出,二階趨勢的插值方法總體上比一階插值方法理想.
表2 普通克里金插值的預(yù)測誤差
3.2.2 半方差函數(shù)比較
基于表2中二階克里金插值預(yù)測誤差比較分析發(fā)現(xiàn),球面模型的RMSE值最小,MSE的絕對值最接近于0且RMSSE的值最接近于1,因此在ME誤差相差不大的情況下,通過數(shù)據(jù)初步判斷普通克里金球面模型的插值效果最好.同時(shí)通過圖2(a)~(d)的對比,球面函數(shù)插值效果更平滑,更符合實(shí)際情況,而其他函數(shù)的插值效果會出現(xiàn)較明顯的斷層現(xiàn)象.
3.2.3 四種克里金插值結(jié)果
基于上述研究結(jié)果發(fā)現(xiàn),球面模型是最適合本研究區(qū)的函數(shù)模型,因此本小節(jié)基于球面函數(shù)模型進(jìn)行四種克里金插值的比較,分別從預(yù)測誤差(表3,90頁)和插值結(jié)果圖(圖3,90頁)兩方面判斷最優(yōu)模型.從預(yù)測誤差方面看,泛克里金的預(yù)測誤差遠(yuǎn)遠(yuǎn)大于其余三種插值方法,ME的絕對值甚至為其他插值方法的幾倍,相比較而言,指示克里金的插值預(yù)測誤差要遠(yuǎn)遠(yuǎn)小于其余三種插值方法.四種基于球面函數(shù)模型的克里金插值結(jié)果圖,可以直觀地反映插值效果.普通克里金插值方法有較多的數(shù)據(jù)特異點(diǎn),存在“孤島”現(xiàn)象,這與插值的意義相背;基于泛克里金的插值方法在賽什塘礦區(qū)東部出現(xiàn)了很多分層情況,其插值效果較差;根據(jù)簡單克里金插值圖基本判斷不出礦區(qū)矽卡巖的分布規(guī)律,無法對分布情況進(jìn)行判斷;而指示克里金插值結(jié)果更平滑,效果相對更好.
表3 矽卡巖深度分布的地統(tǒng)計(jì)學(xué)內(nèi)插方法預(yù)測誤差
對于空間插值結(jié)果,沒有絕對最優(yōu)的插值方法,要根據(jù)具體的條件和實(shí)際情況,對不同的研究區(qū)選取最佳方法[15].為得到理想的插值效果,就要對采樣點(diǎn)數(shù)據(jù)進(jìn)行充分的分析及恰當(dāng)?shù)暮瘮?shù)變換.在控制變量的前提下,反復(fù)實(shí)驗(yàn)比較,選出最佳的插值方法.克里金插值是以半變異函數(shù)為理論基礎(chǔ)的一種線性無偏最優(yōu)估計(jì),對于具有空間相關(guān)性的矽卡巖深度數(shù)據(jù),可以得到較為滿意的插值結(jié)果.綜合興??h賽什塘礦區(qū)矽卡巖深度的插值分布效果及誤差驗(yàn)證結(jié)果,基于球面函數(shù)模型的指示克里金插值為本研究的最優(yōu)插值模型.普通克里金插值因光滑效應(yīng),對于局部不連續(xù)性的情況并不能很好地模擬研究區(qū)內(nèi)矽卡巖的深度空間分布.而泛克里金假設(shè)數(shù)據(jù)中的趨勢是能夠用確定的多項(xiàng)式來擬合的,而本文矽卡巖深度數(shù)據(jù)的分布趨勢并不明顯,難以利用確定的多項(xiàng)式擬合,因此泛克里金的插值方法在本文中并未突出其優(yōu)勢.
基于興海縣塞什塘礦區(qū)鉆孔數(shù)據(jù),綜合比較四種空間插值方法對矽卡巖深度空間分布的預(yù)測誤差和插值結(jié)果圖,得出以下結(jié)論:
(1)矽卡巖深度數(shù)據(jù)呈正態(tài)分布且其空間自相關(guān)性較強(qiáng);東西和南北方向矽卡巖深度數(shù)據(jù)均呈現(xiàn)一階或輕微二階分布趨勢;方差變異分析中,步長數(shù)在5~12,步長值在0.002~0.01范圍內(nèi),會得到相對最佳插值結(jié)果.
(2)基于球面模型的OK、IK、SK和UK,經(jīng)過交叉驗(yàn)證進(jìn)行誤差預(yù)測,球面指示克里金插值效果更符合實(shí)際.
(3)基于插值結(jié)果,本礦區(qū)西北部矽卡巖深度分布最淺,中部和東南部矽卡巖深度分布相對最深.而由于東部地區(qū)鉆孔點(diǎn)相對較少,出現(xiàn)輕微斷層現(xiàn)象,可能與實(shí)際分布情況不相符.