柳炳利,郭 科,敖 東,武 菊
(1.成都理工大學 地球物理學院,成都 610059;2.數學地質四川省高校重點實驗室,成都 610059;3.內江師范學院 數學與信息科學學院,內江 641112)
成礦過程的多期性和多源性,必然使得地球化學元素分布具有高度的非線性特征。眾多復雜地質因素對地球化學元素的控制,必然會表現出元素的群體特征,即共生組合特征。礦床的成礦元素及其伴生元素是指示礦床存在的重要標志,單一的指示元素異常存在著不確定性,多元素的綜合指示能夠有效地反映礦體的存在。因此,采用多元素的組合評價,則可以彌補單元素評價的不足。
基于以上考慮,作者在本文引入了信息論中的JADE算法,用于尋求地球化學成礦元素組合的關鍵問題。
獨立分量分析[1](ICA,Independent Component Analysis)是近年來由盲源分離技術(BSS,Blind Source Separation)發(fā)展起來的一種新的多維信號處理方法,是信號處理技術發(fā)展中的一項前沿熱點。與傳統(tǒng)的二階空間去相關技術相比,ICA不僅可以去除各分量之間的一階、二階相關性,同時還具有發(fā)掘并去除數據間的高階相關信息的能力,使得輸出分量之間相互獨立[2]。因此ICA可以被看作是二階空間去相關技術的一種擴展。JADE是獨立分量分析理論中的典型算法。
獨立分量分析發(fā)展至今,時間雖然不長,但在算法上已得到了深入的研究,成為現代數字信號處理的一個十分活躍的領域,在電子信息、通信、生物醫(yī)學、圖像增強、雷達、地球物理信號處理等領域中,都取得了豐碩的成果。但在地球化學領域的應用,目前仍是空白狀態(tài)。作者在本文將JADE算法應用于尋求地球化學礦化元素組合當中,取得了較好的應用效果。
多道觀測信號X是由多個信源S,經混合矩陣A組合而成(X=AS)?,F在的任務是:
在S與A均未知的條件下,求取一個解混矩陣W,使得X通過它后所得輸出Y(Y=WX)是S的最優(yōu)逼近(見下頁圖1)。
獨立分量分析有多種算法[5],如基于代數結構的AMUSE、SOBI、JADE,以及基于信息論的FastICA和Infomax。其中JADE的估計精度較高,使其成為了獨立分量分析方法中的典型算法。該
圖1 ICA的基本框圖Fig.1 The basic diagram of ICA
(1)去均值。設X(t)=(x1(t),x2(t),…,xn(t))T,t=1、2、…、N為隨機矢量X的N個樣本,則采用以下方法去除樣本的均值:
(2)白化。隨機矢量X的白化,就是通過一定的線性變換T,令
其中 T稱為白化矩陣。
其中 δij為Kronecker delta函數。
白化后的信號的分量之間二階統(tǒng)計獨立。
極大峰度法[1、2]的處理過程有二步,前一步使數據正交化,但未必獨立;后一步則在保持熵值不變的前提下,使各分量盡可能獨立。
(1)正交化。Givens旋轉是Jacobi算法的基礎,它是按照一定優(yōu)化要求,通過一種迭代步驟對一個隨機矢量進行正交歸一變換的方法。通過反復進行一系列坐標平面旋轉,來達到正交歸一變換的目的。每一次的平面旋轉,都只施加在一對坐標上。
令z為M×1矢量,對它的i、j分量,按式(3)作平面旋轉,同時保持z中其它元素不變。
(2)極大峰度法。上述步驟中的關鍵問題,是計算Givens旋轉角θij。作者在本文中以采用白化數據輸入條件下的極大似然判據εML為例加以說明。根據ML判據,對正交變換后的輸出y有:算法的主要特點是加強了算法的代數概念,即引入了多變量數據的四維累積量矩陣,并對其作特征分解,簡化了算法,也提高了結果的穩(wěn)健性。
其中 Kij、Kijkl分別表示二階及四階聯合統(tǒng)計量;σ2、k4分別表示方差和峰度。
圖2 JADE算法流程圖Fig.2 JADE algorithm flow chart
經白化及正交變換后Kij(y)=δij,又根據原始假設δ2(si)=1,于是有:
在式(5)中,第二項與y無關。在白化輸入下,第一項Kijkl(y)為常數,而第三項只有在i=j=k=l時有值,故式(5)可以寫成式(6)。
式(6)中 =c表示與原式只相差一些與y無關的項(包括常數)。
式(6)即為極大峰度算法的表達式。
作者可以對JADE算法進行總結:
(1)化探數據的零均值化。
(2)穩(wěn)健預白化方法得到W0,并令白化后的數據為Z=W0X。
(3)求出白化數據的四階累計量。
(4)根據Givens找到一個旋轉陣V,使累積量盡可能地對角化,使得判據εML最小。
(5)源信號估計,得到被恢復信號的估計:
算法流程圖見圖2。
由ICA的數學模型可知,在源信號S(t)未知,混合矩陣A未知的情況下,若要使求得的最優(yōu)逼近信源的獨立信號Y,只要求得解混矩陣W即可。因此,將多道觀測信號X(t)作為輸入值,經由去均值、白化的數據預處理后,以負極大峰度法作為優(yōu)化判據,從而確定目標函數。Givens旋轉是判據最小以求得解混矩陣W,最終得到相互獨立的信號Y。
為解決尋求最優(yōu)的成礦元素組合的問題,作者在本文中,應用JADE算法加以剖析:
將單元素地球化學數據視為多道觀測信號,將影響元素組合的各種因素視為混合矩陣,在影響因素難以確定的前提下,從統(tǒng)計獨立性的角度出發(fā),將分離出各獨立分量中能量最大的分量,視為最易致礦的元素組合。從而得到了一種非線性科學與高新信息處理技術相結合的地球化學數據處理新方法。
為驗證模型的可靠性,作者選取西藏洞嘎金礦1∶10 000土壤地球化學測量資料作為實驗數據,應用JADE算法得到成礦元素組合,最后采用分形理論,求得異常下限和異常濃集分帶[11~13]。
應用JADE算法,可以得到能量最大的獨立分量式(7)。由式(7)的系數可以看出,對獨立分量Y的影響最大的元素是Zn和Au。所以我們可以判定Y是我們要尋求的成礦元素組合,而Zn和Au是最能影響元素組合異常分布的元素。根據異常圖,我們可以對結論提供進一步的論證,見圖3。
圖3 某礦區(qū)元素異常對照圖Fig.3 Element anomalies contrast diagram
對比單元素的等值線疊加圖與JADE的元素組合異常圖我們可以看出,JADE算法能夠反映單元素疊加圖中的密集區(qū)域。也就是說,JADE算法能夠準確地反映成礦元素的空間分布。
從組合異常圖與各單元素異常圖的對比可以清楚地看出,元素組合異常清晰地反應了Zn和Au的異常形態(tài),這與由公式(7)所得到結果是一致的。
通過應用實例研究,可以得到以下結論:
(1)JADE算法從元素親和性、相關性,以及樣品和變量的空間對應關系的角度出發(fā),在分離過程中,通過對分離結果的非高斯性或相互獨立性的度量來監(jiān)視分離結果,力求定量地分離出能量最大的元素組合。即在一定區(qū)域范圍內,按照地球化學元素的空間組配形態(tài)與機制來度量異常。從組合異常圖來看,效果明顯。
(2)從處理技術上看,依據獨立性分解,勢必涉及概率論密度函數或高階統(tǒng)計量,并且在處理過程常常要引入非線性環(huán)節(jié)。而地球化學數據的空間分布特征也是非線性的[11],所以應用該技術來對地球化學數據進行處理是合理的、可行的。從這一意義上看,ICA技術優(yōu)越于常用的,只建立在二階統(tǒng)計量的線性處理技術。
(3)JADE算法能夠更科學地去除元素組合之間的相關性,得到的元素組合比傳統(tǒng)方法更具有說服力。從對比圖來看,組合異常更能反映礦致異常的分布情況,為研究地球化學次生暈的產生和分布提供了新的有力支撐。
[1] 張發(fā)啟.盲信號處理及應用[M].西安:西安電子科技大學出版社,2006.
[2] 楊福生,洪波.獨立分量分析的原理與應用[M],北京:清華大學出版社,2006.
[3] 唐江波,曾慶寧,郭威.基于ICA的快速定點算法[J].桂林電子科技大學學報,2007,31(8):47.
[4] 胡增輝,炬波,梁甸農.基于盲源分離的近場源參數估計[J].信號處理,2010,26(6):951.
[5] 郭武,朱長仁,王潤生.一種改進的FastICA算法及其應用[J].計算機應用.2008(4):960.
[6] 郭科,郭思.基于獨立分量分析的地震信號多次波盲分離方法研究[J].地球物理學進展,2010,25(3):1075.
[7] 劉喜武,劉洪,李幼銘.獨立分量分析及其在地震信息處理中應用初探[J].地球物理學進展.2003(3):90.
[8] CARDOSO J F.High-order for independent component analysis[J].Neural Computation.1999(1):157.
[9] POLETTO F,ROCCA F,BERTELLI L.Drill-bit signal sep-aration for RVSP using statistical independence[J].Geo-physics,2000(65):1645.
[10]郭科,陳聆,唐菊興.復雜地質地貌區(qū)地球化學異常識別非線性研究[J].成都理工大學學報:自然科學版,2007,34(6):599.
[11]陳聆,魏友華,郭科.用含量面積法確定深切割地區(qū)地球化學異常[J].西南師范大學學報:自然科學版,2004,29(5):867.
[12]郭科,陳聆,唐菊興,等.分形含量梯度法確定地球化學濃集中心的新探索[J].地學前緣,2007,14(5):285.