張光輝 周 文 張銀德 金文輝 包 艷
(1.成都理工大學信息管理學院,四川 成都 610059;2.成都理工大學能源學院,四川 成都 610059)
基于GGA優(yōu)化的PNN方法在氣水儲層識別中的應用
張光輝1,2周 文2張銀德2金文輝2包 艷2
(1.成都理工大學信息管理學院,四川 成都 610059;2.成都理工大學能源學院,四川 成都 610059)
能夠較準確地進行氣水層識別一直以來都是油氣勘探開發(fā)非常關注的一個問題。在認真分析Z氣田山2段儲層地質特征的基礎上,提出了基于格雷碼遺傳算法優(yōu)化的概率神經(jīng)網(wǎng)絡方法(GGA-PNN),探索了該方法在氣水層識別中的應用。首先綜合常規(guī)測井資料和試氣資料構建59個氣水層樣本(其中學習樣本36個,預測樣本23個),并進行數(shù)據(jù)歸一化處理,然后采用格雷碼遺傳算法來訓練PNN平滑參數(shù)和隱中心矢量建立起氣水層目的層段識別模型。利用該模型對36個建模訓練樣本進行回判,正確率達100%。然后對23個預測樣本進行識別,結果正確的有22個,預測精度達95.65%,其中一個誤判樣本是把干層判識為氣層。由此表明,利用GGA-PNN方法對山2段未知流體屬性的正確識別是可行的。
地質特征;流體屬性;GGA-PNN;氣水識別
D F Specht[1]提出的概率神經(jīng)網(wǎng)絡(Probabilistic Neural Network,簡稱PNN)是基于密度函數(shù)估計和貝葉斯決策理論而建立的一種分類網(wǎng)絡。PNN的拓撲結構簡單,容易設計算法,廣泛應用于模式識別及模式分類領域。遺傳算法(Genetic Algorithm,簡稱GA)自Holland于1975年首次提出后,受到了廣泛重視。在應用GA時[2-3],人們發(fā)現(xiàn)二進制編碼有時不便于反映所求問題的結構特征,對于一些連續(xù)函數(shù)的優(yōu)化問題,GA的局部搜索能力也較差。格雷碼編碼方法便于提高遺傳算法的局部搜索能力,且便于實現(xiàn)雜交、變異等遺傳操作。目前,有關PNN參數(shù)的學習基本上都沒有用到訓練樣本的分類正確率,屬于無監(jiān)督學習,筆者給出基于格雷碼遺傳算法(Gray Code Genetic Algorithm,簡稱GGA[4])優(yōu)化的PNN有監(jiān)督學習算法。該方法在油氣勘探開發(fā)領域的應用研究雖剛起步,但和現(xiàn)有的技術方法相比,該方法能明顯提高預測、識別的精度,因而具有良好的應用前景。
Z地區(qū)隨著勘探開發(fā)的深入,在大面積開發(fā)天然氣的同時,出現(xiàn)了產(chǎn)水層,產(chǎn)水0.3~46.6 m3·d-1,嚴重地影響了該地區(qū)的開發(fā)效果和開發(fā)措施 (如射孔層段的選擇),特別是給開發(fā)井的部署帶來極大的風險。這就要求弄清Z地區(qū)的氣水分布區(qū),為提高開發(fā)井的鉆探成功率、高效建產(chǎn)提供必要的前提。而對氣水層的識別是研究氣水分布規(guī)律的重要手段,氣水層的識別問題實質上是一個分類問題,綜合利用常規(guī)測井和地質資料,分析有試氣結論的氣水層測井響應特征,提取測井曲線特征參數(shù),使用一種新的測井識別技術——GGAPNN方法對Z氣田山2段儲層流體性質進行了分類,從而進行氣水層識別。
Z氣田山2段砂體為三角洲前緣水下分流河道沉積,是Y地區(qū)南部砂體在東南向的繼續(xù)延伸。砂體平面呈鳥足狀展布,砂體間發(fā)育分流間灣沉積。單個砂體厚度一般較薄。砂體垂向上表現(xiàn)為正粒序和多個正粒序的疊加,缺乏“二元結構”。
山2段儲層巖性主要為灰白色中粗粒石英砂巖、含礫不等粒石英砂巖、中粗粒巖屑質石英砂巖,局部夾灰色、深灰色粗粒巖屑砂巖及含泥巖屑砂巖。石英砂巖為主要儲集巖性。受沉積環(huán)境的影響,山2段砂巖儲層成分成熟度和結構成熟度較高,儲層碎屑成分以石英為主,一般占全巖組分的75%~85%,占碎屑組成的92%~100%,次為巖屑,占全巖組成的0~6%,占巖屑組成的0%~3%,長石很少,且僅在局部層段出現(xiàn),大部分探井山2段無長石組分。
山2氣藏中部海拔為-1 640~-1 140 m,高差為500 m,平均原始地層壓力為23.7 MPa。根據(jù)常規(guī)物性分析資料統(tǒng)計結果,山2段有效儲層孔隙度主要分布在4.0%~8.0%,平均5.6%;滲透率主要分布在(0.1~10.0)× 10-3μm2,平均1.27×10-3μm2。
2.1 格雷碼簡介[4]
格雷碼是這樣的一種編碼,連續(xù)的2個整數(shù)所對應的編碼值之間僅僅只有一個碼位是不相同的,其余碼位都完全相同。格雷碼遺傳算法可以有效克服二進制編碼的Hamming懸崖缺陷,提高遺傳算子的搜索效率。因此,采用格雷碼(Gray Code)對個體進行編碼是一種很有效的編碼方式。
2.2 PNN模式識別原理[5]
2.2.1 PNN拓撲結構
PNN有幾種典型的拓撲結構[1],筆者使用基于密度函數(shù)核估計的PNN結構[6],這種結構如圖1所示[7]。PNN由4層組成:輸入層、隱層、加層、輸出層。輸入層不做任何計算,把數(shù)據(jù)x輸?shù)骄W(wǎng)絡。隱層接收輸入數(shù)據(jù)x后,第i類模式的第j隱層神經(jīng)元所確定的輸入輸出關系由下式來定義:
其中,i=1,2,…,M;j=1,2,…,Ni;M為訓練樣本的總類數(shù);Ni為第i類訓練樣本的個數(shù),稱其為PNN的第i類模式的隱層神經(jīng)元個數(shù);s為樣本空間維數(shù);σ為平滑參數(shù)(σ∈[0,∞]);xij為第i類訓練樣本的第j個樣本數(shù)據(jù),稱其為PNN的第i類模式的第j隱中心矢量。加層則把隱中心矢量中屬于同一類的所代表的隱層神經(jīng)元輸出相加并作算術平均:
由貝葉斯決策[1],fiNi(x)中最大者的第一個下標所代表的類別為樣本x的估計類別,故得輸出層的輸出為
式中:ρ(x)為樣本x輸入該網(wǎng)絡后所得到的估計類別。
圖1 PNN拓撲結構
2.2.2 基于GGA優(yōu)化的PNN學習算法
GGA優(yōu)化的PNN算法的主要步驟如下[6]:
1)設定參數(shù)值,聚類數(shù)Ni(i=1,2,…,M),θ1,θ2,種群規(guī)模P,交叉概率Pc,變異概率Pm,編碼精度δ,最大進化代數(shù)T。
2)用LVQ[6]分別對訓練樣本聚類,并計算每一類的中心,得到聚類點vij(i=1,2,…,M;j=1,2,…,Ni)和中心mi(i=1,2,…,M)。
3)計算
并構造區(qū)域:
其中,dimax為第i類訓練樣本中最大的歐式距離,即且均為事先給定的正常數(shù);μilik,νilik分別為μili,νili的第k維的數(shù)值。
4)采用格雷碼編碼[4],得到總的編碼長度為L。
5)隨機產(chǎn)生P條長度為L的染色體構成初始種群,并設當前代數(shù)為t=1。
6)通過解碼得出σ,μili(i=1,2,…,M),由此可通過σ,μili(i=1,2,…,M),νij(i=1,2,…,M;j=1,2,…,Ni)構建PNN,輸入所有訓練樣本,并計算被正確分類的樣本數(shù),即為染色體的適應度函數(shù)。
7)根據(jù)適應度函數(shù),依據(jù)比例選擇,獨立地從當前種群中選取P個母體。
8)根據(jù)交叉概率Pc,獨立地對(7)選擇后的染色體進行雜交,雜交得到P條中間個體。
9)根據(jù)變異概率Pm,獨立地對(8)雜交后得到的個體進行變異,得到下代種群。
10)設當前代數(shù)t=t+1。
11)檢查t,若t<T,返回(6),否則停止。
上述算法記為GGA-PNN。其中,聚類數(shù)目Ni(i= 1,2,…,M),θ1,θ2是必須考慮的參數(shù)。
氣層、水層、干層的識別屬于多分類判別模式識別的問題,因此可以利用GGA-PNN方法建立流體識別模型來求解。其基本思路是:首先收集建模樣本,并進行數(shù)據(jù)預處理,然后用GGA-PNN方法建立模型,最后用建立好的模型進行目標識別。
3.1 實驗測試建模
3.1.1 樣本集選取及數(shù)據(jù)歸一化[8-9]
在測井解釋中,學習樣本的真實性、代表性和泛化性是決定預測效果的關鍵,主要由地層測試結果和與之對應的一組測井響應值構成。通過分析各個待選參數(shù)對預測目標的敏感程度,最后確定儲集層流體類型的GGA-PNN判別模型輸入?yún)?shù),包括中子CNL、聲波、深淺雙側向電阻率、自然伽馬等5個參數(shù)。輸出參數(shù)為正整數(shù)表示的氣水層類別標號,如類別1表示水層,類別2表示氣層,類別3表示干層。
由于各參數(shù)的單位和數(shù)量級存在較大差異,如果直接用原始數(shù)據(jù)進行計算,將導致傳遞函數(shù)內(nèi)積計算困難,對預測結果造成負面影響。為避免這種情況發(fā)生,首先對學習樣本的屬性值進行歸一化處理,即根據(jù)“屬性值呈正態(tài)分布的進行常規(guī)歸一化,屬性值呈非正態(tài)分布(如深側向電阻率)的進行對數(shù)歸一化處理”的原則,對所選取的各測井曲線進行歸一化處理,最終將樣本的屬性值映射到[0,1]區(qū)間,從而減小GGA-PNN模型的計算量,提高預測精度。
3.1.2 GGA-PNN分類流程
氣水識別的GGA-PNN分類流程如圖2所示,整個算法的實現(xiàn)通過Matlab R2008a中遺傳算法工具箱和神經(jīng)網(wǎng)絡工具箱來完成。
圖2 GGA-PNN分類流程
3.2 應用效果分析
Z地區(qū)山2段為應用研究的目的層。利用所建立的GGA-PNN氣水識別模型[10-13],對59個由試氣結果和測井資料得到的氣水層樣本進行了回判與預測。36個建模訓練樣本回判的準確率達100%,效果較好。23個預測樣本正確識別的有22個,正確率達到95.65%,其中1個誤判樣本是將干層判識為氣層,因此水層樣本沒有漏失。
圖3為y80井應用GGA-PNN方法進行氣水層識別的結果,并與常規(guī)測井解釋結果進行了對比。該井山23層位(2 606~2 609.9 m)經(jīng)射孔試氣證實,產(chǎn)氣量16 823 m3·d-1,產(chǎn)水量1.5 m3·d-1,GGA-PNN方法可以將氣水層完全分開,很清楚地看出單井剖面上氣、水層的分布,為射孔試氣提供決策依據(jù)。
基于格雷碼遺傳算法優(yōu)化的PNN有監(jiān)督學習算法(GGA-PNN),綜合考慮儲層巖性、物性、流體導電性等的測井響應特征,建立氣水儲層識別模型,可以提高測井解釋精度。該算法把訓練樣本的分類正確率應用到網(wǎng)絡的參數(shù)學習中,同時采用格雷碼遺傳算法來訓練PNN平滑參數(shù)和隱中心矢量,氣水層識別正確率較高。
圖3 GGA-PNN氣水層識別結果
從應用效果來看,GGA-PNN方法用于解決分類、識別、預測問題,精度高,效果好,在油氣勘探開發(fā)領域不失為一種新的有效方法,因此該方法具有良好的應用前景。
[1]Specht D F.Probabilistic neural network[J].Neural Networks,1990,3(1):109-118.
[2]邢文訓,謝金星.現(xiàn)代優(yōu)化計算方法[M].2版.北京:清華大學出版社,2005:113-119. Xing Wenxun,Xie Jinxing.Modern optimizing method for computing[M].2nd Edition.Beijing:Tsinghua University Press,2005:113-119.
[3]Mitchell Melanie.An introduction to genetic algorithms[M].London:the MIT Press,1999:87-93.
[4]楊曉華,沈珍瑤.智能算法及其在資源環(huán)境系統(tǒng)建模中的應用[M].北京:北京師范大學出版社,2005:68-70. Yang Xiaohua,Shen Zhenyao.Intelligentalgorithmsand their applications in resources and environmental system modeling[M]. Beijing:Beijing Normal University Press,2005:68-70.
[5]楊淑瑩.模式識別與智能計算:Matlab技術實現(xiàn)[M].北京:電子工業(yè)出版社,2009:176-179. Yang Shuying.Pattern recognition and intelligent computing:an implement with Matlab[M].Beijing:Electronic Industry Press,2009:176-179.
[6]蔡曲林.基于概率神經(jīng)網(wǎng)絡的模式識別[D].長沙:國防科技大學,2005:6-7,25-27. Cai Qulin.Probabilistic neural network for pattern recognitions[D]. Changsha:National University of Defense Technology,2005:6-7,25-27.
[7]Mao K Z,Tan K C,Ser W.Probabilistic neural network structure determination for pattern classification[J].IEEE Trans on Neural Network,2000,11(4):1009-1016.
[8]楊露.子洲地區(qū)山西組2段氣藏儲集層流體分布特征研究[D].成都:成都理工大學,2009:58-60. Yang Lu.Distribution rule of gas and water in the second member of Shanxi Formation in Zizhou Area[D].Chengdu:Chengdu University of Technology,2009:58-60.
[9]張銀德,童凱軍,向軍,等.支持向量機方法在低阻油層流體識別中的應用[J].石油物探,2008,47(3):306-310. Zhang Yinde,Tong Kaijun,Xiang Jun,et al.Application of support vector machine method for identifying fluid in low-resistivity oil layers[J].Geophysical Prospecting for Petroleum,2008,47(3):306-310.
[10]鄒濤峰.一種基于SOPNN的分類模型及其在測井水淹層識別中的應用[J].大慶石油學院學報,2008,32(6):97-99. Zou Taofeng.Application of SOPNN to water-flooded layer recognition in logging[J].Journal of Daqing Petroleum Institute,2008,32(6):97-99.
[11]楊宇,康毅力,張鳳東.川中嘉二氣藏儲層測井特征及氣水識別[J].斷塊油氣田,2007,14(3):82-84. YangYu,KangYili,ZhangFengdong.Logfeaturesand fluid identification of Jia 2 reservoir in the middle of Sichuan Basin[J]. Fault-Block Oil&Gas Field,2007,14(3):82-84.
[12]過敏,李仲東,林琳,等.榆林南-子洲地區(qū)山2氣藏水層特征及識別[J].斷塊油氣田,2010,17(2):138-141. Guo Min,Li Zhongdong,Lin Lin,et al.Feature and identification of water zone of Shan2 gas reservoir in South Yulin-Zizhou Area[J]. Fault-Block Oil&Gas Field,2010,17(2):138-141.
[13]申輝林,王敏,柴婧.低孔低滲儲層油水層模糊識別方法[J].斷塊油氣田,2007,14(3):79-81. Shen Huilin,Wang Min,Chai Jing.Identifying oil and water zones using fuzzy recognition method[J].Fault-Block Oil&Gas Field,2007,14(3):79-81.
Application of PNN method based on GGA optimization in identification of gas-water zones
Zhang Guanghui1,2Zhou Wen2Zhang Yinde2Jin Wenhui2Bao Yan2
(1.College of Information and Management,Chengdu University of Technology,Chengdu 610059,China;2.College of Energy Resources,Chengdu University of Technology,Chengdu 610059,China)
The accurate identification of gas and water zone has been a problem which is focused on petroleum exploration and development.On the basis of analyzing the geologic characteristics of Shan 2 reservoir in Z Gas Field,this paper proposes the PNN method based on GGA optimization with gray code and discusses its application in the identification of gas and water zones.Firstly, the conventional logging data was combined with gas testing data to set up the samples of 59 gas-water zones,including 36 studying samples and 23 predicting samples,and to normalize the data.Then the GGA was used to train the smooth parameter and hiden central vector to establish the gas-water zone identifying model for interest zone.The model was used to distinguish 36 samples with an accuracy degree of 100%.Then,23 predicting samples were distinguished again,as a result,22 predicting samples were correctly distinguished and the accuracy degree was 95.65%,in which a judgment error is that the dry zone was interpreted as gas zone.So it is feasible to correctly distinguish the uncertain fluid property of Shan 2 reservoir by GGA-PNN method.
geologic feature;fluid property;GGA-PNN;identification of gas and water zone
國家科技重大專項“鄂爾多斯盆地碎屑巖油氣系統(tǒng)分析與有利勘探目標區(qū)評價”(2008ZX05002)
TE319
:A
1005-8907(2011)02-228-04
2010-06-08;改回日期:2010-11-17。
張光輝,男,1986年生,在讀碩士研究生,現(xiàn)從事油氣勘探中的數(shù)學方法研究工作。E-mail:ghz_1616@yahoo.com.cn。
(編輯趙衛(wèi)紅)
張光輝,周文,張銀德,等.基于GGA優(yōu)化的PNN方法在氣水儲層識別中的應用[J].斷塊油氣田,2011,18(2):228-231. Zhang Guanghui,Zhou Wen,Zhang Yinde,et al.Application of PNN method based on GGA optimization in identification of gas-water zones[J]. Fault-Block Oil&Gas Field,2011,18(2):228-231.