国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于特征庫的測井?dāng)?shù)據(jù)格式自動識別與轉(zhuǎn)換方法

2014-12-03 10:31王慧萍王衛(wèi)楊頔何宗斌李曉華
測井技術(shù) 2014年1期
關(guān)鍵詞:數(shù)據(jù)格式數(shù)據(jù)文件自動識別

王慧萍,王衛(wèi),楊頔,何宗斌,李曉華

(1.中石化河南石油勘探局地球物理測井公司,河南 南陽473132;2.中石化石油工程技術(shù)研究院測錄井所,北京100101;3.武漢大學(xué),湖北 武漢430072;4.長江大學(xué),湖北 武漢430100)

0 引 言

測井?dāng)?shù)據(jù)種類繁多,存儲格式多種多樣,尤其是野外測井?dāng)?shù)據(jù),不同的儀器廠商、不同的測井?dāng)?shù)據(jù)處理平臺都有不同的數(shù)據(jù)存儲格式,如LIS、DLIS、XTF、WIS、各種版本的 LAS、各種類型的716等[1]。據(jù)統(tǒng)計,國內(nèi)外現(xiàn)有測井?dāng)?shù)據(jù)存儲格式多達100多種。隨著測井技術(shù)的發(fā)展,測井項目增多,數(shù)據(jù)類型會越來越多,迫切需要一套能夠快速、高效、智能數(shù)據(jù)格式識別、瀏覽、解編的新方法。本文提出了一種基于特征庫的測井?dāng)?shù)據(jù)格式自動識別與轉(zhuǎn)換方法,具有很好的應(yīng)用前景。

1 現(xiàn)有數(shù)據(jù)格式技術(shù)狀況

目前測井資料處理系統(tǒng)的數(shù)據(jù)轉(zhuǎn)換大都采用人工識別方式或半智能化模糊識別方式。

所謂人工識別方式,要求確切知道要轉(zhuǎn)換的數(shù)據(jù)文件類型,調(diào)用相應(yīng)的轉(zhuǎn)換模塊,這種轉(zhuǎn)換方式速度快,效率高,缺點是處理人員必須對該數(shù)據(jù)格式類型十分清楚,否則就無法實現(xiàn)轉(zhuǎn)換。

半智能化模糊識別方式則要求用戶知道要轉(zhuǎn)換的數(shù)據(jù)文件的可能類型,并指定相應(yīng)的可能轉(zhuǎn)換模塊。這種轉(zhuǎn)換方式給出一種或多種可能的數(shù)據(jù)格式,讓程序在給定的格式中自動搜索、匹配,但必須保證要處理的數(shù)據(jù)格式屬于給定的可能格式中的一種,且給定的可能性越多,處理速度越慢,因為系統(tǒng)要對給定的模塊逐個進行掃描、匹配。同時要求多選的格式模塊必須對格式的描述判斷嚴(yán)謹(jǐn)、唯一,否則將會引起混亂,無法實現(xiàn)正確解編。這種識別技術(shù)最大的問題是隨著模塊的增加,文件數(shù)據(jù)格式的相似性增加,識別準(zhǔn)確度降低,模塊間的混淆嚴(yán)重,無法準(zhǔn)確區(qū)分?jǐn)?shù)據(jù)格式,造成系統(tǒng)運行不穩(wěn)定,甚至崩潰[2]。

2 測井?dāng)?shù)據(jù)格式自動識別與轉(zhuǎn)換方法

2.1 技術(shù)思路

分析各種數(shù)據(jù)格式的信息特征,提取其中的一條或多條具有代表性的特征信息,根據(jù)特征信息在文件中出現(xiàn)的位置特點,選擇設(shè)置定點、段內(nèi)或偏移搜索方式,采用多條件識別方法建立數(shù)據(jù)格式特征碼庫,通過軟件自動實現(xiàn)識別數(shù)據(jù)格式特征庫技術(shù),將某一個待操作的數(shù)據(jù)文件與特征庫信息進行匹配,從而快速識別出該數(shù)據(jù)文件的數(shù)據(jù)格式類型,然后再調(diào)用相匹配的數(shù)據(jù)格式轉(zhuǎn)換模塊進行掃描、轉(zhuǎn)換。概括地說就是,利用能夠區(qū)分各種測井?dāng)?shù)據(jù)格式的特征信息,建立數(shù)據(jù)格式特征碼庫,編制計算機軟件,實現(xiàn)自動格式識別、轉(zhuǎn)換[2-3]。

2.2 數(shù)據(jù)格式特征庫設(shè)計

數(shù)據(jù)格式的特征庫設(shè)計依據(jù)測井文件格式內(nèi)部信息對文件類型進行區(qū)分,即通過分析各種數(shù)據(jù)格式的結(jié)構(gòu)特征,提取各種測井?dāng)?shù)據(jù)格式中的特征信息,建立數(shù)據(jù)格式特征碼信息庫。

特征庫文件格式:

信息描述:搜索的操作數(shù)信息描述。

搜索域:設(shè)置搜索方式,進行定點、段內(nèi)和偏移搜索3種方式選擇設(shè)置,根據(jù)所需搜索的特征數(shù)在定點位置或在搜索段內(nèi)或在某特征定點偏移位置設(shè)置,0為全范圍搜索;1為定位搜索;2在上一個特征信息搜索的基礎(chǔ)上,加偏移定位搜索。

起始點,終止點:某特征的位置范圍。對于定點搜索,則從起始點直接對應(yīng)匹配操作數(shù);對于段內(nèi)搜索,則在起始點,終止點任意位置匹配操作數(shù)即可;對于偏移搜索,該起始點為偏移點,實際搜索位置要加上最新搜索的一個定點位置,該定點位置是通過段內(nèi)搜索得到,即:

匹配操作點=上一項段內(nèi)搜索的匹配操作點+起始點

值類型:操作數(shù)的數(shù)據(jù)類型,可為字符、整型、實型多種操作數(shù)特征,操作數(shù)的數(shù)據(jù)類型要考慮操作數(shù)的機器類型,如I4為PC機整型數(shù),I4S為SUN機器整型數(shù)

最小值,最大值:操作數(shù)的最小值與最大值范圍,對于字符型操作數(shù),最大值可以是多個條件值的或,如:最小值、最大值為“H T.OR.C”表示操作數(shù)等于H或T或C時,均滿足搜索條件;對于數(shù)值型操作數(shù),給出的是匹配數(shù)值區(qū)間。

表1為部分格式的特征信息。例如:DLIS是段內(nèi)搜索文件頭、來歷2個特征字FILE-HEADE與ORIGIN。XTF是定點搜索特征字.XTF及2個定點特征數(shù)值1與2。BIT是先在段內(nèi)搜索特征字T,得到定點位置再加各偏移起始點位置處搜索文件號、曲線條數(shù)、采樣間隔、日期、月份等多種類型的操作數(shù)。多種類型的操作數(shù)匹配,是為了更準(zhǔn)確找到某種格式特征。

特征庫的建立力爭作到信息描述的簡潔性、準(zhǔn)確性與唯一性,保證格式識別的快速、準(zhǔn)確。特征庫支持新的識別條件加入,支持未來擴展。數(shù)據(jù)格式特征碼庫的建立,是為計算機自動、快速、準(zhǔn)確的識別數(shù)據(jù)格式類型提供判別標(biāo)準(zhǔn),以便于數(shù)據(jù)格式識別與轉(zhuǎn)換。

表1 特征碼庫文件示例

2.3 技術(shù)實現(xiàn)

2.3.1 建立數(shù)據(jù)格式特征信息庫

通過對目前國內(nèi)外常用的幾十種數(shù)據(jù)格式記錄標(biāo)準(zhǔn)及特征進行分析、研究,提取各格式類型特征信息,建立如表1所示的特征碼庫文件。

2.3.2 軟件實現(xiàn)

在VS2010環(huán)境下用VC++建立數(shù)據(jù)格式識別與轉(zhuǎn)換平臺,提供數(shù)據(jù)瀏覽與解編函數(shù)調(diào)用接口;用動態(tài)連接庫技術(shù)開發(fā)了如表2所示的數(shù)據(jù)格式瀏覽與解編模塊。

在數(shù)據(jù)格式識別與轉(zhuǎn)換平臺中實現(xiàn)待轉(zhuǎn)換的測井?dāng)?shù)據(jù)文件與特征庫中存儲的測井?dāng)?shù)據(jù)格式的特征信息快速自動搜索、匹配,并自動記錄匹配的數(shù)據(jù)格式轉(zhuǎn)換模塊名稱,具體實現(xiàn)流程見圖1。

系統(tǒng)依據(jù)特征庫匹配結(jié)果,自動調(diào)用相匹配的數(shù)據(jù)格式轉(zhuǎn)換模塊進行精確匹配,匹配成功后進行數(shù)據(jù)文件瀏覽、轉(zhuǎn)換,完成數(shù)據(jù)格式的信息獲取與轉(zhuǎn)換。

在程序?qū)崿F(xiàn)過程中,為檢驗特征庫的正確性和唯一性,進行特征信息自動搜索、匹配時,如遇到多解性,程序自動報警,提示用戶,對多解模塊描述信息進行及時調(diào)整,保證特征信息的唯一性;如遇無法識別的模塊,可進行人機交互,選擇可能的解編模塊進行驗證,進一步完善特征信息,保證特征信息的正確性。

對于新增數(shù)據(jù)格式,只需在特征庫中追加相應(yīng)的描述信息,編寫相應(yīng)的解編模塊。測井?dāng)?shù)據(jù)格式自動識別與轉(zhuǎn)換軟件實施流程見圖2。

表2 實現(xiàn)的數(shù)據(jù)解編模塊列表

圖1 特征庫操作流程

基于特征庫的測井?dāng)?shù)據(jù)格式自動識別與轉(zhuǎn)換方法已在中石化自主知識產(chǎn)權(quán)軟件 “測井資料處理解釋系統(tǒng)LOGIK3.0”中得到實現(xiàn),利用該技術(shù)編寫了24個數(shù)據(jù)格式轉(zhuǎn)換模塊,支持對目前國內(nèi)外常用的50多種測井?dāng)?shù)據(jù)格式自動識別與解編,并轉(zhuǎn)換成中石化測井?dāng)?shù)據(jù)存儲格式SLF類型文件。

3 應(yīng)用效果

該項技術(shù)已廣泛應(yīng)用于河南油田生產(chǎn)和科研中,并于2011~2012年在勝利、中原、江漢等10余個油田企業(yè)進行推廣應(yīng)用,在應(yīng)用過程中不斷對特征信息進行測試、驗證和完善,實現(xiàn)了對勝利、中原、四川等多個油田常用及自定義數(shù)據(jù)格式的自動識別與轉(zhuǎn)換。

大量的應(yīng)用實踐證明,該方法克服了以往測井資料處理系統(tǒng)中人工識別方式或半智能化模糊識別方式的缺點,解決了數(shù)據(jù)解編的難題,實現(xiàn)數(shù)據(jù)格式智能化、自動、快速、準(zhǔn)確識別和解編,突破了以往數(shù)據(jù)格式識別瓶頸,提高了數(shù)據(jù)解編工作效率。

圖2 軟件實施流程圖

4 結(jié) 論

(1)該項技術(shù)的應(yīng)用,使得用戶無需了解數(shù)據(jù)格式類型,不需要記憶轉(zhuǎn)換模塊名稱,大大節(jié)約了數(shù)據(jù)轉(zhuǎn)換時間,減少了人工勞動,提高了識別的準(zhǔn)確度,提高了系統(tǒng)的運行效率。

(2)通過該項技術(shù),可為整個測井行業(yè)建立一個標(biāo)準(zhǔn)的數(shù)據(jù)格式特征碼庫,對現(xiàn)有數(shù)據(jù)格式進行檢驗、解編,對新的數(shù)據(jù)格式進行擴充和描述。

[1] 龔福秀.測井?dāng)?shù)據(jù)格式轉(zhuǎn)換系統(tǒng)的開發(fā) [J].江漢石油科技,2006,16(1):65-68.

[2] 王衛(wèi),李光軍,王慧萍,等.基于特征庫的測井?dāng)?shù)據(jù)格式自動識別與轉(zhuǎn)換方法:中國,ZL 2010 1 0203222.5[P].2012-11-07.

[3] 李光軍,王衛(wèi),王慧萍.LOGIK測井微機解釋系統(tǒng)開發(fā)技術(shù)分析 [J].石油天然氣學(xué)報,2011,33(8):91-95.

猜你喜歡
數(shù)據(jù)格式數(shù)據(jù)文件自動識別
基于數(shù)據(jù)挖掘的船舶航跡自動識別系統(tǒng)
基于衛(wèi)星遙感圖像的收費站位置自動識別與校核
自動識別系統(tǒng)
數(shù)據(jù)文件恢復(fù)專題問答
數(shù)據(jù)文件安全管控技術(shù)的研究與實現(xiàn)
SQL數(shù)據(jù)文件恢復(fù)工具
基于RFID的戶外廣告監(jiān)管系統(tǒng)的設(shè)計與實現(xiàn)
一種融合多業(yè)務(wù)的信息化系統(tǒng)框架研究
基于IEC61850的配網(wǎng)終端自動識別技術(shù)
基于ArcGIS的規(guī)劃數(shù)據(jù)格式轉(zhuǎn)換研究