宋 濤 陳 添 梁欣怡 田 宇 劉世杰 柴曉武
(①中國(guó)石油渤海鉆探第一錄井公司;②中國(guó)石油渤海鉆探工程技術(shù)處;③中國(guó)石油長(zhǎng)慶油田分公司第一采油廠)
石油天然氣鉆探過(guò)程中,確保優(yōu)快安全施工是非常重要的工作。為此,在鉆井施工中,井場(chǎng)部署綜合錄井服務(wù),通過(guò)諸多傳感器實(shí)時(shí)感知鉆井作業(yè)過(guò)程中各環(huán)節(jié)的物理量,獲得大量實(shí)時(shí)鉆井參數(shù)數(shù)據(jù),用于實(shí)時(shí)反映鉆井作業(yè)的各種工況。通過(guò)對(duì)鉆井參數(shù)數(shù)據(jù)的實(shí)時(shí)在線智能分析,可以自動(dòng)探測(cè)到萌芽中的異常,并及時(shí)向鉆井操作人員發(fā)出預(yù)警信息,為鉆井優(yōu)快安全施工提供有力保障。
綜合錄井儀鉆井參數(shù)記錄系統(tǒng)以一定的頻率采集并記錄相關(guān)傳感器測(cè)量的數(shù)據(jù)信息,采樣周期通常為1 s 或5 s,因此鉆井參數(shù)數(shù)據(jù)具有時(shí)序性和間斷性的特點(diǎn)。鉆井參數(shù)源自鉆井現(xiàn)場(chǎng)各類傳感器的實(shí)時(shí)記錄,受鉆井現(xiàn)場(chǎng)的復(fù)雜性、傳感器的靈敏性等多方面因素影響,各個(gè)傳感器所測(cè)得的鉆井參數(shù)數(shù)據(jù)會(huì)隨著時(shí)間的推移而呈現(xiàn)出數(shù)值波動(dòng),有時(shí)也會(huì)產(chǎn)生較多明顯的異常離群數(shù)據(jù)點(diǎn)[1]。這些明顯的異常離群數(shù)據(jù)點(diǎn)在曲線中偏離正常波動(dòng)趨勢(shì)過(guò)大,表現(xiàn)為顯著不同于其他數(shù)據(jù)分布的數(shù)據(jù)對(duì)象[2],本文稱其為刺峰噪點(diǎn)數(shù)據(jù)。
鉆井異常事故的智能化報(bào)警主要依托于對(duì)單項(xiàng)或多項(xiàng)鉆井參數(shù)變化趨勢(shì)以及各項(xiàng)參數(shù)之間協(xié)同變化趨勢(shì)的分析,刺峰噪點(diǎn)數(shù)據(jù)會(huì)對(duì)參數(shù)曲線上升或下降變化趨勢(shì)的分析產(chǎn)生嚴(yán)重干擾。若鉆井參數(shù)數(shù)據(jù)中僅有極少噪點(diǎn)數(shù)據(jù),對(duì)智能化報(bào)警系統(tǒng)的整體準(zhǔn)確預(yù)警不會(huì)有較大影響,但事實(shí)上,受鉆井現(xiàn)場(chǎng)的諸多復(fù)雜因素影響,這類刺峰噪點(diǎn)數(shù)據(jù)時(shí)常產(chǎn)生,數(shù)據(jù)質(zhì)量問(wèn)題較為突出,可能導(dǎo)致智能化報(bào)警系統(tǒng)錯(cuò)誤報(bào)警,有效識(shí)別并剔除這些刺峰噪點(diǎn)數(shù)據(jù),對(duì)于鉆井施工過(guò)程中智能化報(bào)警系統(tǒng)等大數(shù)據(jù)智能診斷具有重要作用。因此,研究并應(yīng)用新的大數(shù)據(jù)噪點(diǎn)數(shù)據(jù)識(shí)別技術(shù)具有非常重要的意義。
本文探討的刺峰噪點(diǎn)數(shù)據(jù)是指在各鉆井參數(shù)曲線中出現(xiàn)的明顯向上或向下突變,超出大多數(shù)數(shù)據(jù)波動(dòng)范圍的尖峰狀數(shù)據(jù)點(diǎn),且在該類數(shù)據(jù)點(diǎn)的一定鄰近時(shí)間內(nèi)未出現(xiàn)與之相類似的數(shù)據(jù)點(diǎn),換言之,即為鉆井參數(shù)曲線上與大多數(shù)數(shù)據(jù)都不相鄰的孤立的數(shù)據(jù)點(diǎn)。刺峰噪點(diǎn)數(shù)據(jù)有兩個(gè)顯示特征:一是其波動(dòng)幅度比其他大多數(shù)數(shù)據(jù)的波動(dòng)幅度都大;二是刺峰噪點(diǎn)數(shù)據(jù)在鄰近一段時(shí)間內(nèi)未頻繁出現(xiàn),數(shù)據(jù)點(diǎn)相對(duì)孤立。如圖1 所示,圖中藍(lán)色方塊數(shù)據(jù)點(diǎn)即為典型的刺峰噪點(diǎn)數(shù)據(jù)。
圖1 典型的刺峰噪點(diǎn)數(shù)據(jù)
鉆井參數(shù)曲線的散點(diǎn)分布形式多種多樣,同樣鉆井參數(shù)中的噪點(diǎn)數(shù)據(jù)也是多種多樣,導(dǎo)致實(shí)際工作中難以準(zhǔn)確、全面識(shí)別所有噪點(diǎn)數(shù)據(jù)。因此,本文僅致力于解決相對(duì)明顯的刺峰噪點(diǎn)數(shù)據(jù),對(duì)于其他界定模糊的噪點(diǎn)數(shù)據(jù)則不做深入研究。圖2中所示的藍(lán)色方塊數(shù)據(jù)點(diǎn)不能識(shí)別為刺峰噪點(diǎn)數(shù)據(jù),原因在于類似數(shù)據(jù)點(diǎn)頻繁出現(xiàn),可能是鉆井現(xiàn)場(chǎng)某種真實(shí)信息的客觀反映,若將該類數(shù)據(jù)點(diǎn)直接剔除,可能會(huì)增大鉆井參數(shù)數(shù)據(jù)失真的風(fēng)險(xiǎn)。
圖2 鉆井參數(shù)散點(diǎn)圖
異常值或離群點(diǎn)數(shù)據(jù)分析是機(jī)器學(xué)習(xí)領(lǐng)域經(jīng)常遇到的問(wèn)題。拉依達(dá)法、格魯布斯法、肖維勒法等方法均采用均值或方差以統(tǒng)計(jì)學(xué)方式識(shí)別常規(guī)型異常離群噪點(diǎn)數(shù)據(jù)[2-3];岳峰等[4]使用基于數(shù)據(jù)密度分布的方式有效檢測(cè)聚類邊界點(diǎn)數(shù)據(jù);劉帆[5]使用深度學(xué)習(xí)方法識(shí)別并去除圖像中的噪聲。在石油鉆井領(lǐng)域,對(duì)鉆井現(xiàn)場(chǎng)的環(huán)境噪聲治理與研究較多,但對(duì)鉆井參數(shù)離群噪點(diǎn)數(shù)據(jù)研究很少。本文以鉆井參數(shù)為樣本,借鑒前人的方法經(jīng)驗(yàn)[1-13],對(duì)基于極值分析的鉆井參數(shù)刺峰噪點(diǎn)數(shù)據(jù)識(shí)別方法進(jìn)行探討研究,以供業(yè)內(nèi)技術(shù)人員參考。
一般來(lái)講,對(duì)于一組離散樣本數(shù)據(jù)集,在數(shù)據(jù)正常趨勢(shì)線附近的離群刺峰噪點(diǎn)數(shù)據(jù)首先是偏離正常趨勢(shì)范圍的極值數(shù)據(jù)。因此,基于極值分析的鉆井參數(shù)刺峰噪點(diǎn)數(shù)據(jù)識(shí)別方法,首先研究篩選離散數(shù)據(jù)樣本的極值集,然后在極值集的基礎(chǔ)上進(jìn)行離群噪點(diǎn)識(shí)別,并進(jìn)一步對(duì)噪點(diǎn)附近的數(shù)據(jù)進(jìn)行再識(shí)別,剔除正常數(shù)據(jù)點(diǎn),最后形成噪點(diǎn)數(shù)據(jù)集并標(biāo)記。
通過(guò)鉆井實(shí)時(shí)數(shù)據(jù)分析發(fā)現(xiàn),若干個(gè)連續(xù)時(shí)間的采樣點(diǎn)上表現(xiàn)為上升或下降趨勢(shì)波動(dòng),之后發(fā)生相反趨勢(shì)波動(dòng),即使是較小幅度的變化也會(huì)表現(xiàn)出上升或下降的曲折波動(dòng)。在連續(xù)的數(shù)據(jù)曲線中,波峰或波谷即為函數(shù)的極大值或極小值。鉆井參數(shù)曲線的波動(dòng)情況也與之相似,圖3為某井某項(xiàng)鉆井參數(shù)在近1 min內(nèi)的波動(dòng)曲線,其中由黑色實(shí)線串連在一起的黑色散點(diǎn)為采集的鉆井參數(shù)數(shù)據(jù),紅色圓點(diǎn)為曲線中分段波峰極大值點(diǎn),綠色圓點(diǎn)為分段波谷極小值點(diǎn),藍(lán)色虛線為極大值與極小值的串連線。該圖中黑色的原始鉆井參數(shù)曲線相對(duì)較平緩地上升或下降,波動(dòng)較小。曲線中的各鉆井參數(shù)極大值點(diǎn)與極小值點(diǎn)是曲線局部波動(dòng)的上限和下限,并且由較少極值點(diǎn)串連的藍(lán)色虛線所反映的曲線趨勢(shì)同原始曲線的趨勢(shì)相同。由此可見(jiàn),參數(shù)曲線中鉆井參數(shù)極值點(diǎn)是曲線波動(dòng)的邊界,參數(shù)曲線可反映變化趨勢(shì),其數(shù)據(jù)分析具有同等價(jià)值。
圖3 鉆井參數(shù)波動(dòng)曲線
通過(guò)分析可知,刺峰噪點(diǎn)數(shù)據(jù)的波動(dòng)幅度常大于正常極值點(diǎn)數(shù)據(jù)的波動(dòng)幅度,故本文所研究的刺峰噪點(diǎn)數(shù)據(jù)識(shí)別以極值點(diǎn)數(shù)據(jù)集為基礎(chǔ),且對(duì)于常規(guī)離散點(diǎn)數(shù)據(jù)而言,滿足公式(1)則為極值點(diǎn):
式中:ni為某一常規(guī)離散點(diǎn)數(shù)據(jù);ni-1為ni前一個(gè)點(diǎn)的數(shù)據(jù);ni+1為ni后一個(gè)點(diǎn)的數(shù)據(jù)。
但離散點(diǎn)數(shù)據(jù)還可能存在兩個(gè)數(shù)據(jù)點(diǎn)相等的情況。如與圖3 對(duì)應(yīng)的極值數(shù)據(jù)統(tǒng)計(jì)(表1)顯示,11:45:09 數(shù)值為9.2,至11:45:10、11:45:11 兩個(gè)數(shù)據(jù)點(diǎn)均為9.3;至11:45:14數(shù)值降為9.1后,連續(xù)出現(xiàn)兩個(gè)相等的9.0,至11:45:19 出現(xiàn)極小值8.7。對(duì)于鉆井參數(shù)曲線中多個(gè)連續(xù)相等的數(shù)據(jù)點(diǎn),本文取最后一個(gè)上升或下降的拐點(diǎn)值為極值點(diǎn),如表1 中11:45:23的8.8為極大值。
表1 極值數(shù)據(jù)統(tǒng)計(jì)(對(duì)應(yīng)圖3)
依據(jù)以上分析,極值點(diǎn)集可依據(jù)公式(1)采用計(jì)算機(jī)編程快速自動(dòng)判斷識(shí)別建立。
刺峰噪點(diǎn)數(shù)據(jù)識(shí)別過(guò)程首先是識(shí)別極值點(diǎn)集,進(jìn)而識(shí)別噪點(diǎn)數(shù)據(jù)。噪點(diǎn)數(shù)據(jù)的識(shí)別基于實(shí)際的鉆井參數(shù)數(shù)據(jù)極值點(diǎn)來(lái)分析,先對(duì)噪點(diǎn)的特征進(jìn)行分析,區(qū)分出特殊情況,為計(jì)算機(jī)算法提供理論依據(jù),最后列出計(jì)算機(jī)可編程噪點(diǎn)識(shí)別的數(shù)學(xué)邏輯算法。
2.2.1 刺峰噪點(diǎn)數(shù)據(jù)特殊情況分析
通過(guò)分析大量由于噪點(diǎn)數(shù)據(jù)影響而造成的錯(cuò)誤處理結(jié)果,總結(jié)出噪點(diǎn)數(shù)據(jù)的總體特征為:曲線噪點(diǎn)數(shù)據(jù)的波動(dòng)幅度遠(yuǎn)大于大多數(shù)正常極值點(diǎn)數(shù)據(jù)的波動(dòng)幅度,遠(yuǎn)離主擬合趨勢(shì)線,且曲線的噪點(diǎn)數(shù)據(jù)波動(dòng)幅度與曲線數(shù)據(jù)原值呈一定的比例。
但在實(shí)際散點(diǎn)曲線中,也存在如圖4 所示的特殊情況,即數(shù)據(jù)波動(dòng)幅度雖然大,但仍屬于正常數(shù)據(jù)曲線波動(dòng)。圖4中紅色圓點(diǎn)為曲線中的極值點(diǎn),從第8 s到第12 s 之間,鉆井參數(shù)數(shù)值由6.66 下降至5.15,其波動(dòng)幅度比鄰近極值點(diǎn)的波動(dòng)幅度大出許多,但這種曲線波動(dòng)屬于因作業(yè)工況調(diào)整引起的數(shù)值正常波動(dòng),該類波動(dòng)幅度大的數(shù)據(jù)點(diǎn)不能作為噪點(diǎn)數(shù)據(jù)處理。
圖5給出了另外一種特殊情況,直觀可見(jiàn):雖然第8 s 的數(shù)據(jù)點(diǎn)值90.41 的波動(dòng)幅度比兩側(cè)數(shù)據(jù)點(diǎn)值90.02 大出許多倍,但從縱軸上看,其波動(dòng)幅度僅為0.39,處于數(shù)據(jù)原點(diǎn)90.41 變化的1%之內(nèi)。該類數(shù)據(jù)點(diǎn)相對(duì)其附近數(shù)據(jù)點(diǎn)的波動(dòng)幅度有些異常,但波動(dòng)幅度與數(shù)據(jù)點(diǎn)原值相比非常小,且當(dāng)曲線時(shí)間窗口拉長(zhǎng)后,這類波動(dòng)并無(wú)明顯異常,因此這類相對(duì)原值波動(dòng)極小的數(shù)據(jù)點(diǎn)不應(yīng)看做噪點(diǎn)數(shù)據(jù)。
圖5 正常數(shù)據(jù)波動(dòng)幅度圖
2.2.2 刺峰噪點(diǎn)數(shù)據(jù)識(shí)別算法
鉆井參數(shù)極值刺峰噪點(diǎn)數(shù)據(jù)識(shí)別基本思路為按照專業(yè)技術(shù)人員對(duì)噪點(diǎn)數(shù)據(jù)的常規(guī)認(rèn)知算法,通過(guò)添加約束條件,將正常數(shù)據(jù)點(diǎn)(含正常極值點(diǎn))剔除。具體做法是:首先按照公式(1)先識(shí)別出極值點(diǎn),然后將每個(gè)極值點(diǎn)假定為極值噪點(diǎn)數(shù)據(jù),設(shè)定相關(guān)約束條件檢測(cè)其是否符合極值噪點(diǎn)數(shù)據(jù)特征,如果符合再將相關(guān)約束條件應(yīng)用于該極值點(diǎn)兩側(cè)的非極值點(diǎn)數(shù)據(jù)(范圍限定在檢測(cè)極值點(diǎn)到兩側(cè)最鄰近的不同類型極值點(diǎn)之間的數(shù)據(jù)點(diǎn)),最后將滿足約束條件的數(shù)據(jù)點(diǎn)標(biāo)記為噪點(diǎn)數(shù)據(jù)。
圖6 為某井鉆井參數(shù)數(shù)據(jù)極值點(diǎn)曲線,數(shù)據(jù)點(diǎn)i處的時(shí)間橫軸x值為xi、鉆井參數(shù)數(shù)值縱軸y值為yi;假定鉆井參數(shù)數(shù)值y變化幅度大的極值點(diǎn)為噪點(diǎn)(noise),噪點(diǎn)與左、右兩側(cè)不同類型極值點(diǎn)x、y的差值分別看作微分量dx1、dx2與dy1、dy2;為區(qū)分鉆井參數(shù)曲線整體橫縱軸的波動(dòng)幅度,記在一定時(shí)間段(interval)內(nèi)鉆井參數(shù)曲線兩兩相鄰不同類型極值點(diǎn)的差值由小到大排序后的橫、縱軸的中位數(shù)分別為dxm、dym。
極值噪點(diǎn)判別約束條件如公式(2)所示,式中α、β、γ、η均為待設(shè)定的超參數(shù)。公式(2)中:不等式①是對(duì)刺峰噪點(diǎn)數(shù)據(jù)在水平、垂直兩個(gè)方向上波動(dòng)幅度的限制,α是刺峰噪點(diǎn)數(shù)據(jù)與曲線整體在垂直方向上波動(dòng)幅度的比例關(guān)系,β是曲線波動(dòng)的時(shí)間間隔;不等式②是刺峰噪點(diǎn)數(shù)據(jù)特征的形式化表示,γ是刺峰噪點(diǎn)數(shù)據(jù)的波動(dòng)幅度占鉆井參數(shù)數(shù)值本身的百分比,因此γ的取值比較小,結(jié)合實(shí)驗(yàn)可判定,γ取值為1%~5%時(shí)較為合理;不等式③是針對(duì)圖5 中的特殊情況所做的約束,η是刺峰噪點(diǎn)數(shù)據(jù)左、右兩側(cè)的波動(dòng)比例,刺峰噪點(diǎn)數(shù)據(jù)的特征為左、右兩側(cè)的波動(dòng)幅度近似,η取值2~3為合理范圍。
2.2.3 噪點(diǎn)附近非極值噪點(diǎn)識(shí)別算法
非極值噪點(diǎn)數(shù)據(jù)判別以圖7 為例來(lái)說(shuō)明。圖7 中紅色圓點(diǎn)和藍(lán)色方塊為曲線中的極值點(diǎn),綠色和藍(lán)色三角表示由最底部極小值到兩側(cè)極大值逐漸上升的中間過(guò)渡數(shù)值點(diǎn)。通過(guò)公式(2)的條件約束,可以識(shí)別出藍(lán)色方塊極值點(diǎn)為極值刺峰噪點(diǎn)數(shù)據(jù);顯然,刺峰噪點(diǎn)數(shù)據(jù)右側(cè)的藍(lán)色三角形數(shù)據(jù)點(diǎn)同樣為異常噪點(diǎn)數(shù)據(jù),但接近曲線主趨勢(shì)線的綠色三角形數(shù)據(jù)點(diǎn)則不應(yīng)被歸屬于噪點(diǎn)數(shù)據(jù)。通過(guò)大量實(shí)驗(yàn)得出:極值刺峰噪點(diǎn)ni(noise(xi,yi))左、右兩側(cè)相同時(shí)間窗口范圍(圖7 中虛豎線所限定的區(qū)間)內(nèi),最接近刺峰噪點(diǎn)的極值點(diǎn)k(limit(xk,yk)),最具有參考性,取為參考約束點(diǎn)limit,圍繞該點(diǎn)增加約束條件即可較好地劃分出噪點(diǎn)與正常數(shù)據(jù)點(diǎn)。記極值刺峰噪點(diǎn)y值為ynoise,參考約束點(diǎn)的y值為ylimit。公式(3)給出了極值噪點(diǎn)數(shù)據(jù)到鄰近不同類型極值點(diǎn)之間數(shù)據(jù)是否為噪點(diǎn)數(shù)據(jù)的劃分約束條件。
圖7 噪點(diǎn)數(shù)據(jù)波動(dòng)曲線
Extreme noise neighbor s.t.
公式(3)中?、λ均為待設(shè)定的超參數(shù)(?表示噪點(diǎn)數(shù)據(jù)到鄰近約束點(diǎn)距離與曲線整體的波動(dòng)比例,λ表示檢測(cè)數(shù)據(jù)點(diǎn)到約束點(diǎn)距離與被檢測(cè)的極值點(diǎn)波動(dòng)的比例)。除此之外,搜索極值噪點(diǎn)左、右兩側(cè)同類型極值limit約束點(diǎn)的時(shí)間范圍也是一個(gè)超參數(shù),時(shí)間窗口越大,參考的范圍越寬,反之則越窄。公式(3)中不等式④是針對(duì)極大值噪點(diǎn)的設(shè)定,不等式⑤是針對(duì)極小值噪點(diǎn)的設(shè)定。
通過(guò)公式(2)約束條件可以判定極值點(diǎn)是否為噪點(diǎn)數(shù)據(jù),通過(guò)公式(3)約束條件可以判斷極值點(diǎn)兩側(cè)的非極值點(diǎn)是否為噪點(diǎn)數(shù)據(jù)。為進(jìn)一步避免錯(cuò)誤識(shí)別,可對(duì)已識(shí)別的噪點(diǎn)起止點(diǎn)時(shí)間間隔再次約束,以避免較長(zhǎng)時(shí)間的上升或下降。整個(gè)鉆井參數(shù)噪點(diǎn)數(shù)據(jù)識(shí)別算法流程如圖8所示。
圖8 鉆井參數(shù)噪點(diǎn)數(shù)據(jù)識(shí)別算法流程
鉆井參數(shù)噪點(diǎn)數(shù)據(jù)波動(dòng)幅度與正常數(shù)據(jù)的波動(dòng)幅度差異懸殊,二者波動(dòng)幅度的比例關(guān)系在噪點(diǎn)數(shù)據(jù)識(shí)別中非常重要,這涉及超參數(shù)α、β的設(shè)定。通過(guò)對(duì)曲線中含有刺峰噪點(diǎn)的兩兩相鄰的極值點(diǎn)橫、縱坐標(biāo)的差值進(jìn)行分析,顯示出刺峰噪點(diǎn)數(shù)據(jù)y值差值異常大于其他極值點(diǎn)y值差值,x值差值則相對(duì)穩(wěn)定。分析大量含刺峰噪點(diǎn)數(shù)據(jù)曲線樣例,結(jié)果表明,僅出現(xiàn)個(gè)別刺峰狀異常離群噪點(diǎn)的現(xiàn)象較為普遍,如圖9a所示某口井的鉆井參數(shù)曲線。圖9a 藍(lán)色方塊數(shù)據(jù)點(diǎn)為噪點(diǎn)數(shù)據(jù),圖9b 為圖9a 的相鄰極值點(diǎn)差值分析結(jié)果,藍(lán)色、綠色散點(diǎn)分別為相鄰極值點(diǎn)y、x值的差值絕對(duì)值排序分布。
圖9 鉆井參數(shù)噪點(diǎn)數(shù)據(jù)波動(dòng)分析圖
圖9b 顯示極值點(diǎn)y值波動(dòng)幅度(藍(lán)色散點(diǎn)),只有極少噪點(diǎn)數(shù)據(jù)的波動(dòng)幅度大于2,大部分非噪點(diǎn)數(shù)據(jù)的波動(dòng)幅度均接近于0,二者的比例關(guān)系即為公式(2)中的超參數(shù)α;綠色散點(diǎn)為離散的整數(shù),逐漸地上升并減少,表明各個(gè)極值點(diǎn)上升或下降的時(shí)間間隔多數(shù)在5 s 以內(nèi),連續(xù)8 到10 個(gè)數(shù)據(jù)點(diǎn)上升或下降的曲線片斷很少。經(jīng)多次實(shí)驗(yàn)驗(yàn)證,α取值8~15 為合理范圍,極值點(diǎn)兩側(cè)的總時(shí)間間隔β取值10~20 為合理范圍。在運(yùn)算的最后,依然還會(huì)對(duì)噪點(diǎn)數(shù)據(jù)的起止時(shí)間間隔再次約束,所以β可以適當(dāng)設(shè)置大一些。
通過(guò)大量鉆井參數(shù)數(shù)據(jù)案例測(cè)試分析,得到刺峰噪點(diǎn)數(shù)據(jù)識(shí)別準(zhǔn)確率較高的一組超參數(shù),即:α=9、β=16、γ=2%、η=3、?=4、λ=0.2。搜索極值噪點(diǎn)數(shù)據(jù)左、右兩側(cè)同類型極值(limit)約束點(diǎn)的時(shí)間范圍是25 s,噪點(diǎn)數(shù)據(jù)起止時(shí)間間隔約束小于7 s。
為評(píng)估刺峰噪點(diǎn)數(shù)據(jù)識(shí)別準(zhǔn)確率,隨機(jī)抽樣30口井某一天24 h 的扭矩、立管壓力、總池體積、入口流量、出口流量共5 種鉆井參數(shù)數(shù)據(jù),將24 h 劃分成5 min為一個(gè)時(shí)間窗口,把上述超參數(shù)應(yīng)用于圖8算法中,識(shí)別鉆井參數(shù)刺峰噪點(diǎn);再將識(shí)別到含有噪點(diǎn)數(shù)據(jù)的5 min 鉆井參數(shù)數(shù)據(jù)繪制成曲線圖,并標(biāo)記噪點(diǎn)數(shù)據(jù),然后隨機(jī)抽樣200 張?jiān)朦c(diǎn)數(shù)據(jù)圖片(圖10),請(qǐng)專業(yè)鉆井技術(shù)人員評(píng)估,準(zhǔn)確率達(dá)82%以上。
圖10 鉆井參數(shù)噪點(diǎn)數(shù)據(jù)波動(dòng)分析圖
噪點(diǎn)數(shù)據(jù)的準(zhǔn)確性與數(shù)據(jù)的質(zhì)量有很大關(guān)系,不同的鉆井參數(shù)應(yīng)該有不同的約束條件。從30 口井5種鉆井參數(shù)噪點(diǎn)數(shù)據(jù)召回統(tǒng)計(jì)(表2)可以看出,出口流量的噪點(diǎn)數(shù)據(jù)召回量最大,達(dá)到1 630 個(gè),也印證了鉆井現(xiàn)場(chǎng)技術(shù)人員的普遍經(jīng)驗(yàn)認(rèn)知,即出口流量數(shù)據(jù)質(zhì)量較差,與井場(chǎng)實(shí)際情況相符。
表2 30口井5種鉆井參數(shù)噪點(diǎn)數(shù)據(jù)召回統(tǒng)計(jì)
針對(duì)鉆井參數(shù)曲線中的噪點(diǎn)數(shù)據(jù)識(shí)別問(wèn)題,本文探討并給出了以極值為基礎(chǔ)的刺峰噪點(diǎn)數(shù)據(jù)識(shí)別算法,該算法以刺峰噪點(diǎn)數(shù)據(jù)在曲線中呈現(xiàn)的特征為判斷標(biāo)準(zhǔn),并給出了可編程的算法數(shù)學(xué)公式。通過(guò)數(shù)學(xué)算法和計(jì)算機(jī)流程圖,首先建立極值點(diǎn)數(shù)據(jù)集,再識(shí)別極值點(diǎn)是否為噪點(diǎn)數(shù)據(jù)并建立約束條件,進(jìn)一步將約束條件應(yīng)用于極值點(diǎn)兩側(cè)的非極值點(diǎn),最后整體識(shí)別極值點(diǎn)及其兩側(cè)的數(shù)據(jù)是否為噪點(diǎn)數(shù)據(jù)。
該算法經(jīng)過(guò)大量現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)驗(yàn)證和評(píng)估,具有很高的準(zhǔn)確度。因此,本文提出的基于極值的鉆井參數(shù)刺峰噪點(diǎn)數(shù)據(jù)識(shí)別算法可應(yīng)用于鉆井現(xiàn)場(chǎng)實(shí)際數(shù)據(jù)分析匯總,也可應(yīng)用于類似的工程作業(yè)數(shù)據(jù)分析診斷。