靳澤園,田 楓,劉 芳,于巾濤,盧 俊,徐 昕
(東北石油大學計算機與信息技術學院,黑龍江 大慶 163318)
油田生產作業(yè)是高風險行業(yè),在生產中原油有毒有害,一旦遇到高溫高壓就會發(fā)生爆炸。而實際采油時環(huán)境較為惡劣,加上機器運作時本身溫度就高,一旦作業(yè)現場出現原油泄漏,就很容易發(fā)生爆炸,這對油田作業(yè)造成極大的安全隱患。目前,基于深度學習的目標檢測算法已經應用于生活中的方方面面,像人臉識別、車牌識別等。為了保障油田作業(yè)現場安全生產,本文將基于深度學習的目標檢測算法應用于漏油識別問題中。
國外的原油泄漏研究大多是針對海上溢油檢測方面的研究,如Calla等人使用衛(wèi)星上的多頻微波傳感器來測量海面上溢油的程度以及海面上漏油的厚度[1]。而針對陸地油田石油的漏油檢測研究卻較少。
關于油田遠程視頻監(jiān)控,國內栗生亞[2]認為由于油田生產管理大多是采用人工管理的方式,管理工序多且需要分工不間斷值守,但不能保障所有工序每時每刻都有人值守,容易產生安全隱患且效率低下,引入油田視頻監(jiān)控系統(tǒng)可提高生產效率和安全生產的可靠性。大多數油田所采用的遠程視頻監(jiān)控系統(tǒng),需要利用傳感器采集數據,如安裝壓力變送器和流量計來采集油井內的壓力、流量等信息數據,再通過無線傳輸網絡進行信息通信,進而將現場情況反饋給監(jiān)控室以了解采油設備的工作狀態(tài)。密超[3]的視頻監(jiān)控技術在油田生產中的應用研究,提到由于油井、計量間等主要分布在野外,工作人員要耗時耗力去現場了解油田作業(yè)區(qū)的狀況,所以有遠程實時監(jiān)控的需求。隨著科學技術的不斷進步,油田企業(yè)會讓生產管理更加信息化、科學化、智能化,遠程視頻監(jiān)控系統(tǒng)在油田中的應用不斷增多。邢智偉等人[4]總結分析了油田在生產過程中,油田的數字化建設將會成為主要方向,對突發(fā)性問題能夠實時、快速、準確地處理。
本文提出了基于YOLOv5算法的油田作業(yè)現場漏油識別方法。首先自主拍攝室內、室外2個場景的漏油數據集,并利用數據增強方式擴充數據集,然后將處理好的數據輸入到YOLOv5的4種預訓練網絡中訓練,保存最優(yōu)的訓練權重數據,并用作測試集測試。測試結果表明,所用算法模型的檢測速度和準確性都達到了油田作業(yè)現場的要求,并成功通過了功能測試和性能測試。
YOLOv5(You Only Look Once)是由 Ultralytics LLC公司于2020年提出,模型最快的目標檢測速度可達到0.007 s,即每秒可處理140幀,滿足油田作業(yè)現場實時檢測的需求[5]。其整體的網絡模型結構如圖1所示。
YOLOv5算法的整體網絡結構分為Input、Backbone、Neck、Prediction 4 個主要部分[6]。Input端采用YOLOv4中的Mosaic方式做數據增強處理。Backbone主干網絡指的是提取特征網絡,其作用是提取圖片中的信息,以供后面的網絡使用。Neck部分是放在Backbone和Prediction之間的,是為了更好地利用Backbone提取的特征。Prediction是獲取網絡輸出內容的網絡,利用之前提取的特征,以GIoU Loss作為bounding box的損失,并使用二進制交叉熵函數計算類概率,以及使用Logits損失計算目標得分的損失,最終做出綜合預測。
本文中漏油識別算法以YOLOv5為檢測模型,首先通過攝像頭采集并標注相關數據集,針對作業(yè)現場存在工作人員頭發(fā)等干擾樣本,采用負樣本對比的方法提高算法精度;其次將數據集送入YOLOv5網絡的4種預訓練模型中進行訓練,通過對比檢測速度、精度及召回率得到最佳權重數據;最后將最佳權重文件部署到作業(yè)現場,得到最終的油田作業(yè)現場漏油檢測模型。具體的算法流程如圖2所示。
數據集是深度學習任務中最基本且最重要的一部分,一個模型對于不同的數據集,訓練出的結果也會有所差異,數據集的好壞還會影響模型的性能。對于目標檢測任務,更需要大量的數據集作為網絡的輸入。太少的數據集訓練網絡,容易發(fā)生過擬合;太多的數據集,容易造成數據冗余,增加網絡計算量。
本文的數據集首先通過室內、室外監(jiān)控攝像頭拍攝漏油視頻,其次利用Python截取室內、室外2個場景下的漏油數據集,最后通過數據增強的方法對數據集進行擴增。數據集標注采用LabelImg軟件對整個數據集中每個圖像進行人工標注,標注樣本如圖3所示。標注后生成的是遵循PASCAL VOC格式的XML文件,訓練時YOLOv5不能直接提取XML文件,而是將中心點的坐標即標注框的寬和高以偏移量的方式存儲到TXT文件中,使得訓練時可以忽略不同圖像的尺寸。最終數據集的總量為6566張,其中訓練集5850張,測試集650張,驗證集66張。
訓練平臺的參數配置越高,圖形計算能力越強,模型訓練的效果則會越好。為了使模型達到良好的訓練效果,在GPU上對YOLOv5網絡的4個預訓練模型分別進行訓練。本次實驗在Intel Core i7 6700處理器,主頻為4 GHz,內存為32 G,顯卡型號為GeForce RTX 3080的PC機上進行,在Ubuntu18.04環(huán)境下利用深度學習框架Pytorch對YOLOv5模型進行訓練與測試。訓練模型的參數設置如表1所示。
表1 訓練平臺配置Tab.1 Training platform configuration
YOLOv5共有4種預訓練模型,分別為YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x,每種預訓練模型的深度和寬度不同,所以在數據集上的表現會有所不同。為了選取精度較高和實時性較快的檢測模型,本文在相同數據集條件下,分別在YOLOv5的4種預訓練模型中進行了訓練,對比結果如表2所示。
表2 不同模型效果對比Tab.2 Comparison of different models
通過對比結果發(fā)現,YOLOv5s模型用時最短,檢測速度最快,但YOLOv5m與之相差不大。YOLOv5m模型的精度最高,達到了94%,且YOLOv5m模型的精準率相對于YOLOv5s模型、YOLOv5l模型和YOLOv5x模型分別高出0.10、0.05和0.02個百分點。4種模型對于同一場景下的漏油檢測樣例如圖4所示。
由圖4可以看出,該模型能夠檢測到室內場景中的小目標漏油,并且具有一定識別精度,其中YOLOv5l、YOLOv5m、YOLOv5s、YOLOv5x 4種模型的檢測精度分別為0.87、0.93、0.89、0.91。綜合上述模型的精度和速度分析,本文選用YOLOv5m模型訓練,能得到最佳權重數據,所得出的數據可作為油田作業(yè)現場漏油識別模型的權重數據。
為了保障油田作業(yè)現場安全生產,本文提出了一種基于YOLOv5的油田作業(yè)現場漏油識別模型。首先對采集的數據集進行預處理以及數據集標注,然后通過YOLOv5的4種預訓練模型分別進行訓練,最后對比性能結果和檢測效果得到最優(yōu)權重數據。實驗結果表明,YOLOv5m模型更適用于本文制作的漏油數據集,檢測準確率達到了94.2%,能夠監(jiān)控油田作業(yè)現場區(qū)域內原油泄漏情況,并進行實時、準確、穩(wěn)定檢測。