国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于色彩空間和深度殘差網(wǎng)絡(luò)ResNet-50的復雜巖性油氣藏巖石樣本智能分類及識別

2023-11-04 02:26:38劉今子杜文穎董馳秦志清楊楠廖恩浩
科學技術(shù)與工程 2023年29期
關(guān)鍵詞:類別殘差巖石

劉今子, 杜文穎, 董馳, 秦志清, 楊楠, 廖恩浩

(1.東北石油大學數(shù)學與統(tǒng)計學院, 大慶 163318; 2.東北石油大學物理與電子工程學院, 大慶 163318;3.東北石油大學石油工程學院, 大慶 163318; 4.東北石油大學計算機與信息技術(shù)學院, 大慶 163318; 5.東北石油大學化學與化工學院, 大慶 163318; 6.東北石油大學電氣信息工程學院, 大慶 163318)

巖石樣本圖像的分類識別是油氣和礦產(chǎn)資源勘探的基礎(chǔ)工作,對儲量計算和地質(zhì)建模極為重要。常用的傳統(tǒng)分類方法,以重磁、測井、地震、遙感、電磁及薄片分析方法等方法為主,具有精度差、成本高、應(yīng)用范圍窄等缺點[1-5]。近年來,諸多學者研究以深度神經(jīng)網(wǎng)絡(luò)模型為代表的機器學習方法,應(yīng)用于解決巖石樣本圖像的分類問題,克服了傳統(tǒng)方法的主觀性強、周期長、成本高等弊端,開展了大量的工作。

巖石樣本圖像的局部特征參數(shù)及其分布規(guī)律是巖石巖性類別的重要依據(jù),主要包括:顏色、空間、形狀等特征參數(shù)。其中,色彩空間作為顏色特征的基礎(chǔ)參數(shù),成為巖石數(shù)字圖像分割的主要依賴參數(shù)。國內(nèi)外研究者對此開展了研究工作,并取得一定的成果[6-13]。Yang等[6]利用閾值法降低顏色空間維數(shù),并應(yīng)用于彩色圖像邊緣檢測。丁天懷等[7]、湯慧[8]利用多顏色空間融合作為圖像特征提取的手段。張瑩[9]基于多色彩空間,對切片圖像進行閾值分割,利用二值圖像數(shù)學形態(tài)學相關(guān)理論,對巖石圖像中的孔隙進行精確識別。吳擁等[10]基于正交偏光序列圖像的顆粒分割,利用紅綠藍(red-green-blue,RGB)多閾值分割算法對圖像進行分割,提高了準確性。程國建等[11]將灰度圖像分割應(yīng)用于不同顏色空間的每個顏色分量上,并通過一定的方式進行組合,實現(xiàn)圖像分割方法。王林林等[12]基于RGB色彩空間的彩色圖像處理技術(shù),對切片圖像進行閾值分割,實現(xiàn)了花崗巖組成成分邊界曲線識別與提取。

傳統(tǒng)的機器學習分類算法,分別以無監(jiān)督的K-means聚類和有監(jiān)督的K-近鄰(K-nearest neighbor,KNN)算法為典型代表,成為兩大類方法。國內(nèi)學者研究算法的有效性和應(yīng)用性,并用于巖石圖像分類問題的研究與實踐[13-16]。朱連江等[13]基于輪廓系數(shù)進行聚類的有效性分析。梁淑蓉等[14]基于權(quán)重搜索樹改進KNN的高維分類算法。郭超等[15]將圖像形態(tài)學變換與色彩通道的標準算術(shù)值相結(jié)合,利用神經(jīng)網(wǎng)絡(luò)和支持向量機算法實現(xiàn)了巖石圖像分類。劉燁等[16]基于鑄體薄片圖像顏色空間與形態(tài)學梯度的相關(guān)理論,應(yīng)用支持向量機算法實現(xiàn)了巖石分類。

隨著深度學習算法引入圖像分類和識別領(lǐng)域,國內(nèi)研究者基于巖石圖像的多種特征,提取對應(yīng)的特征參數(shù),構(gòu)建多層的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),實現(xiàn)圖像的快速分類[17-18]。胡祺[17]融合多維信息的巖石薄片圖像,利用深度學習VGG16算法實現(xiàn)分類。金書季[18]基于深度學習的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)實現(xiàn)巖石圖像的分類及圖像特征可視化。

然而,常用的卷積神經(jīng)網(wǎng)絡(luò)模型普遍存在信息丟失、損耗等問題,外國研究者使用了跳躍連接作為深度殘差網(wǎng)絡(luò)(ResNet)內(nèi)部的殘差塊,將輸入信息繞道傳到輸出,確保巖石圖像的局部特征在前向傳播時受到特征重用,能夠有效提高識別精度[19-20]。并且,外國研究者還研究深度殘差網(wǎng)絡(luò)能夠有效解決隨著網(wǎng)絡(luò)層數(shù)的增加而出現(xiàn)的梯度消失或梯度爆炸問題,保證了系統(tǒng)的誤差不會隨著深度增加而增加[21-22]。Kai等[19]采用殘差學習訓練殘差映射形成改進后的DnCNNs網(wǎng)絡(luò)結(jié)構(gòu),進行圖像去噪。Glorot等[20]研究訓練深度前饋神經(jīng)網(wǎng)絡(luò)的困難,對比激活函數(shù)和初始化選擇的效果。Bengio[21]驗證學習梯度下降的長期依賴關(guān)系。Wang等[22]利用深度殘差神經(jīng)網(wǎng)絡(luò)識別巖石圖像的類別,并計算含油量。同時,國內(nèi)學者也對ResNet殘差網(wǎng)絡(luò)的應(yīng)用和實踐進行了大量的研究工作[23-28]。張超群等[23]設(shè)計新的神經(jīng)網(wǎng)絡(luò)模型與ResNet 50、VGG 16算法進行對比,平均準確度為75.6%,優(yōu)于ResNet 50和Vgg 16算法。王元東[24]提出了一種隨機擦除數(shù)據(jù)增強算法,實現(xiàn)了對基于ResNet模型的圖像分類方法的改進。徐勝軍等[25]提出了一種基于多尺度特征融合空洞卷積ResNet模型用于遙感圖像分類。劉晨等[26]基于ResNet-50網(wǎng)絡(luò)模型和遷移學習的巖性識別與分類方法,首先使用預(yù)訓練的ResNet-50殘差網(wǎng)絡(luò)進行特征提取,然后利用改進的分類模型進行訓練,最后在測試集上進行巖性識別分類。劉丹晨[27]應(yīng)用3種算法:ResNet-LSTM、EfficientNet-LSTM和NFNet-LSTM分別進行基于多標簽圖像分類的礦物識別。許振浩等[28]比較并驗證ResNet算法對于巖石識別的穩(wěn)定性和可靠性。

目前,深度學習的分類算法已經(jīng)得到廣泛應(yīng)用。巖石樣本圖像具有明顯的差異性特征,同類巖石樣本也具有一定的色差,直接運用ResNet-50等神經(jīng)網(wǎng)絡(luò)算法進行巖石類型分類,訓練集精度可以接近90%,但是驗證集往往準確度85%左右,誤差損失明顯增大[23,26]?,F(xiàn)結(jié)合色彩空間和深度殘差網(wǎng)絡(luò)的特征,提取巖石圖像的RGB顏色特征,應(yīng)用無監(jiān)督K-means聚類算法進行顏色類別劃分,再通過有監(jiān)督精細KNN算法對顏色類別進行驗證,然后對于不同顏色類別下的巖石樣本,利用深度殘差網(wǎng)絡(luò)ResNet-50進行分類識別。

1 基于色彩空間的K-means聚類和特征提取

1.1 色彩空間

色彩空間是一種用坐標系來描述各類顏色的模型系統(tǒng),通常由3個或4個顏色分量構(gòu)成,色彩空間中的每個點均可看作由多個分量組合而成。常用的色彩空間以RGB(紅色、綠色、藍色)和HSV(色調(diào)、飽和度、明度)為主。

RGB色彩空間通過加法混色法來產(chǎn)生其他顏色,混合色定義為

C=rR+gG+bB

(1)

式(1)中:C為混合色,lm;R、G、B分別為紅、藍、綠3個顏色通道的量值,T;r、g、b分別為匹配時所需要RGB三基色的量值,取值范圍0~1。

RGB色彩空間坐標系可由一個三維立方體表示,如圖1所示。

圖1 RGB色彩空間坐標系Fig.1 RGB color space coordinate system

1.2 基于圖像RGB特征提取

復雜巖性油氣藏的巖石圖像數(shù)據(jù)集來源于2021年第九屆“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽的B題(https://www.tipdm.org:10010/#/competition/1354705811842195456/question)。數(shù)據(jù)集的巖石類別,以淺灰色細砂巖、深灰色泥巖為主,以深灰色粉砂質(zhì)泥巖、灰色泥質(zhì)粉砂巖和灰黑色泥巖為次,含有少量的灰色細砂巖和黑色煤,共計7類315張巖石圖像。巖石樣本圖像共計兩種格式:一種是整張圖像都是巖石,分辨率為4 096×3 000的BMG格式289張;另一種是背景邊緣不是巖石信息,分辨率為2 448×2 048的JPG格式26張。不同類別巖石的典型圖像,如圖2所示。

圖2 不同類別巖石的典型圖像Fig.2 Typical images of different types of rock

不同類別的巖石樣本圖像數(shù)量并不相同,存在數(shù)據(jù)不均衡的現(xiàn)象。為避免神經(jīng)網(wǎng)絡(luò)訓練過程中發(fā)生過擬合現(xiàn)象,利用圖像分割、隨機旋轉(zhuǎn)和平移的方法,進行數(shù)據(jù)增強,見表1。圖像分割選擇3×3的方式,將1張圖像切成9小張,見圖3。BMP格式的圖像直接分割,JPG格式切除邊緣后,再進行分割。

表1 各類巖石圖像數(shù)量

圖3 圖像切割Fig.3 Image segmentation

如圖4所示,巖石圖像RGB顏色屬性特征值分布具有不同的離散分布特征,均近似服從瑞利分布,數(shù)值分布主要集中于[0,100]區(qū)間。所以,巖石圖像的RGB顏色屬性的分布特征可以選用像素點的RGB平均值、中位數(shù)和兩個四分位數(shù),共4種統(tǒng)計量來表征和描述圖像的RGB顏色分布規(guī)律。每張巖石圖像提取的RGB平均值、中位數(shù)和兩個四分位數(shù)的屬性值,如表2所示。

表2 巖石圖像RGB特征數(shù)據(jù)(部分)

圖4 典型巖石圖像及相應(yīng)的RGB顏色數(shù)值分布曲線Fig.4 Typical rock images and corresponding RGB color value distribution curves

1.3 基于圖像RGB特征數(shù)據(jù)的K-means聚類

K-means聚類是將樣本集合劃分為由類似的樣本組成多個類或簇的學習過程。算法步驟如下。

步驟1在n個樣本集合X={x1,x2,…,xn}中,隨機選擇k個樣本點{μ1,μ2,…,μk}作為初始中心。

步驟2分別計算每個樣本xi與各聚類中心μj間的歐式距離d(i,j),將樣本歸類到與其最近的類中。

(2)

式(2)中:i=1,2,…,n;j=1,2,…,k。

步驟3根據(jù)類簇內(nèi)的第i個樣本第j個中心樣本xij,重新計算出該j類簇的聚類中心。

(3)

步驟4計算第i個樣本點的平方誤差Ei。

(4)

步驟5重復多次執(zhí)行步驟3~步驟5,直到所有的樣本點的平方誤差Et變化小于所設(shè)定的閾值。

|Et+1-Et|<δ

(5)

式(5)中:δ為迭代閾值。

引入輪廓系數(shù)S作為初始聚類中心,根據(jù)內(nèi)聚度和分離度的組合及其加權(quán),進行聚類效果評價。輪廓系數(shù)S的取值范圍為[-1,1],取值越接近1,表明聚類效果越好。

假設(shè)樣本集合中的樣本xi被聚類到類簇Kj中,則該樣本xi輪廓系數(shù)為

(6)

式(6)中:ai為樣本xi與其同類簇其他樣本間歐式距離的平均值;bi為樣本xi與其最近的不同類簇中其他樣本間歐氏距離的平均值。ai越小并且bi越大,則說明樣本xi越傾向?qū)儆陬惔豄j,而不屬于其他類簇。

計算樣本集合中所有樣本點xi的輪廓系數(shù)的平均值,可得出聚類的整體輪廓系數(shù)為

(7)

式(7)中:Sk為聚成k類時的輪廓系數(shù);Si為樣本點xi的輪廓系數(shù)。Sk越接近1,則xi的聚類效果越好;Sk越接近-1,則xi的聚類效果越差。

根據(jù)表2中的數(shù)據(jù),計算輪廓系數(shù)對K-means算法聚類效果進行評價,如圖5所示??梢钥闯?當類別數(shù)目為3時,輪廓系數(shù)取得最大值。由此,基于巖石圖像的RGB特征數(shù)據(jù),數(shù)據(jù)集可以聚為3個顏色類別,其不同聚類結(jié)果的巖石數(shù)量,共計2 835張,如表3所示。

表3 基于圖像RGB特征數(shù)據(jù)的K-means聚類結(jié)果

圖5 輪廓系數(shù)Fig.5 Profile coefficient

1.4 基于KNN算法的聚類結(jié)果驗證

KNN分類算法的核心思想是判斷數(shù)據(jù)之間距離的大小,距離越近則表示兩類數(shù)據(jù)之間的相似性越大。算法步驟如下。

步驟1輸入初始化訓練樣本數(shù)據(jù)。

(8)

步驟2計算測試數(shù)據(jù)與各個訓練數(shù)據(jù)之間的距離。

(9)

式(9)中:i=1,2,…,n。

步驟3對測試數(shù)據(jù)與各個訓練數(shù)據(jù)之間的距離,由小到大進行排序。

步驟4計算距離最近的k個樣本Xq=(x1,x2,…,xk)所組成的類別v出現(xiàn)的頻率。

(10)

式(10)中:V為聚類類別數(shù);f(xi)為xi分別屬于各個類別的概率。當a=b時,δ(a,b)=1;否則δ(a,b)=0。

基于K-means聚類的類別結(jié)果,將巖石圖像數(shù)據(jù)集劃分為訓練集(80%)和驗證集(20%),運用KNN算法進行驗證。如圖6所示,KNN算法的綜合分類精度為99%,不同類別的分類精確度分別為98.5%、100%和98.8%。所以,基于巖石圖像RGB特征數(shù)據(jù)的分類結(jié)果具有可靠性和合理性,聚類結(jié)果準確可信。

TPR表示召回率、真陽性率,正樣本總數(shù)占所有正樣本總數(shù)的比例;FNR表示誤識別率、假陽性率,預(yù)測錯的正樣本占全體正樣本的比例

2 基于顏色類別的深度殘差網(wǎng)絡(luò)ResNet-50分類算法

2.1 ResNet-50網(wǎng)絡(luò)基本結(jié)構(gòu)

ResNet-50網(wǎng)絡(luò)結(jié)構(gòu)由輸入模塊、殘差模塊和輸出模塊組成,如圖7所示。輸入模塊,包括conv(卷積層)和max pool(最大池化層),中間使用Relu激活函數(shù)和批歸一化層。殘差模塊,包含Conv Block和IdentityBlock兩種殘差結(jié)構(gòu)。其中,Conv Block輸出的維度與輸入的維度不同,可用于網(wǎng)絡(luò)維度的改變;Identity Block輸出的維度與輸入的維度相同,通過串聯(lián)加深網(wǎng)絡(luò)。輸出模塊,將特征經(jīng)過AvgPOOL平均池化層進行降采樣,輸入全連接層,由Softmax分類器輸出對應(yīng)的類別。網(wǎng)絡(luò)結(jié)構(gòu)描述參數(shù)如表4所示。

表4 ResNet-50網(wǎng)絡(luò)結(jié)構(gòu)描述參數(shù)

圖7 ResNet-50網(wǎng)絡(luò)結(jié)構(gòu)描述圖Fig.7 ResNet-50 network structure

2.2 超參數(shù)優(yōu)選

2.2.1 輸入層

起始層為輸入層,將巖石圖像進行數(shù)據(jù)化預(yù)處理。經(jīng)過優(yōu)化,將類型Ⅰ與Ⅱ的輸入層大小調(diào)整為64×64×3,類型Ⅲ的輸入層大小調(diào)整為256×256×3。

2.2.2 卷積層

卷積層通過建立局部相關(guān)進行特征提取,緩解了全連接帶來的神經(jīng)元數(shù)量迅速增加的問題。卷積的計算過程,如圖8所示。ResNet-50神經(jīng)網(wǎng)絡(luò)所采用卷積核大小為7×7,在保證模型精度的前提下,一定程度上降低了計算量。

圖8 卷積模塊Fig.8 Convolution module

(11)

2.2.3 激活函數(shù)

Relu激活函數(shù)具有單側(cè)抑制性,收斂速度快,計算復雜度低的特點。其定義式如下。

(12)

式(12)中:x為輸入向量。

2.2.4 池化層

ResNet-50神經(jīng)網(wǎng)絡(luò)的池化方式為最大池化,即取滑動窗口內(nèi)的最大元素作為輸出,如圖9所示?;瑒哟翱诖笮?×3,步長為2,有效地增加傳數(shù)據(jù)幀產(chǎn)生精確結(jié)果的概率,提高網(wǎng)絡(luò)的可優(yōu)化性。

圖9 池化模塊Fig.9 Pooling module

2.2.5 殘差模塊

殘差模塊指兩個卷積層之間建立跳躍連接,使神經(jīng)網(wǎng)絡(luò)向訓練精度較好的方向進行優(yōu)化,增大了最大允許深度,同時未增加參數(shù),保持計算復雜度在可控水平的范圍內(nèi),解決了網(wǎng)絡(luò)較深時產(chǎn)生梯度爆炸以及梯度消失的現(xiàn)象。如圖10所示,x表示模塊的輸入,F(x)表示原目標函數(shù),H(x)表示模塊的輸出,即H(x)=F(x)+x。殘差模塊通過跳躍連接傳遞信息,即使代入新的圖像數(shù)據(jù),依然可以避免網(wǎng)絡(luò)退化的現(xiàn)象發(fā)生。

圖10 殘差模塊Fig.10 Residual module

2.2.6 歸一化層

批量歸一化通過對數(shù)據(jù)重新進行標準化,使數(shù)據(jù)分布恢復到原始分布,提高網(wǎng)絡(luò)泛化能力。

設(shè)每個batch的張量形狀為(B,C,H,W),其中B為批量大小,C為進行批標準化的次數(shù),H為輸入圖像的高度,W為輸入圖像的寬度。標準化過程公式如下。

(13)

(14)

(15)

2.2.7 全連接層

全連接層指目標空間的神經(jīng)元與隱層特征空間的所有神經(jīng)元相連,是隱層特征空間所有神經(jīng)元的加權(quán)和,如圖11所示。其作為最后一層,將學習到的樣本特征,由隱層特征空間向目標空間做映射,進行分類。由表3可知,類型Ⅰ與Ⅱ的全連接層大小為5×1,類型Ⅲ的全連接層大小為7×1。

圖11 全連接層Fig.11 Fully connected layer

2.2.8 Softmax分類器

(16)

式(16)中:softmax(si)為被分為第i類的概率;si為輸入值x在第i類中的評分;N為總分類數(shù)。

2.2.9 準確度

(17)

式(17)中:TPii為將i類正確預(yù)測為i類的樣本數(shù);FPij(i≠j)為將i類錯誤預(yù)測為j類的樣本數(shù)。

3 實驗結(jié)果

數(shù)據(jù)集劃分比例為訓練集90%、驗證集10%。基于不同顏色類型的巖石樣本圖像,應(yīng)用ResNet-50算法進行識別,訓練集準確度均高于91%,驗證集準確度均高于84%,平均訓練集精度為93.15%,平均驗證集精度為88.21%,如表6所示。

表6 分類集準確度

4 結(jié)論

針對復雜巖性油氣藏的巖石樣本圖像智能分類及識別問題,基于色彩空間提取巖石圖像的RGB顏色特征數(shù)據(jù),應(yīng)用無監(jiān)督K-means聚類算法,進行顏色類別聚類。然后,利用有監(jiān)督精細KNN算法對顏色類別進行驗證。最后,對于不同顏色類別下的巖石樣本圖像,應(yīng)用深度殘差網(wǎng)絡(luò)ResNet-50算法進行分類識別,得到不同顏色類別巖石樣本識別的平均訓練集精度為93.15%,平均驗證集精度為88.21%。同時,數(shù)據(jù)集拆分成3個類別進行分類識別,降低數(shù)據(jù)量和計算復雜度,訓練時間較快。表明本方法可以有效地解決巖石圖像智能分類問題。

猜你喜歡
類別殘差巖石
基于雙向GRU與殘差擬合的車輛跟馳建模
第五章 巖石小專家
3深源巖石
基于殘差學習的自適應(yīng)無人機目標跟蹤算法
一種叫做煤炭的巖石
海藻與巖石之間
基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
自動化學報(2019年6期)2019-07-23 01:18:32
服務(wù)類別
新校長(2016年8期)2016-01-10 06:43:59
平穩(wěn)自相關(guān)過程的殘差累積和控制圖
河南科技(2015年8期)2015-03-11 16:23:52
論類別股東會
商事法論集(2014年1期)2014-06-27 01:20:42
绍兴市| 余江县| 图木舒克市| 托里县| 康马县| 祁阳县| 长岛县| 九寨沟县| 勃利县| 炎陵县| 临洮县| 隆德县| 青岛市| 来凤县| 雷州市| 龙川县| 南丰县| 上蔡县| 岱山县| 宜黄县| 常山县| 德惠市| 玛纳斯县| 沁水县| 徐水县| 温宿县| 正阳县| 建昌县| 台东市| 郴州市| 滁州市| 徐闻县| 昭苏县| 南通市| 上林县| 八宿县| 桐城市| 金坛市| 澄迈县| 汨罗市| 衡南县|