李慶旭 王巧華,2
(1.華中農(nóng)業(yè)大學(xué)工學(xué)院, 武漢 430070; 2.農(nóng)業(yè)農(nóng)村部長江中下游農(nóng)業(yè)裝備重點(diǎn)實(shí)驗(yàn)室, 武漢 430070)
計(jì)算機(jī)視覺作為禽蛋無損檢測(cè)領(lǐng)域中最常用的技術(shù)手段之一[1-2],對(duì)禽蛋內(nèi)外部品質(zhì)進(jìn)行檢測(cè)時(shí),一般需要根據(jù)人工經(jīng)驗(yàn)手動(dòng)提取禽蛋圖像特征并利用機(jī)器學(xué)習(xí)算法建立禽蛋內(nèi)外部品質(zhì)的分類模型[3-4],或利用卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)提取禽蛋圖像特征實(shí)現(xiàn)端對(duì)端的禽蛋圖像自動(dòng)分類與檢測(cè)[5-6]。機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法需要大量禽蛋樣本才能取得較好的檢測(cè)精度[7],但禽蛋樣本數(shù)據(jù)的獲取是一個(gè)耗時(shí)耗力的過程。在禽蛋圖像檢測(cè)中,利用機(jī)器學(xué)習(xí)算法或深度學(xué)習(xí)算法建立的模型在缺乏足夠的樣本數(shù)據(jù)時(shí)均存在過擬合的風(fēng)險(xiǎn)。
元學(xué)習(xí)已成為近年來人工智能領(lǐng)域的研究熱點(diǎn)[8],旨在通過模擬人類智能在少樣本條件下快速且準(zhǔn)確地完成分類或匹配任務(wù),與深度學(xué)習(xí)需要海量訓(xùn)練數(shù)據(jù)相比,是一種更為接近人類智能的算法。其可以分為3類:①基于度量的元學(xué)習(xí),是使用深度神經(jīng)網(wǎng)絡(luò)提取樣本的特征,將樣本數(shù)據(jù)映射至度量空間中,并在度量空間中計(jì)算樣本間的距離,最終實(shí)現(xiàn)樣本的分類或匹配,常見的基于度量的元學(xué)習(xí)算法有孿生網(wǎng)絡(luò)[9]、原型網(wǎng)絡(luò)[10]與關(guān)系網(wǎng)絡(luò)[11]等。②基于初始化的元學(xué)習(xí),其核心思想是學(xué)習(xí)一個(gè)通用的初始化模型,使模型在處理新任務(wù)時(shí)能夠快速收斂,如模型無關(guān)的元學(xué)習(xí)算法(Model agnostic meta learning, MAML)[12]。③基于優(yōu)化器的元學(xué)習(xí),包含基網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò),利用循環(huán)神經(jīng)網(wǎng)絡(luò)代替梯度下降算法作為基網(wǎng)絡(luò)的優(yōu)化器,從而使基網(wǎng)絡(luò)在小樣本條件下依然能夠表現(xiàn)出較好的性能[13]。
元學(xué)習(xí)被廣泛應(yīng)用于小樣本條件下的圖像分類任務(wù)中[14],但在農(nóng)業(yè)領(lǐng)域尚未發(fā)現(xiàn)相關(guān)文獻(xiàn),若能將元學(xué)習(xí)應(yīng)用于禽蛋圖像檢測(cè),將加速人類智能融入禽蛋無損檢測(cè)領(lǐng)域??紤]到禽蛋圖像的特征主要存在于禽蛋的蛋黃或者蛋殼表面部分[15-16],且禽蛋圖像檢測(cè)一般為2~3分類的專屬任務(wù)。經(jīng)反復(fù)探究與嘗試,本文利用基于度量的元學(xué)習(xí)構(gòu)造少樣本條件下禽蛋圖像檢測(cè)模型。在原型網(wǎng)絡(luò)的基礎(chǔ)上設(shè)計(jì)一種適用于禽蛋圖像檢測(cè)的原型禽蛋網(wǎng)絡(luò)(Prototypical-Egg network),利用引入注意力機(jī)制的逆殘差結(jié)構(gòu)搭建的卷積神經(jīng)網(wǎng)絡(luò)將禽蛋圖像映射到嵌入空間,從而實(shí)現(xiàn)對(duì)禽蛋圖像的分類。將為少樣本條件下的禽蛋圖像無損檢測(cè)提供一種更為智能的檢測(cè)思路,以避免因樣本數(shù)據(jù)不足而無法對(duì)禽蛋圖像進(jìn)行分析檢測(cè)的問題。
禽蛋視覺無損檢測(cè)任務(wù)一般可分為種蛋孵化信息檢測(cè)、內(nèi)部品質(zhì)和外部品質(zhì)檢測(cè)[17-19],分別采集孵化5 d的種鴨蛋圖像(檢測(cè)種鴨蛋是否受精)、雙黃鴨蛋與普通鴨蛋圖像(檢測(cè)雙黃蛋)和裂紋皮蛋與正常皮蛋圖像(檢測(cè)皮蛋裂紋),針對(duì)此3個(gè)禽蛋分類任務(wù)利用原型禽蛋網(wǎng)絡(luò)驗(yàn)證分類效果,以驗(yàn)證本文方法的可行性。
為采集孵化5 d的種鴨蛋透射圖像,選用300枚新鮮的國紹1號(hào)麻鴨種鴨蛋(其中無精蛋和受精蛋比例為1∶1)為試驗(yàn)材料,將其消毒編號(hào)后置入智能孵化箱內(nèi)進(jìn)行孵化,待孵化5 d后利用圖1所示圖像采集系統(tǒng)采集種鴨蛋透射圖像,孵化10 d后對(duì)其進(jìn)行破殼處理獲取精準(zhǔn)的受精結(jié)果。
選用300枚高郵鴨蛋(雙黃蛋和單黃蛋各150枚)作為試驗(yàn)材料,利用圖1所示圖像采集系統(tǒng)采集雙黃蛋與單黃蛋的透射圖像。
為采集禽蛋外部品質(zhì)圖像,試驗(yàn)選用產(chǎn)自湖北神丹公司的300枚皮蛋作為試驗(yàn)材料,其中裂紋皮蛋和正常皮蛋各150枚,利用圖2所示圖像采集系統(tǒng)采集皮蛋表面反射圖像,圖像采集裝置包括工業(yè)相機(jī)及鏡頭、暗箱、光源和計(jì)算機(jī)。
采集得到孵化5 d種鴨蛋圖像300幅,無精蛋和受精蛋各150幅,如圖3所示。雙黃鴨蛋與單黃鴨蛋圖像共300幅,雙黃蛋與單黃蛋各150幅,如圖4所示。正常皮蛋和裂紋皮蛋圖像各150幅,如圖5所示。三者的原始圖像尺寸均為1 024像素×768像素,為方便將圖像輸入設(shè)計(jì)的原型網(wǎng)絡(luò),利用雙線性插值法將原始圖像尺寸統(tǒng)一調(diào)整為256像素×256像素。圖像劃分為支撐集與查詢集,支撐集共300幅圖像(其中受精蛋、無精蛋、雙黃蛋、單黃蛋、正常皮蛋與裂紋皮蛋各50幅),查詢集共600幅圖像,每類含100幅圖像。
原型網(wǎng)絡(luò)是SNELL等提出的一種小樣本學(xué)習(xí)算法,利用非線性映射將支撐集圖像映射到嵌入空間內(nèi),計(jì)算嵌入空間內(nèi)每類圖像的加權(quán)平均值得到該類的原型,測(cè)試圖像同樣經(jīng)過非線性映射至嵌入空間,計(jì)算查詢集圖像在嵌入空間上到每個(gè)類別原型的歐氏距離,利用歐氏距離實(shí)現(xiàn)測(cè)試圖像的分類, 原型網(wǎng)絡(luò)的結(jié)構(gòu)如圖6所示,包括由卷積層和池化層組成的卷積神經(jīng)網(wǎng)絡(luò)、嵌入空間和歐氏距離計(jì)算。
原型網(wǎng)絡(luò)分為模型訓(xùn)練和測(cè)試兩部分,訓(xùn)練時(shí)通過卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的特征提取能力和非線性表達(dá)能力,將支撐集圖像映射至嵌入空間中。在嵌入空間計(jì)算每個(gè)類別圖像的嵌入支持點(diǎn)(圖像特征)的平均向量,得到每個(gè)分類的原型。測(cè)試時(shí)將查詢集圖像輸入至卷積神經(jīng)網(wǎng)絡(luò)得到嵌入支持點(diǎn),計(jì)算測(cè)試圖像嵌入支持點(diǎn)與支撐集每個(gè)類別的原型之間的距離。將距離測(cè)試圖像嵌入支持點(diǎn)最近的原型劃為一類,從而完成測(cè)試圖像的分類。
每類圖像原型ck和測(cè)試圖像與原型之間的距離pφ計(jì)算公式為
(1)
(2)
其中
(3)
式中fφ(xi)——嵌入函數(shù),表示卷積神經(jīng)網(wǎng)絡(luò)的映射關(guān)系
Sk——含k個(gè)類別的樣本集
|Sk|——k個(gè)類別的樣本集的數(shù)量
xi——Sk中第i個(gè)樣本的特征向量
yi——Sk中第i個(gè)樣本的標(biāo)記向量
d——嵌入空間內(nèi)樣本x到第k個(gè)原型的距離函數(shù)
k——支撐集樣本類別數(shù)
原型網(wǎng)絡(luò)在Omniglot和miniImageNet數(shù)據(jù)集上取得了較好的檢測(cè)效果,其中Omniglot數(shù)據(jù)集中的圖像是尺寸為105×105×1的單通道圖像,miniImageNet數(shù)據(jù)集圖像尺寸為84×84×3。原型網(wǎng)絡(luò)的卷積神經(jīng)網(wǎng)絡(luò)部分由卷積層、池化層和批量歸一化操作組成,其網(wǎng)絡(luò)結(jié)構(gòu)如圖7所示,本文以miniImageNet數(shù)據(jù)集為例說明原型網(wǎng)絡(luò)的圖像特征提取過程:
(1)輸入層(Inputs):輸入圖像尺寸為84×84×3,輸入至卷積層1(Conv1)。
(2)卷積層1(Conv1):卷積核尺寸為3×3,卷積核個(gè)數(shù)為64,步長為1,輸入圖像經(jīng)過卷積后輸出的圖像尺寸為64×84×84。后對(duì)其進(jìn)行批量歸一化(BN)操作,最后由ReLU函數(shù)激活后輸入至池化層1(Pool1)。
(3)池化層1(Pool1):池化核尺寸為2×2,輸入圖像(64×84×84)經(jīng)過池化處理后輸出圖像尺寸為64×42×42,并將其輸入至卷積層2(Conv2)。
(4)卷積層2(Conv2):卷積核尺寸為3×3,卷積核個(gè)數(shù)為64,步長為1,輸入圖像經(jīng)過卷積后輸出圖像尺寸為64×42×42。后對(duì)其進(jìn)行批量歸一化操作,最后由ReLU函數(shù)激活后輸入至池化層2(Pool2)。
(5)池化層2(Pool2):池化核尺寸為2×2,輸入圖像(64×42×42)經(jīng)過池化處理后輸出圖像尺寸為64×21×21,并將其輸入至卷積層3(Conv3)。
(6)卷積層3(Conv3):卷積核尺寸為3×3,卷積核個(gè)數(shù)為64,步長為1,輸入圖像經(jīng)過卷積后輸出圖像尺寸為64×21×21。后對(duì)其進(jìn)行批量歸一化操作,最后由ReLU函數(shù)激活后輸入至池化層3(Pool3)。
(7)池化層3(Pool3):池化核尺寸為2×2,輸入圖像(64×21×21)經(jīng)過池化處理后輸出圖像尺寸為64×10×10,并將其輸入卷積層4(Conv4)。
(8)卷積層4(Conv4):卷積核尺寸為3×3,卷積核個(gè)數(shù)為64,步長為1,輸入圖像經(jīng)過卷積后輸出圖像尺寸為64×10×10。后對(duì)其進(jìn)行批量歸一化操作,最后由ReLU函數(shù)激活后輸入至池化層4(Pool4)。
(9)池化層4(Pool4):池化核尺寸為2×2,輸入圖像(64×10×10)經(jīng)過池化處理后輸出圖像尺寸為64×5×5,并將其輸入至嵌入空間。
禽蛋圖像的特點(diǎn)與miniImageNet數(shù)據(jù)集中的數(shù)據(jù)分布情況有顯著區(qū)別,所有的禽蛋圖像均呈近似橢圓形,有效特征主要集中在蛋黃或蛋殼表面部分,如受精蛋和無精蛋相比蛋黃部分顏色呈暗紅色、雙黃鴨蛋的特征在于蛋黃面積較單黃蛋明顯增加、裂紋皮蛋的蛋殼表面有輕微的損傷。針對(duì)禽蛋圖像數(shù)據(jù)特征分布特點(diǎn),要求卷積神經(jīng)網(wǎng)絡(luò)具備更強(qiáng)大的特征提取能力。而原型網(wǎng)絡(luò)的卷積神經(jīng)網(wǎng)絡(luò)部分僅為4層,對(duì)于禽蛋圖像特征的提取能力表現(xiàn)得略顯不足[20]。
卷積神經(jīng)網(wǎng)絡(luò)的層數(shù)越深或?qū)挾仍酱笃涮卣魈崛∧芰?huì)有明顯提升[21-22],MobileNet系列網(wǎng)絡(luò)因其具有參數(shù)量小和檢測(cè)性能強(qiáng)的特點(diǎn),已成為機(jī)器視覺領(lǐng)域較為常用的網(wǎng)絡(luò)[23]。MobileNet網(wǎng)絡(luò)利用深度可分離卷積代替標(biāo)準(zhǔn)卷積(Conv),還增加了分辨率與寬度因子,極大地減少了網(wǎng)絡(luò)參數(shù)量,但其提取低維空間時(shí)存在線性瓶頸。MobileNet V2網(wǎng)絡(luò)針對(duì)MobileNet的缺陷,利用先升維再卷積后降維的逆殘差結(jié)構(gòu)和對(duì)激活函數(shù)的改進(jìn)[24],增強(qiáng)了網(wǎng)絡(luò)的性能,逆殘差結(jié)構(gòu)如圖8所示。為了進(jìn)一步提升網(wǎng)絡(luò)的速度和檢測(cè)精度,MobileNet V3在逆殘差結(jié)構(gòu)的基礎(chǔ)上引入了注意力機(jī)制模塊[25],能夠有效地減少噪聲對(duì)梯度的影響。注意力機(jī)制逆殘差模塊結(jié)構(gòu)如圖9所示。
為此,本文搭建了7層卷積神經(jīng)網(wǎng)絡(luò)(Prototypical-Egg網(wǎng)絡(luò)),網(wǎng)絡(luò)含有逆殘差卷積、注意力機(jī)制逆殘差卷積。與原型網(wǎng)絡(luò)卷積部分相比增加了網(wǎng)絡(luò)的深度,增強(qiáng)了網(wǎng)絡(luò)的魯棒性。Prototypical-Egg網(wǎng)絡(luò)的卷積部分結(jié)構(gòu)如圖10所示,具體實(shí)現(xiàn)過程如下:
(1)輸入層(Inputs):輸入禽蛋圖像尺寸為256×256×3。
(2)卷積層1(Conv2d_1):卷積核尺寸為3×3,核個(gè)數(shù)為16,步長為2。尺寸為256×256×3的圖像經(jīng)過卷積處理后輸出圖像尺寸為128×128×16。
(3)逆殘差卷積層1(IRS_1): 逆殘差卷積包括2個(gè)1×1卷積和1個(gè)3×3卷積,每個(gè)卷積層后加BN層和ReLU激活函數(shù)。128×128×16的禽蛋圖像經(jīng)過逆殘差卷積后輸出圖像尺寸為64×64×16,輸出至逆殘差卷積層2(IRS_2)。
(4)逆殘差卷積層2(IRS_2):尺寸為64×64×16的圖像經(jīng)過逆殘差卷積后輸出圖像尺寸為32×32×24,輸出至逆殘差卷積層3(IRS_3)。
(5)逆殘差卷積層3(IRS_3):尺寸為32×32×24的圖像經(jīng)過逆殘差卷積后輸出的圖像尺寸為32×32×24,輸出至SE逆殘差卷積1(SE IRS_1)。
(6)SE逆殘差卷積(SE IRS_1): 尺寸為32×32×24的圖像經(jīng)過SE逆殘差卷積輸出圖像為32×32×40,輸出至SE逆殘差卷積2(SE IRS_2)。
(7)SE逆殘差卷積(SE IRS_2): 尺寸為32×32×40的圖像經(jīng)過SE逆殘差卷積輸出圖像為16×16×40,輸出至SE逆殘差卷積3(SE IRS_3)。
(8)SE逆殘差卷積(SE IRS_3): 尺寸為16×16×40的圖像經(jīng)過SE逆殘差卷積輸出圖像為16×16×64,輸出至嵌入空間。
試驗(yàn)硬件平臺(tái):AMD銳龍 Threadripper 2920X型CPU、NIVIDIA GeForce RTX 2080Ti 型GPU、128 GB內(nèi)存。軟件平臺(tái):Pytorch 1.6+Python 3.8。
采集的原始圖像尺寸為1 024像素×768像素,若直接將原始圖像輸入至原型網(wǎng)絡(luò)的卷積神經(jīng)網(wǎng)絡(luò)部分,每幅圖像最終輸入給嵌入空間的特征尺寸為64×48×64,網(wǎng)絡(luò)的參數(shù)量將大大增加。為此,本文將原始圖像進(jìn)行尺寸調(diào)整,但圖像尺寸過小則會(huì)損失大量特征導(dǎo)致模型性能表現(xiàn)不佳。以雙黃鴨蛋圖像為例,分別將其調(diào)整為84×84×3(miniImageNet數(shù)據(jù)集)、128×128×3、256×256×3(本試驗(yàn))、512×512×3,如圖11所示。不難發(fā)現(xiàn),將禽蛋圖像尺寸調(diào)整為84×84×3和128×128×3,圖像像素信息丟失較多,考慮模型的參數(shù)量和速度,本文將禽蛋圖像統(tǒng)一調(diào)整為256×256×3。
原型網(wǎng)絡(luò)的訓(xùn)練過程是不斷優(yōu)化參數(shù)找尋最佳原型的過程。先從支撐集讀取6類禽蛋圖像構(gòu)造15個(gè)分類任務(wù),每次隨機(jī)抽取2類禽蛋圖像進(jìn)行二分類。訓(xùn)練時(shí)從支撐集中隨機(jī)抽取50幅圖像(每類含25幅圖像),利用卷積神經(jīng)網(wǎng)絡(luò)將50幅圖像映射成嵌入空間的2個(gè)原型。再從這2類中選取16幅圖像輸入至卷積神經(jīng)網(wǎng)絡(luò)映射到嵌入空間,并計(jì)算每幅禽蛋圖像與2個(gè)原型之間的歐氏距離,從而完成測(cè)試圖像分類。訓(xùn)練流程如圖12所示,其中訓(xùn)練過程中優(yōu)化的目標(biāo)(損失)函數(shù)為
J(φ)=-lgpφ(y=k|x)
(4)
式中φ——網(wǎng)絡(luò)學(xué)習(xí)參數(shù)
試驗(yàn)利用Adam優(yōu)化器尋找最優(yōu)梯度下降方向,使原型網(wǎng)絡(luò)對(duì)禽蛋圖像的分類性能朝著更佳的方向發(fā)展。原型網(wǎng)絡(luò)和Prototypical-Egg網(wǎng)絡(luò)的初始學(xué)習(xí)率均設(shè)置為0.000 1,迭代次數(shù)設(shè)置為50次,每個(gè)迭代次數(shù)設(shè)置為10次。
原型網(wǎng)絡(luò)和Prototypical-Egg網(wǎng)絡(luò)訓(xùn)練過程中損失值變化如圖13所示。從圖13可以發(fā)現(xiàn),原型網(wǎng)絡(luò)的初始損失值較低,迭代20次后維持在較低水平。Prototypical-Egg網(wǎng)絡(luò)初始損失值較大,后總體呈下降趨勢(shì),訓(xùn)練25次后網(wǎng)絡(luò)收斂并維持在較低水平。
將查詢集600幅圖像(受精蛋、無精蛋、雙黃鴨蛋、單黃鴨蛋、裂紋皮蛋和正常皮蛋各100幅)分別輸入訓(xùn)練好的原型網(wǎng)絡(luò)和Prototypical-Egg網(wǎng)絡(luò),測(cè)試網(wǎng)絡(luò)性能,考慮到實(shí)際應(yīng)用價(jià)值,本文主要測(cè)試網(wǎng)絡(luò)在受精蛋與無精蛋(受精任務(wù))、雙黃鴨蛋與單黃鴨蛋(雙黃蛋任務(wù))、裂紋皮蛋與正常皮蛋(裂紋任務(wù))3個(gè)分類任務(wù)上的表現(xiàn),測(cè)試結(jié)果如表1所示。
表1 網(wǎng)絡(luò)精度測(cè)試結(jié)果Tab.1 Network accuracy test results %
對(duì)比原型網(wǎng)絡(luò)和Prototypical-Egg網(wǎng)絡(luò)在查詢集上3個(gè)分類任務(wù)上的表現(xiàn),Prototypical-Egg網(wǎng)絡(luò)在裂紋檢測(cè)任務(wù)上精度比原型網(wǎng)絡(luò)提升了5個(gè)百分點(diǎn),在受精檢測(cè)任務(wù)上精度提升了2個(gè)百分點(diǎn)。其中兩者對(duì)皮蛋裂紋檢測(cè)精度略低,分析原因可能為裂紋特征不夠明顯。但Prototypical-Egg網(wǎng)絡(luò)相比原型網(wǎng)絡(luò)的性能提升明顯,更加適應(yīng)于禽蛋圖像分類任務(wù)的檢測(cè)。
由于所采集禽蛋圖像的背景基本為純黑色,該部分為無用信息。故對(duì)原始圖像進(jìn)行裁剪,將原始圖像尺寸裁剪為700像素×500像素,裁剪后的圖像如圖14所示,可去除大量背景信息。此外,對(duì)裁剪后的支撐集圖像進(jìn)行旋轉(zhuǎn)、平移等操作以實(shí)現(xiàn)數(shù)據(jù)集的擴(kuò)充,數(shù)據(jù)增強(qiáng)后的支撐集圖像為1 200幅(受精蛋、無精蛋、雙黃鴨蛋、單黃鴨蛋、裂紋皮蛋和正常皮蛋各200幅)。利用裁剪和增強(qiáng)后的圖像,以相同的訓(xùn)練方法和網(wǎng)絡(luò)模型進(jìn)一步驗(yàn)證網(wǎng)絡(luò)性能,對(duì)裁剪后查詢集圖像的精度測(cè)試結(jié)果如表2所示??梢园l(fā)現(xiàn),改進(jìn)前后的原型網(wǎng)絡(luò)對(duì)受精和裂紋任務(wù)的檢測(cè)性能均有一定程度的提升,且改進(jìn)后的網(wǎng)絡(luò)性能仍優(yōu)于改進(jìn)前的原型網(wǎng)絡(luò)。
表2 裁剪和增強(qiáng)后的精度測(cè)試結(jié)果Tab.2 Cropped and enhanced accuraey test results %
(1)利用注意力機(jī)制改進(jìn)的逆殘差模塊搭建原型網(wǎng)絡(luò)的卷積部分,更加適用于禽蛋圖像檢測(cè)任務(wù),對(duì)受精、雙黃和裂紋檢測(cè)精度分別為95%、98%、88%,取得了較好的檢測(cè)結(jié)果,比原型網(wǎng)絡(luò)性能提升明顯。對(duì)原始圖像進(jìn)行裁剪去除部分背景后并對(duì)支撐集圖像進(jìn)行數(shù)據(jù)擴(kuò)充,擴(kuò)充后的受精、雙黃和裂紋蛋檢測(cè)精度分別為96%、98%、90%。
(2)試驗(yàn)僅利用300幅圖像作為支撐集用于訓(xùn)練,600幅禽蛋圖像作為查詢集用于測(cè)試,Prototypical-Egg網(wǎng)絡(luò)取得了較好的檢測(cè)精度,充分體現(xiàn)了小樣本學(xué)習(xí)的優(yōu)勢(shì)。采集少量的禽蛋圖像便可完成禽蛋視覺無損檢測(cè),節(jié)約大量人力物力成本,為禽蛋無損檢測(cè)提供了新的思路。
(3)試驗(yàn)結(jié)果表明,將禽蛋圖像尺寸統(tǒng)一調(diào)整為256×256×3,可以在不丟失主要特征的情況下取得較快的訓(xùn)練速度。