李恒鑫,常 侃,2*,譚宇飛,3,凌銘陽,覃團(tuán)發(fā),2
(1.廣西大學(xué)計算機與電子信息學(xué)院,南寧 530004;2.廣西多媒體通信與網(wǎng)絡(luò)技術(shù)重點實驗室(廣西大學(xué)),南寧 530004;3.廣西師范大學(xué)電子工程學(xué)院,廣西桂林,541004)
為了降低商用數(shù)碼相機的成本及技術(shù)難度,廠商通常在相機的光強傳感器前端增加一個顏色濾波矩陣(Color Filter Array,CFA)。其中,應(yīng)用最廣泛的是Bayer 模式[1]。經(jīng)過Bayer 模式采樣得到的圖片,包含有1/4 的紅色(R)通道、1/2的綠色(G)通道及1/4 的藍(lán)色(B)通道信息。由于在Bayer 采樣圖像上,每個像素點僅包含單個色彩通道信息,因此需要應(yīng)用彩色圖像去馬賽克(Color image DeMosaicking,CDM)復(fù)原出全彩圖像。
已有的CDM 算法可以大致分為兩類:傳統(tǒng)算法和基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的算法。其中,CDM 傳統(tǒng)算法可分為基于插值的算法及基于重建的算法?;诓逯档乃惴ò袼亻g簡單插值的算法[2-4]以及引入圖像的稀疏先驗信息的殘差插值算法[5-7]等?;诓逯档乃惴ㄟ\行速度較快,但容易使彩色圖像產(chǎn)生拉鏈效應(yīng)及偽色彩效應(yīng)?;谥亟ǖ乃惴ㄍǔDM 過程視為一個逆問題,引入一種或多種圖像先驗信息以約束求解。例如,黃麗麗等[8]結(jié)合稀疏編碼與字典學(xué)習(xí),提出了非局部稀疏表示算法;Zhang 等[9]利用非局部圖像冗余先驗,應(yīng)用非局部自適應(yīng)算法抑制插值誤差;Chang 等[10]提出的CDM 算法則是聯(lián)合通道間相關(guān)性與非局部自相似性。基于重建的算法需要在線迭代求解優(yōu)化問題,計算負(fù)擔(dān)過重,不易于實際應(yīng)用。
隨著并行計算技術(shù)的發(fā)展,基于CNN 的算法突破了硬件瓶頸,近年來逐漸成為了CDM 算法的主流[11-15],其中較有代表性的算法是:Gharbi 等[11]將輸入的馬賽克圖像重新排列為四維特征圖,并使用原始圖像信息引導(dǎo)網(wǎng)絡(luò)重建過程;Tan等[12]將CDM 過程分為兩個階段(2-stage),其中第一階段產(chǎn)生中間結(jié)果,第二階段則通過殘差學(xué)習(xí)增強輸出圖像質(zhì)量;在文獻(xiàn)[13]中,將訓(xùn)練集分為粗糙、普通及光滑三類,獨立訓(xùn)練3 個模型,并將3 個模型的輸出進(jìn)行融合而得到最終結(jié)果;Cui 等[14]在2-stage 基礎(chǔ)上進(jìn)一步提出了三階段(3-stage)網(wǎng)絡(luò)模型,其使用G 通道來引導(dǎo)R、B 通道的重建。
一般而言,通過增加網(wǎng)絡(luò)深度和寬度,能夠提升網(wǎng)絡(luò)性能,但是,網(wǎng)絡(luò)模型大小和計算量也會隨之增加。部分算法并未考慮龐大的模型尺寸在實際應(yīng)用中的困難。例如,文獻(xiàn)[13]中提出對3 個去馬賽克網(wǎng)絡(luò)的輸出進(jìn)行融合,但3 個網(wǎng)絡(luò)總的參數(shù)量達(dá)到了4.5×106,因此在設(shè)計CNN 網(wǎng)絡(luò)的同時,必須要考慮算法性能和復(fù)雜度/模型尺寸之間的權(quán)衡。
已有一些學(xué)者設(shè)計了高效的網(wǎng)絡(luò)構(gòu)建模塊,旨在以較低的參數(shù)量獲得令人滿意的網(wǎng)絡(luò)性能。例如Chang 等[16]使用多支路以提取圖像中不同尺度的特征,但多支路方案使網(wǎng)絡(luò)的時間成本顯著增加。Hui 等[17]提出信息蒸餾模塊(Information Distillation Block,IDB),其部分特征通過跳躍連接實現(xiàn)信息蒸餾。但I(xiàn)DB 不針對蒸餾的信息進(jìn)一步提煉特征,且存在著蒸餾特征與精煉特征不適配的情況。
為了以較小的網(wǎng)絡(luò)尺寸與計算復(fù)雜度獲得高質(zhì)量的CDM 結(jié)果,本文提出了一種應(yīng)用通道間相關(guān)性和增強信息蒸 餾(Inter-channel Correlation and Enhanced Information Distillation,ICEID)的彩色圖像去馬賽克網(wǎng)絡(luò)。本文的主要工作包括了三個方面:
1)提出了一種應(yīng)用通道相關(guān)性的初始重建模塊(Interchannel-correlation-based Initial Reconstruction Module,IIRM)。該模塊直接在重排列的子色彩通道上提取特征,并利用R、G、B 三個色彩通道之間的相關(guān)性輔助進(jìn)行丟失信號的初始重建。
2)為在網(wǎng)絡(luò)參數(shù)與網(wǎng)絡(luò)性能等之間獲得更好的平衡,提出增強信息蒸餾模塊(Enhanced Information Distillation Module,EIDM)。在該模塊中,通過引入信息蒸餾策略,有效地降低模型參數(shù)量;針對蒸餾的信息,進(jìn)一步進(jìn)行特征增強,以便與精煉的特征更好地適配,從而獲得更強的特征表達(dá)能力。
3)將IIRM 與EIDM 模塊進(jìn)行級聯(lián),構(gòu)成了完整的CDM網(wǎng)絡(luò)ICEID。與其他典型的CDM 算法相比,所提出的網(wǎng)絡(luò)能夠以相對較低的網(wǎng)絡(luò)復(fù)雜度和網(wǎng)絡(luò)尺寸獲得最高的主觀質(zhì)量與客觀質(zhì)量。
Cui 等[14]提出的三階段網(wǎng)絡(luò)是一種較為經(jīng)典框架,如圖1 所示。其中“Network”為通道重建子網(wǎng)絡(luò),“LossG”“LossRG”“LossGB”“LossRGB”分別代表G 通道、RG 通道、GB 通道、RGB通道的損失函數(shù)。該算法首先將馬賽克圖像進(jìn)行雙線性(Bilinear)插值得到初始圖像,再將初始圖像切分為R、G、B三通道分別進(jìn)行重建。由于在Bayer 模式中,G 通道包含更多的采樣信息,故采用重建后的G 通道引導(dǎo)R、B 通道的重建,以獲得更高的重建質(zhì)量。
圖1 三階段網(wǎng)絡(luò)的結(jié)構(gòu)Fig.1 Structure of 3-stage network
但是,上述三階段網(wǎng)絡(luò)存在著以下問題:首先,其初始圖像由馬賽克圖像進(jìn)行Bilinear 插值獲得,在插值后的圖像上提取信息,容易誤導(dǎo)網(wǎng)絡(luò)的學(xué)習(xí)過程;其次,在第一階段重建G 通道信號時,并未使用R 和B 通道的信息進(jìn)行輔助,從而限制了G 通道的重建質(zhì)量;最后,在通道重建子網(wǎng)絡(luò)中,對傳統(tǒng)的“卷積層+批歸一化+激活”模塊進(jìn)行級聯(lián),提取和精煉特征的效率不夠高。為了解決上述問題,一方面,本文提出IIRM 模塊進(jìn)行初始的通道重建;另一方面,提出高效的EIDM 模塊進(jìn)行特征提取和精煉。
Hui 等[17]提出了一種輕量化的信息蒸餾網(wǎng)絡(luò)(Information Distillation Network,IDN),其在網(wǎng)絡(luò)參數(shù)量與性能之間達(dá)到了較好的平衡。圖2 展示了IDN 中的基礎(chǔ)構(gòu)建塊——信息蒸餾模塊(IDB),其中,“Conv”表示卷積層,“”表示特征通道的級聯(lián)(Concat)操作,“”表示特征通道的切分(Slice)操作,“⊕”表示特征通道的加操作。由圖2 可見,IDB 在結(jié)構(gòu)中部對特征進(jìn)行切分,部分特征與輸入特征級聯(lián)后直接連接到模塊末端,與經(jīng)過提煉的特征進(jìn)行相加。由于部分特征進(jìn)行了跨層傳輸,IDB 的參數(shù)量得以減小。
圖2 IDB的結(jié)構(gòu)Fig.2 Structure of IDB
IDB 的結(jié)構(gòu)存在著下述問題:首先,被切分出來的16 個特征通道沒有作進(jìn)一步的提煉,且與另一個支路的48 個特征通道的信息并不適配;其次,結(jié)構(gòu)中存在多次特征通道的調(diào)整,需要過多地手工設(shè)計以匹配不同支路的特征維度,導(dǎo)致網(wǎng)絡(luò)設(shè)計不夠靈活。為了有效地解決IDB 中的缺陷,本文提出增強信息蒸餾模塊(EIDM),并將其作為本文去馬賽克網(wǎng)絡(luò)中的基礎(chǔ)構(gòu)建塊。
本文提出了一種應(yīng)用通道相關(guān)性和增強信息蒸餾(ICEID)的彩色圖像去馬賽克網(wǎng)絡(luò)。該網(wǎng)絡(luò)的結(jié)構(gòu)如圖3 所示,主要由主要特征提取主支路與旁伴支路組成。為了避免Bilinear 插值所引入的誤導(dǎo)信息,將輸入的Bayer 圖像重排列為4 維特征“RG1G2B”,其長寬尺寸由H×W變換為×4。在主要特征提取支路中,“RG1G2B”通過IIRM 及EIDM,輸出特征尺寸為× 64,再傳遞給一個3×3 卷積層及子像素層[18](Sub-pixel),從而生成H×W× 3 的特征圖。在旁伴支路中,“RG1G2B”通過一層5×5 卷積層及子像素層生成H×W× 3 的特征圖,其輸出直接跨層連接至主要特征提取支路尾端以便于網(wǎng)絡(luò)進(jìn)行殘差學(xué)習(xí)。最后,將輸出圖像中各個通道的Bayer 采樣位置像素替換為真實采樣值。ICEID 網(wǎng)絡(luò)內(nèi)主要包含IIRM 與EIDM 兩個子模塊,采用端到端的訓(xùn)練方式以解決CDM 問題,各個子網(wǎng)絡(luò)不進(jìn)行獨立訓(xùn)練。
圖3 應(yīng)用ICEID的CDM網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Structure of CDM network based on ICEID
如前文所述,從Bilinear 插值結(jié)果中提取特征,會一定程度上限制網(wǎng)絡(luò)的性能。為了高效、準(zhǔn)確地從Bayer 圖像中提取特征,參照Gharbi 等[11]的算法,將H×W的Bayer 圖像重排列為4 個的子色彩通道“R”“G1”“G2”和“B”,并在這4個子色彩通道上進(jìn)行特征提取。重排列的4 個子色彩通道可由式(1)得到:
其中:X表示輸入的Bayer 圖像,表示重排列特征圖像;(i,j)表示馬賽克圖像中像素的坐標(biāo)位置,其中i∈[0,H/2-1],j∈[0,W/2-1];p=0,1,2,3 分別對應(yīng)子色彩通道“R”“G1”“G2”和“B”。
圖4 為IIRM 的結(jié)構(gòu),該結(jié)構(gòu)用于初步重建出3 個色彩通道的丟失信息。
圖4 IIRM的結(jié)構(gòu)Fig.4 Structure of IIRM
具體地,對于R 和B 通道,IIRM 分別需要重建出3 個尺寸為的子通道;而對于G 通道,則僅需要重建出2 個的子通道。與文獻(xiàn)[14]不一樣,在本文提出的IIRM模塊中,在G 通道的重建過程中使用R、B 通道信息進(jìn)行輔助,從而提升G 通道的重建準(zhǔn)確性。由于G 通道具備更多的采樣信息,在G 通道重建后,再將其用于引導(dǎo)R、B 通道的重建。從上述結(jié)構(gòu)可知,G 通道的重建準(zhǔn)確度會影響R、B 通道的重建結(jié)果。因此在訓(xùn)練中,本文將G 通道的重建誤差引入損失函數(shù),以獲得高質(zhì)量的G 通道重建結(jié)果。為了更為有效地提取特征,本文采用了殘差通道關(guān)注塊(Residual Channel Attention Block,RCAB)[19],該模塊的結(jié)構(gòu)如圖5 所示,其中“?”表示特征通道的乘操作。通過引入通道注意力(Channel Attention,CA)機制,RCAB 可以獲得比傳統(tǒng)的殘差塊(Residual Block)更強的特征表達(dá)能力。但需要注意的是,因為IIRM 模塊僅負(fù)責(zé)對R、G、B 通道進(jìn)行初始重建,所以在R、G、B 三個支路上都只使用了單個RCAB 塊。
圖5 RCAB的結(jié)構(gòu)Fig.5 Structure of RCAB
在完成三個通道的丟失信息的初始重建后,將其分別與Bayer 采樣得到的3 個子色彩通道信息級聯(lián),并采用3×3 卷積重新提取特征圖,以便進(jìn)行下一階段的增強重建。
圖6 為EIDM 的結(jié)構(gòu)圖,其由3 個信息蒸餾增強塊(Enhanced Information Distillation Block,EIDB)堆疊而成。在EIDB 中,“RCAG”代表殘差通道關(guān)注組(Residual Channel Attention Group,RCAG)。則EIDM 的函數(shù)形式可由式(2)表示:
圖6 EIDM的結(jié)構(gòu)Fig.6 Structure of EIDM
其中:FEIDB-3(·)表示3 個EIDB 的級聯(lián);為EIDM 函數(shù)輸入特征,C1表示1×1 卷積。
在EIDB 中,首先將輸入特征通過1×1 卷積層,以便隱式地學(xué)習(xí)如何進(jìn)行特征的打包;接下來,通過Slice 操作,將前16 個特征通道劃分到上支路,剩余48 個特征通道劃分到下支路。針對上支路的16 個特征通道,采用了單個RCAB 塊進(jìn)行特征提煉,針對下支路的48 個特征通道,采用RCAG 模塊進(jìn)行特征提煉。RCAG 模塊的結(jié)構(gòu)如圖7 所示,其中包含了M個級聯(lián)的RCAB 塊,以便有效地提煉48 個特征通道的深度特征。最后,將上下兩個支路的特征通道進(jìn)行級聯(lián),傳遞給下一個EIDB。
圖7 RCAG的結(jié)構(gòu)Fig.7 Structure of RCAG
本文所提出的EIDB 的結(jié)構(gòu)與文獻(xiàn)[17]中的IDB 結(jié)構(gòu)的主要區(qū)別在于:一方面,在本文中,對蒸餾的信息,即上支路的16 個特征通道,也進(jìn)行特征提煉;另一方面,經(jīng)過蒸餾的信息與下支路精煉的信息是通過級聯(lián)操作進(jìn)行合并。這樣的設(shè)計不僅有效地解決了兩個支路特征信息的不適配的問題,也避免了文獻(xiàn)[17]中超參數(shù)過多的問題。從參數(shù)量上來看,因為上支路僅針對16 個特征通道設(shè)置了一個RCAB 塊,所耗費的參數(shù)量遠(yuǎn)低于下支路,所以仍然有利于將EIDB 的總參數(shù)量維持在相對較低的水平。而通過將多個EIDB 級聯(lián)構(gòu)成的CNN 網(wǎng)絡(luò),也能夠保持高效、輕量化的優(yōu)勢。
為了能更好地證明本文算法的性能,將本文算法與自適應(yīng)殘差插值(Adaptive Residual Interpolation for color image demosaicking,ARI)[7]、深度聯(lián)合去馬賽克與去噪(Deep Joint Demosaicking and Denoising,DJDD)[11]、基于深度殘差學(xué)習(xí)的彩色圖像去馬賽克(color image demosaicking via Deep Residual Learning,DRL)[12]、3-stage[14]這4 種主流的CDM 算法進(jìn)行比較。其中,ARI 是傳統(tǒng)的CDM 算法,DJDD、DRL、3-stage 算法是3 種基于CNN 的算法。為了保證實驗的公平性,在本實驗中,使用相同的學(xué)習(xí)策略重新訓(xùn)練DJDD、DRL與3-stage。具體地,使用自適應(yīng)動量(ADAptive Momentum,ADAM)估計作為優(yōu)化器,優(yōu)化器初始化參數(shù)設(shè)置β1=0.9、β2=0.999 以及ε=10-8;網(wǎng)絡(luò)初始學(xué)習(xí)速率為2× 10-4,總訓(xùn)練輪次(epoch)設(shè)置為200,其中學(xué)習(xí)率在epoch 為[100,140,180]時降低為之前的一半;使用Agustsson 等[20]提出的DIV2K 圖像庫作為訓(xùn)練集,其輸入塊(patch)大小為96× 96,每個批次(batch)包含了64 對輸入塊及目標(biāo)塊。
在本文網(wǎng)絡(luò)中,EIDM 是重要的基礎(chǔ)構(gòu)建模塊。參照IDN 中相關(guān)參數(shù)設(shè)置,EIDM 中增強蒸餾支路特征通道維度為16,提煉支路特征維度設(shè)置為48;為了控制網(wǎng)絡(luò)參數(shù)量,EIDM 中M設(shè)置為3。本文算法采用L2 損失函數(shù)(loss function),如式(3)所示,其最終損失函數(shù)Loss由圖3 中的LossRGB與圖4 中的LossG組成:
其中:FICEID(·)表示ICEID 的函數(shù)形式,Θ1與Θ2分別表示初始G 通道重建階段與整體網(wǎng)絡(luò)重建階段的參數(shù),Xk與Yk分別表示輸入Bayer 圖像與全彩目標(biāo)參照圖像的第k個圖像塊表示全彩圖像塊Yk中的G 通道信號。
在測試階段中,使用廣泛應(yīng)用的IMAX 與Kodak 數(shù)據(jù)集來測試網(wǎng)絡(luò)實際性能。本文采用彩色峰值信噪比(Color Peak Signal-to-Noise Ratio,CPSNR)及結(jié)構(gòu) 相似指 數(shù)(Structural SIMilarity index,SSIM)作為客觀評價指標(biāo)。以上所有實驗在一塊Nvidia GeForce RTX 2080Ti GPU 上進(jìn)行。除ARI 外,所有算法在Pytorch 框架進(jìn)行實驗。
表1 展示了本文所提網(wǎng)絡(luò)的不同變種模型的性能比較。其中,“Base”表示基礎(chǔ)網(wǎng)絡(luò),其主體結(jié)構(gòu)與ICEID 一致,但在EIDM 中僅使用特征通道數(shù)為48 的RCAG 替代EIDB;網(wǎng)絡(luò)“w/Bayer”表示在ICEID 網(wǎng)絡(luò)的基礎(chǔ)上,取消像素重排列,直接將Bayer 圖像輸入網(wǎng)絡(luò);網(wǎng)絡(luò)“w/ID”表示在ICEID 網(wǎng)絡(luò)的基礎(chǔ)上,去除每個EIDB 上支路的RCAB,而直接將16 個特征通道與精煉后的48 個特征通道級聯(lián);網(wǎng)絡(luò)“w/EID”表示在“Base”網(wǎng)絡(luò)中引入增強蒸餾機制,即完整的ICEID 網(wǎng)絡(luò)。
表1 在IMAX數(shù)據(jù)集上的消融實驗Tab.1 Ablation study on IMAX dataset
由表1 可知,在ICEID 網(wǎng)絡(luò)中取消像素重排列后,其CPSNR 下降了0.01 dB,SSIM 下降了0.000 3,說明了像素重排列能有效保留圖像結(jié)構(gòu)特征信息,除此之外,像素重排列使色彩通道的分辨率降低為原來的1/4,能有效降低網(wǎng)絡(luò)的計算復(fù)雜度;在“Base”網(wǎng)絡(luò)中應(yīng)用跨層傳輸結(jié)構(gòu)后,其CPSNR 值提升了0.06 dB,說明了信息蒸餾結(jié)構(gòu)能夠有效地提煉重要特征;在“Base”網(wǎng)絡(luò)中使用增強的信息蒸餾結(jié)構(gòu)替代普通卷積后,其CPSNR 提升了0.09 dB,SSIM 提升了0.000 3,說明了增強的信息蒸餾策略能夠有效提升網(wǎng)絡(luò)的表達(dá)能力。從表1 可知,“w/EID”網(wǎng)絡(luò)相較“w/ID”網(wǎng)絡(luò)的參數(shù)量有少量的增加,原因在于“w/EID”在蒸餾信息支路增加了一個寬度為16 的RCAB。
將本文算法與4 種主流CDM 算法進(jìn)行比較,其主觀結(jié)果見圖8、9,客觀結(jié)果見表2、3。
圖8、9 展示了本文算法與對比算法主觀質(zhì)量上的差別。從圖8、9 中可以發(fā)現(xiàn):傳統(tǒng)算法ARI 的主觀效果質(zhì)量最差,其色彩偽影明顯,圖像邊緣鋸齒效應(yīng)嚴(yán)重;DJDD、DRL、3-stage主觀效果有一定的提升,但在細(xì)節(jié)豐富的區(qū)域存在偽影現(xiàn)象。本文算法能夠獲得最優(yōu)主觀質(zhì)量:一方面,ICEID 能夠更準(zhǔn)確地恢復(fù)圖像中的高頻特征;另一方面,ICEID 能較好的抑制色彩偽影、拉鏈效應(yīng)等各類失真的產(chǎn)生。
圖8 對IMAX數(shù)據(jù)集中1號圖的各個CDM算法的主觀質(zhì)量比較Fig.8 Subjective quality comparison of different CDM algorithms on Figure1 from IMAX dataset
由表2、3 可以看出,本文算法ICEID 在所有數(shù)據(jù)集中都獲得了最好的客觀結(jié)果。例如在Kodak 數(shù)據(jù)集中,相較于ARI[7]、DJDD[11]、DRL[12]、3-stage[14],本文算法在平均CPSNR上分別提升了3.37 dB、1.36 dB、0.72 dB、0.50 dB;在平均SSIM上分別提升了0.014 6、0.001 3、0.000 6、0.000 7。
表2 IMAX數(shù)據(jù)集上不同算法的定量比較Tab.2 Quantitative comparison of different algorithms on IMAX dataset
表3 Kodak數(shù)據(jù)集上不同算法的定量比較Tab.3 Quantitative comparison of different algorithms on Kodak dataset
圖9 對Kodak數(shù)據(jù)集中24號圖的各個CDM算法的主觀質(zhì)量比較Fig.9 Subjective quality comparison of different CDM algorithms on Figure24 from Kodak dataset
如表4 所示,本文通過網(wǎng)絡(luò)參數(shù)量及浮點運算次數(shù)(FLOating Point of operations,F(xiàn)LOPs)衡量算法的復(fù)雜度,其中FLOPs 以目標(biāo)參照圖分辨率為1 280×720 進(jìn)行計算。由表4 可知,3-stage 網(wǎng)絡(luò)參數(shù)量遠(yuǎn)大于其他對比算法,但其性能卻顯著低于本文算法;DJDD 網(wǎng)絡(luò)參數(shù)量雖然較小,但其重建性能較差。另外,DRL、3-stage 網(wǎng)絡(luò)采用馬賽克圖像的Bilinear插值結(jié)果作為網(wǎng)絡(luò)輸入,其特征運算尺寸為H×W;而DJDD與本文算法將馬賽克圖像重排列后作為網(wǎng)絡(luò)輸入,其特征運算尺寸為。所以,若在相同參數(shù)量下,DRL 與3-stage的FLOPs 約為本文算法的4 倍。
表4 不同算法的參數(shù)量和FLOPsTab.4 Parameter number and FLOPs of different algorithms
本文提出了一種被稱為ICEID 的彩色圖像去馬賽克網(wǎng)絡(luò)。首先,針對Bayer 模式設(shè)計特征提取網(wǎng)絡(luò),能更充分、高效地利用彩色圖像通道間相關(guān)性進(jìn)行初始重建;其次,作為基礎(chǔ)構(gòu)建模塊,EIDM 能夠有效地對特征進(jìn)行提煉,并保持相對較低的參數(shù)量。實驗結(jié)果表明,在相同的實驗環(huán)境下,與其他對比算法相比,ICEID 能夠達(dá)到最高的CPSNR 與SSIM,并且獲得最佳的主觀質(zhì)量;其次,本文算法網(wǎng)絡(luò)參數(shù)量、復(fù)雜度都相對較低,更易于在實際應(yīng)用場合中部署。下一步的工作重心是考慮在含有未知噪聲的應(yīng)用場景中,提升網(wǎng)絡(luò)模型的性能與魯棒性。
致謝 此次論文數(shù)據(jù)獲得了廣西多媒體通信和網(wǎng)絡(luò)技術(shù)重點實驗室和廣西高性能計算平臺的支持,在此表示衷心的感謝!