楊慶圓,王川龍
(太原師范學(xué)院 工程科學(xué)計算實驗室/數(shù)學(xué)與統(tǒng)計學(xué)院,山西 晉中 030619)
隨著信息技術(shù)的迅猛發(fā)展,存儲和處理數(shù)據(jù)已經(jīng)成為至關(guān)重要的問題,且真實數(shù)據(jù)都具有結(jié)構(gòu)復(fù)雜和大規(guī)模的特點,如彩色圖像、視頻序列等,通常用張量來表示.張量填充是張量分析和處理中的一個重要問題,深受專家和學(xué)者的關(guān)注.它主要應(yīng)用于如數(shù)據(jù)挖掘[1]、機器學(xué)習(xí)[2]、圖像處理[3]、醫(yī)學(xué)影像[4]等領(lǐng)域.張量填充問題的優(yōu)化模型如下:
s.t.PΩ(X)=PΩ(T)
(1)
其中X∈I1×I2×…×IN是N階填充張量,T∈I1×I2×…×IN是N階觀測張量,rank(X)代表張量的秩,且有多種定義,如CP秩,Tucker秩,Tubal秩,TT秩,TR秩等.PΩ是集合Ω上的正交投影算子,即:
與矩陣類似,張量秩函數(shù)的計算同樣是NP-hard的.張量核范數(shù)首先由Liu等人[5,6]于2009年提出,基于最小化Tucker秩將模型(1)凸松弛為:
s.t.PΩ(X)=PΩ(T),i=1,2,…,N
(2)
針對張量正向切片中行和列的缺失,研究此類結(jié)構(gòu)缺失的低秩張量填充問題,基于高精度低秩張量填充算法的模型,引入延遲嵌入的思想,提出相應(yīng)算法,對彩色圖像進行填充實驗,驗證了所提出算法的有效性.
文章結(jié)構(gòu)如下:第1節(jié)介紹張量、矩陣的基礎(chǔ)知識;第2節(jié)介紹高精度低秩張量填充算法(HaLRTC)和多向延遲嵌入變換(MDT)[14,15];第3節(jié)提出了嵌入空間中的低秩張量填充算法(MDT-LRTC);第4節(jié)利用Matlab進行數(shù)值和彩色圖像實驗,并與HaLRTC、DR-TR這兩種算法進行了比較,驗證了所提算法的有效性;第5節(jié)是總結(jié)部分.
定義1(奇異值分解[16]) 設(shè)X∈I1×I2是一個秩為r的矩陣,則必存在正交矩陣U∈n1×r和V∈n2×r,滿足:
X=UΣrVT,∑r=diag(σ1,…,σr),
其中σ1≥σ2≥…≥σr≥0.
定義2(奇異值閾值算子[17]) 對于任意參數(shù)τ≥0,矩陣X∈I1×I2的秩為r,則存在X=UΣrVT,奇異值閾值算子Dτ定義為:
Dτ(X)=UDτ(Σ)VT,Dτ(Σ)=diag({σk-τ}+),
定義3(廣義逆[18]) 對于任意的矩陣X∈I1×I2,若存在某個矩陣G∈I2×I1,滿足以下四個方程,則稱G為X的廣義逆矩陣,X+=(XTX)-1XT為廣義逆(本文將廣義逆稱之為偽逆).
XGX=X;GXG=G;(XG)T=XG;(GX)T=GX.
定義4(張量的n模態(tài)矩陣積[19])N階張量X∈I1×I2×…×IN與矩陣U∈J×In的n模態(tài)矩陣積是一個維度為I1×…×In-1×J×In+1×…×IN的張量,表示為X×nU,且有如下元素對應(yīng)關(guān)系:
2013年Liu等人[6]結(jié)合交替方向乘子法,引入中間變量Mi,將模型(2)轉(zhuǎn)化為如下問題:
s.t.PΩ(X)=PΩ(T)
X=Mi,i=1,…,N
(3)
算法1高精度低秩張量填充算法(HaLRTC)
輸出:填充張量X.
第1步:fori=1:N
end
第3步:若‖Xk+1-Xk‖F(xiàn)/‖Xk‖F(xiàn)<ε,停止迭代,否則轉(zhuǎn)第4步;
為簡單起見,先定義向量的標(biāo)準(zhǔn)延遲嵌入變換.假設(shè)向量v=(v1,v2,…,vL)T∈L,延遲嵌入變換的參數(shù)為τ,則v對應(yīng)的標(biāo)準(zhǔn)延遲嵌入變換Hτ(v)為:
(a)標(biāo)準(zhǔn)延遲嵌入的正向變換
(b)復(fù)制矩陣
(c)逆變換
實際生活中收集到的數(shù)據(jù)往往由于設(shè)備或傳輸?shù)葐栴}導(dǎo)致數(shù)據(jù)缺失,如圖片和視頻數(shù)據(jù)在傳輸過程中可能會出現(xiàn)整行整列缺失的情況;醫(yī)學(xué)圖像如核磁共振影像可能會由于病人的身體晃動或漏做某項檢查出現(xiàn)條狀或塊狀缺失的情況等.針對這個問題,提出了如下算法,可以有效的填充這種結(jié)構(gòu)缺失的數(shù)據(jù).
算法2嵌入空間中的低秩張量填充算法(MDT-LRTC)
輸入:原始張量T,采樣集合Ω,采樣張量PΩ(T),向量τ,參數(shù)αi,ρ0,e,ε.
輸出:最終的填充張量X.
第1步:構(gòu)造復(fù)制矩陣S,利用多向延遲嵌入變換(MDT)將N階張量T和X以及采樣算子PΩ變?yōu)?N階Hankel張量H(T)、H(X)和PΩ;
第3步:fori=1:2N
end
第5步:若‖(H(X))k+1-(H(X))k‖F(xiàn)/‖(H(X))k‖F(xiàn)<ε,停止迭代,否則轉(zhuǎn)第6步;
第7步:利用逆多向延遲嵌入變換(逆MDT)將得到的2N階張量H(X)變?yōu)樽罱K的N階填充張量X.
采用大小為256×256×3的peppers(1)https:∥ccia.ugr.es/cvg/dbimagenes/彩色圖像,分別用MDT-LRTC算法與HaLRTC、DR-TR算法進行采樣填充,從相對誤差(RSE)、峰值信噪比(PSNR)、結(jié)構(gòu)相似度(SSIM)三個方面驗證新算法的性能.所有的數(shù)值代碼都是用Matlab(R2019b)編寫,數(shù)值實驗都是在戴爾(DELL) PowerEdge R740xd高性能2U機架式并行運算服務(wù)器上實現(xiàn)的.
SSIM(Xhat,T)=[l(Xhat,T)αc(Xhat,T)βs(Xhat,T)γ],
其中l(wèi)(Xhat,T)、c(Xhat,T)、s(Xhat,T)分別表示亮度比較函數(shù)、對比度比較函數(shù)和結(jié)構(gòu)相似度比較函數(shù),α,β,γ分別為上述三個函數(shù)這三個分量的相對重要性.
圖1 只對張量的每個正向切片的行和列采樣的填充效果
表1 只對張量的每個正向切片的行和列采樣的數(shù)值結(jié)果
由圖2可知,新算法MDT-LRTC相較于HaLRTC、DR-TR算法來說,不僅可以恢復(fù)隨機缺失的圖像,而且對于有結(jié)構(gòu)缺失的圖像恢復(fù)效果也很不錯.
由表2可知,新算法MDT-LRTC的相對誤差更小,峰值信噪比和結(jié)構(gòu)相似度更高,有力說明新算法的高效性能.
圖2 隨機采樣并對張量正向切片的行和列采樣的填充效果
表2 隨機采樣并對張量正向切片的行和列采樣的數(shù)值結(jié)果
提出了基于多向延遲嵌入低秩張量填充算法,在原有的高精度低秩張量填充算法的基礎(chǔ)上,結(jié)合數(shù)據(jù)的條狀或塊狀這種結(jié)構(gòu)缺失,引入了嵌入空間的思想,對多向延遲嵌入變換得到的高階Hankel張量進行填充.由圖和表均可以看出,針對彩色圖像填充,新算法占有很大優(yōu)勢.