国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多媒體隱寫研究進(jìn)展

2022-07-02 12:06張衛(wèi)明王宏霞李斌任延珍楊忠良陳可江李偉祥張新鵬俞能海
中國圖象圖形學(xué)報 2022年6期
關(guān)鍵詞:代價編碼載體

張衛(wèi)明,王宏霞,李斌,任延珍,楊忠良,陳可江,李偉祥,張新鵬,俞能海

1. 中國科學(xué)技術(shù)大學(xué)網(wǎng)絡(luò)空間安全學(xué)院,合肥 230027; 2. 四川大學(xué)網(wǎng)絡(luò)空間安全學(xué)院,成都 610207;3. 深圳大學(xué)廣東省智能信息處理重點實驗室及深圳市媒體信息內(nèi)容安全重點實驗室,深圳 518060;4. 武漢大學(xué)國家網(wǎng)絡(luò)安全學(xué)院,武漢 430072; 5. 清華大學(xué)電子工程系,北京 100084;6. 復(fù)旦大學(xué)計算機(jī)科學(xué)技術(shù)學(xué)院,上海 200438

0 引 言

大數(shù)據(jù)分析可以跳過數(shù)據(jù)內(nèi)容而僅從數(shù)據(jù)背景挖掘情報。當(dāng)通信行為被發(fā)現(xiàn)時,使用密文通信的人就顯得很突出,從而成為被監(jiān)控和分析的重點對象。因此現(xiàn)代通信安全不僅要求內(nèi)容保密,而且希望過程隱蔽。因此只加密數(shù)據(jù)內(nèi)容難以保障通信安全。

隱寫技術(shù)是將秘密消息嵌入各種載體(如數(shù)字圖像、音頻、視頻或文本)中實現(xiàn)隱蔽通信的技術(shù)(王朔中 等,2005),是應(yīng)對大數(shù)據(jù)情報獲取的有效手段,是加密技術(shù)的必要補(bǔ)充。隨著一帶一路的推動和經(jīng)貿(mào)全球化的發(fā)展,保障我國企業(yè)、機(jī)構(gòu)海外權(quán)益的需求迅速增加,對非受控環(huán)境下的安全通信提出了更高的要求,通信不僅要保密而且要隱蔽。所以,隱寫術(shù)對于保障國家特殊部門和關(guān)鍵人群的通信安全具有不可或缺的作用。另一方面,在APT(advanced persistent threat)攻擊中,基于隱寫術(shù)構(gòu)建的隱信道成為重要一環(huán);通過與惡意代碼結(jié)合,隱寫術(shù)也成為網(wǎng)絡(luò)攻擊的典型非對稱技術(shù)。從攻防兩方面看,網(wǎng)絡(luò)空間的隱蔽通道都是各國爭奪的戰(zhàn)略資源。

隱寫技術(shù)及其應(yīng)用曾出現(xiàn)在許多古代東西方的文字記載中,最早可以追溯到Herodotus(公元前486年—公元前425年)所著的Histories,其中記載了Histiaeus將消息刺在奴隸的頭皮上,待其頭發(fā)長出后再送出去進(jìn)行秘密通信(Jamil,1999)。近代也出現(xiàn)了很多隱寫應(yīng)用,比如隱形墨水和偽裝物品等廣泛應(yīng)用于兩次世界戰(zhàn)爭中的隱蔽通信。20世紀(jì)90年代以來,隨著互聯(lián)網(wǎng)和多媒體數(shù)據(jù)的逐漸普及,古老的隱寫技術(shù)獲得了新的發(fā)展。近年來,基于數(shù)字多媒體數(shù)據(jù)的隱寫技術(shù)因其在個人隱私保護(hù)、情報與軍事等安全領(lǐng)域不可替代的作用,正日益引起國內(nèi)外學(xué)術(shù)界和相關(guān)部門的高度重視,并成為當(dāng)前多媒體內(nèi)容安全研究領(lǐng)域的熱點之一。隱寫技術(shù)的相關(guān)研究也受到政府和國際組織的資助,單項資助金額高達(dá)850萬美元(https://cordis.europa.eu/project/id/101021687/fr)。

隨著人工智能,尤其是深度學(xué)習(xí)在計算機(jī)視覺、語音和自然語言處理等領(lǐng)域的巨大成功,給隱寫術(shù)帶來了新機(jī)遇也提出了新挑戰(zhàn),促使圖像、音/視頻和文本隱寫出現(xiàn)了一系列新思想、新方法。在此背景下,梳理國內(nèi)外多媒體隱寫的發(fā)展現(xiàn)狀、前沿動態(tài)、熱點問題和發(fā)展趨勢,對于政府決策與立項、相關(guān)領(lǐng)域科技工作者了解研究進(jìn)展都有重要意義。

本文主體部分按載體對隱寫術(shù)分類介紹。注意到雖然各類載體上的隱寫術(shù)有差別,但是其核心追求有共通之處,可以提煉成通用的隱寫編碼問題。所以本文首先介紹隱寫編碼,然后針對最重要和流行的載體重點介紹圖像隱寫、視頻隱寫、音頻隱寫和文本隱寫的進(jìn)展。

1 國際研究現(xiàn)狀

1.1 隱寫編碼

為了對抗隱寫分析的檢測,隱寫術(shù)需要在給定的載荷率下最小化因嵌入消息引入的載體失真。這是隱寫術(shù)設(shè)計理論中的核心問題,此問題可以抽象成一個特殊的率失真編碼問題來解決,即隱寫編碼(steganographic codes)(Zhang和Li,2008)。根據(jù)隱寫編碼的發(fā)展歷程,可將其分為5種代價模型下的編碼問題:

1)常數(shù)代價編碼模型。假設(shè)在不同元素上修改造成的影響都是相同的,最小化修改代價等同于最小化修改點數(shù)量。

2)兩級代價編碼模型。即將載體元素分為干、濕兩類,“濕點”的位置禁止修改,“干點”的修改代價一致,接收方無需知道濕點位置就可以提取消息。

3)多級代價編碼模型。兩級代價模型對載體的刻畫不夠精細(xì),更高級的模型是“多級代價模型”,即對不同的元素定義不同的修改代價。

4)非二元代價編碼模型?;镜木幋a通常是針對二元修改設(shè)計的。±1修改相較于二元修改安全性更強(qiáng),但±1修改本質(zhì)上對應(yīng)三元嵌入,而三元編碼的計算復(fù)雜度很高。非二元代價編碼模型研究如何通過二元隱寫碼實現(xiàn)高效的非二元嵌入。

5)非加性編碼模型。加性代價模型假設(shè)修改載體各元素引入的代價是獨(dú)立的,這是對真實情況的一種簡化??紤]隱寫修改之間的相互影響,最小化“非加性代價”是隱寫術(shù)發(fā)展的更高級追求。

隱寫編碼的性能可由嵌入效率(embedding efficiency)來衡量,嵌入效率定義為信息長度與修改總代價之比,即引入單位代價可嵌入的信息量。嵌入效率越高,則編碼性能越好。

1.1.1 常數(shù)代價隱寫編碼

常數(shù)代價模型認(rèn)為所有元素具有相同的修改代價,故最小化修改代價等價于最小化元素修改數(shù)量。矩陣編碼是該模型下隱寫編碼的設(shè)計范式(Crandall,1998),利用分組糾錯編碼的奇偶校驗矩陣完成消息的嵌入和提取。最早的矩陣編碼方案是根據(jù)Hamming碼設(shè)計的,并形成了經(jīng)典的BZ隱寫算法(Westfeld,2001)。在分析線性/非線性覆蓋碼與隱寫編碼之間的關(guān)系并推導(dǎo)矩陣編碼的率失真界后,Galand和Kabatiansky(2003)、Bierbrauer和Fridrich(2008)分別提出了多個性能優(yōu)異的矩陣編碼方案。Munuera(2007)也討論了隱寫編碼與糾錯編碼之間的關(guān)系,并基于BCH(Bose-Chaudhuri-Hocquenghe)碼設(shè)計了性能更優(yōu)的矩陣編碼方案。進(jìn)一步地,基于BCH碼的方案可以從嵌入效率和計算復(fù)雜度兩個方面得到改善(Sch?nfeld和Winkler,2006)。Fridrich和Soukal(2006)則考慮到隨機(jī)線性碼的價值,并基于低密度生成矩陣(Low-density generator matrix,LDGM)碼構(gòu)造具有大嵌入容量和高嵌入效率的隱寫編碼(Fridrich和Filler,2007)。

1.1.2 兩級代價隱寫編碼

兩級代價模型也稱為濕紙模型(wet paper code),即將載體元素分為干、濕兩類,“濕點”的位置禁止修改,而接收方無需知道濕點位置就可以提取消息。Fridrich等人(2005b)首先給出了濕紙編碼的高斯消元求解方法。為了降低該求解方法的計算復(fù)雜度,他們進(jìn)一步借助用于擦除信道的稀疏線性碼加快了求解速度(Fridrich等,2005a)。為了提高濕紙碼的嵌入效率,F(xiàn)ridrich等人(2006)提出了Meet-in-the-Middle方法。在真實場景中,濕點個數(shù)不是一定的,因此,這些基于結(jié)構(gòu)碼的設(shè)計一般難以滿足現(xiàn)實需求。Filler和Fridrich(2009)提出了“Wet ZZW(Zhang Zhang Wang)”編碼方案,可以由大嵌入率濕紙碼生成一族小嵌入率濕紙碼。

1.1.3 多級代價隱寫編碼

濕紙代價對載體的刻畫不夠精細(xì),更高級的模型是“多級代價模型”。每個載體元素可以定義任意的修改代價。Kim等人(2007)將Hamming矩陣編碼改為每個分組允許多個修改來適應(yīng)多級代價模型。Sachnev等人(2009)將允許多個修改的思想擴(kuò)展到基于BCH碼的矩陣編碼中。Filler等人(2011)提出了基于卷積碼的校驗網(wǎng)格編碼(syndrome trellis codes,STC)方法,可以在多級代價模型下逼近嵌入效率上界。Diouf等人(2018)提出了一種基于極化碼(polar codes)設(shè)計的隱寫碼方案,但在多級代價模型仍存在一定局限。為了增加隱寫算法面對有損處理的魯棒性,Kin-Cleaves和Ker(2018)提出了DualSTC方法,相比于原始STC編碼僅用于消息嵌入,DualSTC再嵌套了一層STC編碼用于載密恢復(fù)。Nakajima和Ker(2020)將網(wǎng)格碼算法應(yīng)用于生成式隱寫,給出了一種在線性約束下從指定分布中采樣的方法。

1.1.4 非二元隱寫編碼

使用二元碼每個載體元素的最大載荷量是1 bit。而在最大允許修改幅度為1時,可以對元素進(jìn)行±1修改,此時每元素最多承載log23 bit信息,這表明三元編碼具有更高的嵌入效率。Fridrich 和 Lisonek(2007)基于圖著色理論設(shè)計了基于±1修改的編碼方法。Mielikainen(2006)首先將載體的所有像素值兩兩成對,之后以像素值對為單位嵌入消息。Filler等人(2011)提出了多層隱寫構(gòu)造(multi-layered construction)方法,進(jìn)一步將雙層構(gòu)造與STC結(jié)合提出了“雙層STC”,從而STC可以用于±1嵌入,成為使用最普遍的隱寫編碼工具,并且“雙層STC”可以擴(kuò)展到“多層STC”用于±2嵌入。

1.1.5 非加性隱寫編碼

2013年國際信息隱藏領(lǐng)域8位著名學(xué)者聯(lián)合提出了關(guān)于隱寫的23個公開問題,其中“如何設(shè)計非加性隱寫編碼”排在首位。Kin-Cleaves和Ker(2018)提出了動態(tài)STC編碼方法,在執(zhí)行維特比譯碼進(jìn)行信息嵌入的過程中,未譯碼序列的修改代價會根據(jù)之前發(fā)生的修改進(jìn)行動態(tài)調(diào)整,實現(xiàn)了非加性隱寫嵌入。

1.2 圖像隱寫

隱寫研究有兩個主要思路。一個思路是如何減小因隱寫所產(chǎn)生的代價,該思路引導(dǎo)了眾多基于最小代價框架隱寫方法的蓬勃發(fā)展;另一思路是如何降低被隱寫分析檢測的概率,這引發(fā)了對抗式隱寫方法的興起?;谧钚〈鷥r框架的隱寫方法是主要的研究熱點,在該方向上,主要可以分為:基于統(tǒng)計模型的代價函數(shù)設(shè)計、基于載體源轉(zhuǎn)換的自然隱寫、基于邊信息的代價函數(shù)設(shè)計和基于對抗博弈的代價調(diào)整等主要技術(shù)思路。

1.2.1 基于模型的代價函數(shù)設(shè)計

基于統(tǒng)計模型的隱寫方法對圖像元素進(jìn)行建模,通過最小化載體圖像和載密圖像分布之間的KL散度(Kullback-Leibler divergence)或最優(yōu)檢測器的能力來設(shè)計嵌入代價,與啟發(fā)式設(shè)計的代價函數(shù)不同,該類方法在統(tǒng)計模型的意義上保證了隱寫性能。Butora等人(2020)通過啟發(fā)式設(shè)計的隱寫代價搜索一個最優(yōu)的嵌入修改率,并由此轉(zhuǎn)換成每個像素或DCT(discrete cosine transform)系數(shù)的隱寫Fisher information,提出了從基于代價到基于模型的隱寫方法MiPOD(minimizing the power of optimal detector),在部分情況下提升了啟發(fā)式代價函數(shù)的性能。在MiPOD的基礎(chǔ)上,Denemark和Fridrich(2017a)提出了使用邊信息的SI-MiPOD,先使用多元高斯模型對圖像獲取噪聲進(jìn)行建模并基于預(yù)載體(precover)對模型參數(shù)進(jìn)行估計,然后通過最小化載體圖像分布和載密圖像分布之間的KL散度求得載體元素的修改概率并轉(zhuǎn)化為嵌入代價。Sharifzadeh等人(2019)使用與MiPOD相同的載體噪聲模型,同時將秘密信號建模為一個加性高斯噪聲,提出了高斯嵌入方案,可實現(xiàn)多元嵌入。Cogranne等人(2020)利用DCT變換的線性屬性和多元高斯隨機(jī)變量的線性變換規(guī)律,將MiPOD擴(kuò)展至JPEG域(J-MiPOD),同時設(shè)計了4種使用不同色彩通道嵌入代價的消息分配策略。在相機(jī)RAW圖像可被獲取且載體圖像生成流程給定(邊信息)的情況下,Giboulot等人(2020b)通過挖掘JPEG圖像生成流程中像素之間的相關(guān)性,優(yōu)化了DCT系數(shù)的方差估計;同時使用量化誤差的邊信息對高斯嵌入方法進(jìn)行了擴(kuò)展。Giboulot等人(2020a)提出了基于同步嵌入的多元高斯嵌入方法(multivariate Gaussian embedding, MGE),對預(yù)載體圖像和預(yù)載密圖像進(jìn)行建模,考慮了塊內(nèi)和塊間DCT系數(shù)的相關(guān)性并添加具有特定協(xié)方差形式的最優(yōu)隱寫信號,該特定協(xié)方差是載體噪聲協(xié)方差的一個縮放。Giboulot等人(2021)在噪聲模型中進(jìn)一步考慮了gamma校正以適應(yīng)更為完整的圖像生成流程,同時探究了“噪聲方差”和“內(nèi)容方差”在應(yīng)對具有不同知識的隱寫分析者時的作用。Taburet等人(2020)提出了適應(yīng)于啟發(fā)式代價的JPEG圖像隱寫同步修改機(jī)制,利用圖像生成流程中相鄰塊間DCT系數(shù)的相關(guān)性,先將啟發(fā)式代價轉(zhuǎn)換為高斯分布,然后由已嵌系數(shù)導(dǎo)出條件高斯分布,綜合考慮了協(xié)方差矩陣的關(guān)聯(lián)性和隱寫代價的方差,可用于基于啟發(fā)式代價的嵌入方案。

1.2.2 自然隱寫

自然隱寫是一類相對特殊的基于統(tǒng)計模型設(shè)計代價的隱寫方法,其使用“載體源轉(zhuǎn)換”的思路,利用圖像本身的噪聲進(jìn)行建模,以某一種噪聲模式下的圖像作為載體,將隱寫嵌入模仿成另一種噪聲模式,這種模仿式的噪聲為自然隱寫帶來了顯著的安全性提升。Bas(2017)首先提出了基于“載體源轉(zhuǎn)換”的自然隱寫框架,對于一個給定的ISO(International Standards Organization)感光度ISO1,先將相機(jī)的傳感器噪聲建模為一個獨(dú)立高斯分布,然后將嵌入過程模仿成ISO1到另一個更高感光度ISO2的轉(zhuǎn)換過程,并針對gamma校正和下采樣操作設(shè)計了載密信號的生成方法(Denemark等,2018)。Denemark等人(2018)將自然隱寫擴(kuò)展至JPEG圖像,通過將傳感器噪聲添加至更為復(fù)雜的RAW圖像獲取、圖像生成和JPEG壓縮的全流程中,使用Monte-Carlo采樣估計載密DCT系數(shù)的分布。前述工作針對的是單色傳感器,Taburet等人(2019a,2021)將自然隱寫擴(kuò)展至彩色傳感器,由于彩色傳感器會導(dǎo)致DCT系數(shù)之間具有更強(qiáng)的塊內(nèi)和塊間相關(guān)性,首先對3×3個8×8塊的DCT系數(shù)相關(guān)性建模為多元高斯分布,然后以子格依次采樣的方式計算不同DCT塊的條件分布。Taburet等人(2019b)進(jìn)一步針對非線性的圖像生成流程推導(dǎo)了DCT系數(shù)載密信號的顯式協(xié)方差矩陣。

1.2.3 基于邊信息的代價函數(shù)啟發(fā)式設(shè)計

在圖像隱寫中,邊信息是隱寫方可獲得而隱寫分析方無法確知的信息,這種信息的不對稱可以提升隱寫方法的安全性。邊信息的種類是多種多樣的,除了前述的相機(jī)獲取的RAW圖像外,邊信息還可以是圖像降質(zhì)處理(如JPEG壓縮、下采樣)的量化取整誤差和同一場景拍攝的多幅圖像等。近期亦有針對這些邊信息的啟發(fā)式隱寫方法。Denemark和Fridrich(2017b)挖掘了同一場景拍攝的兩幅JPEG圖像攜帶的邊信息,利用兩幅JPEG圖像的相同位置DCT系數(shù)的差異性,設(shè)計了基于該邊信息的非對稱代價調(diào)制方法,顯著提升了只有單幅JPEG圖像的隱寫安全性。Denemark和Fridrich(2017c)進(jìn)一步探究了同一場景拍攝的多幅JPEG圖像的邊信息構(gòu)造方法,即選取其中兩幅最接近的JPEG圖像作為配對圖像來構(gòu)造邊信息,并分析了代價調(diào)制因子與質(zhì)量因子相關(guān)的原因。Butora和Fridrich(2020b)基于最小擾動的思想,改進(jìn)了邊信息已知的JPEG圖像代價調(diào)制方法,通過合理懲罰與量化取整誤差相反的修改方向的嵌入代價,提升了低質(zhì)量因子圖像的隱寫安全性。Butora和Fridrich(2020a)針對壓縮率更大的Trunc取整JPEG圖像,提出了抑制零DCT系數(shù)修改的代價函數(shù)和使用量化取整誤差的代價調(diào)制方法。使用量化取整誤差進(jìn)行代價調(diào)制和基于“鄰域修改方向一致”進(jìn)行代價調(diào)制是空域圖像隱寫中兩種不同的非對稱代價調(diào)制方法,Boroumand和Fridrich(2020)針對兩種方法各自鼓勵的修改方向存在相同或沖突的情況,優(yōu)化了兩種方法的組合策略,在量化取整誤差調(diào)制代價中引進(jìn)了基于修改方向一致的調(diào)制因子,提升了直接組合的性能。

1.2.4 基于對抗博弈的代價調(diào)整

對抗樣本是一種可以使得目標(biāo)隱寫分析檢測器檢測失效的方法,而將對抗樣本納入隱寫分析訓(xùn)練集則可以增強(qiáng)其檢測性能。在利用對抗樣本技術(shù)進(jìn)行隱寫和隱寫分析博弈方面,Bernard等人(2019,2021a)提出通過多輪迭代訓(xùn)練,并在每一輪迭代過程中選取讓隱寫分析檢測器集合最難以檢測的載密圖像組成訓(xùn)練集合,然后用該集合訓(xùn)練新的隱寫分析檢測器并加入至檢測器集合中。該方案顯式地構(gòu)造了一個最小—最大博弈方案,極大地提高了隱寫方法抵抗深度學(xué)習(xí)隱寫分析檢測的能力。此外,Bernard等人(2021b)提出將多個隱寫分析檢測器的檢測評估視為非加性代價度量,通過對Gumbel-Softmax分布采樣獲得期望梯度,再進(jìn)行對抗樣本修改調(diào)整代價值,從而提升隱寫抗檢測能力。

1.3 視頻隱寫

近年來,隨著網(wǎng)絡(luò)帶寬的增加以及各種高效視頻壓縮算法的提出,無論在PC互聯(lián)網(wǎng)還是移動互聯(lián)網(wǎng)上,數(shù)字視頻的網(wǎng)絡(luò)流量所占比重越來越多。據(jù)2021年8月中國互聯(lián)網(wǎng)絡(luò)信息中心(China Internet Network Information Center,CNNIC)發(fā)布的《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,截至2021年6月,中國網(wǎng)絡(luò)視頻(含短視頻)用戶規(guī)模達(dá)9.44億,占網(wǎng)民整體的93.4%。可見,數(shù)字視頻已成為網(wǎng)絡(luò)上廣為流行的主流媒體之一。視頻相對于圖像,在時間維度上做了擴(kuò)展,給隱寫帶來了更大的可用空間,即使較低的相對嵌入率,也能達(dá)到較高的絕對嵌入容量。因此,視頻隱寫技術(shù)引起國內(nèi)外學(xué)者及研究機(jī)構(gòu)的密切關(guān)注。

為便于儲存?zhèn)鬏?,原始視頻需要進(jìn)行編碼壓縮,以去除空間、時間維度上的冗余。目前,廣為使用的視頻壓縮國際標(biāo)準(zhǔn)主要有H.264/AVC(advanced video coding)、H.265/HEVC(high efficiency video coding)和MPEG-2/4(moving picture expert group)。此外,中國還制訂了新一代編碼標(biāo)準(zhǔn)AVS(audio video coding standard)和AVS2。視頻數(shù)據(jù)在壓縮編碼的過程中,衍生出了預(yù)測模式、運(yùn)動矢量和QDCT(quantized discrete cosine transform)系數(shù)等載體數(shù)據(jù),這些數(shù)據(jù)為視頻隱寫提供了更多的嵌入方式和嵌入空間的選擇。以H.264/AVC為例,結(jié)合編碼的不同階段,圖1給出了視頻隱寫的可嵌入數(shù)據(jù)域。與圖像隱寫相比,視頻隱寫不僅要考慮幀內(nèi)的空間特征,還要考慮時域上的幀間特征。根據(jù)秘密信息嵌入的數(shù)據(jù)域不同,現(xiàn)有的視頻隱寫方法主要分為空域和壓縮域隱寫。

圖1 H.264/AVC視頻隱寫的可嵌入數(shù)據(jù)域Fig.1 Embeddable data fields for H.264/AVC video steganography

1.3.1 空域視頻隱寫

空域視頻隱寫利用視頻每一幀圖像的空間冗余性,直接對視頻的色彩空間 RGB 或 YUV 進(jìn)行修改以嵌入秘密信息。這類方法類似于圖像隱寫,因此很多圖像隱寫方法可移植到視頻隱寫中。例如,Cetin和Ozcerit(2009)將視頻的每一幀作為一個嵌入單元,計算其直方圖特征并設(shè)置一個閾值進(jìn)行隱寫,秘密信息嵌入在視頻幀的RGB像素上??沼蛞曨l隱寫方法考慮了人類視覺系統(tǒng)的特性,具有較大的嵌入容量。然而,視頻在存儲與傳輸過程中通常需要進(jìn)行視頻壓縮編碼,而空域視頻隱寫需要完全解碼,因此嵌入的秘密信息容易在后續(xù)的壓縮編碼過程中損失。目前,一些學(xué)者嘗試采用糾錯碼和重復(fù)嵌入的方式去增強(qiáng)抗視頻壓縮編碼的魯棒性,降低提取信息的誤碼率。

1.3.2 壓縮域視頻隱寫

壓縮域視頻隱寫通過修改壓縮編碼過程中產(chǎn)生的編碼參數(shù)以嵌入秘密信息,已成為視頻隱寫領(lǐng)域的研究重點??捎糜谇度胄畔⒌妮d體數(shù)據(jù)通常包括幀內(nèi)/幀間預(yù)測模式、運(yùn)動矢量、QDCT系數(shù)以及熵編碼碼字等。目前國際上的研究進(jìn)展多集中在基于預(yù)測模式和運(yùn)動矢量的視頻隱寫技術(shù),此外,國外研究機(jī)構(gòu)還開發(fā)了少量的視頻隱寫工具,可在互聯(lián)網(wǎng)上免費(fèi)下載。

基于幀內(nèi)預(yù)測模式的視頻隱寫按照一定的映射規(guī)則,通過調(diào)制視頻編碼中宏塊的幀內(nèi)預(yù)測模式實現(xiàn)隱寫。由于該類方法只能在I幀中嵌入信息,而視頻序列中I幀的比例較低,因此隱藏容量受到限制。為了提高隱藏容量,一些算法結(jié)合矩陣編碼來減少對載體信息的修改量,從而提高嵌入效率。相對于幀內(nèi)預(yù)測隱藏方式,目前基于幀間預(yù)測的視頻隱寫研究相對較少。幀間預(yù)測技術(shù)旨在去除視頻的時域冗余,由于幀間預(yù)測過程主要是在P幀上進(jìn)行的,因此基于幀間預(yù)測的視頻隱寫算法一般將P幀作為主要的嵌入幀,且P幀數(shù)量較多,也能提供更多的可嵌入空間。在H.264/AVC的幀間預(yù)測中采用了可變尺寸塊分割和運(yùn)動估計算法,因此,早期的方法通過建立宏塊級幀間預(yù)測模式與秘密信息間的映射關(guān)系,根據(jù)秘密信息比特調(diào)制當(dāng)前幀間編碼單元的宏塊級幀間預(yù)測模式來嵌入信息(Kapotas和Skodras,2008)。此外,還可通過構(gòu)建編碼單元幀間劃分模式預(yù)測模型實現(xiàn)信息嵌入(Shanableh,2018)。

基于運(yùn)動矢量(motion vector, MV)的視頻隱寫是將視頻編碼過程中的運(yùn)動估計步驟獲取的運(yùn)動矢量作為載體,進(jìn)行隱寫修改,完成信息嵌入。一般視頻預(yù)測幀中的每個宏塊至少包含一個運(yùn)動矢量,由水平和垂直兩個分量組成。與其他多媒體載體類似,不是所有的MV都適合用于嵌入信息,這是因為對有的MV進(jìn)行輕微修改就會導(dǎo)致視頻畫面質(zhì)量和碼率的較大改變,而有的MV在進(jìn)行較大幅度修改后仍不會對視頻質(zhì)量有過大的影響。例如,Aly(2011)選擇預(yù)測誤差較大的宏塊對應(yīng)的運(yùn)動矢量進(jìn)行信息嵌入,并通過重構(gòu)P幀和B幀獲得最小的嵌入代價。

1.3.3 基于深度學(xué)習(xí)的視頻隱寫

在隱寫領(lǐng)域,已經(jīng)有基于生成對抗網(wǎng)絡(luò)(generative adversarial network, GAN)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)等深度神經(jīng)網(wǎng)絡(luò)的端到端隱寫架構(gòu),但限于視頻本身數(shù)據(jù)量大,以及復(fù)雜的視頻編解碼過程,目前用于視頻隱寫的端到端神經(jīng)網(wǎng)絡(luò)極少。最近,谷歌的Luo等人(2021)提出了一種稱為DVMark的端到端多尺度深度視頻水印架構(gòu),整個架構(gòu)包括編碼器、失真層、解碼器和視頻判別器4部分,水印信息嵌入在多個時空尺度上,并對H.264壓縮、裁剪、丟幀和高斯噪聲等具有較強(qiáng)的魯棒性。另外,麻省理工學(xué)院的Zhang等人(2019)提出了一種稱為RivaGAN的基于注意力機(jī)制的魯棒視頻水印架構(gòu)。這些水印框架為基于深度學(xué)習(xí)設(shè)計視頻隱寫也提供了思路。

1.3.4 視頻隱寫工具

OpenPuff(https://embeddedsw.net/OpenPuff_Steganography_Home.html)是一款基于文件格式的隱寫軟件,也是目前國外下載網(wǎng)站中免費(fèi)下載量較大的一款專業(yè)隱寫軟件,支持多種視頻、圖像與音頻格式。在視頻方面,OpenPuff支持的格式主要包括3GP、MP4、MPG、VOB、FLV、SWF等。此外,MSU StegoVideo(http://compression.ru/video/stego_video/index_en.html)是目前互聯(lián)網(wǎng)上可下載的一款典型的空域視頻隱寫軟件,2006年由莫斯科國立大學(xué)開發(fā)。該軟件能夠?qū)⑷我飧袷降奈募[藏至AVI格式的視頻中,并且支持任意壓縮編碼格式,還具有一定的抗壓縮轉(zhuǎn)碼能力。

1.4 音頻隱寫

數(shù)字音頻應(yīng)用的普及為信息隱藏提供了新的隱蔽載體空間和通信信道。目前,數(shù)字音頻隱寫的研究主要集中在兩個方面:基于音頻載體的隱寫算法和基于音頻流數(shù)據(jù)的隱蔽通信系統(tǒng)。

在基于音頻載體的隱寫算法研究方面,國外的研究成果在研究的深度和創(chuàng)新性方面相較于國內(nèi)滯后,主要是對傳統(tǒng)音頻隱寫算法的微量優(yōu)化和擴(kuò)展。隱寫手段包括基于人類聽覺感知冗余特性的隱寫;基于音頻時域信號的隱寫,如LSB(least-significant-bit)安全隱寫、QIM(quantization index modulation)語音隱寫和回聲語音隱寫方法等;基于音頻變換域信號的隱寫,如基于擴(kuò)展頻譜的語音隱寫、基于相位的語音隱寫以及基于小波變換的語音隱寫算法等。伊拉克高等教育和科學(xué)研究部AlSabhany等人(2020)對數(shù)字語音隱寫工作進(jìn)行了較為全面的綜述。印度理工學(xué)院(Indian Institute of Technology, IIT)電子和電氣工程系的Dutta等人(2020)對語音隱寫技術(shù)的發(fā)展進(jìn)行了綜述。傳統(tǒng)語音隱寫方法在面向?qū)嶋H的語音隱蔽通信環(huán)境時會面臨語音編碼壓縮,隱寫信息會被損壞,因此該類隱寫算法在實際隱蔽通信中使用較少。通過對各種語音編碼算法中的壓縮參數(shù)進(jìn)行調(diào)制是現(xiàn)有音頻隱寫算法的主要趨勢。Kheddar等人(2019)在MELP(mixed-excitation linear prediction)語音編碼bit流中基于基音和傅里葉幅度值調(diào)制實現(xiàn)2.4 kbps隱寫;Banjarnahor等人(2019)使用聲學(xué)特征實現(xiàn)了魯棒隱寫;Pal等人(2021)從多域嵌入的角度實現(xiàn)大容量的隱寫。

在基于音頻流數(shù)據(jù)的隱蔽通信技術(shù)研究方面,國外的研究成果較多集中在面向VoIP(voice over internet protocol)通信環(huán)境的語音隱寫技術(shù),這些技術(shù)不限于基于音頻數(shù)據(jù)本身為載體的隱寫,而是以基于語音通信信道為載體信道的隱蔽通信機(jī)制,利用語音的通信會話過程中的各個可能環(huán)節(jié)進(jìn)行秘密信息的傳輸。該方面的主要研究團(tuán)隊是波蘭華沙工業(yè)大學(xué)電子與信息技術(shù)學(xué)院Wojciech Mazurczyk教授。其所利用VoIP隱蔽通信的載體主要包括語音數(shù)據(jù)、VoIP協(xié)議數(shù)據(jù)和VoIP數(shù)據(jù)包間隔等,利用VoIP中語音數(shù)據(jù)流的統(tǒng)計分布特性進(jìn)行隱寫通信(Mazurczyk和Szczypiorski, 2008)。Saenger等人(2020)利用VoIP通信中的活動語音檢測和靜音編碼機(jī)制,在靜默數(shù)據(jù)包中隱藏秘密數(shù)據(jù)實現(xiàn)隱蔽通信。Mazurczyk等人(2016)利用Skype的視頻流作為信息隱藏的載體,實現(xiàn)秘密信息的傳輸。其他國家的學(xué)者在VoIP的隱蔽通信技術(shù)方面也有很多研究成果。伊拉克科爾巴拉大學(xué)電氣與電子工程系的Shahadi等人(2021)提出基于VoIP語音編碼器G.711的隱蔽通信機(jī)制。德國魯爾大學(xué)的Kohls等人(2016)提出基于Skype的魯棒語音隱寫算法,實現(xiàn)了基于Skype VoIP通信過程中的隱蔽通信。阿塞拜疆技術(shù)大學(xué)的Mustafayeva 等人(2019)提出基于手機(jī)移動終端中的WhatsApp的隱蔽通信;波蘭電子科技大學(xué)電子系的Wojtuń和Piotrowski等人(2021)針對VoIP通信中的語音信號隱寫的同步機(jī)制,所提方法在VHF(very high frequency)無線電鏈路和VoIP信道中傳輸隱寫數(shù)據(jù)具有有效性。

1.5 文本隱寫

在當(dāng)前的網(wǎng)絡(luò)環(huán)境下,文本相比于圖像、音頻等其他數(shù)字載體同時具有獨(dú)特的優(yōu)勢和挑戰(zhàn)。優(yōu)勢主要體現(xiàn)在兩方面:1)文本是人類語言的符號化編碼,是人們進(jìn)行信息交流的主要形式,其使用場景的廣泛性和普遍性給文本隱寫術(shù)帶來了廣闊的應(yīng)用場景;2)文本在網(wǎng)絡(luò)空間傳輸時具有較強(qiáng)的魯棒性,信道噪聲幾乎不會使其包含的隱蔽信息丟失。然而,利用文本進(jìn)行信息隱藏同樣面臨極大的挑戰(zhàn):語言的高度信息編碼和低信息冗余特性,使其很難嵌入額外信息。因此,如何實現(xiàn)在文本中安全且高效地嵌入額外信息是個極具挑戰(zhàn)的課題。

當(dāng)前主流的文本隱寫術(shù)根據(jù)秘密信息嵌入域的不同通??梢苑譃榛谖谋靖袷降碾[寫術(shù)和基于文本內(nèi)容的隱寫術(shù),如圖2所示。其中基于文本格式的隱寫術(shù)主要利用文本在特定文檔中的組織、排版和呈現(xiàn)時的特定規(guī)則實現(xiàn)信息嵌入,如編碼并修改PDF文檔中字符間的位置信息(劉友繼 等,2006)。這類方法通常具有較高的視覺隱蔽性,但它們的使用場景具有一定的局限性,并且文字的重新錄入、內(nèi)容轉(zhuǎn)移和格式變化都會造成隱蔽信息的破壞或丟失?;谖谋緝?nèi)容的隱寫術(shù),也稱為語言隱寫術(shù),主要采用自然語言分析和處理手段,利用文本中的語言特征實現(xiàn)隱蔽信息嵌入,是當(dāng)前文本隱寫研究的熱點和難點內(nèi)容。語言隱寫術(shù)通常可以歸納為修改式、檢索式和生成式3種隱寫策略。

圖2 文本隱寫術(shù)種類劃分Fig.2 Classification of text steganography

檢索式語言隱寫術(shù)通過對大規(guī)模文本庫中的樣本進(jìn)行特殊編碼,然后根據(jù)待嵌入的秘密信息選擇對應(yīng)語句進(jìn)行傳輸。這類方法的好處是不需要對原始文本進(jìn)行任何修改就可以代表特定的隱蔽信息,具有極高的隱蔽性。但是缺點在于需要事先共享一個非常大的語料庫,并且通常難以獲得較高隱藏容量。

修改式語言隱寫術(shù)主要是對文本中詞匯級或者句子級的語義單元進(jìn)行同義替換以嵌入隱蔽信息?;谕x變換的文本隱寫術(shù)曾引起大量研究人員關(guān)注,這類方法主要缺點在于嵌入率比較低,難以傳遞大量信息。但是最近隨著掩碼語言模型的提出和應(yīng)用以及掩碼語言模型的巨大潛力,基于修改策略的語言隱寫術(shù)又得到了國際上研究人員的關(guān)注,其中日本京都大學(xué)的Ueoka等人(2021)利用掩碼語言模型強(qiáng)大的填空能力,極大簡化了替換規(guī)則的構(gòu)建,同時有效提升了該類語言隱寫術(shù)的隱藏容量和抗自動檢測能力。盡管如此,這類方法的隱藏容量相比基于生成策略的語言隱寫術(shù)仍然較低。

生成式語言隱寫術(shù)成為近兩年的熱點研究方向。其主要思路是根據(jù)待嵌入的秘密信息自動生成一段自然文本,在生成過程中對文本語義單元進(jìn)行編碼實現(xiàn)隱蔽信息嵌入。該策略不需要事先給定嵌入秘密信息的載體。由于沒有事先給定載體的限制,因此隱寫方在嵌入信息過程中有較大的自由,可以獲得較高的信息嵌入率。同時,生成式隱寫策略面臨的挑戰(zhàn)同樣非常巨大。為了提升語言感知隱蔽性,西班牙馬德里理工大學(xué)的Muoz等人(2010)提出基于N-gram模型和短語片段集合的隱寫文本自動生成模型。英國劍橋大學(xué)的Chang和Clark(2010)進(jìn)一步利用Google構(gòu)建的Google N-gram數(shù)據(jù)集指導(dǎo)隱寫文本生成。美國哈佛大學(xué)的Ziegler等人(2019)利用GPT-2語言模型和算術(shù)編碼生成隱寫文本。美國伊利諾伊大學(xué)的Shen等人(2020)結(jié)合自然語言處理中的核采樣方法在Ziegler等人(2019)工作的基礎(chǔ)上改進(jìn),提出了自適應(yīng)的算術(shù)編碼方法。

2 國內(nèi)研究進(jìn)展

2.1 隱寫編碼

國內(nèi)學(xué)者在隱寫編碼發(fā)展的各個階段都做出了貢獻(xiàn)。

2.1.1 常數(shù)代價隱寫編碼

在常數(shù)代價隱寫編碼階段,Wang等人(2012)提出了擴(kuò)展矩陣方法提高隨機(jī)矩陣編碼的嵌入速度。Zhang等人(2008)從隱寫術(shù)本身規(guī)律出發(fā),發(fā)現(xiàn)了信息嵌入的“修改可復(fù)用特性”,提出了“修改復(fù)用”編碼技術(shù),給出了可對各種載荷率逼近率失真界的編碼方法ZZW(Zhang Zhang Wang)。

2.1.2 兩級代價隱寫編碼

在濕紙模型下, Zhang等人(2010a)提出了折紙算法“Paper Folding”,該方法將二元濕紙載體對折編碼。借用濕紙碼的比喻,折紙算法的思想可以比喻成構(gòu)造了一個特殊的復(fù)寫紙,只需對頂層修改,就可以在每層都寫上字,關(guān)鍵之處在于每層可以寫出不一樣的字。這一方法可以多次遞歸調(diào)用,即將載體多次對折,從而生成各種載荷率的碼。折紙算法通過折疊載體,將一個找最優(yōu)解問題轉(zhuǎn)化成了多個找解問題來解決,從而降低了計算復(fù)雜度,折紙算法不僅可以逼近濕紙模型的率失真界,計算復(fù)雜度也明顯低于以前的方法。

2.1.3 多級代價隱寫編碼

在多級代價模型下的編碼方法階段,在STC編碼的基礎(chǔ)上,Zhao等人(2016)提出了新的漸近最優(yōu)的雙層STC編碼NDSTC(near-optimal double-layered syndrome-trellis codes),與傳統(tǒng)的雙層 STC 相比,NDSTC雙層嵌入順序顛倒,并允許少量的±2修改,提高了安全性。Feng等人(2020)則是在STC編碼內(nèi)嵌套了一層FCC(forward error correction)糾錯編碼,用以提升隱寫編碼的魯棒性。Li等人(2020b)基于極化碼(polar codes)設(shè)計出了可逼近率失真界的極化隱寫碼SPC(steganographic polar codes),并解決了現(xiàn)實場景中載體長度非2冪次方等問題。

2.1.4 非二元隱寫編碼

Zhang和Wang(2006)將秘密比特轉(zhuǎn)換為多進(jìn)制數(shù),提出了EMD(exploiting modification direction)方法,至多只需要對載體分組中的一個元素進(jìn)行+1或-1修改。Zhang等人(2007a)將±1編碼問題等價分解為兩個二元編碼問題,提出雙層嵌入編碼方法并證明其能達(dá)到率失真界性能。在修改幅度為1的±1編碼中,每個元素所能承載的最大信息量為log23比特;當(dāng)最大修改幅度為2時,最大信息量可增大為log25比特。針對±2隱寫,Zhang等人(2010b)提出了3層構(gòu)造方法,以此分解為逐層的二元編碼問題。Zhang(2010)進(jìn)一步改進(jìn)了3層構(gòu)造方法,使之逼近±2隱寫的嵌入效率上界。

2.1.5 非加性隱寫編碼

Zhang等人(2017b)用定義在像素塊上的聯(lián)合代價表達(dá)修改的非加性,并發(fā)現(xiàn)了“聯(lián)合隱寫代價的可分解性”,提出了非加性隱寫編碼DeJoin,將非加性編碼問題等效分解成幾個加性編碼問題,從而實現(xiàn)快速嵌入。Wang等人(2021c)提出了漸進(jìn)式柵格編碼(progressive trellis coding,PTC),在嵌入過程中,維護(hù)與可能的最佳路線相對應(yīng)的多個上下文,并定期回溯以確定應(yīng)如何修改每個載體塊。每次修改后,都會重新評估剩余的載體塊及其嵌入代價,并更新每個上下文以反映修改影響。

2.2 圖像隱寫

2.2.1 最小代價框架下的代價函數(shù)設(shè)計

1)啟發(fā)式隱寫代價設(shè)計。在圖像隱寫研究中,加性代價函數(shù)的設(shè)計是最為常見的。隨著空域圖像代價函數(shù)的研究日趨完善,學(xué)者更多地將研究重點轉(zhuǎn)移至代價函數(shù)的通用增強(qiáng)方法以及JPEG圖像和彩色圖像的代價函數(shù)設(shè)計上。

在代價函數(shù)增強(qiáng)方法的研究中,Zhou等人(2017)挖掘了多種已有代價函數(shù)的爭議性,提出了“爭議像素優(yōu)先(controversial pixel prior, CPP)”原則,充分利用隱寫分析器對這些爭議像素的不敏感性來實現(xiàn)代價函數(shù)定義形式上的變異,提升了現(xiàn)有代價函數(shù)的安全性。王子馳等人(2018)利用像素灰度級本身的代價值優(yōu)化原始代價函數(shù),然后根據(jù)修改情況多次迭代地調(diào)整嵌入代價,盡可能聚集修改方向,從而使載密圖像具有更好的抗檢測性。Chen等人(2019)提出了“微尺度隱寫”(microscale steganography, MS)的代價增強(qiáng)方法,通過對圖像進(jìn)行內(nèi)容增強(qiáng)和細(xì)節(jié)放大,更精細(xì)地挖掘載體圖像內(nèi)容特點,以輔助進(jìn)行合理的代價定義,提升了現(xiàn)有代價函數(shù)的安全性。Wu等人(2020)觀察到圖像平坦區(qū)域像素由于小尺度濾波器的作用而具有低修改代價的現(xiàn)象,通過多尺度濾波器對載體圖像進(jìn)行增強(qiáng),彌補(bǔ)了代價的分配不當(dāng)?shù)膯栴}。

在JPEG圖像代價函數(shù)的研究中,“紋理復(fù)雜優(yōu)先”仍是首要遵循的設(shè)計原則。Wang等人(2016)、Wei等人(2018)和Su等人(2018)分別使用均值濾波、小波濾波和Gabor濾波對解壓縮圖像的紋理復(fù)雜度進(jìn)行度量,并結(jié)合量化步長獲取適合修改的低復(fù)雜度DCT系數(shù)。Hu等人(2018a)和Su等人(2022)則研究了高效的域轉(zhuǎn)換方法,能夠?qū)⒖沼虼鷥r函數(shù)轉(zhuǎn)化為 DCT域代價函數(shù),從而獲取較高的隱寫安全性和較低的計算復(fù)雜度。

設(shè)計非加性代價函數(shù)是隱寫研究的公開問題之一,學(xué)者針對JPEG圖像亦設(shè)計了多種非加性代價隱寫方法。Li等人(2018)從抑制隱寫修改的塊效應(yīng)出發(fā),提出了“塊邊界連續(xù)性”(block boundary continuity, BBC)原則,并結(jié)合聯(lián)合代價分解(DeJoin)模型(Zhang 等,2017b)設(shè)計了相鄰塊相同模式DCT系數(shù)的非加性代價嵌入方法,提升了現(xiàn)有加性代價函數(shù)的性能。Wang等人(2021a)考慮了相鄰塊中所有DCT系數(shù)對空域塊邊界連續(xù)性的影響,提出了一個加強(qiáng)版策略BBC++,采用多輪嵌入并在每一輪嵌入后更新下一輪的載體和代價,更好地維持了空域塊邊界的連續(xù)性。Lu等人(2020)也從抑制塊效應(yīng)的角度設(shè)計了JPEG圖像非加性隱寫方法。進(jìn)一步地,Wang等人(2021b)觀察到空域塊邊界的修改易被檢測的現(xiàn)象,提出了“塊邊界維持”(block boundary maintenance, BBM)原則,設(shè)計了DCT塊內(nèi)不同系數(shù)間的非加性嵌入方法,有效減少了隱寫對空域塊邊界的修改。受啟發(fā)于性能優(yōu)異的“邊信息已知”JPEG圖像隱寫方法,近期亦有針對JPEG圖像的邊信息估計隱寫研究。該類方法首先估計量化取整誤差,然后將其用于非對稱代價調(diào)制,顯著提升了現(xiàn)有代價函數(shù)的性能。王麗娜等人(2018)使用AR-CNN(artifacts reduction convolutional neural network)估計原始空域圖像,并基于估計的取整誤差極性設(shè)計了簡單的二元嵌入隱寫方法。Wang等人(2019)使用3×3均值濾波器對解壓縮空域圖像進(jìn)行濾波,將輸出的邊界值替換掉原始邊界的像素值,并對更新后的空域圖像進(jìn)行JPEG壓縮得到取整誤差極性用于非對稱代價調(diào)制。Wang等人(2018b)進(jìn)一步使用3×3維納濾波器來估計原始空域圖像,并通過最小化載體/載密的隱寫分析特征距離來選取最優(yōu)調(diào)制因子。由于分別需要執(zhí)行20次的消息嵌入和特征提取,該方法的計算復(fù)雜度較高。Li等人(2020a)使用專門的去塊效應(yīng)方法SSRQC(structural sparse representation and quantization constraint)估計原始空域圖像,并設(shè)計了基于估計取整誤差極性和幅值的代價調(diào)制模型,大幅提升了現(xiàn)有代價函數(shù)的安全性。

在彩色圖像代價函數(shù)的研究中,直接將灰度圖像的方法獨(dú)立地拓展至彩色圖像3個顏色通道并非最佳方案。湯光明等人(2019)分析了彩色分量內(nèi)容特性與通道間相關(guān)性的關(guān)系,提出中心元素的代價更新準(zhǔn)則,在嵌入過程中依據(jù)相鄰分量修改情況對代價進(jìn)行動態(tài)調(diào)整,設(shè)計了一種彩色空域圖像隱寫方法CCMS(modification strategy for color components)。Liao等人(2020)提出ACMP(amplifying channel modification probability)方法對載體圖像的代價分布與秘密信息的分配關(guān)系進(jìn)行定量度量,利用圖像RGB的3個通道相關(guān)性調(diào)整通道間對應(yīng)像素點的代價,增大通道間對應(yīng)像素點被同時修改的概率,提高了彩色圖像隱寫安全性。Wang等人(2020)發(fā)現(xiàn)G通道與R、B通道之間的相關(guān)性強(qiáng)于R與B之間的相關(guān)性,因此設(shè)計了同步R、B通道與G通道的修改方向的算法GINA,大幅提高了隱寫安全性。

2)基于模型的隱寫代價設(shè)計。Hu等人(2018b)優(yōu)化了空域圖像非加性嵌入方法CMD(clustering modification directions),將已嵌子圖的修改方向作為當(dāng)前子圖概率分布的先驗知識,通過最小化載體圖像和載密圖像的KL散度計算非對稱的修改概率,避免了對代價調(diào)制因子的人工選取步驟。Qin等人(2019)使用高通濾波器組獲取圖像殘差并計算殘差的Fisher information,通過最小化載體圖像和預(yù)測的載密圖像的KL散度來計算最優(yōu)的嵌入概率,獲得了更好的隱寫代價。Su等人(2021)使用交叉相鄰的4個元素構(gòu)造的高斯馬爾可夫隨機(jī)場來捕捉相鄰像素的依賴性,將載體圖像以棋盤格式分成兩個不連接的子圖像,將隱寫的安全問題轉(zhuǎn)化為最小化載體和載密圖像之間的KL散度,提出了GMRF(Gaussian Markov random field)隱寫算法。

2.2.2 基于深度學(xué)習(xí)的隱寫代價設(shè)計

1)基于GAN的隱寫代價學(xué)習(xí)。隱寫生成和隱寫分析檢測之間的關(guān)系與生成對抗網(wǎng)絡(luò)(GAN)結(jié)構(gòu)有相似之處,因此利用GAN進(jìn)行隱寫方法設(shè)計具有可行性。其中GAN生成器代表隱寫方,GAN判別器代表隱寫分析方,生成器和判別器的交替更新可視為隱寫與隱寫分析之間的博弈對抗,當(dāng)一個收斂的判別器無法區(qū)分真實圖像和生成器所生成的載密圖像時,說明隱寫方取得了優(yōu)勢。直接用GAN生成的載密圖像并不具有很強(qiáng)的信息解碼能力,因此Tang等人(2017)提出利用GAN學(xué)習(xí)隱寫代價的方案ASDL-GAN(automatic stegnographic distortion learning GAN)。其中,生成器和判別器都分別由卷積神經(jīng)網(wǎng)絡(luò)組成,生成器學(xué)習(xí)每個像素的嵌入修改概率,該概率最終可以通過最優(yōu)嵌入公式轉(zhuǎn)換為代價。通過一個由全連接神經(jīng)網(wǎng)絡(luò)及Sigmoid激活函數(shù)構(gòu)建的模擬嵌入器,不僅可以進(jìn)行模擬嵌入使得判別器具有可靠的載密圖像輸入,而且還可以進(jìn)行梯度回傳優(yōu)化生成器。Yang等人(2020a)在此框架上提出UT-GAN,利用性能更優(yōu)的U-Net作為生成器,以及利用double-tanh激活函數(shù)作為模擬嵌入器,獲得了不俗的性能。Yang等人(2019a)提出JS-GAN(JPEG steganography GAN),采用隨機(jī)極性調(diào)制的嵌入概率作為模擬嵌入修改,可應(yīng)用于JPEG圖像。

2)基于強(qiáng)化學(xué)習(xí)的隱寫代價學(xué)習(xí)和調(diào)整。在基于GAN的隱寫代價學(xué)習(xí)方案中,模擬嵌入容易導(dǎo)致梯度消失或?qū)?yīng)的修改與實際修改產(chǎn)生偏差。為了避免該缺陷,Tang等人(2021)提出基于采樣方式產(chǎn)生離散的模擬修改值,設(shè)計了將隱寫分析檢測器梯度值作為獎懲函數(shù)反饋進(jìn)行強(qiáng)化學(xué)習(xí)的方法SPAR-RL(steganographic pixel-wise actions and rewards with reinforcement learning),可以獲得比GAN方法更為穩(wěn)定和更為有效的結(jié)果。Mo等人(2021)結(jié)合蒙特卡羅樹搜索(Monte Carlo tree search, MCTS),提出了基于強(qiáng)化學(xué)習(xí)技術(shù)的非加性隱寫框架MCTSteg,在多次模擬代價調(diào)整動作的過程中自動學(xué)習(xí)代價調(diào)整策略,可以獲得比手工設(shè)計的非加性代價調(diào)整策略更好的性能。

3)基于對抗樣本的隱寫方法。為應(yīng)對當(dāng)前深度學(xué)習(xí)檢測器已成為主流檢測方法所帶來的挑戰(zhàn),國內(nèi)研究學(xué)者提出在信息隱寫中使用對抗樣本技術(shù)的各類方法。根據(jù)加入對抗樣本信號的不同階段,可以分為在信息嵌入前加入、在嵌入中加入和在嵌入后加入3種類型。Zhang等人(2018a)提出在嵌入前對載體圖像加入對抗樣本噪聲,然后在獲得增強(qiáng)后的載體圖像中進(jìn)行信息隱寫,該方法可以拓展至同時對抗多種檢測器的情況。Tang等人(2019)提出在嵌入中加入對抗樣本噪聲的方法,在生成代價過程中調(diào)整不同修改極性的代價,并最小化可能需要的修改元素。Ma等人(2019)結(jié)合二元嵌入的極性信息進(jìn)行對抗樣本代價調(diào)制,并提出應(yīng)減弱梯度圖像中所不應(yīng)呈現(xiàn)的棋盤格效應(yīng)。Mo等人(2019)提出對梯度幅度較大的像素通過多次迭代進(jìn)行代價調(diào)整,該方法可適用于JPEG圖像。Qin等人(2021)提出了將CMD與對抗樣本結(jié)合的方法,可以達(dá)到更好的對抗成功率。Zha等人(2019)提出在嵌入后加入對抗樣本噪聲的方法,通過對少量像素添加對抗樣本信號,且令修改的像素校驗規(guī)則符合信息提取方式,該方法具有一定的遷移能力。Song等人(2021)采用啟發(fā)式搜索的方式,對載體進(jìn)行隨機(jī)后處理獲得多個版本的載密圖像,在特征空間選擇與載體圖像最相鄰近的一個版本作為最終的載密圖像。

2.2.3 魯棒隱寫

魯棒圖像隱寫是近年來的研究熱點,它應(yīng)對的是圖像隱寫方法在社交網(wǎng)絡(luò)平臺的實用性問題。傳統(tǒng)的圖像隱寫方法均假設(shè)載密圖像是經(jīng)過無損傳輸?shù)?,故接收方能夠完全無誤地提取秘密信息。但是,社交網(wǎng)絡(luò)平臺(如 Facebook、微信等)會對上傳的圖像進(jìn)行有損處理以節(jié)省內(nèi)存和帶寬,如尺寸縮減和JPEG壓縮。由于載密圖像發(fā)生變化和STC具有誤差擴(kuò)散特性,接收方此時并不能準(zhǔn)確地提取秘密信息。因此,以社交網(wǎng)絡(luò)平臺作為隱蔽通信信道的隱寫方法需要同時考慮抗檢測性與魯棒性。

針對信道JPEG重壓縮的問題,目前抗JPEG壓縮的魯棒隱寫研究可以分為兩類。第1類方法是基于魯棒水印的設(shè)計思想。Zhang等人(2016b)提出了“構(gòu)建抗壓縮域+糾錯碼”的魯棒隱寫框架,該框架首先在載體內(nèi)構(gòu)建抗二次JPEG壓縮能力較強(qiáng)的抗壓縮域,然后再利用RS(Reed-Solomon)糾錯碼進(jìn)一步提高消息提取的正確率,并利用特征域挑選算法將修改更多地集中于圖像紋理復(fù)雜區(qū)域,進(jìn)一步提升安全性(Song 等,2021)。為了能夠充分利用JPEG量化操作的特性,Zhang等人(2018c)在DMAS(dither modulation based adaptive steganography)算法中利用抖動調(diào)制的方法修改中頻的交流DCT系數(shù)完成消息嵌入,以實現(xiàn)性能的提升。雖然以上3種算法都具有較強(qiáng)的魯棒性,但是由于抗壓縮域較小且只采用編碼效率較低的二元STC,因此抗檢測性較弱且容量較小。Yu等人(2020)提出的GMAS(generalized dither modulation based adaptive steganography)系數(shù)修改的過程中考慮了非對稱代價,在擴(kuò)大嵌入域的同時使用了三元STC嵌入,其安全性和魯棒性有了較大幅度的提升。Qiao等人(2021)和Zhu等人(2021a)分別利用DCT系數(shù)的符號和最后一個非零系數(shù)位置在壓縮前后的不變性,進(jìn)一步提升了魯棒隱寫的性能。不同于對秘密信息進(jìn)行糾錯編碼,Zhang等人(2020b)選擇部分載體嵌入消息,然后將循環(huán)檢驗位嵌入到剩余載體中用于載密糾錯。第2類方法可以認(rèn)為是啟發(fā)式的,通常構(gòu)思巧妙。為了能夠抵抗更低質(zhì)量的JPEG壓縮,Tao等人(2019)在不考慮空域量化損失的情況下,通過將消息嵌入到壓縮后的圖像中獲得載密圖像,然后反過來再修改載體圖像,使得修改后的載體圖像通過有損信道后仍能獲得載密圖像,具有很高的魯棒性,但假設(shè)過于理想難以實用。Zhao等人(2019)發(fā)現(xiàn)JPEG圖像被相同質(zhì)量因子壓縮多次后更穩(wěn)定,提出了信道匹配算法,不斷地進(jìn)行圖像上傳下載操作,直到圖像穩(wěn)定后,在穩(wěn)定圖像上嵌入信息,提升了魯棒性。Lu等人(2021)利用自編碼器從被信道處理破壞后的圖像中恢復(fù)出原始載密圖像以實現(xiàn)信息提取。

針對信道對圖像進(jìn)行尺寸縮減的問題,Zhang等人(2018b)提出了僅能抵抗尺度變換中的最近鄰插值算法的魯棒隱寫方法,利用變換前后像素的一一對應(yīng)關(guān)系實現(xiàn)了魯棒性。Zhu等人(2021b)利用逆插值公式進(jìn)一步實現(xiàn)了對多種插值算法的魯棒性。Zhang等人(2021a)提出了抗減半降采樣處理的魯棒隱寫方法,通過對載體圖像進(jìn)行增強(qiáng),使之在減半縮放處理后恰為已經(jīng)嵌入秘密信息的接收方圖像,從而可以使用與嵌入方法對應(yīng)的提取方法進(jìn)行秘密信息的無損提取??紤]到社交網(wǎng)絡(luò)平臺信道的復(fù)雜性,Zhang等人(2020a)基于“構(gòu)建抗壓縮域+糾錯碼”框架,提出了可以抵抗多種攻擊(如JPEG壓縮、尺寸縮減和高斯噪聲等)的魯棒隱寫方法。

由于社交網(wǎng)絡(luò)平臺只會對超過尺寸約束門限的圖像進(jìn)行尺寸縮減處理,即圖像的尺寸變換是容易避免的,因此目前關(guān)于魯棒隱寫方法的研究主要針對JPEG圖像的二次壓縮問題展開。大多數(shù)方法并不需要知道社交網(wǎng)絡(luò)平臺的任何壓縮信息,但是其抗檢測性能較弱并且容量較小。少量方法假設(shè)了社交網(wǎng)絡(luò)平臺的JPEG壓縮過程可以被完美地人工模擬,以至于可以在線下執(zhí)行社交網(wǎng)絡(luò)平臺的一次(Tao等,2019)或多次(Zhao 等,2019)JPEG壓縮。但是目前還不能夠完美地模擬社交網(wǎng)絡(luò)平臺的JPEG壓縮過程,因此在實際應(yīng)用中只能將原始圖像經(jīng)過實際的社交網(wǎng)絡(luò)平臺上傳和下載一次或多次來實現(xiàn)消息嵌入,這種行為本身就是可疑的而且比較耗時。因此,目前的魯棒隱寫方法都存在各自明顯的缺陷,設(shè)計適用于社交網(wǎng)絡(luò)平臺的安全魯棒圖像隱寫方法仍然任重道遠(yuǎn)。

2.3 視頻隱寫

相比于國外,目前國內(nèi)在視頻隱寫技術(shù)方面的研究更為活躍,且大多在壓縮域嵌入信息。在基于幀內(nèi)預(yù)測模式的視頻隱寫技術(shù)方面,Yang等人(2011)對I4模式進(jìn)行分組,并將2比特秘密信息通過矩陣編碼映射到3個I4模式中,且每嵌入2比特信息只需對一個I4模式進(jìn)行修改。修改預(yù)測模式會在一定程度上影響碼率,但可使接收端從壓縮視頻中準(zhǔn)確地提取出秘密信息,且不需要對視頻進(jìn)行完全解碼,因此算法效率較高。

基于運(yùn)動矢量的隱寫嵌入容量遠(yuǎn)高于幀內(nèi)預(yù)測模式和QDCT系數(shù)的隱藏方法(李松斌 等,2016),并且具有畫面失真小、檢測難度大的優(yōu)勢(王麗娜 等,2014;Su等,2011;Yang和Li,2018)。國內(nèi)在基于MV的視頻隱寫方面的研究工作主要集中在如何選擇以及如何修改候選MV的兩個關(guān)鍵問題上。例如,Zhang等人(2016a)選擇具備局部最優(yōu)特性的候選運(yùn)動矢量;王麗娜等人(2017)選取低復(fù)雜度宏塊進(jìn)行信息嵌入,以保持運(yùn)動矢量局部最優(yōu),并通過加減1方法保持運(yùn)動矢量相互間的相關(guān)性。

視頻序列經(jīng)幀內(nèi)和幀間預(yù)測后得到的預(yù)測誤差,經(jīng)DCT變換、量化后得到QDCT系數(shù)。QDCT系數(shù)隱寫方法類似于JPEG圖像的隱寫,均是將信息嵌入在量化后DCT系數(shù)中。不同之處在于,由于視頻的QDCT系數(shù)是從絕對值較小的預(yù)測殘差變換得到,對于P或B幀,大部分的QDCT系數(shù)為0、1、-1,為避免引入過大的失真,嵌入信息時通常不對值為0、1、-1的系數(shù)進(jìn)行修改,因此,該類方法嵌入容量不是很高。另外,基于QDCT系數(shù)的隱寫并不需要考慮對修改后的DCT系數(shù)進(jìn)行DCT反變換,更多需要考慮的是秘密信息的隱蔽性和魯棒性。由于H.264/AVC標(biāo)準(zhǔn)中的幀內(nèi)預(yù)測采用相鄰塊像素預(yù)測方式,因此直接修改殘差塊QDCT系數(shù)會使幀內(nèi)宏塊在預(yù)測編碼過程中發(fā)生誤差擴(kuò)散,形成失真漂移,導(dǎo)致視頻畫面失真較大。為解決這些問題,可以考慮通過選擇殘差塊中合適的耦合系數(shù)對來防止隱寫修改產(chǎn)生的誤差擴(kuò)散到其他塊(Ma等,2010;Li和Wang,2019)。

熵編碼是視頻壓縮編碼的最后一個階段,基于熵編碼的視頻隱寫方法直接在熵編碼后的碼流中嵌入秘密信息。針對熵編碼的不同方式,該類隱寫方法主要基于CAVLC(context-adaptive varialbe-length coding)編碼拖尾系數(shù)(Li和Wang,2019)、CABAC(context-based adaptive binary arithmetic coding)編碼末尾比特位(You等,2017),通過修改拖尾系數(shù)的數(shù)量或符號、碼字替換等方法實現(xiàn)信息嵌入?;陟鼐幋a的隱寫的優(yōu)勢是碼率變化小,可無損恢復(fù)秘密信息,且計算復(fù)雜度低,接收端無需解碼即可從載密碼流中直接提取秘密信息。然而,由于熵編碼階段冗余空間少,致使嵌入容量不高,且視頻質(zhì)量難以保證。

2.3.1 基于失真代價的自適應(yīng)視頻隱寫

隱寫分析技術(shù)的快速發(fā)展使隱寫術(shù)從“非自適應(yīng)”向“自適應(yīng)”階段發(fā)展,即優(yōu)先修改代價小(難檢測)的區(qū)域。與圖像不同,視頻隱寫中嵌入修改操作不只是對當(dāng)前像素塊引入失真,同時對相鄰塊和相鄰幀都可能會引入失真,因此,應(yīng)考慮嵌入修改對視頻元素造成的多種擾動來設(shè)計代價函數(shù)。國內(nèi)在基于失真代價的自適應(yīng)視頻隱寫技術(shù)方面的研究成果較多, 表1列出了近幾年國內(nèi)學(xué)者在該方向隱寫算法的基本信息,這些算法雖然基于不同的失真代價函數(shù)設(shè)計思想,但均采用STC或雙層STC嵌入信息,以實現(xiàn)總代價的最小化。

表1 近幾年基于失真代價的視頻隱寫算法基本信息Table 1 Basic information of video steganography algorithms based on distortion cost in recent years

2.3.2 魯棒視頻隱寫

為了節(jié)省視頻流傳輸帶寬和存儲空間,社交平臺往往會在后臺對傳輸?shù)囊曨l進(jìn)行二次壓縮、轉(zhuǎn)碼等有損處理。然而,現(xiàn)有的視頻隱寫技術(shù)通常默認(rèn)是在無損信道中傳輸,經(jīng)過社交網(wǎng)絡(luò)有損傳輸后很難提取嵌入的秘密信息。因此,近幾年,能抵抗有損信道的魯棒隱寫技術(shù)受到熱切關(guān)注(Chen等,2021b;Zhang等,2021a;Lu等,2021)。魯棒性主要指有損信道下隱寫的容錯性。根據(jù)應(yīng)用場景,常見的視頻攻擊主要為有損壓縮、轉(zhuǎn)碼、重編碼/量化、加噪、濾波、分辨率/幀率轉(zhuǎn)換、丟幀、丟包、旋轉(zhuǎn)、縮放、剪切、插入和修飾等。其中,實現(xiàn)抵抗旋轉(zhuǎn)、縮放、剪切等幾何攻擊, 以及社交平臺未知壓縮轉(zhuǎn)碼的魯棒性技術(shù)難度最大。為提高魯棒性,目前主要采用糾錯碼(Tao等,2019;Liu等,2013)、穩(wěn)健子帶(Liu等,2015)和幾何不變量(Huan等,2022)等方法。

2.4 音頻隱寫

國內(nèi)在音頻隱寫方面的研究工作目前處于國際領(lǐng)先地位。現(xiàn)有音頻隱寫研究主要面向可構(gòu)建隱蔽通信應(yīng)用的音頻和語音壓縮參數(shù)域隱寫。

語音壓縮域隱寫算法的主要研究團(tuán)隊包括清華大學(xué)黃永峰教授、武漢大學(xué)任延珍教授、中國科學(xué)技術(shù)大學(xué)黃劉生教授、華僑大學(xué)田暉教授和中國科學(xué)院聲學(xué)所李松斌研究員等。目前的主流語音壓縮算法基于CELP(code excited linear prediction)編碼框架,包括AMR(adaptive multi-rate compression)、G.729、G.723.1、iLBC(Internet low bitrate codec)等,在移動通信網(wǎng)絡(luò)、互聯(lián)網(wǎng)絡(luò)上應(yīng)用非常廣泛,其主要的隱寫嵌入域包括線性預(yù)測系數(shù)LPC(linear predictive coefficient)、基音周期和激勵碼本參數(shù)3類。

線性預(yù)測系數(shù)LPC體現(xiàn)語音信號產(chǎn)生的聲道特性,是語音信號的短時相關(guān)性參數(shù)。LPC系數(shù)的編碼通常是對其線性譜頻率系數(shù)LSF(linear speetral frequency)采用矢量量化進(jìn)行壓縮編碼?,F(xiàn)有LPC隱寫算法通?;赒IM隱寫原理,對LSF矢量量化碼本進(jìn)行分組劃分,依據(jù)需要嵌入的秘密信息選擇不同分組碼本實現(xiàn)信息隱寫。目前各算法的區(qū)別主要關(guān)注于如何選擇分組劃分模式,使得隱寫所引入的聽覺失真和統(tǒng)計失真更小。Xiao等人(2008)針對G.729、G.723.1、iLBC 這3種語音編碼算法,提出互補(bǔ)鄰居節(jié)點(complementary neighbor vertices,CNV)算法,對LPC矢量量化碼本進(jìn)行分組劃分實現(xiàn)隱寫。Huang等人(2017)基于圖模型,采用密鑰控制的QIM算法對碼本空間進(jìn)行劃分實現(xiàn)隱寫,平衡了矢量空間劃分的均衡性和多樣性,提高了算法的安全性和魯棒性。Ren等人(2018)針對SILK編碼,提出基于LSF碼本統(tǒng)計分布特性的安全隱寫算法。Sun等人(2021)提出基于LPC參數(shù)的分組隱寫機(jī)制,在保證實時性和不改變音頻大小的同時,提升了隱寫算法的安全性。

基音周期體現(xiàn)了語音信號產(chǎn)生的聲帶震動基頻特性,通常采用基音預(yù)測算法估計獲得,該類隱寫通常是對基音周期參數(shù)微調(diào)實現(xiàn)信息隱藏。Wu等人(2003)提出了基于修改語音編碼基音周期參數(shù)進(jìn)行信息隱藏的方法。Huang等人(2012)面向G.729,通過對自適應(yīng)碼書進(jìn)行奇偶分組,調(diào)整基音周期閉環(huán)搜索過程中自適應(yīng)碼本搜索范圍,實現(xiàn)秘密信息的嵌入。Ren等人(2021)利用SILK編碼中基音周期參數(shù)采用多級矢量量化的特點,基于各階矢量統(tǒng)計分布特性設(shè)計嵌入損失函數(shù),實現(xiàn)基于STC的SILK 基音周期安全隱寫算法。

激勵碼本是CELP編碼框架中的脈沖激勵信號,不同編碼算法的激勵碼本的產(chǎn)生和編碼方式不同。如AMR采用固定碼本編碼,SILK采用隨機(jī)脈沖激勵編碼。在CELP類編碼數(shù)據(jù)中,激勵碼本所占信息位多,而對其修改所帶來的語音質(zhì)量損失小,因此具有非常良好的隱蔽空間。該類隱寫方法主要通過修改碼本的取值、位置或符號實現(xiàn)隱寫。Geiser和Vary(2008)利用AMR固定碼本非零脈沖位置選擇的隨機(jī)性,對AMR固定碼本非零脈沖位置與嵌入信息之間的映射關(guān)系進(jìn)行控制,實現(xiàn)大容量隱寫。Miao等人(2012)面向AMR-WB(videband)標(biāo)準(zhǔn),修改固定碼本的搜索約束條件,選擇次優(yōu)脈沖位置組合實現(xiàn)大容量隱寫。Ren等人(2019)基于AMR固定碼本的固有分布特性,提出基于掩碼調(diào)制的固定碼本統(tǒng)計分布保持隱寫算法,提高了算法的統(tǒng)計安全性。

音頻壓縮域隱寫算法的主要研究團(tuán)隊包括中國科學(xué)院信工所的趙險峰研究員、寧波大學(xué)的王讓定教授等。目前主流的音頻壓縮算法均基于感知音頻編碼模型,包括AAC(advanced audio coding)、MP3(moving picture experts group audio layer Ⅲ)、CELT(constrained energy lapped transform)等。主流音頻壓縮域隱寫方法所修改的主要壓縮參數(shù)包括比例因子、量化MDCT系數(shù)(quantified modified DCT, QMDCT)和Huffman編碼參數(shù)3類。

QMDCT系數(shù)表示音頻幀內(nèi)各頻率成分幅度譜的量化值,是音頻壓縮數(shù)據(jù)中的主要參數(shù)。微量修改QMDCT系數(shù)對于音頻解碼后質(zhì)量影響較小,該嵌入域具有較大的隱藏容量和聽覺隱蔽優(yōu)勢。QMDCT系數(shù)隱寫方法與JPEG的量化DCT系數(shù)隱寫方法類似,通常包括兩類:1)在編碼過程中直接對量化后MDCT系數(shù)進(jìn)行修改實現(xiàn)隱寫;2)在Huffman編碼階段修改碼本實現(xiàn)隱寫。第2類方法同樣修改了QMDCT系數(shù),其優(yōu)點是只需要對壓縮碼流進(jìn)行修改,不會產(chǎn)生數(shù)據(jù)的二次壓縮,實時性和隱蔽性更好。Zhang等人(2020c)考慮隱寫的統(tǒng)計安全性,基于QMDCT系數(shù)相鄰幀之間的統(tǒng)計相關(guān)性設(shè)計失真實現(xiàn)自適應(yīng)隱寫算法(joint embedding distortion, JED)。Yang等人(2019b)基于QMDCT系數(shù)的一階直方圖統(tǒng)計分布特征和人類絕對閾值曲線設(shè)計失真代價函數(shù),基于STC框架實現(xiàn)MP3自適應(yīng)隱寫。在Huffman編碼域的隱寫方法中,嚴(yán)迪群等人(2011)將Huffman碼表中的碼字分為兩組,形成碼字映射關(guān)系。對應(yīng)的碼字在碼字空間中根據(jù)密鑰進(jìn)行選擇,通過碼字替換實現(xiàn)隱寫。Yang等人(2017)提出了一種基于等長熵編碼的自適應(yīng)隱寫算法(equal length entropy codes substitution,EECS),利用人類聽覺絕對閾值曲線設(shè)計失真代價函數(shù),基于STC實現(xiàn)自適應(yīng)安全隱寫。Yi等人(2019)提出基于Huffam碼字幀塊失真優(yōu)選的自適應(yīng)隱寫框架算法(adaptive Huffman code mapping,AHCM)。將Huffman碼表中的碼字分組策略從一一對應(yīng)改為一組內(nèi)有多個相互替換碼字的策略,構(gòu)造了多個碼字動態(tài)映射的關(guān)系來實現(xiàn)隱寫。

目前基于深度學(xué)習(xí)的音頻隱寫算法(Jiang等,2020;Wu等,2020)和面向VoIP語音流的隱寫算法(Tian等,2017)也已經(jīng)成為現(xiàn)在音頻隱寫的關(guān)注方向。Chen等人(2021a)設(shè)計了基于文本合成語音的可證安全隱寫算法。

2.5 文本隱寫

如前文所述,國內(nèi)的現(xiàn)代文本隱寫術(shù)通常可以分為基于文本格式的隱寫術(shù)和基于文本內(nèi)容的隱寫術(shù)。在基于文本格式的隱寫術(shù)研究中,有研究人員利用PDF文檔中的閑置空間進(jìn)行填充(Wojtuń和Piotrowski,2021)、對文檔的定位操作符進(jìn)行細(xì)微修改(鐘征燕 等,2012)以及增刪文檔中的對象樹信息(Zhong等,2007)等實現(xiàn)隱蔽信息嵌入。這類方法的使用場景具有較強(qiáng)的局限性。

近年來的國內(nèi)研究熱點主要集中于基于文本內(nèi)容的隱寫術(shù),該技術(shù)通??梢詺w納為檢索式、修改式和生成式3種隱寫策略。其中檢索式語言隱寫術(shù)國內(nèi)比較有代表性的方法是南京信息工程大學(xué)的周志立等人(Lee和Tsai,2010)提出的基于多個關(guān)鍵詞的無載體文本隱寫方法,他們通過對大規(guī)模文本庫中的樣本進(jìn)行特殊編碼,然后根據(jù)待嵌入的秘密信息選擇對應(yīng)語句進(jìn)行傳輸以實現(xiàn)隱蔽通信。修改式語言隱寫術(shù)主要是對文本中詞匯級或者句子級的語義單元進(jìn)行同義替換以嵌入隱蔽信息。例如對于詞級同義變換,可以通過構(gòu)建同義詞典,然后對同義詞典進(jìn)行適當(dāng)編碼,根據(jù)待嵌入秘密信息選擇特定的同義詞對原始文本進(jìn)行替換以嵌入信息(Zhou等,2016)。對于句級同義變換,可以通過對句法結(jié)構(gòu)進(jìn)行等價變換以代表不同的隱蔽信息(Liu等,2005)。修改式和檢索式文本隱寫方法都面臨著嵌入率比較低而難以傳遞大量信息的缺點。

生成式語言隱寫術(shù)是近年來國內(nèi)的研究熱點,吸引了大量研究人員,該類方法的優(yōu)勢之一就是嵌入率高。Luo等人(2016)結(jié)合句法模板和統(tǒng)計語言模型以生成特定格式下的隱寫文本。Yang等人(2019c)提出基于條件概率編碼(Conproc)的載體生成式隱寫模型RNN-Stega,該方法能大幅度提升生成的隱寫文本的感知隱蔽性和信息嵌入率,相比之前主流的基于修改式的語言隱寫術(shù)只有1%—3%左右的嵌入率,RNN-Stega模型的嵌入率最高可達(dá)到20%以上。Yang等人(2021)實驗結(jié)果表明,Conproc框架生成的隱寫文本表現(xiàn)出顯著的感知—統(tǒng)計隱蔽性沖突效應(yīng)(psic effect)。為了解決這一問題,Zhou等人(2021)引入對抗學(xué)習(xí)機(jī)制,通過對抗訓(xùn)練約束正常文本和生成的隱寫文本之間的統(tǒng)計分布差異,Zhang等人(2021c)提出名為ADG(adaptive dynamic grouping)的可證安全生成式文本隱寫方法,該方法采用分組劃分策略構(gòu)建秘密信息和詞表映射的隱寫思路。這些最新的研究進(jìn)展在保證生成的隱寫文本具有一定感知隱蔽性的基礎(chǔ)上,大幅度增強(qiáng)了其統(tǒng)計隱蔽性。考慮到語義隱蔽性,Yang等人(2018)提出應(yīng)用在對話系統(tǒng)中的RITS(real-time interactive text steganography)模型,并利用強(qiáng)化學(xué)習(xí)約束生成文本和上下文之間的語義關(guān)聯(lián)性,首次嘗試約束生成隱寫文本語義表達(dá)。Li等人(2019)在image caption任務(wù)中,利用給定的圖像約束生成的隱寫文本的語義表達(dá)。2020年,Yang等人(2021)基于encoder-decoder框架實現(xiàn)語義可控的隱寫文本自動生成方法。然而,基于encoder-decoder中解碼嵌入技術(shù)路線的文本生成式隱寫方法在提高嵌入率時,會帶來隱寫文本質(zhì)量和語義控制能力的雙雙下降??紤]到這一缺陷,Yang等人(2020c)提出基于編碼端的知識圖譜引導(dǎo)下的語義可控隱寫文本生成方法,即Graph-Stega模型。該方法將秘密信息嵌入到知識圖譜的路徑表達(dá)中。這些工作均在一定程度上實現(xiàn)了嵌入秘密信息的同時控制生成的隱寫文本的語義表達(dá)、增強(qiáng)了生成式語言隱寫術(shù)的安全性。

3 國內(nèi)外研究進(jìn)展比較

3.1 隱寫編碼

早期的隱寫編碼一直由國外研究學(xué)者主導(dǎo),尤其是在常數(shù)代價隱寫模型編碼階段,美國紐約大學(xué)賓漢姆分校的Fridrich團(tuán)隊引領(lǐng)著隱寫編碼的發(fā)展。中國科學(xué)技術(shù)大學(xué)張衛(wèi)明團(tuán)隊提出ZZW編碼,使以矩陣編碼為基礎(chǔ)的隱寫編碼的性能進(jìn)一步逼近理論界。復(fù)旦大學(xué)張新鵬團(tuán)隊提出了首個非二元的隱寫編碼EMD,后續(xù)國外學(xué)者在其基礎(chǔ)上繼續(xù)發(fā)展非二元編碼方法。在多級代價模型階段,F(xiàn)iller提出的STC提供了一種逼近嵌入效率理論上界的自適應(yīng)隱寫碼方案,實際上已經(jīng)成為隱寫編碼標(biāo)準(zhǔn),得到廣泛使用。長期以來自適應(yīng)隱寫碼僅有STC單一選項。已有研究指出STC具有潛在瑕疵(K?hler等,2017),因此設(shè)計一種可替代STC的隱寫碼方案對于保證隱寫算法的安全性和擴(kuò)充隱寫碼的多樣性具有重要意義。中國科學(xué)技術(shù)大學(xué)張衛(wèi)明團(tuán)隊在2020年將極化碼改造成隱寫碼SPC,可以逼近多級代價模型的理論界,且理論復(fù)雜度低于STC?;仡?0年隱寫編碼的發(fā)展過程,可以看出隱寫編碼從國外提出,到國內(nèi)跟進(jìn),現(xiàn)在逐漸進(jìn)入并駕齊驅(qū)的狀態(tài)。

3.2 圖像隱寫

從上述國內(nèi)外研究工作可知,近年來中國在圖像隱寫方面研究呈現(xiàn)蓬勃發(fā)展之勢。在前沿研究方向上,有兩個明顯優(yōu)勢。1)將深度學(xué)習(xí)方法與隱寫結(jié)合。國內(nèi)學(xué)者率先提出了基于生成對抗網(wǎng)絡(luò)及基于強(qiáng)化學(xué)習(xí)的隱寫代價生成方法,使得隱寫失真代價不再依賴于統(tǒng)計模型或基于啟發(fā)式的設(shè)計,利用隱寫與隱寫分析的博弈及數(shù)據(jù)驅(qū)動進(jìn)行隱寫代價的學(xué)習(xí)。國內(nèi)學(xué)者也提出了多種利用對抗樣本技術(shù)應(yīng)對日益強(qiáng)大的深度學(xué)習(xí)隱寫分析器的挑戰(zhàn),同時確保了對抗樣本的對抗成功率與載密信息的提取成功率。2)魯棒隱寫方法。國內(nèi)學(xué)者從各個角度提出了應(yīng)對社交媒體、日常圖像處理中所面臨的重壓縮、重采樣等引起的秘密信息誤碼提取問題,對隱藏信息的容量、安全性和魯棒性三者關(guān)系進(jìn)行了探索,發(fā)展深化了隱寫的實用性。與國外的研究相比,國內(nèi)在大規(guī)模公共評測數(shù)據(jù)庫的建立、基于統(tǒng)計模型的隱寫研究和隱寫安全性的理論探討等方面還有待加強(qiáng)研究力量。這些方面不僅有望獲得具有影響力的突破性成果,還將有助于隱寫學(xué)科內(nèi)涵和外延的發(fā)展,達(dá)到載體統(tǒng)計模型和安全模型的和諧統(tǒng)一。

3.3 視頻隱寫

隨著多媒體技術(shù)的發(fā)展和5G時代的到來,視頻將逐步取代圖像成為主流的數(shù)字媒介。因此,國內(nèi)外對視頻隱寫技術(shù)的研究也明顯呈上升趨勢,涌現(xiàn)了大量的視頻隱寫方法??偟膩碚f,相較于國外,目前國內(nèi)在視頻隱寫領(lǐng)域的研究成果更加豐碩。然而,國內(nèi)在該領(lǐng)域的研究大多致力于如何提高視頻隱寫的嵌入效率和安全性,因此,現(xiàn)有方法主要涉及壓縮域視頻隱寫,以及基于失真代價的自適應(yīng)視頻隱寫。近期隨著社交網(wǎng)絡(luò)的發(fā)展,很多國內(nèi)學(xué)者對魯棒視頻隱寫方法開始關(guān)注。與此同時,隨著人工智能的發(fā)展,國外一些知名大公司和研究機(jī)構(gòu)(如谷歌、MIT)已開始研究基于深度學(xué)習(xí)的視頻隱寫技術(shù),并著手設(shè)計基于深度神經(jīng)網(wǎng)絡(luò)的端到端視頻隱寫架構(gòu)。雖然國內(nèi)也有少量的研究工作將深度學(xué)習(xí)引入到視頻隱寫技術(shù)領(lǐng)域,但缺乏對端到端視頻隱寫架構(gòu)的設(shè)計,如Liu等人(2021)提出的方法是用CNN替換視頻 I 幀的環(huán)路濾波器,以便更好地改善壓縮后圖像的重建質(zhì)量,所以該方法實際上是用CNN替代視頻編碼中的一個“部件”。目前,基于深度學(xué)習(xí)的視頻隱寫技術(shù)研究處于起步階段,主要旨在實現(xiàn)智能的端到端視頻隱寫,具有很好的愿景,但由于視頻數(shù)據(jù)量大而難于訓(xùn)練大量高清視頻,因此,其實用性還有待進(jìn)一步探索。

3.4 音頻隱寫

從目前對國內(nèi)外音頻隱寫技術(shù)的公開學(xué)術(shù)研究成果的分析看,國內(nèi)學(xué)者的研究處于國際領(lǐng)先地位,尤其是對各類主流語音和音頻編碼算法的壓縮參數(shù)域隱寫方面,從所覆蓋的音頻壓縮算法的廣度和隱寫載體嵌入域的特性分析和安全性提升方面具有更好的實際應(yīng)用價值。在基于VoIP等音頻流隱寫的技術(shù)公開成果發(fā)表方面,國內(nèi)相對成果較少。因此,國內(nèi)的后期研究可以更多地從應(yīng)用的角度,充分挖掘和分析現(xiàn)有語音信號存儲和傳輸空間特性,尋找和發(fā)現(xiàn)可利用的數(shù)據(jù)載體,實現(xiàn)高效安全的隱蔽通信應(yīng)用。

3.5 文本隱寫

文本隱寫術(shù)長期以來由于其難以實現(xiàn)高嵌入率隱寫,導(dǎo)致其受到的關(guān)注度較低。即便如此,國內(nèi)學(xué)者經(jīng)過多年耕耘,在文本隱寫多個方面始終保持領(lǐng)先地位。例如南京信息工程大學(xué)的孫星明團(tuán)隊、湖南大學(xué)的劉玉玲團(tuán)隊、長沙理工大學(xué)的向凌云團(tuán)隊等在文本檢索式隱寫和文本修改式隱寫方面長期處于國際領(lǐng)先。隨著近兩年自然語言處理技術(shù)的飛速發(fā)展,基于生成策略的語言隱寫術(shù)成為文本隱寫領(lǐng)域的熱點研究方向,吸引了大量國內(nèi)外研究人員的興趣。在這一最新研究熱點上,國內(nèi)學(xué)者例如清華大學(xué)黃永峰團(tuán)隊、中國農(nóng)業(yè)大學(xué)的薛一鳴團(tuán)隊等保持對國外的領(lǐng)先地位。文本生成式隱寫面臨的挑戰(zhàn)難題可總結(jié)為感知隱蔽性、統(tǒng)計隱蔽性和認(rèn)知隱蔽性。目前感知隱蔽性和統(tǒng)計隱蔽性方面均有了較好的解決方案,但是在認(rèn)知隱蔽性上還亟待突破。因此,國內(nèi)研究團(tuán)隊接下來的研究需要著眼于認(rèn)知隱蔽性增強(qiáng),重點研究語義、主題、風(fēng)格和情感等因素可控的生成式文本隱寫,以進(jìn)一步增強(qiáng)生成式隱寫術(shù)的隱蔽性和安全性。

4 發(fā)展趨勢與展望

4.1 隱寫編碼

對隱寫碼的已有研究表明,隱寫碼與糾錯碼存在對偶關(guān)系,即糾錯碼的譯碼算法對應(yīng)于隱寫碼的編碼算法。從簡單的常數(shù)代價模型到復(fù)雜的多級代價模型,從基于分組漢明碼的BZ到基于卷積碼的STC,這揭示了設(shè)計更優(yōu)隱寫碼可通過選取更為優(yōu)越的糾錯碼及其譯碼算法。STC和SPC算法可逼近隱寫理論界得益于卷積碼和極化碼的優(yōu)良性能。但是適用于多級代價模型的隱寫碼依然太少。未來可以考慮將其他優(yōu)秀的糾錯碼,如Turbo碼、LDPC(low-density parity-check code)碼等,改造為隱寫碼。同時,隨著數(shù)據(jù)和場景的變化,發(fā)展更高效和更安全的生成式隱寫編碼也是值得研究的方向。

4.2 圖像隱寫

圖像隱寫的研究應(yīng)在理論和應(yīng)用兩個維度協(xié)同發(fā)展,主要體現(xiàn)在3個方面。1)提高隱寫安全性。應(yīng)對不斷發(fā)展的深度學(xué)習(xí)和特征工程的隱寫分析挑戰(zhàn),結(jié)合載體生成、載體選擇和載體邊信息利用等方式,設(shè)計更為安全有效的隱寫方法。2)提高效率。針對移動互聯(lián)網(wǎng)等應(yīng)用,設(shè)計高效快速的隱寫代價生成及隱寫編解碼方法。3)提高魯棒性。針對各類社交平臺,設(shè)計抗各類后處理的魯棒隱寫方法。

4.3 視頻隱寫

視頻具有信息量大、視覺表現(xiàn)強(qiáng)和實時性高等優(yōu)勢,廣泛應(yīng)用于視頻會議、社交平臺、可視電話和網(wǎng)絡(luò)直播等場景,未來可結(jié)合實際應(yīng)用進(jìn)行廣泛地探索研究。比如,目前社交網(wǎng)絡(luò)中廣泛應(yīng)用的短視頻成為當(dāng)今互聯(lián)網(wǎng)中媒介傳播的主力軍,因此,短視頻隱寫有著重要的研究價值。其中,抵抗短視頻平臺轉(zhuǎn)碼的魯棒性,以及短視頻持續(xù)時間較短所帶來的嵌入容量限制是需要考慮的技術(shù)難點。此外,基于新一代視頻編碼標(biāo)準(zhǔn)的隱寫技術(shù)研究將會越來越多,將深度學(xué)習(xí)引入視頻隱寫技術(shù)進(jìn)行端到端架構(gòu)的設(shè)計或優(yōu)化,依然受到關(guān)注。

4.4 音頻隱寫

數(shù)字音頻是優(yōu)質(zhì)的隱寫載體,在各種社交應(yīng)用中存在大量的隱蔽通信信道。從目前本領(lǐng)域國際國內(nèi)研究成果的分析,未來音頻隱寫技術(shù)的研究將會面向?qū)嶋H應(yīng)用,以構(gòu)建隱蔽通信為目標(biāo),提升隱寫算法和隱寫行為的安全性,實現(xiàn)適用于現(xiàn)有音頻通信環(huán)境的安全魯棒隱寫算法。研究成果可以應(yīng)用于個人、企業(yè)、政府及國家安全領(lǐng)域,實現(xiàn)重要信息在開放互聯(lián)網(wǎng)絡(luò)環(huán)境下的安全通信。

4.5 文本隱寫

總的來說,現(xiàn)有的文本隱寫術(shù)已經(jīng)可以生成具有較高感知隱蔽性的隱寫文本。在統(tǒng)計隱蔽性方面,最新的研究工作能夠做到可證安全。在認(rèn)知隱蔽性方面,目前雖然已經(jīng)有一定的進(jìn)展,但是離該挑戰(zhàn)難題的最終解決還有一段距離。

此外,現(xiàn)有的文本隱寫術(shù)基本都可以歸納為符號隱寫,即通過對自然語言中的符號進(jìn)行編碼實現(xiàn)隱蔽信息嵌入,然而文本符號的離散性導(dǎo)致符號隱寫將很可能破壞文本語義表達(dá)的完整性。而基于隱空間編碼的文本隱寫思路,如Zhang等人(2021b)提出的方法,一方面能抵抗當(dāng)前基于符號統(tǒng)計分析的文本隱寫檢測方法;另一方面也能與現(xiàn)有符號隱寫方法進(jìn)行結(jié)合,以進(jìn)一步提升其隱藏容量,這類方法或許是未來文本隱寫術(shù)非常有價值的研究方向。

致 謝本文由中國圖象圖形學(xué)學(xué)會數(shù)字媒體取證與安全專委會組織撰寫,該專委會更多詳情請見鏈接:http://www.csig.org.cn/detail/2450。

猜你喜歡
代價編碼載體
創(chuàng)新舉措強(qiáng)載體 為僑服務(wù)加速跑
住院病案首頁ICD編碼質(zhì)量在DRG付費(fèi)中的應(yīng)用
以幾何畫板為載體,探究等腰三角形的存在性問題
堅持以活動為載體有效拓展港澳臺海外統(tǒng)戰(zhàn)工作
幸災(zāi)樂禍的代價
幸災(zāi)樂禍的代價
高效視頻編碼幀內(nèi)快速深度決策算法
代價
不斷修繕 建立完善的企業(yè)編碼管理體系
代價