徐明杰,楊婉霞,周蓓蓓,李妙棋,劉 燕,王巧珍
(甘肅農(nóng)業(yè)大學(xué)機電工程學(xué)院,甘肅蘭州 730070)
信息隱藏是保證信息安全的重要技術(shù)手段之一,與經(jīng)典的加密技術(shù)相得益彰、互為補充,共同守護(hù)網(wǎng)絡(luò)信息安全。然而,加密技術(shù)注重內(nèi)容安全,行為上的暴露會激發(fā)攻擊者的熱情。信息隱藏通過公開載體傳遞機密信息,追求的是內(nèi)容和行為兩者的不可感知性和不易察覺性,即隱蔽性??梢?,信息隱藏的目的是將私密信息融入載體,使其很自然地成為載體不可分離的一部分。
實施信息隱藏的前提是選擇已有載體或構(gòu)造載體,因此可按照載體的時代特征將信息隱藏劃分為傳統(tǒng)形式隱寫和現(xiàn)代信息隱寫兩種。傳統(tǒng)隱寫主要基于物理媒介、化學(xué)物質(zhì)和擴頻通信等載體[1];而現(xiàn)代信息隱寫是隨著計算機、互聯(lián)網(wǎng)等技術(shù)發(fā)展,出現(xiàn)了文本、圖像、音頻等數(shù)字載體而開啟的,使得信息隱藏手段發(fā)生了前所未有的變化,其比基于傳統(tǒng)隱寫技術(shù)發(fā)展更快速,應(yīng)用更廣泛??梢哉f,信息隱藏的發(fā)展史是尋求載體并與載體和諧共處的奮斗史,詳見圖1。在眾多數(shù)字載體中,文本是最常用、最普遍的載體,基于文本的信息隱藏技術(shù)必然受到研究界的極大關(guān)注。從圖2 可以看出,基于文本載體的信息隱藏研究關(guān)注度及發(fā)表文獻(xiàn)數(shù)量位居第二(知網(wǎng)和WOS 檢索量),圖像位居之一是由于其冗余度大。因此,本文以文本信息隱藏技術(shù)為研究對象,詳細(xì)分析其研究現(xiàn)狀、熱點和發(fā)展趨勢以及存在的問題。
Fig.1 Timeline of the development of modern information hiding with the change of the carrier圖1 現(xiàn)代信息隱藏隨載體變化而發(fā)展的時間軸
Fig.2 Comparison of the number of Chinese and English literatures in different carriers圖2 不同載體中英文文獻(xiàn)數(shù)量比較
目前文本信息隱藏技術(shù)主要分為三大類。第一大類為修改式文本信息隱藏,主要包括:①基于文本格式的信息隱藏。該類算法的特點為微調(diào)已有文本的格式實現(xiàn)隱寫,不會改變文本內(nèi)容,例如通過微調(diào)文本間距[2-4]、改變字符編碼[5-7]和文件格式[8-10]實現(xiàn)信息隱藏;②基于文本內(nèi)容的信息隱藏。該類方法不改變文本語義,在不同粒度情況下修改文本內(nèi)容時實現(xiàn)信息隱藏,修改對象集中在詞匯層和語句層,例如通過替換相似字符[11-13]、增刪句子中的助詞[14]、改變句子長度等實現(xiàn)信息隱藏[15]。第二大類為搜索式無載體文本信息隱藏。該類方法不對原有載體作任何修改,而是以大數(shù)據(jù)為基礎(chǔ),在大量自然載體中搜索含密載體進(jìn)行傳輸,重點解決如何準(zhǔn)確定位私密信息的問題。目前常用方法包括利用漢字?jǐn)?shù)學(xué)表達(dá)式生成定位標(biāo)簽[16-17],基于漢語拼音組合特征[18]、漢字的聲調(diào)特征[19]、字符編碼特征[20]和詞階圖[21]等設(shè)計的無載體信息隱藏方法。該類方法的特點是抗檢測性極強,但受標(biāo)簽+關(guān)鍵詞搜索載密文本的模式所限,需要大量文本數(shù)據(jù)方可穩(wěn)定實施,且算法復(fù)雜,隱藏容量十分有限。第三大類為生成式文本信息隱藏方法,其借助概率統(tǒng)計理論及自然語言生成技術(shù),設(shè)計符合語法規(guī)則的句法模板,通過構(gòu)建字典資源將私密信息編碼為自然語言的文本內(nèi)容。例如Simova 等[22]針對基于同義詞替換策略生成文本的隱寫軟件Nicetext 生成的文本語義生硬等問題改進(jìn)模型,充分考慮英文句法規(guī)則,提高了生成文本質(zhì)量;余振山等[23]結(jié)合字詞編碼實現(xiàn)自動生成宋詞的信息隱藏,嵌入率高,但算法選詞的隨機性強,生成的宋詞欣賞性不佳,隱蔽性降低;Yang 等[24]采用大數(shù)據(jù)驅(qū)動的循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建文本生成和隱寫模型,隱藏容量和隱蔽性均有所提升;Kang 等[25]基于關(guān)鍵詞并引入注意力機制建立的語言模型能更深層次地學(xué)習(xí)語義信息,提高了生成載密文本的抗檢性;Yang等[26]采用知識圖譜約束文本自動生成過程的語義,保證了較好的文本生成質(zhì)量;其還探索了面向唐詩和宋詞生成的多種信息隱藏方法[27-28],促進(jìn)了文本生成式信息隱藏研究的進(jìn)一步發(fā)展。
為了更清晰地展現(xiàn)已有算法的原理和特點,本文對現(xiàn)有文本信息隱藏方法進(jìn)行簡要概括與比較,詳見表1??梢钥闯?,修改式文本信息隱藏方法因其固有的缺點難以抵抗統(tǒng)計隱藏檢測。搜索式無載體文本信息隱藏方法的搜索和存儲代價大,隱藏容量普遍較低,且隱藏成功率會受到算法和數(shù)據(jù)影響。而基于文本自動生成的信息隱藏方法可以很好地協(xié)調(diào)隱藏容量和隱蔽性,也無需大量文本數(shù)據(jù)。然而目前文本生成模型生成的文本自然度欠佳,主題和情感等可控性不完善。綜合分析可知,當(dāng)前研究主要集中在面向文本自動生成的信息隱藏技術(shù),以及將搜索式思想與文本自動生成相結(jié)合的隱藏方法方面。以下將通過對相關(guān)文獻(xiàn)進(jìn)行分析,進(jìn)一步挖掘文本信息隱藏的研究熱點和發(fā)展趨勢。
Table 1 Comparison of text information hiding methods表1 文本信息隱藏方法比較
本文分析數(shù)據(jù)來源于Web of Science 數(shù)據(jù)庫,主題詞設(shè)置為“text”and“information hiding or steganagraphy”,源期刊限定Web of Science 的核心合集數(shù)據(jù)庫,設(shè)定年限為2010-2021 年,剔除與研究主題不相關(guān)的條目,最終得到有效英文文獻(xiàn)200篇。
利用科學(xué)引文文獻(xiàn)數(shù)據(jù)挖掘和可視化分析工具Cite SpaceⅣ[29-30]對樣本文獻(xiàn)中蘊含的潛在知識信息及其相互關(guān)系進(jìn)行科學(xué)計量與深度分析,得到高被引文獻(xiàn)以及作者、研究機構(gòu)、國家/地區(qū)的合作共現(xiàn)情況等,形成文本信息隱藏領(lǐng)域研究作者及機構(gòu)的知識圖譜,進(jìn)而探究文本信息隱藏學(xué)科結(jié)構(gòu)的發(fā)展概況。
首先對文獻(xiàn)共被引進(jìn)行聚類分析,挖掘相似文獻(xiàn)的共同主題,得到研究主題的知識基礎(chǔ),形成并體現(xiàn)引文網(wǎng)絡(luò)中的學(xué)科點;然后對文獻(xiàn)中的關(guān)鍵詞進(jìn)行共現(xiàn)分析,以揭示文獻(xiàn)所代表學(xué)科與各主題之間的關(guān)系,同時結(jié)合結(jié)構(gòu)變異性分析,即通過關(guān)鍵詞和高被引作者的突變檢測,反映和辨識新興學(xué)科和研究前沿的轉(zhuǎn)變。
圖3 為1990-2021 年期間文本信息隱藏領(lǐng)域的年度文獻(xiàn)統(tǒng)計??梢钥闯?,自1995 年起,文本信息隱藏研究開啟了迅速發(fā)展的階段,并在2016 年后迎來爆發(fā)式增長。分析其原因:1996 年5 月,第1 屆國際信息隱藏學(xué)術(shù)研討會(The First International Workshop on Information Hiding)在英國劍橋大學(xué)召開,標(biāo)志著信息隱藏學(xué)的正式誕生。2017年,Transformer 模型被提出,在自然語言處理(Natural Language Processing,NLP)領(lǐng)域掀起了新的發(fā)展浪潮,促進(jìn)了基于文本自動生成的無載體信息隱藏技術(shù)蓬勃發(fā)展。在我國,信息隱藏技術(shù)研究正式開始于1999 年。2000 年1月,國家自然科學(xué)基金委員會將信息隱藏技術(shù)確定為優(yōu)先領(lǐng)域,不僅開啟了信息隱藏學(xué)科這一新的發(fā)展方向,也為該領(lǐng)域的研究與發(fā)展提供了重要的資金來源。文本是通用載體,基于文本的信息隱藏技術(shù)自然隨之快速發(fā)展。
Fig.3 Annual statistics of literatures of text information hiding during 1990-2021圖3 1990-2021年期間文本信息隱藏領(lǐng)域年度文獻(xiàn)統(tǒng)計
對200篇文獻(xiàn)作者所在的國家和研究機構(gòu)進(jìn)行統(tǒng)計可揭示文本信息隱藏領(lǐng)域中堅研究力量的分布情況。選擇節(jié)點類型為研究機構(gòu),Top N=25,形成了文本信息隱藏研究機構(gòu)分布的可視化圖譜,見圖4。圖中的網(wǎng)絡(luò)節(jié)點數(shù)量為205 個,連線數(shù)量(Links)165 條,網(wǎng)絡(luò)密度(Density)為0.007 9。其中,節(jié)點及字體大小代表機構(gòu)出現(xiàn)頻次高低,連線密度和粗細(xì)度表示機構(gòu)之間的合作密切程度。可以看出,該領(lǐng)域的研究主要集中在中國,發(fā)文量為78 篇,占總量的39%,遙遙領(lǐng)先其他國家;發(fā)文量排名第二的為印度,占22%;其次是美國(占13%)和沙特(占8%)。研究機構(gòu)主要為國內(nèi)外的各類高校,專業(yè)部門和研究中心亦有參與,但各機構(gòu)的合作不太緊密。研究機構(gòu)中,南京信息工程大學(xué)的貢獻(xiàn)率最突出,其次是清華大學(xué)和湖南大學(xué)。此外,為了追蹤國際上各研究機構(gòu)不同時間段在信息隱藏領(lǐng)域的研究貢獻(xiàn),制作了研究機構(gòu)的突變圖,如圖5 所示。
Fig.4 Visualization graph of research institutions圖4 研究機構(gòu)可視化圖譜
Fig.5 Research institutional mutation map圖5 研究機構(gòu)突變圖
可以看出,早些時候,英國的薩塞克斯大學(xué)(2011-2013 年)、土耳其的塞爾庫克大學(xué)(2012-2014 年)和馬來西亞的馬來亞大學(xué)(2012-2015 年)在該領(lǐng)域有持續(xù)研究且影響顯著。在國內(nèi),較早涉獵該領(lǐng)域的為大連理工大學(xué)(2014-2016 年)。然而,自2017 年后,南京信息工程大學(xué)在該領(lǐng)域的研究占主導(dǎo)地位,影響強度最大,主要研究方向為搜索式文本無載體信息隱寫;其次為清華大學(xué),影響力僅次于南京信息工程大學(xué),其研究方向主要為生成式無載體文本信息隱寫。在此期間,印度技術(shù)學(xué)院等也是該領(lǐng)域的主力研究機構(gòu)之一。
以文本信息隱藏為主題檢索得到的文獻(xiàn)中,被引量排名前6 位的作者及文獻(xiàn)信息見表2。其中被引頻次最高的為南京信息工程大學(xué)Chen 等[20]于2017 年發(fā)表的名為Coverless Information Hiding Method Based on the Chinese Character Encoding的文獻(xiàn),該文創(chuàng)新性地提出一種基于漢字編碼技術(shù)的無載體信息隱藏方法,設(shè)計了在二進(jìn)制數(shù)與漢字間變換的標(biāo)簽實現(xiàn)對秘密信息的定位。該標(biāo)簽滿足隨機性和通用性要求,采用標(biāo)簽+關(guān)鍵詞的形式在大量文本中搜索載密體,提高了隱蔽通信的安全性和魯棒性。被引頻次排名第2 位的為馬來亞大學(xué)Por Lip Yee 等[31]于2012 年發(fā)表的文獻(xiàn),其實現(xiàn)了一種采用不同編碼將Unicode 空格字符插入到文中不同位置以實現(xiàn)信息隱藏的可逆性方法,不僅提高了嵌入效率和嵌入信息的不可見性,還可以刪除嵌入信息,完全重建原始文檔。被引頻次排名第3 位的文獻(xiàn)[24]首次采用循環(huán)神經(jīng)網(wǎng)絡(luò)自動生成含密載體,創(chuàng)造了生成式文本無載體信息隱藏方法。被引頻次排名第4 和第6位的文獻(xiàn)[32][33]為同一作者,其核心思想是采用壓縮編碼方法將私密信息隱藏在由自然文本組成的文本庫中,構(gòu)造并使用隱藏密鑰以提高安全性。被引頻次排名第5 位的文獻(xiàn)[34]創(chuàng)新性地將敏感的醫(yī)療診斷信息隱藏在自由文本中,以加強對個人隱私的保護(hù)。上述文獻(xiàn)之所以高被引,主要原因是每篇文獻(xiàn)都從信息隱藏的核心技術(shù)和主要應(yīng)用出發(fā),從不同角度創(chuàng)新了隱藏思路,各自代表一種新的文本信息隱藏研究與應(yīng)用方向,對文本無載體信息隱藏方法的發(fā)展起到了引領(lǐng)作用。
對該領(lǐng)域作者進(jìn)行共現(xiàn)分析得到如圖6 所示的合作網(wǎng)絡(luò)圖譜,圖中共包含201 個網(wǎng)絡(luò)節(jié)點,345 條連線,網(wǎng)絡(luò)密度為0.008 8,說明作者的整體分布比較分散。其中,中心性強且合作關(guān)系較為緊密的包括以黃永峰、楊忠良為中心組成的研究團隊,孫星明、吳玉磊等組成的研究團隊,李千目和Milad Taleby Ahvanooey 組成的研究團隊,他們在該領(lǐng)域的研究成果較多,學(xué)術(shù)影響力也較大,貢獻(xiàn)突出。
Table 2 Highly cited article information表2 高被引文獻(xiàn)信息
關(guān)鍵詞是對文獻(xiàn)主題的高度概括,反映了主要研究內(nèi)容和觀點,對一定時間內(nèi)相似文獻(xiàn)的關(guān)鍵詞進(jìn)行統(tǒng)計分析,可體現(xiàn)該段時間內(nèi)相關(guān)領(lǐng)域的研究熱點。圖7 為對200 篇文本信息隱藏主題文獻(xiàn)的295 個關(guān)鍵詞進(jìn)行共現(xiàn)分析的結(jié)果,其網(wǎng)絡(luò)節(jié)點數(shù)為292,連線數(shù)量為680,網(wǎng)絡(luò)密度為0.016,說明聚類效果較好。表3 為以關(guān)鍵詞出現(xiàn)的頻次和中心度為依據(jù)對其進(jìn)行排名的結(jié)果(取前8位)。
分析圖7 和表3 可知,在所有關(guān)鍵詞中,無載體信息隱藏(Coverless Information Hiding)的突現(xiàn)性最強,遠(yuǎn)超出其他主題詞,這說明它將成為今后信息隱藏領(lǐng)域的主要研究方向。顯著性最高的關(guān)鍵詞為隱馬爾科夫模型(Hidden Markov Model),原因是該模型主要用于時序數(shù)據(jù)建模,能夠反映自然語言前后字符之間的相關(guān)性,是語音識別和自然語言處理的主要技術(shù)之一,自然成為文本信息隱藏方法的重要基礎(chǔ)。其次是水?。╓atermarking)和隱寫術(shù)(Steganography),二者屬于信息隱藏的兩大平行分支,它們的主要用途不同,目前水印多應(yīng)用于版權(quán)保護(hù),但技術(shù)方法相似、目的相同。
Fig.6 Author co-occurrence diagram圖6 作者共現(xiàn)圖
Fig.7 Keyword co-occurrence analysis圖7 關(guān)鍵詞共現(xiàn)分析
Table 3 Keyword frequency,centrality表3 關(guān)鍵詞頻次、中心度
關(guān)鍵詞突現(xiàn)分析可反映兩方面內(nèi)容,一是通過某段時間內(nèi)突現(xiàn)的某一關(guān)鍵詞探測和了解該段時間內(nèi)的研究前沿,二是通過各時間段內(nèi)不同關(guān)鍵詞的突現(xiàn)揭示研究前沿的演變過程。圖8 為通過Citespace Ⅴ探測的2010-2021 年期間,以文本信息隱藏為主題突現(xiàn)的前17 位關(guān)鍵詞及其影響力大小,按出現(xiàn)時間排序??梢钥闯?,信息隱藏(Information Hiding)突現(xiàn)時間較早(2011-2015 年),持續(xù)時間最長。其反面技術(shù)分類(Classification)突現(xiàn)時間晚于正面技術(shù)隱藏,但持續(xù)時間也較長(2016-2019 年),這是由于有隱寫技術(shù)就必然會有應(yīng)對措施;其次是隱馬爾可夫模型(Hidden Markov Model)在信息隱藏算法中的應(yīng)用,突現(xiàn)時間為2015-2017 年,強度較大,為1.83。突現(xiàn)強度最大的關(guān)鍵詞為無載體信息隱藏(Coverless Information Hiding),為2.88,持續(xù)時間為2017-2019 年,其余依次為無載體文本信息隱藏(Coverless Text Steganography)、隱寫分析(Text Steganalysis)、隱寫容量(Capacity),突現(xiàn)時間均為2019-2021年,可見這3 個分支是信息隱藏領(lǐng)域的重點研究內(nèi)容,也代表了近年來該領(lǐng)域的研究前沿。
Fig.8 Keyword emergent graph圖8 關(guān)鍵詞突現(xiàn)圖
本文借助科學(xué)文獻(xiàn)計量可視化軟件Citespace 科學(xué)系統(tǒng)地呈現(xiàn)了近年來文本信息隱藏領(lǐng)域的研究概況、前沿和發(fā)展動態(tài),加強并拓展了對文本信息隱藏技術(shù)的認(rèn)識,得出以下結(jié)論并進(jìn)行分析討論:
(1)自信息隱藏學(xué)正式誕生后,相關(guān)文獻(xiàn)發(fā)表數(shù)量穩(wěn)定增長,研究機構(gòu)主要分布在中國、美國、英國和印度,且集中在高校及專業(yè)部門,研究成果和文獻(xiàn)質(zhì)量不斷提升。在2011-2015 年期間,英國的劍橋大學(xué)等高校在信息隱藏領(lǐng)域的研究成果頗多。然而,自2015 年后,中國在無載體信息隱藏研究方面遙遙領(lǐng)先于其他國家且貢獻(xiàn)突出。以中國高校為中心培養(yǎng)的研究人員及合作關(guān)系已分布于全球多數(shù)國家,特別是為亞洲的一些高校培養(yǎng)了中堅研究力量,加快了這些國家在該領(lǐng)域的研究步伐。
(2)研究前沿代表一個領(lǐng)域的研究方向,知識基礎(chǔ)可以進(jìn)一步明晰研究前沿的變革方向。知識基礎(chǔ)在很大程度上是由科學(xué)文獻(xiàn)的知識流動匯聚而來,通過對文本信息隱藏領(lǐng)域的文獻(xiàn)進(jìn)行分析,獲得該領(lǐng)域參考文獻(xiàn)的共被引網(wǎng)絡(luò),進(jìn)而得到該領(lǐng)域的知識基礎(chǔ)。通過深度挖掘和分析,本文研究文獻(xiàn)共被引網(wǎng)絡(luò)中典型節(jié)點的主要思想體現(xiàn)在兩個方面:其一是通過挖掘構(gòu)成文本的字、詞、句子特征,提煉不同載體實現(xiàn)隱寫的思想,結(jié)合構(gòu)成文本要素的特征,將已成功應(yīng)用于其他載體的隱藏算法思想遷移到文本載體的信息隱寫上,最大化利用原始文本的冗余隱藏私密信息;其二是利用神經(jīng)網(wǎng)絡(luò)直接構(gòu)建文本生成式隱寫模型,同時設(shè)計適合的編碼機制,高效地將私密信息嵌入在生成的文本中。目前,文本信息隱藏的知識基礎(chǔ)主要涉及自然語言處理技術(shù)、編碼技術(shù)、基于語言相關(guān)性的生成模型等方面。
(3)信息隱藏即充分利用載體的冗余度嵌入私密信息,使得嵌入信息與載體渾然一體,掩蓋隱藏的內(nèi)容和行為。因此,文本信息隱藏的關(guān)鍵為解決隱藏信息與自然文本的融合度問題,即隱蔽性和安全性問題。在滿足安全性的前提下,應(yīng)盡可能提高隱藏容量,這是所有隱藏方法追求的共同目標(biāo)。傳統(tǒng)的修改式文本信息隱藏方法會或多或少地改變文本自身的屬性和結(jié)構(gòu)而留有痕跡,難以抵抗變換和統(tǒng)計檢測。因此,后來的研究思路轉(zhuǎn)變?yōu)闊o需修改載體的無載體信息隱藏,即以私密信息為導(dǎo)向,將私密信息加上隱秘標(biāo)簽,在大量文本數(shù)據(jù)庫中匹配相應(yīng)的文本或生成含密文本,不對原有文本進(jìn)行修改。搜索式文本隱藏技術(shù)的關(guān)鍵在于隱秘標(biāo)簽選取和高質(zhì)量標(biāo)簽+私密信息索引庫構(gòu)建,目的是提高隱藏容量和算法效率。而生成式文本隱藏主要通過隱藏信息的編碼或映射轉(zhuǎn)換規(guī)則的設(shè)定,以及采用深度學(xué)習(xí)和知識圖譜技術(shù)構(gòu)建文本生成模型,以生成自然流暢、語義連貫和富有情感的高質(zhì)量文本。
(1)隱藏容量低。相較于圖像、視頻等載體,文本的冗余空間很小,可提供的隱藏空間也小。對于修改式文本信息隱藏,如果對文本的格式或內(nèi)容進(jìn)行大量修改以提高隱藏容量,那么隱蔽性便會降低??尚械慕鉀Q辦法是采用壓縮編碼的方式對嵌入的信息進(jìn)行壓縮處理,在減小嵌入信息空間的同時保持一定的隱藏容量。對于搜索式無載體文本信息隱藏,由于受定位標(biāo)簽協(xié)議和詞轉(zhuǎn)換協(xié)議的影響,隱藏容量十分受限,其未來研究重點為定位標(biāo)簽協(xié)議和詞轉(zhuǎn)換協(xié)議的精細(xì)化、簡約化和隨機化,在提高隱藏容量的同時保證安全性。生成式文本信息隱藏的嵌入率受生成文本質(zhì)量的約束,換句話說,嵌入率的提高會降低文本生成的質(zhì)量,可能的改進(jìn)方向是優(yōu)化深度學(xué)習(xí)的文本生成語言模型,自適應(yīng)調(diào)整信息嵌入,使生成的文本情感和主題可控。
(2)魯棒性低。由于文本格式的脆弱性,基于文本格式的信息隱藏均難以抵抗謄寫、重抄、縮放等攻擊手段。其他形式的文本信息隱藏亦容易受到增加、刪除、替換和篡改等攻擊,進(jìn)而導(dǎo)致信息無法正確提取。對于受局部攻擊造成信息缺失的問題,可以采用數(shù)據(jù)編碼檢驗的方法;對于整體受攻擊引起的信息無法正確傳輸問題,應(yīng)考慮提高隱蔽通信系統(tǒng)的安全性。
(3)算法通用性不強。目前大多數(shù)文本信息隱藏方法是針對某些語言的字詞特征或某種文本格式的特征設(shè)計的專用算法,很難有一個適用于多種語言、多種格式的隱藏算法,可移植性較低。今后的研究應(yīng)盡可能地融合多種算法的優(yōu)勢,或?qū)⒉煌d體的算法有機結(jié)合,例如將適用于文本與圖像載體的算法有機結(jié)合,以提高算法的穩(wěn)健性,使得針對文本隱藏的攻擊方法失效;亦可將搜索式算法與生成式算法相結(jié)合,提高生成文本的自然度。在隱藏算法通用性方面的突破必然會促進(jìn)文本信息隱藏領(lǐng)域的快速發(fā)展。
本文以文本信息隱藏領(lǐng)域相關(guān)文獻(xiàn)為基礎(chǔ),從其發(fā)文量、作者國家及研究機構(gòu)分布、關(guān)鍵詞共現(xiàn)和文獻(xiàn)共被引等方面分析了該領(lǐng)域的知識基礎(chǔ)、發(fā)展概況、研究熱點變遷和存在的問題。研究結(jié)果顯示,近年來,雖然該領(lǐng)域文獻(xiàn)數(shù)量快速增長,但其研究機構(gòu)仍然集中在高等院校,且機構(gòu)間合作較少。同時,其研究重點正逐步轉(zhuǎn)向無載體文本信息隱藏以及對應(yīng)的隱寫分析技術(shù)。該研究結(jié)果旨在為文本信息隱藏領(lǐng)域的科研工作者提供可借鑒信息,以促進(jìn)文本信息隱藏技術(shù)更好更快發(fā)展。