顧偉
摘 要:文章通過分析可逆信息隱藏技術(shù)在電子檔案利用領(lǐng)域的適用性,提出了一種基于可逆信息隱藏技術(shù)的電子檔案保真利用模型,并給出了電子檔案保真利用系統(tǒng)的實(shí)現(xiàn)流程和預(yù)期效果評價。與其他技術(shù)方法相比,可逆信息隱藏技術(shù)能夠不依賴于外部條件獨(dú)立完成電子檔案真實(shí)性的“自我證明”,更適合電子檔案利用過程中的保真利用需求。
關(guān)鍵詞:可逆信息隱藏;電子檔案;保真;檔案利用
分類號:G270.7
Research on Fidelity Utilization of Electronic Archives Based on Reversible Information Hiding Technology
Gu Wei
( Anhui University Archives, Hefei, Anhui 230039 )
Abstract: Based on the analysis of the applicability of reversible information hiding technology in the field of electronic archives
utilization, this paper puts forward an electronic archives fidelity utilization model based on reversible information hiding technology, and gives the implementation process and expected effect evaluation of electronic archives fidelity utilization system. Compared with other technical methods, this technology can independently complete the "self certification" of the authenticity of electronic archives without relying on external conditions. Therefore, it is more suitable for the fidelity application needs in the process of electronic archives utilization.
Keywords: Reversible Information Hiding; Electronic Archives; Fidelity; Utilization of Archives
長期以來,對電子檔案真實(shí)性的質(zhì)疑制約著電子檔案的廣泛利用及憑證價值的發(fā)揮。“來源可靠、程序規(guī)范、要素合規(guī)”可以保障電子檔案在“收”和“管”過程中的真實(shí)性,卻無法保障其在“用”這一過程中的真實(shí)性。在檔案分發(fā)、傳遞等利用環(huán)節(jié)中,電子檔案極易被篡改而無法“自證清白”。從本質(zhì)上說,檔案的真實(shí)性來源于檔案的原始記錄性,而電子檔案信息與載體的可分離使得電子檔案的“原始記錄性”無法沿用紙質(zhì)檔案“原件”鑒定法來驗(yàn)證,[1]進(jìn)而影響了檔案利用者對電子檔案真實(shí)性的認(rèn)可。
相關(guān)學(xué)者對電子檔案保真問題開展了研究,如張寧[2]從概念入手,構(gòu)建了電子文件真實(shí)性認(rèn)定與保障體系框架模型;趙屹[3]對各種電子文件防篡改技術(shù)做了分析,并指出技術(shù)發(fā)展對檔案管理的影響;傅榮校[4]從檔案機(jī)構(gòu)的角度切入,研究了電子文件真實(shí)性保障機(jī)制;駱建珍[5]等人從電子文件歸檔、移交接收和長期保存三個環(huán)節(jié)對電子檔案真實(shí)性檢測內(nèi)容進(jìn)行分析并提出相應(yīng)的檢測方法。這些研究雖然能夠幫助厘清電子檔案真實(shí)性保護(hù)內(nèi)容與方式,但缺乏如何在利用過程中確保電子檔案真實(shí)性的探討。隨著近些年計算檔案學(xué)的興起和發(fā)展,徐彤陽[6]提出可以采用被動檢測技術(shù)對照片檔案的真實(shí)性進(jìn)行鑒定;余彩霞[7]提出可以利用數(shù)字水印方法,解決電子文件的安全傳遞問題。本文基于已有研究成果,提出了一種“可逆”條件下的基于信息隱藏技術(shù)的電子檔案保真利用方法,以幫助保障電子檔案利用過程中的真實(shí)性。
1 可逆信息隱藏技術(shù)在電子檔案利用領(lǐng)域的適用性分析
信息隱藏技術(shù)作為一種技術(shù)手段,已被廣泛運(yùn)用于軍事、通訊、醫(yī)藥行業(yè)的信息防篡改、版權(quán)保護(hù)、防偽認(rèn)證等領(lǐng)域。其是指將人眼不可識別或不可見的信息“脆弱”地隱藏于文本、照片、音視頻等電子檔案中,并能實(shí)現(xiàn)“脆弱”信息的無損提取。所謂“脆弱”可以理解為一觸即碎。當(dāng)電子檔案未被篡改時,“脆弱”信息可以被原樣提??;當(dāng)電子檔案被篡改時,“脆弱”信息也將隨之發(fā)生變化,因而能夠發(fā)現(xiàn)電子檔案已被篡改。同時,根據(jù)電子檔案能否恢復(fù)原樣,信息隱藏技術(shù)又可分為可逆信息隱藏技術(shù)和不可逆信息隱藏技術(shù)。
相比較而言,可逆信息隱藏技術(shù)更適用于電子檔案利用過程的真實(shí)性鑒定,主要原因在于:首先,信息是以不可見的方式隱藏于電子檔案中,這種不可見性體現(xiàn)在三個方面。一是視覺上的不可見,信息以人眼不可感知的方式隱藏于電子檔案中,因此不會影響電子檔案的正常閱讀和使用;二是內(nèi)容的不可見,可以通過加密變換的方式將明文信息變換成加密信息流進(jìn)行隱藏,一般而言,隱藏的是電子檔案的元數(shù)據(jù)或特征信息,這種方式可以防止算法被破解后信息的泄露;三是隱藏方式的不可見,隱藏信息并不簡單附著于電子檔案的空白位置,而是通過計算機(jī)算法,以融合的方式與電子檔案內(nèi)容合二為一,并不影響電子檔案的文件結(jié)構(gòu)和數(shù)據(jù)內(nèi)容。
其次,“藏”的目的在于檢驗(yàn)電子檔案的真實(shí)性,這種檢驗(yàn)不能以破壞電子檔案為代價,任何一種檢驗(yàn)電子檔案真實(shí)性的方法都必須能夠“可逆”地將電子檔案恢復(fù)成原始狀態(tài),保證恢復(fù)后的電子檔案與隱藏信息前的電子檔案在內(nèi)容、元數(shù)據(jù)、結(jié)構(gòu)等方面完全一致,以保持電子檔案的原始記錄性。由于信息隱藏算法的“嵌入—提取”是一個“可逆”的過程,因此可以將含有隱藏信息的電子檔案無差別地還原成嵌入隱藏信息前的初始狀態(tài),保證電子檔案不會因?yàn)樾畔⒌那度攵l(fā)生不可逆的變化。
再次,可逆信息隱藏技術(shù)可以不依賴外部條件獨(dú)立完成對電子檔案真實(shí)性的鑒定,實(shí)現(xiàn)真實(shí)性的“自我證明”。在驗(yàn)證電子檔案真?zhèn)螘r,只需提取隱藏信息,并與原始信息做比較即可證明,無需其他任何輔助信息幫助判定。同時,該技術(shù)的安全性由信息隱藏算法保證,信息隱藏算法的時間復(fù)雜度和空間復(fù)雜度相對較低,尤其是信息隱藏的“提取”方法都較為簡單、便捷,因而能實(shí)現(xiàn)電子檔案的快速鑒真,具備較高的可行性。
2 基于可逆信息隱藏技術(shù)的電子檔案保真利用模型
基于可逆信息隱藏技術(shù)的電子檔案保真利用模型如圖1所示。電子檔案即為受保護(hù)的客體,也是信息隱藏的載體,可以是文本、照片、聲音、視頻等任何類型的電子檔案。隱藏信息是嵌入電子檔案的信息,可以是一段文字、一幅圖片,也可以是公開的明文、不公開的密文。[8]
整個模型可分為信息隱藏、電子檔案利用、電子檔案鑒真和電子檔案還原四個模塊。其中,信息隱藏模塊是整個模型的關(guān)鍵,作用是將信息以不可見的方式“藏”入電子檔案中,輸出含有隱藏信息的電子檔案。電子檔案利用模塊負(fù)責(zé)電子檔案的分發(fā)、傳遞和利用,將含有隱藏信息的電子檔案傳遞給檔案利用者。電子檔案鑒真模塊是對電子檔案真實(shí)性進(jìn)行鑒定,可以認(rèn)為是信息隱藏模塊的“逆過程”,檔案利用者提取電子檔案中的隱藏信息,并與原先的信息作比對,若二者相同則判定電子檔案未被篡改,反之,電子檔案則已被篡改。電子檔案還原模塊的作用就是根據(jù)可逆恢復(fù)算法,將電子檔案“逆向”還原成原始狀態(tài)。
2.1 隱藏信息“嵌入”過程
將信息隱藏于電子檔案的過程如圖2所示。首先,采用加密、置亂等方式對隱藏信息進(jìn)行預(yù)處理,生成一串二進(jìn)制信息流;之后,根據(jù)電子檔案的表現(xiàn)形式和數(shù)據(jù)特點(diǎn)選擇合適的信息隱藏方法。文本類型的電子檔案可以選擇基于文檔結(jié)構(gòu)、文檔格式和自然語言處理的嵌入方法;以數(shù)字化掃描件形式存在的電子檔案,可以選擇直方圖移位、差值擴(kuò)展、像素值排序的嵌入方法,執(zhí)行相應(yīng)的算法步驟,生成含有“不可見”隱藏信息的電子檔案。
2.2 隱藏信息“提取”與電子檔案“可逆”恢復(fù)過程
隱藏信息的提取與電子檔案“可逆”還原是同一過程的不同方面。信息提取的目的在于提取并驗(yàn)證隱藏信息,以完成對電子檔案真實(shí)性的驗(yàn)證;電子檔案“可逆”還原的目的在于去除隱藏于電子檔案中的信息,將電子檔案恢復(fù)至初始狀態(tài)以保證電子檔案的原始性。隱藏信息的提取首先需根據(jù)算法,提取電子檔案中的二進(jìn)制信息流,之后對信息流進(jìn)行解密、反置亂等操作,恢復(fù)隱藏信息,若恢復(fù)后的隱藏信息與原隱藏信息一致,則證明該電子檔案是真實(shí)的。電子檔案的“可逆”還原首先是將電子檔案中的隱藏信息“刪除”,再根據(jù)算法的“可逆性”,以“逆向變換”的方式將電子檔案還原成原始狀態(tài)。隱藏信息的提取和電子檔案的還原均是由可逆信息隱藏算法本身所保證的。
3 可逆信息隱藏技術(shù)與其他防篡改技術(shù)的比較
可逆信息隱藏技術(shù)作為一種電子檔案防篡改方法,與文件固化技術(shù)、哈希值校驗(yàn)技術(shù)、數(shù)字簽名技術(shù)和區(qū)塊鏈技術(shù)[9-10]等典型應(yīng)用技術(shù)相比,在技術(shù)思路、實(shí)現(xiàn)方式和應(yīng)用場景等方面存在較多的不同,主要區(qū)別如表1所示。
文件固化技術(shù)是利用XML技術(shù)將電子檔案的數(shù)據(jù)、元數(shù)據(jù)及文件修改記錄固化成PDF或OFD版式文件,使之只能以“只讀”方式進(jìn)行流轉(zhuǎn)和處理。這種技術(shù)方式在實(shí)現(xiàn)電子檔案防篡改目的的同時,限制了電子文件的流轉(zhuǎn)格式,對電子檔案長期保存來說是有利的,但不利于電子檔案的廣泛利用。
哈希值校驗(yàn)技術(shù)是一種經(jīng)典的篡改檢測方法,其是對電子檔案進(jìn)行哈希運(yùn)算,生成長度固定且唯一的特征“指紋”值,若電子檔案發(fā)生變動,其哈希值也會隨之發(fā)生改變。這種方法需要單獨(dú)保存每個電子檔案所對應(yīng)的哈希值,占用額外的存儲空間;同時,在鑒別電子檔案真?zhèn)螘r,該方法要重新計算電子檔案的哈希值以做比較,因此時間復(fù)雜度和空間復(fù)雜度相對較高。
數(shù)字簽名技術(shù)也是一種基于哈希算法的證明方法,通過CA認(rèn)證實(shí)現(xiàn)對電子檔案發(fā)送方身份信息和電子檔案內(nèi)容的認(rèn)證,能夠有效維護(hù)電子檔案的真實(shí)完整性。但是,這種方法需要申請CA認(rèn)證,并不適用于廣泛的檔案利用服務(wù)工作。
區(qū)塊鏈技術(shù)是在網(wǎng)絡(luò)上利用共識機(jī)制實(shí)現(xiàn)對電子檔案真實(shí)性的判定,適用于鏈上電子檔案真實(shí)性認(rèn)證,但當(dāng)電子檔案處于離線“鏈下”狀態(tài)時,該方法便不再適用。
可逆信息隱藏技術(shù)與其他方法相比,在技術(shù)思路上,不再是采用“被動認(rèn)證”的方式檢測電子檔案的真實(shí)性,而是采用“主動嵌入”的方式對電子檔案內(nèi)容進(jìn)行真實(shí)性驗(yàn)證。該方法不需要額外存儲空間保存隱藏信息,同時具有內(nèi)容與載體的不可分離性、鑒別過程的便利性和自證性等特點(diǎn),因而適合于各種場景下電子檔案的真實(shí)性鑒定。
4 基于可逆信息隱藏技術(shù)的電子檔案保真利用系統(tǒng)的實(shí)現(xiàn)與預(yù)期效果
4.1 實(shí)現(xiàn)流程
收集完成后的電子檔案一般存放在電子檔案管理系統(tǒng)中,檔案利用者在履行檔案利用手續(xù)后,可以通過文件權(quán)限管理和網(wǎng)絡(luò)訪問控制程序下載電子檔案。之后,檔案利用者出于各種原因?qū)㈦娮訖n案分發(fā)、傳遞給第三方單位。例如,公民為辦理相關(guān)業(yè)務(wù)需要向政府職能部門提供個人民生檔案,畢業(yè)生需要向用人單位提供相關(guān)證明材料等,便可利用可逆信息隱藏技術(shù),實(shí)現(xiàn)對電子檔案材料真實(shí)性的驗(yàn)證,具體流程如圖3所示。
4.2 預(yù)期效果
可逆信息隱藏技術(shù)適用場景較廣、實(shí)用性較強(qiáng)、流程邏輯較清晰,具有實(shí)際應(yīng)用價值和推廣利用價值,能夠在電子檔案保真利用中取得較好的預(yù)期應(yīng)用效果。
首先,由于隱藏信息在視覺上不可感知,用戶無法肉眼查看隱藏信息的存在,因此可以在一定程度上降低攻擊者利用技術(shù)手段擦除隱藏信息的可能。其次,電子檔案真實(shí)性鑒定過程操作簡便,隱藏信息提取流程簡單,檢測方法的時間復(fù)雜度低、空間復(fù)雜度小,檢測結(jié)果能夠即時生成,能夠?qū)崿F(xiàn)對電子檔案真實(shí)性的實(shí)時驗(yàn)證。再次,采用可逆信息隱藏技術(shù)鑒定電子檔案真實(shí)性時,現(xiàn)有的電子檔案在收集、歸檔、整理、保管等環(huán)節(jié)的業(yè)務(wù)流程均不需要改動。只需要在電子檔案授權(quán)給檔案利用者前,調(diào)用信息隱藏模塊,將信息隱藏于電子檔案中;在需要驗(yàn)證該電子檔案真實(shí)性時,調(diào)用信息提取模塊即可,而不需其他輔助信息,適用場景廣泛,既可以在網(wǎng)絡(luò)環(huán)境下完成驗(yàn)證,又可以在離線場景下獨(dú)立完成鑒定。最后,該方法不僅能夠驗(yàn)證電子檔案真實(shí)性,還能將電子檔案無損還原為初始狀態(tài),有效維護(hù)電子檔案的原始記錄性。
*本文系國家檔案局科技項(xiàng)目“新技術(shù)環(huán)境下電子照片檔案真實(shí)性保存與利用研究”(項(xiàng)目編號:2020-X-058)階段性研究成果。
注釋與參考文獻(xiàn)
[1]劉世明,劉新安.檔案真實(shí)屬性的研究[J].檔案學(xué)研究,2002(4):3-5+10.
[2]張寧.電子文件真實(shí)性的再認(rèn)識[J].檔案學(xué)研究,2012(4):12-16.
[3][10]趙屹.電子文件防篡改技術(shù)發(fā)展對檔案管理的影響及啟示[J].檔案學(xué)研究,2019(6):77-85.
[4]傅榮校.化繁為簡:從檔案機(jī)構(gòu)角度看如何保障電子文件的真實(shí)性[J].檔案學(xué)通訊,2015(2):50-55.
[5]駱建珍,楊安榮,馬來娣.電子檔案“四性”檢測要求及其實(shí)現(xiàn)方法[J].浙江檔案,2017(12):27-30.
[6]徐彤陽,尹凱.基于計算機(jī)技術(shù)鑒定數(shù)碼照片檔案真?zhèn)蔚难芯縖J].檔案學(xué)研究,2018(5):107-111.
[7]余彩霞,姚曄.基于不可見水印的電子文件傳遞安全策略探析[J].檔案學(xué)通訊,2019(1):40-46.
[8]何順,姚劍波,梁海英.一種改進(jìn)的基于JPEG圖像可逆水印算法[J].計算機(jī)仿真,2020,37(8):219-223.
[9]馬仁杰,李夢云.關(guān)于區(qū)塊鏈技術(shù)應(yīng)用于我國檔案利用工作的若干問題[J].中國檔案,2020(11):76.