袁雙云 王仁秋 張 莉/攀枝花學(xué)院檔案館
隨著檔案信息化工作的深入開展,電子檔案數(shù)據(jù)量呈指數(shù)級(jí)增長,磁盤作為計(jì)算機(jī)系統(tǒng)常用的大容量存儲(chǔ)設(shè)備,已成為電子檔案的主要存儲(chǔ)介質(zhì)。磁盤包括軟盤和硬盤,由于軟盤已基本淘汰,現(xiàn)在的磁盤通常都是硬盤,本文所指磁盤即是硬盤。如中國美術(shù)學(xué)院綜合檔案室引入磁盤陣列存儲(chǔ)系統(tǒng)技術(shù),解決了數(shù)字檔案存儲(chǔ)空間不足的問題,從根本上滿足了檔案網(wǎng)絡(luò)管理系統(tǒng)對海量電子檔案數(shù)據(jù)的遠(yuǎn)程在線傳輸及后期存儲(chǔ)空間擴(kuò)容的基本需求[1]。以磁盤為存儲(chǔ)載體的電子檔案可以被稱為磁盤檔案。電子檔案安全問題是當(dāng)前檔案信息化研究的熱點(diǎn)。通過對中國知網(wǎng)的檢索可以發(fā)現(xiàn),以電子檔案安全為主題的研究很多,但針對硬盤或磁記錄載體檔案安全的研究卻很少,且現(xiàn)有研究主要集中在磁盤檔案的初級(jí)保護(hù)上,對更深層次的安全存儲(chǔ)保護(hù)技術(shù)的研究和探討還比較少,尤其對磁盤檔案安全刪除的研究存在明顯不足。
當(dāng)前,磁盤檔案所面臨的安全問題主要有以下幾種。一是病毒攻擊所帶來的安全問題。磁盤是計(jì)算機(jī)系統(tǒng)中最重要的存儲(chǔ)設(shè)備,針對磁盤數(shù)據(jù)的攻擊往往是病毒的攻擊重點(diǎn)。據(jù)不完全統(tǒng)計(jì),對計(jì)算機(jī)磁盤數(shù)據(jù)有惡意攻擊意圖的病毒超過10萬種,而且傳播非常迅速,如CIH、沖擊波、敲詐者、灰鴿子等。病毒攻擊可直接導(dǎo)致檔案數(shù)據(jù)丟失、泄露、被篡改,一旦被感染數(shù)據(jù)難以恢復(fù),危害程度極高;且病毒攻擊具有較高的隱秘性,不易被發(fā)現(xiàn)。
二是人為操作不當(dāng)所帶來的安全問題。對計(jì)算機(jī)及磁盤操作不當(dāng)將導(dǎo)致磁盤故障或磁盤檔案信息丟失,操作不當(dāng)包括對磁盤使用不當(dāng)、保管不當(dāng)以及對數(shù)據(jù)的誤刪除、誤格式化等。其中誤刪除的數(shù)據(jù)較容易恢復(fù),只要用戶不再對磁盤進(jìn)行二次讀寫操作,借助相關(guān)專業(yè)軟件即可恢復(fù);一般的誤格式化數(shù)據(jù)也可以恢復(fù),不過使用格式化命令進(jìn)行低級(jí)格式化的數(shù)據(jù)則很難恢復(fù)。
三是磁盤故障所帶來的安全問題。磁盤故障有物理故障和邏輯故障兩種。物理故障包括固件損壞、電路板損壞、磁頭損壞等,通常表現(xiàn)為系統(tǒng)不識(shí)別盤、電機(jī)不轉(zhuǎn)、發(fā)出咔嚓咔嚓聲、無法格式化等。磁盤出現(xiàn)物理故障需由專業(yè)人員進(jìn)行修復(fù),只要操作得當(dāng)數(shù)據(jù)一般能夠恢復(fù)。磁盤的邏輯故障是由于病毒攻擊、人為誤操作等導(dǎo)致磁盤MBR(主引導(dǎo)記錄)損壞、分區(qū)表丟失等,通常表現(xiàn)為系統(tǒng)無法啟動(dòng)、無法正確讀取文件、系統(tǒng)報(bào)錯(cuò)、文件丟失等。出現(xiàn)邏輯故障后,用戶千萬不能再往丟失數(shù)據(jù)的分區(qū)或磁盤寫數(shù)據(jù),如系統(tǒng)盤數(shù)據(jù)丟失也不要重啟電腦,否則會(huì)有很多臨時(shí)文件寫入系統(tǒng)區(qū),導(dǎo)致原數(shù)據(jù)被覆蓋。只要數(shù)據(jù)區(qū)沒有被覆蓋,借助專業(yè)軟件,因邏輯故障而丟失的數(shù)據(jù)一般可以恢復(fù)。
在NTFS(New Technology File System)文件系統(tǒng)管理下,磁盤檔案的存儲(chǔ)有物理存儲(chǔ)與邏輯存儲(chǔ)兩種方式。磁盤片經(jīng)格式化后被劃分成物理扇區(qū),磁盤的磁面、磁道和扇區(qū)即標(biāo)識(shí)了數(shù)據(jù)存儲(chǔ)的物理位置。NTFS文件系統(tǒng)通過建立索引關(guān)系將物理位置轉(zhuǎn)換成邏輯位置,再把數(shù)據(jù)分配到對應(yīng)的邏輯扇區(qū),這樣就形成了數(shù)據(jù)的邏輯存儲(chǔ)?,F(xiàn)有的磁盤數(shù)據(jù)存儲(chǔ)技術(shù)是基于磁盤的物理存儲(chǔ)與邏輯存儲(chǔ),同時(shí)為滿足海量數(shù)據(jù)的存儲(chǔ)需要而產(chǎn)生的磁盤存儲(chǔ)體系結(jié)構(gòu)。要根據(jù)磁盤檔案的數(shù)據(jù)量、安全級(jí)別及所需成本,選擇合適的存儲(chǔ)技術(shù)。
數(shù)據(jù)加密是指將一段明文通過加密算法和加密秘鑰轉(zhuǎn)換成密文的過程,數(shù)據(jù)加密技術(shù)是實(shí)現(xiàn)數(shù)據(jù)安全存儲(chǔ)的最常用技術(shù)。磁盤檔案的數(shù)據(jù)以扇區(qū)為基本存儲(chǔ)單位,長度固定,因此要求加密算法的輸出數(shù)據(jù)長度固定不變,并且各扇區(qū)間的數(shù)據(jù)相互獨(dú)立。適用于磁盤檔案的加密算法有對稱加密算法DES、AES、3DES等。
目前,針對磁盤的數(shù)據(jù)加密技術(shù)具有硬件加密和軟件加密兩種方式。硬件加密指直接添加新的硬件單元,從電路級(jí)別對磁盤數(shù)據(jù)進(jìn)行保護(hù),如基于FPGA技術(shù)[2]的硬盤數(shù)據(jù)加密系統(tǒng)、YBM Technologies公司設(shè)計(jì)的個(gè)人計(jì)算機(jī)磁盤保護(hù)系統(tǒng)(HDPS)[3]等;軟件加密指依賴應(yīng)用程序、文件系統(tǒng)或操作系統(tǒng)限制對磁盤進(jìn)行讀寫訪問。軟件加密存在加解密速度慢、安全性不高的問題,硬件加密的安全性較高,不過基本都已形成專利,其使用成本較高。
數(shù)據(jù)隱藏指將某一簽字信號(hào)嵌入主信號(hào)的過程,主信號(hào)經(jīng)信息嵌入變成一個(gè)偽裝媒體。數(shù)據(jù)隱藏也叫做數(shù)字水印,它與數(shù)據(jù)加密不同,數(shù)據(jù)加密是隱藏信息的內(nèi)容,而數(shù)據(jù)隱藏是隱藏信息的存在性,使數(shù)據(jù)不容易引起攻擊者的注意,可以說數(shù)據(jù)隱藏比數(shù)據(jù)加密更為安全。
數(shù)據(jù)隱藏技術(shù)起源于1994年的IEEE國際圖像處理會(huì)議,會(huì)上Van Schyndel[4]等學(xué)者第一次明確提出了“數(shù)字水印”的概念,從此掀起了現(xiàn)代數(shù)據(jù)隱藏技術(shù)研究的高潮。在美國,許多知名大學(xué)和研究機(jī)構(gòu)一直致力于數(shù)據(jù)隱藏技術(shù)的研究并取得了大量研究成果,如麻省理工學(xué)院的媒體實(shí)驗(yàn)室、南加州大學(xué)、IBM公司等。目前,數(shù)據(jù)隱藏技術(shù)已廣泛應(yīng)用于通信、網(wǎng)絡(luò)、媒體傳播等領(lǐng)域,磁盤檔案應(yīng)用數(shù)據(jù)隱藏技術(shù)主要是為了確保檔案數(shù)據(jù)的完整性并進(jìn)行數(shù)據(jù)完整性鑒定。檔案數(shù)據(jù)鑒定過程通常由兩部分組成:一是通過水印嵌入系統(tǒng)對真實(shí)的原始檔案數(shù)據(jù)進(jìn)行修改或在其上附加其他數(shù)據(jù);二是通過水印檢測系統(tǒng)檢測可能發(fā)生的篡改操作及其具體內(nèi)容。鑒定所用的水印算法有脆弱型與半脆弱型[5]等。
磁盤的使用壽命不長,有研究表明,磁盤工作4至6年后會(huì)進(jìn)入耗損失效期[6],因此一般磁盤在使用4年后便要對磁盤檔案進(jìn)行備份遷移。磁盤若使用不當(dāng)會(huì)加速其損壞,因此使用過程中應(yīng)注意以下幾點(diǎn):一是控制溫度,磁盤的工作環(huán)境溫度一般要控制在55℃以內(nèi),溫度過高磁盤壽命將縮短,可以在機(jī)箱內(nèi)加裝風(fēng)扇來降低溫度;二是避免振動(dòng),尤其是機(jī)械磁盤,在使用過程中出現(xiàn)劇烈振動(dòng),磁頭可能撞擊磁盤,直接導(dǎo)致磁頭和盤面損壞;三是安全停止磁盤,磁盤使用時(shí)都在高速旋轉(zhuǎn),突然的關(guān)機(jī)或斷電將使磁頭與盤片猛烈摩擦,容易導(dǎo)致壞道甚至損壞;四是減少頻繁操作,頻繁的讀寫操作會(huì)產(chǎn)生大量磁盤碎片,甚至產(chǎn)生磁盤壞道;五是遠(yuǎn)離磁場。
NTFS磁盤文件由引導(dǎo)扇區(qū)、NTLDR(NT加載程序)、MFT(主控文件表)、文件存儲(chǔ)區(qū)四部分組成,在NTFS卷中刪除一個(gè)文件時(shí)系統(tǒng)實(shí)際只做了3處修改,一是該文件MFT頭偏移16H處的一個(gè)字節(jié);二是其父文件夾的INDEX-ROOT屬性或者INDES-ALLOCATION;三是在位圖元數(shù)據(jù)文件中把該文件所占用的簇對應(yīng)位置置0。從刪除文件的原理可知,系統(tǒng)對于NTFS卷文件的刪除是很不徹底的,首先在MFT部分僅僅修改了文件頭,而對10H、30H、80H屬性沒有任何改變;其次對于文件數(shù)據(jù)區(qū)的內(nèi)容沒有作任何修改。所以利用一定的工具軟件或直接通過手工操作完全有可能將刪除的文件信息恢復(fù)出來,如果這些檔案數(shù)據(jù)被非法利用,將直接威脅檔案安全,甚至造成泄密事故。因此要安全徹底刪除NTFS磁盤檔案數(shù)據(jù),不僅要把文件數(shù)據(jù)區(qū)內(nèi)容完全覆蓋掉,還需要?jiǎng)h除MFT區(qū)數(shù)據(jù)。
NTFS的文件數(shù)據(jù)區(qū)內(nèi)容的安全刪除通常采用的是文件覆蓋技術(shù),即通過創(chuàng)建一個(gè)函數(shù)將文件內(nèi)容讀出,然后在緩沖區(qū)中將文件的內(nèi)容覆蓋。絕大部分徹底刪除工具都是通過此技術(shù)實(shí)現(xiàn),把無用的數(shù)據(jù)反復(fù)寫入刪除文件的數(shù)據(jù)區(qū),進(jìn)行多次覆蓋,從而達(dá)到完全刪除文件的目的。如美國國防部對于磁介質(zhì)(固定磁盤或移動(dòng)硬盤)上敏感數(shù)據(jù)的安全刪除有專門標(biāo)準(zhǔn)DOD 5220.22-M,其定義的覆蓋規(guī)范是3次:第一次對于磁盤上的每個(gè)二進(jìn)制位采用0來填充;第二次對于磁盤上的每個(gè)二進(jìn)制位采用1來填充;第三次對于磁盤上的每個(gè)二進(jìn)制位隨機(jī)采用0或1來填充。
NTFS文件的MFT區(qū)記錄了文件名、文件的創(chuàng)建日期和修改日期等信息。通常情況下,NTFS卷的MFT功能只能采用磁盤扇區(qū)的直接讀寫來完成,而且需要編制大量代碼。采用文件重命名技術(shù)可以大大簡化操作,代碼簡單可行,可以覆蓋原文件名等信息。文件重命名技術(shù)即首先隨機(jī)產(chǎn)生一個(gè)字符串,然后用該字符串替換需要安全刪除的文件名。
在網(wǎng)絡(luò)信息時(shí)代,沒有絕對的數(shù)據(jù)安全,計(jì)算機(jī)技術(shù)在發(fā)展的同時(shí),相應(yīng)的攻擊和漏洞也會(huì)隨之而生。本文所探討的安全存儲(chǔ)技術(shù)和安全刪除是當(dāng)前計(jì)算機(jī)領(lǐng)域較成熟的數(shù)據(jù)安全保障技術(shù),可以在一定程度上確保磁盤檔案數(shù)據(jù)安全,提高檔案數(shù)據(jù)的可靠性;安全刪除技術(shù)則可以確保NTFS磁盤檔案在進(jìn)入到刪除銷毀階段時(shí)數(shù)據(jù)得到徹底刪除,避免因刪除不徹底而導(dǎo)致檔案泄密事故。
注釋與參考文獻(xiàn):
[1]洪昉霖,馬麗華.磁盤陣列存儲(chǔ)系統(tǒng)在檔案保管中的應(yīng)用[J].浙江檔案.2015(11):61.
[2]苗勝,張新家,曹衛(wèi)兵等.磁盤數(shù)據(jù)加密系統(tǒng)的設(shè)計(jì)及其FPGA實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用研究,2004,21(10):217-219.
[3]Fisherman,et al.Personal Computer Hard Disk Protection System[P/OL].[1997-08-12].http://patft.uspto.gov.
[4]R.G.van.Schyndel,A.Z.Tirkel,and C.F.Osbome.A dgital watermark[C].International Conference on Image Processing,IEEE,U.S.A:Austin,1994:86-90.
[5]樊潔,李建軍.一種半脆弱數(shù)字水印算法.計(jì)算機(jī)技術(shù)與發(fā)展.2017,27(02):69-71
[6]劉曉光.硬磁盤可靠性研究[J]中國檔案.2016(11):66-67.