張倩,陳維娜,郝紅光
(1.中國人民公安大學 刑事科學技術學院,北京 100038;2.公安部物證鑒定中心,北京 100038)
高光譜成像技術通過獲取地區(qū)空間分布圖像中目標的輻射強度、空間位置信息、光譜信息等,早期廣泛應用于遙感領域,隨著科學技術的進步與交叉學科的研究,應用領域得到不斷拓展。由于物證種類的擴展、檢驗要求的提升,近年來光譜成像技術是司法鑒定中舉足輕重的檢驗手段,光譜成像技術作為一種無損檢驗方法,在法庭科學領域最早應用于表面潛在指紋的顯現(xiàn)和提取[1],在文件檢驗工作中,文件檢驗儀、拉曼光譜儀等光學檢測設備也是必不可少的檢驗儀器。通過闡述高光譜成像技術的特征優(yōu)勢和主要研究應用,總結歸納基于該技術的文件檢驗研究現(xiàn)狀,提出發(fā)展方向為吸引更多學者的關注與研究,促進該技術的完善與其在文件檢驗方面的有效應用。
作為一種將傳統(tǒng)的空間成像分析技術和光譜分析技術融為一體的光學檢驗技術,高光譜成像技術擁有更高光譜分辨率、更廣光譜波段范圍、更豐富數(shù)據(jù)信息。高光譜圖像不僅僅能實現(xiàn)在成百上千個連續(xù)的可見光、紅外、近紅外等廣泛的光譜區(qū)域成像,亦能記錄目標的空間位置信息。在選定的波長范圍中捕獲圖像中所有點的光譜信息、所有波段的圖像信息以及待測目標相應的輻射強度,空間位置信息與光譜圖中的特征峰信息結合對待測目標進行識別、鑒定、分類。
高光譜圖所提供的大量信息及其相關性為進一步的檢驗分析提供可行性。針對所得的光譜圖進行研究分析,可根據(jù)檢驗要求及其譜圖特征,選取合適的數(shù)據(jù)定標類型如輻射定標、光譜定標、空間幾何定標。
雖然高光譜成像技術與多光譜技術均是以成像光譜儀檢測目標物質的物理性質與化學成分,但高光譜具備較高的納米級光譜分辨率,是與全色和多色光譜成像相比較的顯著優(yōu)勢,與二維圖像數(shù)據(jù)最大的區(qū)別則是在顯示檢材空間位置的同時,保存檢材在不同波段下的反射率。在此,可以概括出高光譜圖像的優(yōu)勢:①“信息三合一”,通過高光譜圖像得到的三維立體數(shù)據(jù),可形象地表征物質輻射強度、空間信息和光譜信息之間的關系,融合了這三種信息后能夠得到更佳的研究效果;②更為豐富的數(shù)據(jù)信息,多光譜技術只能在幾個波段范圍捕獲光譜信息,而高光譜成像技術以高達0.01數(shù)量級的光譜分辨率連續(xù)成像;③譜圖連續(xù)性,通過成百上千個光譜數(shù)完成成像,能從光譜維度讀取出連續(xù)的光譜曲線。豐富的數(shù)據(jù)可得到復雜模型對待測物進行識別、鑒定與分類;④與傳統(tǒng)的譜圖維度信息相比,高光譜數(shù)據(jù)維度高,包含的信息量多且隨波段數(shù)增加而增加,空間位置信息及光譜波段信息相關性高。在圖像分析處理方面,與通過調整圖像RGB組合相比得到的結果更理想。
高光譜圖像處理分析方法不勝枚舉,在圖譜數(shù)據(jù)處理過程中,有如下基礎方法。
高光譜圖像因其攜帶大量的數(shù)據(jù)信息,增強了技術的檢測能力,同時也增大了信息的冗余量,因此在預處理階段的主要目的即對立體數(shù)據(jù)進行降維處理。在保存感興趣特征的同時減少數(shù)據(jù)信息量,降低處理信息的時長與難度同時增強數(shù)據(jù)分析的精確度。目前,較為普遍的高光譜圖像預處理方法有特征選擇和特征提取兩種方法[2]。
特征選擇是指從最初波段中直接選取有效的特征波段,達到降低數(shù)據(jù)維度的目的。特征提取是指通過對一個或若干個原始波段的屬性關系進行組合變換,得到新的特征屬性。光譜信息的冗余量與相關性取決于波段的寬窄度,因而選取最優(yōu)波段是圖像降維度過程的關鍵要素。實際檢驗鑒定中常通過多種降維方法交叉結合使用,來達到最佳的檢驗結果。如基于主成分分析、基于高階統(tǒng)計量的獨立元分析、最小噪聲分離變換、傅里葉變換、基于核函數(shù)和基于神經(jīng)網(wǎng)絡的非線性特征分析等[3]。
根據(jù)檢材在光譜圖中的不同特性信息反映,選取不同分類模型對不同類別的待測目標進行分類。使用計算機分析處理作為輔助方法,彌補鑒定人員的視覺鑒別傳統(tǒng)方法的不足,如最大似然比分類、卷積神經(jīng)網(wǎng)絡分類方法等等。作為機器學習方法之一的監(jiān)督學習,通過對已知標簽的特征進行提取學習,構造訓練函數(shù)完成對未知樣本的分類檢驗任務,如K近鄰法、馬氏距離分類、最大似然法、最小距離法、光譜角分類法等等。另一種非監(jiān)督分類則是直接對光譜信息進行特征提取,統(tǒng)計差別進行分類,如K-均值、ISODATA(迭代自組織數(shù)據(jù)分析)等[4]。對高光譜圖進行數(shù)據(jù)分析的過程中,通過總體分類精度對分類方法進行評價,選擇最有效的分類方法而獲得最佳結果。
最先應用于遙感技術的高光譜成像技術能深入分析細節(jié)和表征實物外貌特征,作為一種非接觸式的無損檢驗,成像快,檢測范圍廣,最早應用于軍事偵查領域中?;谠摷夹g的“信息三合一”優(yōu)勢,能同時提高檢驗目標的化學和物理特征,且具備較高的空間分辨率。高光譜成像技術的應用領域越來越多,目前已被成功應用于生態(tài)資源、軍事航天、農(nóng)業(yè)食品、醫(yī)學診斷、文物保護、法庭科學等。
在生態(tài)資源領域,高光譜成像技術與遙感技術的結合,以高精度、高效率的優(yōu)勢可以實現(xiàn)植被覆蓋勘探與識別、地表生物數(shù)量估計、大氣污染狀況評估、地質環(huán)境污染動態(tài)勘測等。在水質污染情況檢測中,高光譜成像技術能根據(jù)水資源中含有不同有機物所反映在圖譜中的波段變化,根據(jù)光譜特征的相關性與差異性評判水質污染狀況。還能通過空間信息、輻射強度分布情況判斷水資源中污染物的探測、水溫實時監(jiān)控等。同理,在地質礦產(chǎn)資源勘查工作中,通過捕獲的空間信息、光譜信息、輻射強度信息實現(xiàn)地質礦產(chǎn)資源的識別與分布情況。
在軍事航天領域,高光譜成像技術主要應用于軍事偵查、探測目標的偽裝性、欺騙性,發(fā)覺隱藏目標等方面。通過比對偽裝目標與樣本材料的譜圖差異性分辨真假,顯示遮擋物體與環(huán)境之間的光譜特征的差異實驗目標的揭露,達到反欺詐的效果。除此之外,高光譜成像技術正朝向天文行星探測領域發(fā)展,作為航空探測儀器成功搭載在中國首顆繞月人造衛(wèi)星中[5]。
在農(nóng)業(yè)食品領域,高光譜成像技術能在檢測目標物的外部特征同時又能探測內(nèi)部品質與安全,在農(nóng)業(yè)監(jiān)控與食品安全領域取得了較好的檢測結果。高光譜成像技術的優(yōu)勢能貼合農(nóng)業(yè)生產(chǎn)與食品制造的待測量龐大和無損檢驗的要求,在不影響外形、不破壞結構的非接觸檢測下,快速、準確、高效的對農(nóng)藥殘留、農(nóng)產(chǎn)物優(yōu)劣、食品腐敗等問題大批量檢驗。
在醫(yī)學診斷領域,高光譜成像技術通過對正常組織與器官的光譜特征與病變組織、器官相對比,對機體健康狀況進行檢測評估,因其具備“信息三合一”的優(yōu)勢還能應用于臨床方面,高靈敏度、高特異性的同時判斷人體組織病變情況與分布位置,對于各類臨床手術具有實質性的指導作用。高光譜成像技術不僅能捕獲目標物的物理信息與化學信息,還能達到非破壞性實時監(jiān)測,在推動醫(yī)學診斷領域的發(fā)展中卓有成效[6]。
在文物保護領域,高光譜成像技術相較于多光譜能在更精細的波段范圍成像,豐富了數(shù)據(jù)信息,提高了光譜、空間的分辨率,對待測物體進行無損檢測為歷史文物的鑒定工作提供了強有力的技術支撐[4]。在國外,多用于文物的奠定分析,如Gong等選擇光譜角度映射器(SAM)來分類和識別涂料中使用的顏料,比較使用實際顏料的分類和鑒定結果獲得更令人滿意的效果[7]。王樂樂等利用高光譜成像技術對古代壁畫進行分析,結合相關的古代文獻,可以生成所用繪畫技法的信息、估計壁畫的年代、評價其歷史、科學和藝術價值[8]。Balas等開發(fā)了一種計算機可控的高光譜成像設備,能夠在380~1 000 nm的光譜范圍內(nèi)采集502 nm帶寬和302 nm 調諧步長的光譜圖像,可以恢復舊手稿中的擦除覆蓋腳本[9]。在國內(nèi),高光譜成像技術在考古與文物藝術品保存中得到廣泛應用,如侯妙樂[10]利用高光譜成像技術對彩繪文物的分析研究。
目前,高光譜成像部件的技術發(fā)展為法庭科學應用奠定了基礎,快速采集、便攜式、高分辨率系統(tǒng)正在興起,有助于將高光譜成像從實驗室轉移到現(xiàn)場,應用于現(xiàn)場調查與現(xiàn)場勘驗中。快速高效的掃描系統(tǒng)能完整的掃描現(xiàn)場信息,提高勘驗人員的勘查效率,為偵查破案提供線索。高光譜成像技術融合了光譜分析與成像分析,能同時捕獲待測目標的全面信息進行物理結構、化學成分、空間分布的研究。這種技術使檢驗員能夠分析痕跡的化學成分,同時可視化它們的空間分布。高光譜成像技術為痕跡物證的檢測、可視化、識別和年齡估計提供了重要的技術支撐[11]。例如,在法醫(yī)學中,相較于實驗室未污損的樣本檢驗,高光譜成像技術可檢測復合污染的混合物,在生物痕跡的化學成分檢測中,可使用該技術進成痕時間估計與分析,以及利用該技術探究系列環(huán)境條件對生物物證穩(wěn)定性的影響等[12]。
文件檢驗工作在實際案件中常見有筆跡比較檢驗、印章印文同一認定、文件材料同一認定、書寫時間檢驗鑒定等任務。生活、工作環(huán)境的科技化與物證鑒定要求的日益提高,文件檢驗工作中先進的科學設備顯得愈發(fā)重要,高光譜成像技術的自身優(yōu)勢,再同圖譜數(shù)據(jù)的預處理、數(shù)據(jù)分析的各類方法相結合,能夠達到更細化、精準的檢測目的[13]。運用該技術在文件檢驗中的簽名筆跡鑒定、變造文件檢驗、文件材料檢驗、印刷文件檢驗、以及書畫鑒定等方面均能達到較好的檢驗鑒定效果。
筆跡檢驗運用同一認定的原理和方法,對檢材、樣本進行分別檢驗和比較檢驗,客觀分析和總結檢材與樣本的特征符合點和差異性,作出綜合性判斷。1983年,Laing等[14]用顯微光度法無損分析紙張上的墨水,從待測墨水樣品的吸收光譜圖中了解墨水成分的含量,檢驗區(qū)分顏色相近的不同種墨水方法,控制紙張載體的變量對比研究發(fā)現(xiàn)不同載體對檢驗結果沒有影響。Kevern[15]研究了在薄層色譜基礎上,使用激光發(fā)光和激發(fā)光譜鑒別墨水種類,當傳統(tǒng)檢驗鑒定技術不能區(qū)分時,該方法提高檢驗技術的靈敏性能成功區(qū)分相似油墨種類,與低溫下的發(fā)光檢驗相比較是一種用于室溫發(fā)光增強的有效檢驗方法。此外,Sinor等[16]將激光作為光譜激發(fā)光源對文件材料進行檢驗,因書寫印刷材料中不同的染料和顏料中的生色基團在激光激發(fā)下產(chǎn)生熒光進行區(qū)分。Cantu等[17]通過薄層色譜法區(qū)分不同種類墨水,使用不同離子激光源照射樣本記錄相應的光譜輻射亮度。對結果數(shù)據(jù)比較分析得出氬離子激光照射分離的墨水能達到最佳效果。為了比較不同檢驗方法對筆跡檢驗中墨水的鑒別性能優(yōu)劣性,Paynel等證明高光譜成像技術在法醫(yī)環(huán)境中具有顯著優(yōu)勢,例如能夠并排顯示視覺和光譜結果并減少樣品制備,從而最大限度地降低污染風險。對于大多數(shù)證據(jù)類型,高光譜成像比傳統(tǒng)技術產(chǎn)生更大的區(qū)分能力,非破壞性檢測特征還能保留進一步分析的證據(jù)[18]。
在筆跡檢驗中,可以對書寫筆跡的墨水成分進行分類鑒定推斷書寫工具的同一性,亦能通過對書寫習慣、筆跡特征檢驗分析作出檢驗鑒定意見,但依舊存在大量的局限性。譬如檢驗方法對原文件的破壞性,檢驗環(huán)境的干擾對結果準確度影響等;一些言語特征、書寫習慣地方化、年代化,特征表征能力不夠普遍,只試用于特定的地域與時代。測量筆痕寬度等特征僅能表征書寫工具的大小差異,對顯微設備的精準度要求甚高,且在差異較小的情況下難以判別。
李嫣然等基于半監(jiān)督學習提出了高聚類精度、強穩(wěn)定性的自適應性高光譜圖像分類方法,通過對肉眼觀察難以區(qū)分的不同筆跡樣本檢測,利用評測結果的聚類精度來評估不同算法的優(yōu)劣性能??偨Y得出以提供訓練樣本的半監(jiān)督學習的自適應聚類方法最優(yōu),相比K-Means及ISODATA算法能得到更高的準確率和穩(wěn)定性,能準確高效地自動鑒別不同材質書寫的相同顏色的筆跡[18]。
孫梅等使用高光譜成像技術,在400~1 000 nm光譜范圍內(nèi),結合數(shù)據(jù)分析方法,成功鑒定筆跡添改現(xiàn)象和書寫工具的同一認定判斷[19]。對以10種不同的藍、黑墨水為書寫條件,來自7個書寫者所提供的檢驗樣本,通過高光譜圖像技術成像結果,選取有效的特征波段區(qū)域,加強反差,增強區(qū)分度,優(yōu)化實驗結果,與RGB圖像閾值分割相比,HSI圖像閾值分割效果更好[20]。
鑒定人員主要通過區(qū)分印刷油墨、墨粉、紙張的種類鑒別完成印刷文件的真?zhèn)舞b定。Brauns等[21]使用紅色、藍色和黑色墨水制備樣品,通過傅里葉變換光譜以實現(xiàn)光譜辨別,觀察到藍、黑墨水的譜圖變化,對所有圖像進行模糊c均值聚類分析,以客觀地分析和自動化圖像分析得出聚類分析可以區(qū)分具有非常相似的可見光透射光譜的圖像特征。Gl等[22]通過可見光和近紅外區(qū)域(Vis-NIR FORS)中的光纖反射光譜直接在紙上檢查了6種不同品牌的19種黑色噴墨油墨,創(chuàng)建主成分分析模型在500~1 000 nm范圍內(nèi)的預處理,能夠區(qū)分含碳和不含碳的墨水。Khan等[23]開發(fā)了一種基于端到端攝像頭的高光譜文件成像系統(tǒng),提出了一種新穎的聯(lián)合稀疏波段選擇技術,在書寫筆跡中運用該技術從高光譜圖像中選擇信息帶以進行精確的墨水不匹配檢測,平均精度提高達15%。在文件檢驗鑒定工作中,通過打印機品牌區(qū)分墨粉種類遠遠滿足不了鑒定需求。劉猛等為區(qū)分激光打印墨粉種類,成功通過高光譜成像儀提取400~1 000 nm波段的光譜信息完成更細化的分類鑒定,根據(jù)光譜信息搭建五類統(tǒng)計模型進行數(shù)據(jù)分類分析,并以準確率、拒識率、誤識率評價各類模型[13]。
通過對消除文本、添加文本和添改筆畫來模擬3種不同類型的典型偽造情況。對消除和添加文本進行主成分分析進行真?zhèn)舞b別,使用多元曲線分辨交替最小二乘方法(MCR-ALS)增強挖掘消除文本隱藏信息和添加文本區(qū)分差異度結果。結果表明,通過主成分分析方法和MCR-ALS方法能以82%的準確率區(qū)分添加文本的真?zhèn)舞b別。對于添改筆畫的偽造類型通過多元曲線分辨交替最小二乘方法和偏最小二乘法判別分析能以85%的準確率識別鑒定添改筆畫的偽造文本[24]。
去污的辦法種類有物理方法、化學處理法和影像處理法等,對于化學處理法來說,由于污斑理化性質各異、化學成分復雜,化學去污的同時可能導致字跡顏色褪變,同時影響紙張材料整體的耐久性[25]。運用數(shù)字化成像方法對紙質文檔進行保存的過程中,對于解決文檔因環(huán)境因素自身老化和保管過程中人為污損的問題,高光譜成像技術的出現(xiàn)能較好的完成文檔去污、除霉、清晰字跡等工作。在550~900 nm的可見光紅外波段中掃描檢測發(fā)現(xiàn),于850 nm處波長的數(shù)據(jù)采集圖像中霉斑淡退,被霉斑遮蓋的文本字跡清晰呈現(xiàn)出來。對于被涂改、涂畫、標記的文本,在855 nm波長圖像中藍黑墨水和圓珠筆字跡被消除,印刷文本被加強顯現(xiàn)增強了文檔數(shù)字化掃描保存的質量[26]。550 nm單波長圖像的等高線圖提供了關于鐵油墨遷移空間特性的詳細信息。在紅墨水涂抹于黑色墨水上的一部分文本中,使用像素解混來確定紅墨水的涂抹程度。紫外線光源有助于目測確定其遷移程度,以及區(qū)分遷移部分與原始墨水。油墨損失也可以通過構建單波長圖像的密度片并將損失的油墨量與吸光度的降低相關性聯(lián)系起來進行評估。使用高光譜成像來評估和量化油墨的各個方面,例如這些文件中部分油墨遷移和油墨損失的程度,密度切片具有表征墨水損失程度和發(fā)生位置的優(yōu)點,通過比較光譜特性的空間特性,來比較墨水的吸光度。利用表面特性(例如pH)與光譜特征的相關性分析比較結果能確定是否發(fā)生了油墨的進一步損失[27]。
當下最常見的書畫造假方法有:①勾描線條,著色填墨來偽造名家題款和書法作品;②東拼西湊,改頭換面;將殘缺字畫、無落款字畫通過添改、挖裁、漂洗等手段,將字畫偽造成名家作品;③模仿特征,臨摹偽造;通過對書畫名人長年累月的書寫繪畫習慣和風格特征的模仿,以至達到以假亂真的效果;④現(xiàn)在高科技方法,如電腦掃描,運用墨水和國畫顏料進行仿真印刷;通過掃描名家原章經(jīng)過電腦處理做電腦激光造印章,運用制版印刷的原理,拍照原印章通過配制化學試劑制得制版章。技術的發(fā)展和字畫市場的持續(xù)升溫,讓偽作市場十分猖獗,對名人書畫的保存和傳播造成較大的負面影響。如何抵制書畫贗品,鑒定真?zhèn)问菚嬍袌龅碾y題。傳統(tǒng)的鑒定手段主要是通過顯微觀察來人工鑒定,主要依賴于鑒定人的經(jīng)驗與專業(yè)水平,該方法耗時耗力、精準度不穩(wěn)定、鑒定效率低下。物理化學分析方法雖能提高鑒定效率和準確度但屬于對檢測樣本有損檢驗,會摧毀真跡的價值。高光譜成像技術作為一種無損檢驗,能克服上述檢驗不足并對書畫鑒定能提供很好的技術佐證。
國內(nèi)學者張冬等運用高光譜成像技術捕獲書畫作品圖像信息,通過預處理的降噪、校準、降維,對圖譜信息通過卷積神經(jīng)網(wǎng)絡進行特征提取,分析空間、光譜特征的相關性通過支持向量機分類器進行分類處理,顯現(xiàn)作品中的隱藏信息增強視覺效果,識別鑒定書畫顏料來實現(xiàn)對書畫真假鑒定的自動分類識別[4]。Brauns EricB、Padoan等分別利用高光譜數(shù)據(jù)對不同墨汁的分類識別進行書寫作品、筆墨畫的真?zhèn)舞b別[28]。Costas Balas、Christian Fischer、Maria Kubik、Rosi、以及Brunetti等分別利用高光譜成像技術對書畫作品中的顏料進行了識別和分析,宏觀的空間圖譜特征和微觀的光譜特征相輔相成,達到鑒別贗品的目的。國內(nèi)學者韓曉夢、王樂樂等通過高光譜成像技術對古代作品進行整體與局部的書畫顏料分析鑒定,總結歸納了同種顏料在不同波段特征和不同顏料的光譜特征。除了有色顏料的分類鑒定分析,高光譜數(shù)據(jù)還可以對彩繪文物表層的無色涂料進行分析,例如有無香蕉水洗刷的對比分析等[29]。
高光譜成像技術已經(jīng)廣泛的應用于各大領域中,設備的完善能滿足各大領域的檢驗需求,后期的研究側重于檢驗后期的數(shù)據(jù)處理方面。對于檢驗獲取的大量高光譜圖像數(shù)據(jù),如何選取最優(yōu)的數(shù)據(jù)分析模型對圖譜特征進行分類,加強自動化識別減少人為因素的誤差達到最有效的結果是目前主要研究重點。
在檢驗過程中,雜光、大氣中的灰塵等會對光感元件對待測目標的信息采集產(chǎn)生影響,得到的圖譜信息中含有因環(huán)境干擾產(chǎn)生的信息。在數(shù)據(jù)預處理過程中,選取怎樣的處理方式對圖譜信息進行降噪、降維處理,刪除噪聲波段美化光譜成像是主要改進目的。此外,對高光譜圖像特征區(qū)域的選取、研究更優(yōu)化特征提取算法,以及多類特征信息融合的方式,結合人工智能的機器學習方法處理數(shù)據(jù),減少人工核對圖譜信息特征的誤差影響,是目前研究熱點之一,不僅能提高分類的精度和準確度還能大幅度提升鑒定工作效率。
根據(jù)檢驗任務的需求來擬定圖譜數(shù)據(jù)處理方法,達到獲取最佳分類結果的目的。研究在目前擇優(yōu)的聚類算法中如何將空間位置信息與光譜信息特征相關性融合,對于譜圖信息差別較小檢測對象,在該方法未能準確區(qū)分的問題上研究將儀器分析結果與人工智能結合通過提高學習率完成更細化的分類。在對書畫文物保護和真假鑒定工作中,目前較為廣泛應用的是近紅外光譜和可見光譜,尚未進一步研究將二者結合的效果,可以試探性研究融合二者波段范圍的光譜特征是否能帶來更高的精確度和魯棒性。
除此之外,高光譜成像技術的分類鑒定基于復雜混合的信息,如何高效準確地對未知待測物分類識別需要大量的已知光譜庫給予支撐,因而完備的光譜庫是數(shù)據(jù)分析應用和結果檢驗的重要工具,在日后的研究中建立各類物質的高光譜數(shù)據(jù)庫,為檢驗鑒定提供數(shù)據(jù)支撐,以供更多的科研工作使用。