国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于中紅外光聲光譜的紙質(zhì)文獻(xiàn)破損定級(jí)的研究

2019-09-04 09:45馬趙揚(yáng)杜昌文
新世紀(jì)圖書館 2019年7期

馬趙揚(yáng) 杜昌文

摘 要 本文通過紅外光聲光譜掃描,建立不同破損級(jí)別紙張的預(yù)測模型,以達(dá)到快速檢測紙張破損程度的目的。研究發(fā)現(xiàn)不同破損級(jí)別的紙張有明顯的聚類特點(diǎn),利用概率神經(jīng)網(wǎng)絡(luò)建立紙張破損級(jí)別模型的預(yù)測準(zhǔn)確率達(dá)到62%。未來在優(yōu)化模型的同時(shí),擬增加紙張各組分的定量研究,建立紙張破損程度與紙張物質(zhì)變化的相關(guān)關(guān)系并達(dá)到實(shí)時(shí)監(jiān)測的目的。

關(guān)鍵詞 紙張破損定級(jí) 紅外光聲光譜 概率神經(jīng)網(wǎng)絡(luò)

分類號(hào) G250.7

DOI 10.16810/j.cnki.1672-514X.2019.07.013

Abstract In this paper, the prediction model of paper with different breakage grades is established by infrared photoacoustic spectrum scanning, in order to quickly detect the degree of paper breakage. It was found that the paper with different damage levels had obvious clustering characteristics. The prediction accuracy of paper damage level model based on probabilistic neural network reached 62%. In the future, while optimizing the model, it is proposed to increase the quantitative study of paper components, establish the correlation between the degree of paper damage and the change of paper material, and achieve the purpose of real-time monitoring.

Keywords Paper damage grading. Infrared photoacoustic spectrum. Probabilistic neural network.

國際上各個(gè)國家都非常重視文獻(xiàn)的保護(hù)工作,把文獻(xiàn)保護(hù)作為圖書館的重要工作內(nèi)容之一。為了加強(qiáng)文獻(xiàn)保護(hù)工作,國家圖書館曾成立專門的圖書保護(hù)組,發(fā)文頒布《國家圖書館文獻(xiàn)保護(hù)條例》,并成立“國家古籍保護(hù)中心”規(guī)范和指導(dǎo)文獻(xiàn)的保護(hù)工作。當(dāng)時(shí),針對古籍特藏文獻(xiàn)的老化破損程度,《古籍特藏破損定級(jí)標(biāo)準(zhǔn)》[1]將文獻(xiàn)的破損級(jí)別分為五級(jí),但對于普通文獻(xiàn)尤其是保存本文獻(xiàn)的老化破損程度沒有明確的界定標(biāo)準(zhǔn)。而目前國家圖書館館藏民國文獻(xiàn)的破損率已經(jīng)達(dá)到90%以上,而1949年以后的文獻(xiàn)也陸續(xù)開始出現(xiàn)發(fā)黃等破損現(xiàn)象,依據(jù)現(xiàn)有的文獻(xiàn)破損定級(jí)方法已經(jīng)很難滿足館內(nèi)大量的文獻(xiàn)保存情況調(diào)查工作。本文采用傅里葉變換中紅外光聲光譜法,希望通過紅外光聲光譜技術(shù)檢測破損文獻(xiàn)的光譜特征,結(jié)合紙張本身的物理化學(xué)性質(zhì),能夠定性甚至定量文獻(xiàn)的破損程度,以期建立基于紅外光譜技術(shù)的文獻(xiàn)破損定級(jí)方法,達(dá)到快速檢測文獻(xiàn)破損程度的目的。

1 紙張樣本與定級(jí)標(biāo)準(zhǔn)

供試紙張為新聞紙,采集自國家圖書館期刊保存本庫房及私人藏書,共39個(gè)樣本。樣本的統(tǒng)計(jì)特征見表1,分為五個(gè)破損級(jí)別。其中一級(jí)破損紙張均來自民國文獻(xiàn)。目前,國家圖書館館藏的民國文獻(xiàn),尤其是期刊報(bào)紙類文獻(xiàn)依然在流通之列。然而,民國文獻(xiàn)的紙張已經(jīng)老化破損,脆弱不堪,在多次甚至一次借閱后就會(huì)出現(xiàn)散裂的情況。這也是本研究開展的初衷。在實(shí)踐中,對于所采集的樣本進(jìn)行實(shí)時(shí)監(jiān)控,或者說對文獻(xiàn)的物質(zhì)組成進(jìn)行實(shí)時(shí)監(jiān)控,以觀察其破損過程中各物質(zhì)反應(yīng)。

《古籍特藏破損定級(jí)標(biāo)準(zhǔn)》 根據(jù)文獻(xiàn)紙張的破損程度判斷其破損級(jí)別,分為五個(gè)破損級(jí)別,其中一級(jí)破損為最高級(jí)別破損,二級(jí)、三級(jí)、四級(jí)、五級(jí)破損程度依次遞減。定級(jí)方法依據(jù)文獻(xiàn)的損害特性,包括酸化、老化和蟲蛀鼠嚙等,酸化老化屬于漸進(jìn)型損害,較為隱蔽不易發(fā)現(xiàn),蟲蛀鼠嚙屬于靜止型損害,損害特征明顯且多為局部損壞。具體定級(jí)標(biāo)準(zhǔn)參見《古籍特藏破損定級(jí)標(biāo)準(zhǔn)》。其中各級(jí)標(biāo)準(zhǔn)的并列條件較多,分別含有兩到八條不等,包含有定級(jí)人員一定的主觀判斷,不夠客觀直接。在真正對庫房文獻(xiàn)進(jìn)行定級(jí)的過程中會(huì)花費(fèi)較多的時(shí)間,且其定級(jí)標(biāo)準(zhǔn)是在文獻(xiàn)已經(jīng)呈現(xiàn)了破損現(xiàn)象以后進(jìn)行的,是后知后覺的定級(jí)方法,無法檢測到文獻(xiàn)的破損進(jìn)程。

本文利用傅里葉變換中紅外光聲光譜掃描得到所有樣本的光譜數(shù)據(jù)。光聲光譜是基于光聲效應(yīng)的光譜研究方法[2],具有操作方便、分析快速、樣品用量少、樣品不受破壞等特點(diǎn)。中紅外光譜位于4000~400cm-1(2500~25 000nm),是基頻振動(dòng)吸收區(qū)(為研究方便中紅外區(qū)一般用波數(shù)作單位,即1cm所包含的整波的數(shù)量)。由于基頻振動(dòng)是紅外活性振動(dòng)中吸收最強(qiáng)的振動(dòng),更有利于紅外光譜的定性和定量分析[3]。

所用儀器為傅里葉變換紅外光聲光譜儀Nicolet 380(Thermo Fisher Scientific,美國),DTG檢測器,光聲池采用PA300(MTEC,美國),動(dòng)鏡速率為0.3165 cm/s,掃描分辨率為4cm-1,掃描次數(shù)32。紙張樣品放入圓柱形不銹鋼樣品池(直徑10mm,高5mm),每半個(gè)小時(shí)以碳黑做一次背景,掃描范圍為中紅外區(qū)4000~400cm-1。光譜預(yù)處理采用Matlab R2009a進(jìn)行平滑去噪及標(biāo)準(zhǔn)化處理。

2 數(shù)據(jù)分析方法

本文主要利用主成分分析(Principal Components Analysis,PCA)和概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network,PNN)做研究。

首先,利用PCA簡化光譜數(shù)據(jù),并提取光譜主要信息。PCA是一種多元統(tǒng)計(jì)分析技術(shù)[4]。它通過變換原始數(shù)據(jù)的特征空間,從而生成維數(shù)更低且新生成的各變量之間相互獨(dú)立的特征空間。原始變量與新生成的變量之間為線性相關(guān)關(guān)系。新變量因其所攜帶信息量的不同,從大到小稱為第一主成分、第二主成分、第三主成分……,樣本的信息主要集中在前幾個(gè)主成分中,越往后其所攜帶的信息就越少,可以忽略不計(jì)。利用主成分分析既可以保證所選用信息的可靠性,同時(shí)也可以起到降維的作用。其次,利用前幾個(gè)主成分做聚類分析,觀察其分類效果,運(yùn)用PNN建立模型,分別預(yù)測每一個(gè)樣本的破損級(jí)別,并統(tǒng)計(jì)結(jié)果。PNN是一種常用于模式分類的神經(jīng)網(wǎng)絡(luò)[5],擁有強(qiáng)大的非線性分類能力。PNN需要調(diào)節(jié)的參數(shù)少,訓(xùn)練過程簡單,收斂速度快,不易產(chǎn)生局部最優(yōu);且穩(wěn)定性較高,可以容忍個(gè)別錯(cuò)誤樣本,分類正確率較高。無論分類問題多么復(fù)雜,只要有足夠多的訓(xùn)練數(shù)據(jù),PNN可以保證獲得貝葉斯準(zhǔn)則下的最優(yōu)解。

3 結(jié)果與分析

3.1 紙張的紅外光聲光譜特征

紙張的老化破損本質(zhì)上是其物質(zhì)組成的理化性質(zhì)發(fā)生改變所導(dǎo)致的。紙張的主要成分為纖維素、半纖維素、木質(zhì)素,其中纖維素含量最高。在外界和內(nèi)部環(huán)境的共同作用下[6],纖維素、半纖維素發(fā)生水解、氧化,內(nèi)部分子鍵斷裂,聚合度下降,導(dǎo)致紙張的各項(xiàng)理化性能下降,發(fā)生老化。紙張的主要組成物質(zhì)纖維素、半纖維素、木質(zhì)素,是不以原料的變化而改變的,只是三者的相對含量會(huì)有所不同。而紙張的老化破損,與這三者的含量有一定的關(guān)系。纖維素含量越高,紙張性能越好。纖維素的性質(zhì)較穩(wěn)定,而半纖維素的性質(zhì)較不穩(wěn)定,易導(dǎo)致紙張的老化。木質(zhì)素則是紙張中的有害物質(zhì),會(huì)加速紙張的老化損。

圖1是不同破損級(jí)別紙張的紅外光聲光譜圖,紙張破損程度不同其吸收峰的大小位置有所偏差。其中,3400cm-1處的吸收主要是由纖維素分子中O-H的伸縮振動(dòng)產(chǎn)生,2900cm-1處的吸收主要由C-H的伸縮振動(dòng)產(chǎn)生,1650~1700cm-1處的吸收由木質(zhì)素分子中C=O的伸縮振動(dòng)產(chǎn)生[7],1090cm-1處的吸收由C-O伸縮振動(dòng)產(chǎn)生[8]。從圖中可以看出,一級(jí)破損紙張?jiān)?400cm-1范圍的吸收明顯高過其他破損級(jí)別的紙張,紙張老化是纖維素分子解體的過程,而水解是纖維素老化的主要過程[9], 纖維素通過水解反應(yīng)生成的多糖或葡萄糖含有更多的O-H鍵,由此 3400cm-1處吸收峰可作為紙張老化的標(biāo)志之一。一級(jí)破損紙張?jiān)?678cm-1的吸收明顯高于其他破損級(jí)別紙張,說明民國文獻(xiàn)的木質(zhì)素含量較高,紙張易發(fā)生老化破損。其他各處的吸收多有變化,這是由于紙張?jiān)谥圃爝^程中的原料不同所致。

3.2 主成分分析

利用主成分分析對所測光譜進(jìn)行數(shù)據(jù)簡化,按攜帶信息量從大到小分為第一主成分,第二主成分,依次類推。表2為主成分分析后各主成分所攜帶信息及累計(jì)攜帶信息情況。從表2中可以看出,前十個(gè)主成分?jǐn)y帶信息累計(jì)達(dá)到94%,幾乎攜帶了光譜的全部信息,其中,前三個(gè)主成分?jǐn)y帶信息量分別為44.8%, 16.4%,10.3%,占所有光譜信息的70%以上。

對前三個(gè)主成分與中紅外光譜區(qū)做相關(guān)性分析,相關(guān)性越高表明該主成分?jǐn)y帶的光譜信息越多。圖2是前三個(gè)主成分和中紅外區(qū)的相關(guān)性圖。從圖中可以看出,第一主成分與3400cm-1、2900cm-1、1700cm-1、1000cm-1的吸收呈明顯的相關(guān)關(guān)系,而紙張的主要組成物質(zhì)(纖維素)也在這幾處有吸收[8]。

利用前三個(gè)主成分作散點(diǎn)圖(圖3),圖中每個(gè)樣本點(diǎn)旁邊對應(yīng)標(biāo)記該樣本的破損級(jí)別。從圖中可以看出,不同破損級(jí)別的紙張樣本呈現(xiàn)出一定的聚類特點(diǎn),以一級(jí)破損的聚類最為明顯,三級(jí)、四級(jí)、五級(jí)樣本均呈現(xiàn)出一定的聚類性。大部分樣本都集中在相同破損級(jí)別的范圍之內(nèi),少量樣本游離在相同破損級(jí)別外,這是由于紙張?jiān)谥圃爝^程(包括其原料、工藝等)中產(chǎn)生的差異及其儲(chǔ)存環(huán)境的不同所致。

3.3 概率神經(jīng)網(wǎng)絡(luò)分析

采用MATLAB自帶的概率神經(jīng)網(wǎng)絡(luò)工具箱,所用函數(shù)為newpnn(P,T, SPREAD)。以前十個(gè)主成分為輸入層,以五級(jí)破損級(jí)別為輸出層,建立神經(jīng)網(wǎng)絡(luò)。其中,分別選擇0.1、50、70、100、200的擴(kuò)展系數(shù)作比較,其中0.1為默認(rèn)擴(kuò)展系數(shù)。合理選擇擴(kuò)展系數(shù)是非常重要的,其值應(yīng)該足夠大,使徑向基神經(jīng)元能夠?qū)斎胂蛄克采w的區(qū)間都產(chǎn)生響應(yīng),但也不要求大到所有的徑向基神經(jīng)元都產(chǎn)生響應(yīng),只要部分徑向基神經(jīng)元能夠?qū)斎胂蛄克采w的區(qū)間產(chǎn)生響應(yīng)就足夠了。隨機(jī)抽取一個(gè)樣本作為測試樣本,利用剩余樣本建立神經(jīng)網(wǎng)絡(luò)模型,用測試樣本驗(yàn)證模型準(zhǔn)確性,直到每個(gè)樣本都被測試過一次,統(tǒng)計(jì)模型預(yù)測的準(zhǔn)確率。預(yù)測結(jié)果如表3。

從模型預(yù)測結(jié)果可以看出,隨著擴(kuò)展系數(shù)的變大,模型的預(yù)測準(zhǔn)確率逐漸增加,從41%增加到62%。繼續(xù)增大擴(kuò)展系數(shù),模型的預(yù)測準(zhǔn)確率不再變化,表明該模型的預(yù)測準(zhǔn)確率最高為62%。該結(jié)果表明大多數(shù)樣本的破損級(jí)別可以被很好地預(yù)測出來。

4 結(jié)語

通過本次試驗(yàn)發(fā)現(xiàn),紙張本身有比較明顯的紅外光聲光譜吸收特征,其中在3400cm-1、2900cm-1、1700cm-1、1000cm-1的吸收最強(qiáng)。紙張破損程度與紅外光譜3400cm-1、3700cm-1、1500cm-1、1200cm-1、1000cm-1波段的吸收最為相關(guān)。利用主成分分析的前三個(gè)主成分作散點(diǎn)圖,不同破損級(jí)別的紙張有明顯的聚類特點(diǎn)。

利用概率神經(jīng)網(wǎng)絡(luò)建立模型,預(yù)測準(zhǔn)確率的最優(yōu)結(jié)果達(dá)到62%,表明模型的建立較好,能夠準(zhǔn)確分類大多數(shù)紙張樣本的破損級(jí)別。沒有達(dá)到更高的預(yù)測準(zhǔn)確率的原因可能在于紙張破損定級(jí)方法在定級(jí)過程中由于人的主觀意識(shí)導(dǎo)致分類誤差;供試樣本的數(shù)量較小,涵蓋的各種紙張的破損情況不夠全面;傳統(tǒng)的紙張破損定級(jí)方法中的五個(gè)破損級(jí)別與紙張紅外光譜之間的相關(guān)性不夠好。

后續(xù)實(shí)驗(yàn)將增加樣本的多樣性和樣本量,以優(yōu)化模型的建立。利用傅里葉變換紅外光聲光譜對紙張的幾個(gè)主要成分(如纖維素、半纖維素、木質(zhì)素)做定量分析,關(guān)聯(lián)紙張破損程度與紙張物質(zhì)組成之間的相關(guān)關(guān)系,通過監(jiān)測紙張的物質(zhì)組成變化,達(dá)到對紙張老化破損的實(shí)時(shí)監(jiān)測。

參考文獻(xiàn):

中華人民共和國文化部.古籍特藏破損定級(jí)標(biāo)準(zhǔn):WH/T 22-2006[S].北京:北京出版社,2007.

MCCARTY G W, REEVES J B, REEVES V B, et al. Mid-infrared and Near-infrared diffuse reflectance spectroscopy for soil carbon measurement[J]. Soil Science Society of America Journal, 2002,66(2):640-646.

MCCARTY G W, REEVES J B. Comparison of near infrared and mid infrared diffuse reflectance spectroscopy for field-scale measurement of soil fertility parameters[J]. Soil Science,2006,171(2):94-102.

許祿,邵學(xué)廣.化學(xué)計(jì)量學(xué)方法[M].2版.北京:科學(xué)出版社, 2004:130.

蘇亮,宋緒丁.基于Matlab的概率神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)及應(yīng)用[J].計(jì)算機(jī)與現(xiàn)代化, 2011(11):47-50.

侯剛健,趙軍.淺析紙張的老化因素與高校圖書館應(yīng)采取的措施[J].科技情報(bào)開發(fā)與經(jīng)濟(jì)2010,20(12):50-51.

郭京波,陶宗婭,羅學(xué)剛.竹木質(zhì)素的紅外光譜與X射線光電子能譜分析[J].化學(xué)學(xué)報(bào),2005,63(16):1536-1540.

熊磊,于東偉.酸處理后纖維素分子結(jié)構(gòu)的顯微紅外光譜分析[J].纖維素科學(xué)與技術(shù),2013,21(2): 59-62.

張志清.文獻(xiàn)紙張的自然老化及其研究[J].檔案學(xué)研究,1998(2):60-61.