姚志湘,孫增強(qiáng),粟 暉,袁洪福
1. 廣西科技大學(xué)廣西糖資源綠色加工重點(diǎn)實(shí)驗(yàn)室,廣西 柳州 545006 2. 北京化工大學(xué)材料科學(xué)與工程學(xué)院,北京 100029 3. 廣西科技大學(xué)生物與化學(xué)工程學(xué)院,廣西 柳州 545006
通過(guò)向量角轉(zhuǎn)換校正拉曼光譜中乘性干擾
姚志湘1, 3,孫增強(qiáng)1, 3,粟 暉1, 3,袁洪福2
1. 廣西科技大學(xué)廣西糖資源綠色加工重點(diǎn)實(shí)驗(yàn)室,廣西 柳州 545006 2. 北京化工大學(xué)材料科學(xué)與工程學(xué)院,北京 100029 3. 廣西科技大學(xué)生物與化學(xué)工程學(xué)院,廣西 柳州 545006
拉曼光譜強(qiáng)度與物質(zhì)量存在的線性關(guān)系會(huì)受到許多復(fù)雜因素破壞,包括激發(fā)光源、聚焦、散射、折射等,導(dǎo)致定量效果不佳。各種因素的干擾效應(yīng),總體上分成加性和乘性效應(yīng),而消除乘性效應(yīng)的難度會(huì)更大一些。光譜序列信號(hào)可視為向量,信號(hào)強(qiáng)度對(duì)應(yīng)向量的模量,而體現(xiàn)向量本質(zhì)的方向?qū)傩圆粫?huì)受模量變化的影響。根據(jù)這一原理,利用向量的方向確定性,將信號(hào)的強(qiáng)度度量轉(zhuǎn)換成空間角度度量,建立了一種消除乘性效應(yīng)的方法。首先,選擇一個(gè)與待定量組分相近而與背景空間近似正交的基準(zhǔn)向量,并定義移動(dòng)窗口; 然后,計(jì)算移動(dòng)窗口內(nèi)的光譜向量與基準(zhǔn)向量的夾角,所得值存儲(chǔ)為矩陣,完成角度描述轉(zhuǎn)換。角度矩陣消除了乘性效應(yīng)的干擾,而定量關(guān)系仍然近似線性,只要將該矩陣的秩滿足多元統(tǒng)計(jì)建模要求,就可以用于多元校正,并得到良好結(jié)果。研究采用甲醇-乙醇-異丙醇混合體系,驗(yàn)證了消除乘性效應(yīng)后改進(jìn)的定量效果,對(duì)于積分時(shí)間波動(dòng)的預(yù)測(cè)值與實(shí)際值,直接PLS方法的相關(guān)系數(shù)r為0.911 9,預(yù)測(cè)標(biāo)準(zhǔn)偏差(RMSEP)為0.110 2; 采用MSC預(yù)處理的r為0.906 0,RMSEP為0.100 8; 而本文提出的VAPLS的r為0.998 7,RMSEP為0.015 2。結(jié)果表明向量角轉(zhuǎn)換度量處理后,光譜的乘性干擾得到了有效校正,拉曼定量分析準(zhǔn)確性得到了提高。
拉曼光譜; 乘性效應(yīng); 散射校正; 向量角轉(zhuǎn)換
確定條件下,拉曼散射光強(qiáng)度與組分濃度呈線性關(guān)系,此為拉曼光譜定量基礎(chǔ)[1]。但是拉曼光譜測(cè)量實(shí)際存在多種影響定量準(zhǔn)確的因素,根據(jù)對(duì)光譜強(qiáng)度的影響,可分為加性和乘性的。常見(jiàn)的基線漂移、噪聲等為加性效應(yīng),而光源穩(wěn)定性、樣品的透射和散射、聚焦,積分時(shí)間變動(dòng),甚至于折射率隨液體樣品濃度變化等則屬于乘性效應(yīng),使得拉曼強(qiáng)度與被測(cè)組分濃度之間不再是簡(jiǎn)單的線性關(guān)系[2]。常用的乘性校正方法有標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate transformation, SNV)和多元散射校正(也稱乘性散射校正,multiplicative scatter correction, MSC)[3]; SNV假設(shè)所有變量具有相同的標(biāo)準(zhǔn)偏差,而MSC假設(shè)乘性和加性變化遠(yuǎn)大于樣品濃度或化學(xué)性質(zhì)變化[4],這些假設(shè)對(duì)于組分性質(zhì)變化較寬的樣品處理效果可能變差,文獻(xiàn)表明SNV和MSC處理結(jié)果相似[5]。此外,擴(kuò)展多元散射校正方法(extended MSC, EMSC)需要樣品中所有對(duì)光譜有貢獻(xiàn)的為純物質(zhì)光譜,限制了應(yīng)用[6],也有文獻(xiàn)證明MSC處理后,拉曼光譜反而出現(xiàn)明顯的背景傾向[7]。張倩暄等、Chen等[8]對(duì)EMSC進(jìn)行了改進(jìn),陳增萍等[10-11]提出了光程長(zhǎng)評(píng)估與校正算法(optical path length estimation and correction, OPLEC),進(jìn)一步又提出了乘性效應(yīng)模型(multiplicative effects model, MEM)進(jìn)行散射校正,上述方法可以消除乘性效應(yīng),但原理和步驟都比較復(fù)雜。
傳統(tǒng)上,光譜分析直接關(guān)聯(lián)光譜強(qiáng)度與待測(cè)性質(zhì),建立光譜強(qiáng)度與預(yù)測(cè)性質(zhì)的定量關(guān)系。本文提出不將光譜強(qiáng)度與預(yù)測(cè)性質(zhì)直接關(guān)聯(lián),而是轉(zhuǎn)化為向量間的夾角余弦后,再進(jìn)行多變量計(jì)算,以避免針對(duì)于強(qiáng)度的乘性干擾,改善定量結(jié)果。
1.1 原理
確定組成的體系,其光譜與組分濃度間關(guān)系表示為
y=Xc+e
(1)
式中,y是測(cè)量到的光譜,由體系n個(gè)組分純物質(zhì)光譜X=[x1,x2, …,xn],和各組分濃度c=(c1,c2, …,cn)混合貢獻(xiàn)而成,同時(shí)還疊加了隨機(jī)誤差e。
但是拉曼光譜測(cè)量容易受到乘性效應(yīng)影響,難以嚴(yán)格重復(fù),導(dǎo)致強(qiáng)度不穩(wěn)定。這些影響歸納到模型中,以乘性因子b,加性因子d代入式(1)
y=bXc+d+e
(2)
式(2)中加性因子d和隨機(jī)誤差e可采用一階導(dǎo)數(shù)平滑和低通濾波、重復(fù)平均等方法消除或降低,這些方法原理清晰,可方便地預(yù)處理光譜數(shù)據(jù)[11]。
式(2)的校正關(guān)鍵在于消除乘性因子b,為此引入向量角概念。離散的光譜測(cè)量點(diǎn),可以表達(dá)為序列數(shù)組,可視為數(shù)據(jù)空間內(nèi)的向量[12]。向量模(長(zhǎng)度)表示測(cè)量強(qiáng)度,而向量方向決定于體系的構(gòu)成,表達(dá)為空間中與確定坐標(biāo)的夾角[13]。乘性因子b導(dǎo)致強(qiáng)度變化,即改變了向量模,但體系構(gòu)成未改變,故而向量方向不變,即向量角不隨模改變。
如果采用向量角替代向量模描述體系,就能消除乘性因子b。如圖1,a和b共同構(gòu)成向量S,當(dāng)a和b等比例縮小時(shí),S′與S在方向上不發(fā)生改變; 而只有在a與b的比例發(fā)生變化時(shí),其共同構(gòu)成的向量才會(huì)發(fā)生方向變化,向量角與體系構(gòu)成比例具有函數(shù)關(guān)系,該函數(shù)與向量模無(wú)關(guān)。
Fig.1 The relationship between system components and vector direction
向量角的描述和計(jì)算如圖2所示,空間中的固定向量a與隨組成變化的向量S存在夾角θ,可用點(diǎn)積式(3)計(jì)算
(3)
如果S受到乘性因子b影響變?yōu)镾′,即
S′=bS
(4)
將式(4)代入式(3),有
(5)
表明向量角描述不受乘性因子b影響。
進(jìn)一步,基于向量角描述的定量不能破壞測(cè)量值與預(yù)測(cè)值的基本線性關(guān)系。由式(3)和圖2可知,S由背景向量d和預(yù)測(cè)向量f構(gòu)成,如果將S和d,f的模量歸一化,那么S由含量分別為c和cb的f和d構(gòu)成,即
S=cf+cbd
(6)
(7)
如果參照向量a與背景d呈正交關(guān)系,那么有
(8)
Fig.2 The relationship between the analyte contents and vector angle
式(8)中,a,S,f均為單位模量向量,其中a,f是確定向量,因此可以改寫(xiě)成
cosθ=k1c
(9)
而實(shí)際情況下,要確定與d完全正交的a比較困難,同時(shí)多變量情況下d存在一定幅度的波動(dòng)。因此,對(duì)于選擇了近似正交的參照向量a和相對(duì)穩(wěn)定的多變量背景的情況,cosθ可近似保持與c的線性關(guān)系,即在一定值域范圍內(nèi)存在如下關(guān)系
cosθ≈k1c+k2
(10)
1.2 數(shù)據(jù)處理方法
根據(jù)上述原理,首先選取合適的參比向量a,用于計(jì)算量測(cè)向量S與其夾角。參比向量應(yīng)該與背景正交,但與被測(cè)組分不正交或相近; 選擇被測(cè)組分占優(yōu)分布的空間,進(jìn)行奇異值分解(SVD)或主成分分解(PCA),其第一主分量可近似滿足這一要求。
然后,將量測(cè)信號(hào)及參比向量數(shù)據(jù)劃分到若干區(qū)間,每個(gè)區(qū)間為對(duì)應(yīng)的子向量對(duì),計(jì)算向量對(duì)之間的夾角余弦,形成數(shù)組[cos(θ1), cos(θ2), …, cos(θm)],m為劃分的區(qū)間數(shù); 多組光譜轉(zhuǎn)化為向量角矩陣Θ=[cos(θi1), cos(θi2), …, cos(θim)],i=(1,N),N表示樣本個(gè)數(shù)。相應(yīng)的組分含量矩陣為Q=[Q1,Q2, …,QN]T,模型近似加和矩陣為R=[R1,R2, …,Rm],偏差ε。則式(1)和式(2)轉(zhuǎn)為
Θ=QR+ε
(11)
原始量測(cè)矩陣向量角轉(zhuǎn)化后,新矩陣的秩不小于體系組分?jǐn)?shù),即滿足多元統(tǒng)計(jì)分析的秩要求,就能采用PLS建立多元模型,預(yù)測(cè)被測(cè)組分含量。如果量測(cè)存在加性干擾,在執(zhí)行上述乘性校正處理前,就應(yīng)該加以去除。
2.1 儀器和試劑
拉曼光譜儀(QE65000,美國(guó)Ocean optics),激光器(MTS-785-MD600N,美國(guó)Mars Electronics); 光纖探頭(BAC100-785-OEM,美國(guó)Ocean optics)。
無(wú)水乙醇(分析純); 甲醇(分析純); 異丙醇(分析純)。
2.2 方法
2.2.1 系列樣品配制
準(zhǔn)確量取不同體積的乙醇10 mL容量瓶,加入體積各不相同的異丙醇后,以甲醇定容得到乙醇體積分?jǐn)?shù)5%~90%范圍的系列樣品共30個(gè)。
2.2.2 拉曼光譜采集
樣品置于光程1 cm石英比色皿,固定拉曼探頭與比色皿的間距。以兩種方式采集光譜,一是固定積分時(shí)間1 s,分別采集30個(gè)樣品的拉曼光譜; 二是調(diào)整積分時(shí)間(積分時(shí)間范圍1~10 s),采集處于儀器最佳信噪比和線性范圍內(nèi)的光譜。
3.1 數(shù)據(jù)處理
如圖3,選取751~1 600和2 601~3 150 cm-1兩段光譜建模,以降低光譜中不含或僅含少量信息的區(qū)域?qū)δP偷母蓴_[14]。選擇乙醇含量高于80%的4個(gè)樣本進(jìn)行SVD分解,將第一分量作為參比向量。將參比向量和樣品光譜的300個(gè)數(shù)據(jù)劃分到30個(gè)子區(qū)間,分別計(jì)算對(duì)應(yīng)的夾角余弦值,構(gòu)成尺寸為30×30的矩陣Θ。使用累計(jì)方差貢獻(xiàn)率確定矩陣Θ的主成分?jǐn)?shù)(化學(xué)秩)為3,與體系實(shí)際包括甲醇、乙醇、異丙醇3種組分的情況一致,并且矩陣秩滿足多元建模要求。
Fig.3 Raman spectra of methanol/ethanol/ isopropyl and their mixture
3.2 定量分析
按照乙醇含量分布,從30組樣本中選20組作為校正集,其余作為驗(yàn)證集。固定積分時(shí)間1 s,由于測(cè)量條件確定,沒(méi)有顯著的乘性效應(yīng),采用PLS、向量角+PLS(Vector angle+PLS, VAPLS)的結(jié)果如表1和圖4所示。
調(diào)整樣品測(cè)量的積分時(shí)間,可以使測(cè)量結(jié)果有較好的信噪比和線性響應(yīng),第二種測(cè)量方式下,積分時(shí)間處于1~10 s不等,因此信號(hào)包含了乘性干擾,采用PLS,MSC+PLS和VAPLS分別處理的結(jié)果如表2和圖5。
表3對(duì)比了兩種測(cè)量方式PLS和經(jīng)過(guò)VAPLS處理后的預(yù)測(cè)結(jié)果,乘性效應(yīng)顯著時(shí),直接PLS結(jié)果誤差顯著,而MSC處理后的PLS,RMSEP略微降低,但預(yù)測(cè)值與實(shí)際值的相關(guān)性變差; VAPLS則保持了穩(wěn)定而理想的定量效果。由于測(cè)量信噪比的改善,VAPLS在變動(dòng)積分時(shí)間測(cè)量的結(jié)果甚至優(yōu)于固定積分時(shí)間測(cè)量。
Table 1 Analytical result of ethanol content by different methods at 1S as integration time
Fig.4 The result of ethanol content by PLS and unvarying integration time (1 s)
Fig.5 The result of ethanol content by PLS,MSC+PLS VAPLS at an and VAPLS at varying integration time (1 ~10 s)
使用MSC這種經(jīng)驗(yàn)選取的方法進(jìn)行乘性效應(yīng)校正時(shí),參數(shù)選擇非常重要,如果參數(shù)選擇不合適或MSC假設(shè)不成立,如表2和表3,反而破壞了原始數(shù)據(jù)間的近似線性關(guān)系,導(dǎo)致模型預(yù)測(cè)能力降低,無(wú)法保證校正效果。PLS建模基于測(cè)量值與預(yù)測(cè)值之間的線性關(guān)系,未經(jīng)校正的拉曼光譜,其強(qiáng)度波動(dòng)降低或破壞了線性關(guān)系。拉曼光譜的測(cè)量方式無(wú)法避免散射和折射的影響,在固定測(cè)量條件的預(yù)測(cè)結(jié)果中,可以看出規(guī)律性誤差,對(duì)于高/低含量,誤差明顯,說(shuō)明僅僅約束測(cè)量條件,無(wú)法避免乘性效應(yīng)誤差。
Table 2 Analytical result of ethanol content by different methods at 1~10 s as integration time
Table 3 Analytical result of different methods
通過(guò)向量角轉(zhuǎn)換校正乘性效應(yīng),利用了向量角不受乘性效應(yīng)影響的特性,重構(gòu)線性關(guān)系,雖然不是完全嚴(yán)格,但從實(shí)驗(yàn)結(jié)果可以看出,其損失的準(zhǔn)確性通過(guò)消除乘性效應(yīng)得到彌補(bǔ),因調(diào)整參數(shù)改善的信噪比和儀器線性響應(yīng),又進(jìn)一步提高了預(yù)測(cè)精度。
拉曼光譜定量一直受到散射和折射影響,現(xiàn)有方法或效果有限或通常比較復(fù)雜。VAPLS方法將光譜數(shù)據(jù)視為向量,通過(guò)向量角轉(zhuǎn)換消除因散射和折射引起的乘性干擾,滿足多元分析所需的線性條件。實(shí)驗(yàn)結(jié)果表明有效改善了定量效果,原理簡(jiǎn)單、易于理解,數(shù)據(jù)處理過(guò)程便于模塊化,對(duì)于過(guò)程分析和在線監(jiān)測(cè)等難以保證可重復(fù)分析條件的應(yīng)用場(chǎng)合,將具有廣泛的應(yīng)用價(jià)值。
[1] HU Jun, HU Ji-ming(胡 軍, 胡繼明). Chinese Journal of Analytical Chemistry(分析化學(xué)), 2000, 28(6): 764.
[2] WANG Shu-xia, LI Li-mei, ZHONG Li-jing, et al(王淑霞, 李麗梅, 仲利靜, 等). Journal of Analytical Science(分析科學(xué)學(xué)報(bào)), 2011, 27(6): 782.
[3] Bakeev K D. Process Analytical Technology. 2nd ed. NJ: A John Wiley & Sons, Ltd. 2010. 372.
[4] CHU Xiao-li(褚小立). Molecular Spectroscopy Analytical Technology Combined with Chemometrics and Its Applications(化學(xué)計(jì)量學(xué)方法與分子光譜分析技術(shù)). Beijing: Chemical Industry Press(北京: 化學(xué)工業(yè)出版社), 2011. 48.
[5] Blanco M, Coello J, Montoliu I, et al. Analytica Chimica Acta, 2001, 434: 126.
[6] Jin Jingwei, Chen Zengping, Li Limei, et al. Analytical Chemistry, 2012, 84, 321.
[7] Iversen J A, Berg R W, Ahring B K. Anal. Bioanal. Chem., 2014, 406: 4915.
[8] Chen Y C, Thennadil S N. Analytica Chimica Acta, 2012, 746: 38.
[9] Yang Jing, Chen Zeng Ping, Zhang Juan, et al. Chemometrics and Intelligent Laboratory System, 2013, 126: 6.
[10] Song Mi, Chen Zeng Ping, Chen Yao, et al. Talanta, 2014, 125: 348.
[11] HU Ai-qin, YUAN Hong-fu, SONG Chun-feng, et al(胡愛(ài)琴, 袁洪福, 宋春風(fēng). 等). Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2014, 34(10): 2606.
[12] YAO Zhi-xiang,SU Hui(姚志湘, 粟 暉). CN102306236A.2012-01-04.
[13] Bai T J, Bai A A. Acta Ecologica Sinica, 2002, 22(6): 950.
[14] CHU Xiao-li, YUAN Hong- fu, LU Wan-zhen(褚小立, 袁洪福, 陸婉珍). Progress in Chemistry(化學(xué)進(jìn)展), 2004, 16(4): 535.
Correction Multiplicative Effects in Raman Spectra through Vector Angle Transformation
YAO Zhi-xiang1,3, SUN Zeng-qiang1, 3, SU Hui1, 3, YUAN Hong-fu2
1. Guangxi Key Laboratory of Sugar Resources Green Processing,Guangxi University of Science and Technology,Liuzhou 545006, China 2. College of Materials Science and Engineering, Beijing University of Chemical Technology, Beijing 100029, China 3. College of Biological and Chemical Engineering, Guangxi University of Science and Technology, Liuzhou 545006, China
The linear relationship between the Raman spectral intensity and the analyte amount is frequently disrupted for a variety of complex reasons, which include these variations in laser source, focusing effect, sample scattering and refracting, so that causes poor quantitative results. As a whole, these disturbing effects can be divided to be additive and multiplicative, and the multiplicative effects are generally more difficult to be eliminated. A spectrum is a series data, also can be treated as a vector. In principle, unstable motions in spectrum intensity/amplitude corresponding to the module shifts for a vector, doesn’t impact the vector direction which is the essence of the vector, so it is reasonable to rewrite the data form on module to on space angle for the same measurement. This thesis employed a data transformation to eliminate the multiplicative effects within spectra, i. e., the spectrum signal on its amplitude has been transformed to be on the vector angles. The first step of the transformation is the selection of a stand vector which is near to the analyte and almost orthogonal to the background within the sample space; and the next step is to define a moving window, then to find out the angle between the sample vector (i. e. the transformed spectrum) and the stand vector within the window; while the window is moved along the spectrum data series, the transformation for vector angle (VA) series has been finished. The thesis has proved that an approximate linear quantitative relationship has been remained in the VA series. Multivariate calibration need full rank matrix which is combined by spectrum from variety samples, and variety VA series also can combine a full rank VA matrix, so the approximate linear VA matrix still perfectly meeting the demand for multivariate calibration. A mixed system consisted by methanol-ethanol-isopropanol has been employed to verify the eliminations to the multiplicative effects. These measuring values of the system are obtained at different Raman integral times and have remarkable multiplicative effects. In predicting results, the correlation coefficient (r) and the root mean squared error of prediction (RMSEP) from class PLS respectively are 0.911 9 and 0.110 2, and 0.906 0 and 0.100 8 are for the preprocessing by multiplicative scatter correction (MSC). In contrast,rand RMSEP under the VAPLS, presented by this thesis, respectively are 0.998 7 and 0.015 2 and are significantly better than others. The VAPLS has eliminated the multiplicative effects of Raman spectra and improved the accuracy of Raman quantitative analysis and it owes to the preprocessing of the vector angle transformation.
Raman spectrum; Multiplicative effects; Scatter correction; Vector angle transformation
Oct. 13, 2014; accepted Feb. 4, 2015)
2014-10-13,
2015-02-04
國(guó)家科技支撐計(jì)劃課題(2011BAE11B00), 廣西自然科學(xué)基金項(xiàng)目(2014GXNSFAA118056),廣西科技計(jì)劃項(xiàng)目(桂科攻 1355010-15)資助
姚志湘,1968 年生,廣西科技大學(xué)廣西糖資源綠色加工重點(diǎn)實(shí)驗(yàn)室教授 e-mail: zxyao@21cn.com
O657.37
A
10.3964/j.issn.1000-0593(2016)02-0419-05