袁 麗,謝貝貝,崔永強(qiáng),張曉丹,焦慧慧
1. 成都信息工程大學(xué)計(jì)算機(jī)學(xué)院,四川 成都 610225 2. 燕山大學(xué)信息科學(xué)與工程學(xué)院,河北 秦皇島 066004
近年來隨著航海事業(yè)、 海洋石油開發(fā)和沿海經(jīng)濟(jì)的發(fā)展,突發(fā)性海洋溢油事故隱患大大增加[1]。 溢油事故一旦發(fā)生,受風(fēng)力、 浪潮和海洋漂流等的影響,會在海面上迅速擴(kuò)散,給海洋環(huán)境、 海洋生物、 人類經(jīng)濟(jì)生活等帶來極大的危害,造成不可估量的海洋生態(tài)環(huán)境損害和社會經(jīng)濟(jì)損失[2]。 例如美國墨西哥灣和我國渤海灣的溢油事故無疑是其中最具代表性的事件,一度成為媒體關(guān)注的焦點(diǎn)。 因此海洋溢油污染的治理、 改善,成為海洋環(huán)境保護(hù)工程中刻不容緩的重要工作,而對溢油污染區(qū)域準(zhǔn)確識別并監(jiān)測其動態(tài)發(fā)展變化是控制溢油污染加劇、 制定溢油清理方案的關(guān)鍵。
其次溢油進(jìn)入海域,由于自身性質(zhì)和海面環(huán)境的不斷作用和影響,會經(jīng)歷擴(kuò)散、 蒸發(fā)、 溶解、 分散、 乳化、 光氧化、 微生物降解、 對懸浮物的吸附和沉積到海底等復(fù)雜的風(fēng)化過程[3]。 我們將其簡單區(qū)分為未乳化、 乳化、 降解等三個主要的階段。 而對海面上的溢油而言,主要包括未乳化與乳化兩個不同階段。 不同的海面溢油污染類型,需要采用不同的應(yīng)急處理策略,如圍隔圍擋、 燃燒消除等[4]。
另外從溢油探測技術(shù)來看,激光誘導(dǎo)熒光(LIF)技術(shù)指依靠激光源發(fā)射激光到海面,海水及各種溢油成分受激發(fā)射含各種成分信息的熒光。 它是一種基于光致發(fā)光的物質(zhì)成分和含量分析技術(shù),因其能夠探測到石油最主要特性,即獨(dú)特的石油熒光光譜特征,被認(rèn)為是目前海面溢油遙感探測的最有效手段之一。 本文基于LIF探測系統(tǒng)獲取的未乳化與乳化溢油熒光光譜信息,分析比較得出兩者光譜的差異性,并根據(jù)光譜差異對溢油狀態(tài)進(jìn)行分類,可為海面溢油狀態(tài)的快速識別提供一種新的方法。
LIF光譜實(shí)驗(yàn)裝置原理圖如圖1所示。 實(shí)驗(yàn)采用NDV4542激光二極管,以405 nm激光作為激發(fā)光源。 光譜儀為AvaSpec-ULS204,依據(jù)溢油熒光光譜信號的響應(yīng)波段,將波段接收范圍設(shè)定為420~600 nm。 光譜儀獲得的熒光光譜通過計(jì)算機(jī)進(jìn)行分析和處理。 電子顯微鏡用來觀察乳化液中液滴的存在方式。
圖1 LIF系統(tǒng)測量溢油熒光示意圖Fig.1 Schematic diagram of LIF system measuringoil spill fluorescence
選取市售柴油、 煤油兩種常見成品油作為實(shí)驗(yàn)用油,其中,采用加入乳化劑的方式配備溢油乳化物,在玻璃容器中先加入適量比例的混合乳化劑,再加入定量的成品油和水,用攪拌機(jī)進(jìn)行攪拌,即可制備出一定油水比的溢油乳化物; 采用平鋪擴(kuò)散的方法來制備油膜,用滴管將不同量的油滴到玻璃容器水面上,靜置一段時間,待油膜均勻擴(kuò)散后,即可獲得不同厚度的油膜。
在實(shí)驗(yàn)數(shù)據(jù)收集過程中,受背景噪聲、 激發(fā)光能量波動、 熒光收集效率變化的影響,會造成光譜信號不穩(wěn)定從而影響后續(xù)的分析結(jié)果,對于信噪比過低的光譜信號可以采用Savitzky-Golay濾波器[5]平滑處理。 另對于獲取的光譜,將不同位置多次采集的信號求平均值,并去除背景光信號。 采集柴油油膜和煤油油膜光譜時,為了使實(shí)驗(yàn)更貼近實(shí)際情況,每組油膜厚度的選取均不相同。 由于乳化因水油比例的不同所呈現(xiàn)的熒光光譜會有差異,采集乳化柴油光譜時,制備了33種,水占比范圍為1%~98%的不同油水比例的乳濁液,每個油水比例采集2組數(shù)據(jù); 采集乳化煤油光譜時,選用與柴油相同的方法。 實(shí)驗(yàn)中采集乳化柴油光譜66組,乳化煤油光譜42組,柴油油膜光譜25組,煤油油膜光譜27組,共計(jì)光譜數(shù)據(jù)160組。
不同厚度的油膜為純油分子,乳化溢油為油水混合結(jié)構(gòu),不同油水比的乳化溢油又具有不同的液滴存在方式。 通過顯微鏡觀察配置的乳化液液滴分布,以及根據(jù)油與水在乳液中角色的不同,乳化溢油存在油包水、 油包水包油、 水包油包水、 水包油四種方式。 由于油包水包油和水包油包水沒有明確的油水比例界限,將兩者合稱為多重狀態(tài)。 所以按液滴存在方式將乳化溢油狀態(tài)分為油包水、 多重、 水包油三種。 加上未乳化時的油膜,海面溢油可看作包含四種狀態(tài)。 不同狀態(tài)溢油由于熒光團(tuán)的不同表現(xiàn),在激光作用下激發(fā)出的熒光信息也會不同。 因此同一實(shí)驗(yàn)條件下,不同狀態(tài)的海面溢油呈現(xiàn)出不同的熒光光譜曲線形狀。
分別選取柴油、 煤油不同狀態(tài)的部分?jǐn)?shù)據(jù),對其波形進(jìn)行展示。 如圖2、 圖3所示。 其中,兩圖中的分圖(a)中圖例代表的不同厚度對應(yīng)不同油滴數(shù)目,分圖(b),(c)和(d)中圖例均為不同含水率。
在之前的研究工作中[6],我們已經(jīng)總結(jié)過溢油乳化物熒光特性變化規(guī)律,詳細(xì)論述了含水與不含水以及不同含水下的光譜區(qū)別和產(chǎn)生的原因。 分析不同狀態(tài)溢油光譜曲線圖,也可看出,不管是柴油油膜與乳化柴油的對比,還是煤油油膜與乳化煤油的對比,曲線形狀的不同均表現(xiàn)為: 熒光峰個數(shù)、 強(qiáng)度以及峰位的不同。 這種差異有利于運(yùn)用特征參量化+聚類分析法進(jìn)行區(qū)分識別。
圖2 柴油不同狀態(tài)光譜曲線圖(a): 柴油油膜; (b): 油包水型乳化柴油; (c): 多重型乳化柴油; (d): 水包油型乳化柴油Fig.2 Spectrum curves of diesel oil in different states(a): Diesel oil film; (b): Water in oil emulsified diesel oil;(c): Multi heavy emulsified diesel; (d): Oil in water emulsified diesel oil
圖3 煤油不同狀態(tài)光譜曲線圖(a): 煤油油膜; (b): 油包水型乳化煤油; (c): 多重型乳化煤油; (d): 水包油型乳化煤油Fig.3 Spectrum curves of kerosene in different states(a): Kerosene film; (b): Water in oil emulsified kerosene;(c): Multi heavy emulsified kerosene; (d): Oil in water emulsified kerosene
2.2.1 特征參量化
前面研究得出的光譜變化規(guī)律可以構(gòu)成溢油狀態(tài)的識別依據(jù)。 但由于這些特征屬于光譜總體直觀形狀的描述,需要先進(jìn)行參數(shù)化,將描述性特征用具體數(shù)據(jù)表示出來,即實(shí)現(xiàn)形態(tài)空間到數(shù)據(jù)空間的轉(zhuǎn)換。
將乳化溢油熒光光譜外觀形態(tài)進(jìn)行參數(shù)化的過程,主要包括熒光峰數(shù),熒光峰值,熒光峰位等幾個相關(guān)特征進(jìn)行數(shù)據(jù)化表示的過程。
首先,選擇光譜的平均值和標(biāo)準(zhǔn)差來表示光譜曲線的一般形狀,其中
平均值: 表示了熒光光譜的平均能量強(qiáng)度,反映數(shù)據(jù)的集中趨勢。 計(jì)算公式為
(1)
標(biāo)準(zhǔn)差: 代表譜值的離散化程度,計(jì)算公式為
(2)
選擇峰度系數(shù)來表示光譜曲線上熒光峰的形態(tài)特點(diǎn),正態(tài)分布的峰度為0,其他分布的峰度是以正態(tài)分布為標(biāo)準(zhǔn)描述該分布密度形狀為陡峭或平坦的數(shù)字特征。 計(jì)算公式為
(3)
其次,熒光峰數(shù)用光譜的曲線斜率來表示,即通過相鄰波長差范圍內(nèi)斜率的乘積為負(fù)數(shù),且兩個斜率是正負(fù)次序來確定。
熒光峰位用譜線寬度來表示,譜線寬度指的是光譜曲線最大強(qiáng)度的一半處所對應(yīng)的兩個波長之差,也稱為半寬度,此處選用的參數(shù)為最大峰高度的半寬度。
熒光峰強(qiáng): 確定好熒光峰位后,對應(yīng)的熒光強(qiáng)度值。 此處涉及的參量記為最高峰高度。
最后借助matlab工具,對光譜進(jìn)行特征參數(shù)化,其中,平均值所用函數(shù)為M=mean(A, dim),標(biāo)準(zhǔn)差也就是方差的算術(shù)平方根,這里計(jì)算方差所用函數(shù)為V=var(A,w, dim) ; 峰度系數(shù)計(jì)算函數(shù)為k=kurtosis(X, flag); 最高峰高度、 最大峰高度的半寬度幾個參數(shù)計(jì)算所用函數(shù)為 [PKS, LOCS, W, P]=findpeaks(Y); 求曲線斜率采用插值后差分代微分的方法,根據(jù)斜率值判斷熒光峰數(shù)。
2.2.2 聚類分析
聚類分析是以樣品或指標(biāo)之間的相近程度為依據(jù)對研究對象進(jìn)行分類的統(tǒng)計(jì)分析技術(shù),可對各種類型的數(shù)據(jù)進(jìn)行分類分析。 聚類分析不需要進(jìn)行樣本訓(xùn)練,是一種無指導(dǎo)學(xué)習(xí)的分類方法[7-8]。
其基本原理為: 根據(jù)研究對象指標(biāo)(變量)或者研究的樣本(網(wǎng)點(diǎn))之間存在的不同程度的相似性(相似程度-用樣品或者變量之間的距離度量),對于一批分析樣品的多個具體觀測指標(biāo)或者樣品本身,通過研究找出一些可以用來衡量指標(biāo)或者樣本之間親疏關(guān)系的統(tǒng)計(jì)量,將這些統(tǒng)計(jì)量作為組劃分或類劃分的輸入依據(jù)。 在一定的閾值指標(biāo)下,將相似程度較大的一部分變量(或樣本)聚合為一類,而將另外一部分變量(或樣本)根據(jù)相似程度聚合成另一類。 逐步進(jìn)行下去,直到最后,所有的變量(或樣本)都處于某一類中。
對描述性特征進(jìn)行參數(shù)化后,將轉(zhuǎn)換后的數(shù)據(jù)再次進(jìn)行標(biāo)準(zhǔn)化處理,即可作為聚類分析的輸入?yún)⒘俊?/p>
本文實(shí)現(xiàn)樣本聚類,綜合考慮各種方法的利弊后,確定采用分層聚類[9]實(shí)現(xiàn)。 樣本之間的相似性度量,經(jīng)過反復(fù)嘗試之后采用歐幾里得距離[10]作為樣本之間相似性度量,實(shí)際分析中兩個樣本如果同屬于一類,則其特征參量相似性越高,歐幾里得距離值應(yīng)該越小,即分類方法采用最短距離法。
2.2.3 識別結(jié)果
利用matlab編寫相應(yīng)的算法對熒光光譜數(shù)據(jù)進(jìn)行計(jì)算,對應(yīng)的相關(guān)特征參數(shù)如表1所示。 編號1—66為乳化柴油相關(guān)數(shù)據(jù),67—91號為柴油油膜相關(guān)數(shù)據(jù); 92—133號為乳化煤油相關(guān)數(shù)據(jù),134—160號為煤油油膜相關(guān)數(shù)據(jù)。
表1 特征參數(shù)表Table 1 Characteristic parameter table
接下來利用SPSS軟件的系統(tǒng)聚類,將均值、 標(biāo)準(zhǔn)差、 峰度系數(shù)、 最大峰高度、 熒光峰數(shù)、 最大峰高度半寬度幾個參數(shù)作為輸入?yún)⒘?,對柴油?shù)據(jù)和煤油數(shù)據(jù)分別進(jìn)行分類,實(shí)現(xiàn)數(shù)據(jù)空間到對象空間的轉(zhuǎn)換。 結(jié)果如圖4和圖5所示。
圖4橫軸為不同的柴油數(shù)據(jù)(91組),縱軸為類別相對距離,從上往下的豎線代表不同相對距離下柴油狀態(tài)的類別。
圖5橫軸代表不同的煤油數(shù)據(jù)(69組),縱軸為類別相對距離,從上往下的豎線代表不同相對距離下煤油狀態(tài)的類別。
根據(jù)分類樹狀圖的結(jié)果,如果二分類,為乳化與未乳化的區(qū)分; 如果四分類,為油包水、 多重、 水包油、 油膜四種狀態(tài)的區(qū)分,區(qū)分具體結(jié)果如表2和表3所示。
通過表中結(jié)果的對照,可以看出,對于柴油和煤油,乳化與未乳化的分類,該方法與實(shí)際狀態(tài)是完全一致的,即能完全識別乳化與未乳化; 劃分四個類別時,多重狀態(tài)有個別歸為油包水或水包油,考慮原因?yàn)槎嘀貭顟B(tài)本身的界定并沒有十分準(zhǔn)確的一個油水比值,而實(shí)驗(yàn)數(shù)據(jù)是連續(xù)間隔選取的油水比,物質(zhì)成分是十分相近的,所以出現(xiàn)多重狀態(tài)里的個別劃分不準(zhǔn),是允許存在的。 總的說來,該方法可以很好實(shí)現(xiàn)對溢油不同狀態(tài)的劃分。
圖4 柴油狀態(tài)分類樹狀圖Fig.4 Tree diagram of diesel status classification
表2 二分類結(jié)果對照表Table 2 Comparison table of two classification results
表3 四分類結(jié)果對照表Table 3 Comparison table of four classification results
熒光光譜的形狀取決于物質(zhì)的分子結(jié)構(gòu),基于此,論文從光譜形狀的不同出發(fā),利用統(tǒng)計(jì)特征和波形特征,找到描述乳化與未乳化,以及不同類型乳化的光譜不同形狀的數(shù)據(jù)化參量,并使用聚類分析的方法,最終實(shí)現(xiàn)已知油種前提下的海面溢油不同狀態(tài)的區(qū)分和識別。 當(dāng)前關(guān)于油種識別已見相關(guān)算法,后續(xù)可結(jié)合油種的識別方法,進(jìn)行更深入全面的研究,以期實(shí)現(xiàn)不同油種不同溢油狀態(tài)的識別。