鄭少娜 車松杰 黃陽海
(1廣東省環(huán)境監(jiān)測中心廣東廣州5103082東莞立創(chuàng)華科檢測技術(shù)服務(wù)有限公司廣東東莞523808)
主成分分析方法在松山湖水質(zhì)分析的應(yīng)用
鄭少娜1車松杰2黃陽海2
(1廣東省環(huán)境監(jiān)測中心廣東廣州5103082東莞立創(chuàng)華科檢測技術(shù)服務(wù)有限公司廣東東莞523808)
采用基于因子分析的主成分分析的方法對松山湖2015年11個(gè)采樣點(diǎn)8項(xiàng)監(jiān)測指標(biāo)進(jìn)行分析,從原始數(shù)據(jù)出發(fā)提取了2個(gè)主要成分。第1成分主要是由水中的有機(jī)污染物所引起的;第2成分主要代表水中的硝酸鹽。評價(jià)結(jié)果認(rèn)為南部2#和3#監(jiān)測點(diǎn)位水質(zhì)污染程度嚴(yán)重,是松山湖水質(zhì)較差的主要原因??刂拼藚^(qū)域水質(zhì)污染程度將對松山湖水質(zhì)的改善產(chǎn)生巨大影響。
主成分分析;水質(zhì)指標(biāo);松山湖
水質(zhì)評價(jià)是根據(jù)某些水質(zhì)指標(biāo)值,通過所建立的數(shù)學(xué)模型,對水質(zhì)等級進(jìn)行綜合評價(jià)。如何更合理地、更客觀地描述水質(zhì)狀況,是20世紀(jì)90年代以來水環(huán)境研究領(lǐng)域的一個(gè)熱點(diǎn)和難點(diǎn)問題[1,2]。水質(zhì)受很多因素影響,基于單一指標(biāo)的許多評價(jià)方法在評價(jià)水質(zhì)時(shí)表現(xiàn)出一定的局限性,因?yàn)樗|(zhì)系統(tǒng)是由多維因子組成的復(fù)雜系統(tǒng),因子間可互相關(guān)聯(lián),綜合評價(jià)較為困難[3,4]。
主成分分析(Principal Components Analysis,PCA),又稱定量分析或多元分析,它是在一組變量中尋找出方差-協(xié)方差矩陣的特征量,然后由原變量在不損失原數(shù)據(jù)主要信息情況下,使信息更加集中、更典型地顯示出研究對象的特征[4,5]。該方法充分考慮各指標(biāo)之間的信息重疊,能夠在最大限度地保留原有信息的基礎(chǔ)上,對高維變量進(jìn)行最佳的綜合降維,且更客觀地確定各個(gè)指標(biāo)的權(quán)重,避免了主觀隨意性,因此廣泛應(yīng)用于社會(huì)學(xué)、教育學(xué)、醫(yī)學(xué)、環(huán)境科學(xué)等方面[2]。
東莞松山湖科技產(chǎn)業(yè)園區(qū)位于廣東省東莞市寮步、大朗、大嶺山三鎮(zhèn)接壤處,總面積59.43km2,是東莞市的幾何中心,目前規(guī)劃控制面積約72 km2,擁有8 km2的淡水湖(以下簡稱松山湖)和14 km2的生態(tài)綠地,是一個(gè)生態(tài)自然環(huán)境保持良好的區(qū)域。近年來,隨著園區(qū)經(jīng)濟(jì)的快速發(fā)展,松山湖水質(zhì)不斷惡化,水體富營養(yǎng)化現(xiàn)象日趨嚴(yán)重。為了研究松山湖水質(zhì)情況,于2015年對松山湖11個(gè)采樣點(diǎn)的8項(xiàng)指標(biāo)進(jìn)行為期1年的監(jiān)測,利用主成分分析方法對其水質(zhì)進(jìn)行綜合評價(jià)。
2.1采樣方法
根據(jù)視松山湖的地形、水面面積、入湖河流和工業(yè)排污口分布、富營養(yǎng)化狀況及其主要分布特征等,分別在北部、中部各設(shè)4個(gè)采樣點(diǎn),在南部設(shè)3個(gè)取樣點(diǎn)。具體采樣點(diǎn)位置如圖1所示,采樣方法按照《地表水和污水監(jiān)測技術(shù)規(guī)范》(HJ/T 91-2002)中的要求進(jìn)行。
圖1 松山湖水質(zhì)監(jiān)測點(diǎn)位示意圖
2.2監(jiān)測項(xiàng)目
監(jiān)測項(xiàng)目包括pH、溶解氧(DO)、高錳酸鹽指數(shù)(CODMn)、五日生化需氧量(BOD5)、氨氮(NH3-N)、總磷(TP)、總氮(TN)和硝酸鹽(NO3-N)等8項(xiàng),監(jiān)測結(jié)果詳見表1所示。
表1 松山湖水質(zhì)指標(biāo)監(jiān)測結(jié)果
3.1主成分確定
為了消除原始數(shù)據(jù)量綱和數(shù)量級的影響,利用SPSS19.0軟件對11個(gè)檢測點(diǎn)8項(xiàng)指標(biāo)數(shù)據(jù)進(jìn)行Z-Score標(biāo)準(zhǔn)化[7],見表2所示。再對標(biāo)準(zhǔn)后的數(shù)據(jù)進(jìn)行相似性分析,求得其相關(guān)系數(shù)矩陣R,結(jié)果見表3所示。從表3可以知道,CODMn與BOD5、TP和TN之間,TP和TN之間具有較強(qiáng)的相關(guān)性,其他指標(biāo)之間的相關(guān)性較小。
利用SPSS19.0軟件分別對檢測數(shù)據(jù)計(jì)算特征值和主成分貢獻(xiàn)率,結(jié)果見表4所示。從表4可以看出,利用SPSS19.0分別對檢測數(shù)據(jù)計(jì)算特征值和主成分貢獻(xiàn)率,第1、第2、第3主成分特征值分別為6.374、0.984和0.383,我們?nèi)√卣髦禐?.9,故只有第1和第2主成分的特征值大于0.9,且二者方差累積貢獻(xiàn)率達(dá)到91.970%,滿足因子選取原則(≥)說明第1和第2個(gè)主成分已經(jīng)反映原始變量提供的91.970%的信息,包含了以上8個(gè)指標(biāo)的所要信息,根據(jù)綜合評介的需要,用前2個(gè)主成分來代替原來的8個(gè)指標(biāo)變量。
表2 標(biāo)準(zhǔn)化數(shù)據(jù)
表3 相關(guān)系數(shù)矩陣R
表4 主成分特征值和累計(jì)貢獻(xiàn)率
3.2主成分表達(dá)式的確定
每個(gè)污染指標(biāo)初始因子載荷系數(shù)表示與主成分的相關(guān)程度,正值表示正相關(guān),負(fù)值表示負(fù)相關(guān),其絕對值越接近1,表示相關(guān)程度越高[4]。對第1、第2主成分進(jìn)行載荷值計(jì)算,結(jié)果見表5所示。由主成分載荷大小可以看出,第1成分,除NO3-N載荷較小外,其他指標(biāo)所占載荷均較大,說明第1個(gè)主成分反映了pH、DO、CODMn、BOD5、NH3-N、TP和TN等7項(xiàng)指標(biāo)的信息;第2個(gè)主成分中NO3-N載荷最大,說明第2個(gè)主成分主要反映了NO3-N指標(biāo)的信息。
表5 初始因子載荷矩陣
表6 主成分系數(shù)表
各成分表達(dá)式系數(shù)用初始因子荷載量矩陣第i列向量除于特征值就得到第i個(gè)主成分的系數(shù)向量[3,4],結(jié)果見表6所示。則各成分表達(dá)式為:
其中,xn為原始監(jiān)測數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)值。
以每個(gè)主成分所對應(yīng)的特征值占提取主成分總的特征值之和的比例作為權(quán)重計(jì)算主成分模型[3,4]:
3.3評價(jià)結(jié)果
根據(jù)上述主成分表達(dá)式計(jì)算出11個(gè)監(jiān)測點(diǎn)位的主成分得分F1、F2及綜合得分F,以定量描述各監(jiān)測點(diǎn)位水質(zhì)污染程度并進(jìn)行排序,具體結(jié)果見表7。
根據(jù)表5可以知道,F(xiàn)1反映了pH、DO、CODMn、BOD5、NH3-N、TP和TN等7項(xiàng)指標(biāo)的信息,但關(guān)聯(lián)最大的是CODMn和BOD5,表示的是有機(jī)污染物污染程度。從表7可以知道,南部2#和3#監(jiān)測點(diǎn)位的值最大,而且遠(yuǎn)遠(yuǎn)大于其他監(jiān)測點(diǎn)位,說明此處水體中有機(jī)污染物污染程度最嚴(yán)重。這是因?yàn)槟喜?#監(jiān)測點(diǎn)位剛好位于大嶺山楊屋村、顏屋村混合生活污水排入松山湖的排污口;而南部3#監(jiān)測點(diǎn)位剛好位于大嶺山月山村生活污水排入松山湖的排污口,據(jù)現(xiàn)狀分析,這幾個(gè)村的生活污水暫時(shí)沒有收集處理,還是直接排入松山湖,引起有機(jī)物污染嚴(yán)重,影響水質(zhì)。因此,完善大嶺山各村鎮(zhèn),特別是靠近松山湖附近村鎮(zhèn)的生活污水截流管網(wǎng),將生活污水排入污水處理站處理后再排放,對松山湖的水質(zhì)的提高有深刻的影響。
表7 各監(jiān)測點(diǎn)位水質(zhì)綜合評價(jià)結(jié)果
F2反映了NO3-N指標(biāo)信息。從表7可以知道,南部2#監(jiān)測點(diǎn)位值最高,中部2#監(jiān)測點(diǎn)位值其次,而北部1#和2#監(jiān)測點(diǎn)位值最小。南部2#監(jiān)測點(diǎn)位值最高原因與前面有機(jī)物污染分析一致,而中部2#監(jiān)測點(diǎn)位較高的原因可能跟中部由于商部、交通設(shè)施、密集人流、等產(chǎn)生的生活污水和生活垃圾進(jìn)入松山湖引起的。
本文利用SPSS對2015年松山湖水質(zhì)進(jìn)行計(jì)算分析,得到以下內(nèi)容:(1)對松山湖水質(zhì)監(jiān)測指標(biāo)進(jìn)行主成分分析,得到第1主成分主要是水中的CODMn和BOD5有機(jī)污染物引起;第2主成分主要體現(xiàn)的是水中的NO3-N信息。(2)位于南部2#和3#監(jiān)測點(diǎn)位的水質(zhì)污染程度嚴(yán)重,也是松山湖水質(zhì)較差的主要原因??刂拼藚^(qū)域水質(zhì)污染程度將對松山湖水質(zhì)的改善產(chǎn)生巨大影響。
[1]鄒志紅,孫靖南,任廣平.模糊評價(jià)因子的熵權(quán)法賦權(quán)及其在水質(zhì)評價(jià)中的應(yīng)用[J].環(huán)境科學(xué)學(xué)報(bào),2005,25(4):552-556.
[2]鄒海明,蔣良富,李粉茹.基于主成分分析的水質(zhì)評價(jià)方法[J].數(shù)學(xué)實(shí)踐與認(rèn)識(shí),2008,38(8):85-90.
[3]譚明芳,毛唐秀,江利平,田哲.基于主成分分析法的淪河水質(zhì)評價(jià)[J].現(xiàn)代農(nóng)業(yè)科技,2012,11:214-215.
[4]潘春芳,崔廣柏,張浩.主成分分析方法在太湖水質(zhì)綜合評價(jià)中的應(yīng)用[EB/OL].北京:中國科技論文在線.[2008-06-10].http: //www.paper.edu.cn/releasepaper/content/200806-197.
[5]萬金保,何華燕,曾海燕,李嬡嬡.主成分分析法在鄱陽湖水質(zhì)評價(jià)中的應(yīng)用[J].南昌大學(xué)學(xué)報(bào),2010,32(2):113-117.
鄭少娜(1985—),女,廣東饒平人,研究生,從事環(huán)境監(jiān)測質(zhì)量管理工作。