吳 勇,劉有軍,陳 偉,江 強(qiáng)
(云南省建筑科學(xué)研究院,云南昆明650223)
水環(huán)境質(zhì)量評(píng)價(jià)就是通過一定的數(shù)理方法和其他手段,對(duì)水環(huán)境素質(zhì)的優(yōu)劣進(jìn)行定量描述的過程。水環(huán)境質(zhì)量評(píng)價(jià)必須以監(jiān)測(cè)資料為基礎(chǔ),經(jīng)過數(shù)理統(tǒng)計(jì)得出統(tǒng)計(jì)量 (特征數(shù)值)及環(huán)境的各種代表值,然后依據(jù)水環(huán)境質(zhì)量評(píng)價(jià)方法及水環(huán)境質(zhì)量分級(jí)分類標(biāo)準(zhǔn)進(jìn)行環(huán)境質(zhì)量評(píng)價(jià)。然而水環(huán)境系統(tǒng)是一個(gè)復(fù)雜的系統(tǒng),在分析過程中,需要對(duì)多個(gè)變量進(jìn)行分析,由于變量個(gè)數(shù)眾多且彼此之間存在著一定的相關(guān)性,使得對(duì)主要信息的提取變得十分復(fù)雜。僅僅靠單一的指標(biāo)來評(píng)價(jià)水環(huán)境質(zhì)量的污染程度,難免產(chǎn)生片面性。因此對(duì)水環(huán)境質(zhì)量進(jìn)行綜合評(píng)價(jià)的最大難點(diǎn)就是多目標(biāo)性,即需要考慮眾多表征水環(huán)境質(zhì)量的指標(biāo)。如何科學(xué)地、客觀地將一個(gè)多指標(biāo)問題綜合成為少數(shù)幾個(gè)指標(biāo)問題成為水環(huán)境質(zhì)量評(píng)價(jià)的研究重點(diǎn)。
近年來,隨著多元統(tǒng)計(jì)分析的普及和應(yīng)用,主成分分析法也成為一種新興的評(píng)價(jià)方法,在環(huán)境質(zhì)量綜合評(píng)價(jià)方面應(yīng)用廣泛。主成分分析法能將高維空間的問題轉(zhuǎn)化到低維空間去處理,使問題變得比較簡單、直觀,而且這些較少的綜合指標(biāo)之間互不相關(guān),又能提供原有指標(biāo)的絕大部分信息[1]。而且,伴隨主成分分析的過程,將會(huì)自動(dòng)生成各主成分的權(quán)重,這就在很大程度上抵制了在評(píng)價(jià)過程中人為因素的干擾。
渭河在“品字泉”源頭,其水質(zhì)良好,清澈透亮,沁人心脾。從源頭往下,進(jìn)人水土流失區(qū),河水由清變濁、由濁變渾。據(jù)有關(guān)資料介紹,在定西境內(nèi),河水含沙量達(dá)66.4kg/m3。渭河甘肅段有污染源87家,其中工業(yè)污染源62家,年接納工業(yè)廢水和生活污水2622萬t。根據(jù)甘、陜環(huán)境保護(hù)部門的監(jiān)測(cè)資料,渭河至陜西鳳閣嶺后,除個(gè)別指標(biāo)超標(biāo)外,其水質(zhì)多年來均符合《地面水環(huán)境質(zhì)量標(biāo)準(zhǔn)》Ⅲ類水標(biāo)準(zhǔn),可以滿足工農(nóng)業(yè)用水的要求。
渭河陜西段有工業(yè)企業(yè)8000多家,呈串珠式分布于渭河及其支流兩岸;尚有50多萬個(gè)鄉(xiāng)鎮(zhèn)企業(yè),其中鄉(xiāng)鎮(zhèn)工業(yè)企業(yè)達(dá)15萬個(gè)左右。據(jù)對(duì)縣及縣以上工業(yè)企業(yè)的環(huán)境統(tǒng)計(jì),渭河年接納工業(yè)廢水3.2億t,城市生活污水1.69億t;工業(yè)廢水、生活污水處理率分別為77.9%、21%左右,絕大多數(shù)生活污水和22%的工業(yè)廢水未經(jīng)處理直接排入渭河水系。渭河水系年接納重金屬4.46t、有機(jī)污染物約10.75萬t,其中COD達(dá)10.66萬 t,約占有機(jī)污染物的99.2%。由于含重金屬的工業(yè)廢水已在20世紀(jì)80代基本治理達(dá)標(biāo),向渭河排放的重金屬的數(shù)量較少,而渭河又是一條多泥沙、河槽寬闊、比降較小的河流,水流速度較慢、水層亦較淺,易于泥沙對(duì)重金屬離子的吸附和沉降,河水中重金屬的濃度較低,只有個(gè)別斷面某種金屬離子濃度超過地面水的Ⅲ類水的標(biāo)準(zhǔn)。渭河流經(jīng)寶雞、咸陽、西安和渭南等市,受到有機(jī)污染物的重復(fù)污染,已超出其稀釋和自凈能力,呈有機(jī)型污染特征,以氨氮、高錳酸鹽指數(shù)、生化需氧量和揮發(fā)酚污染較為突出。
主成分分析法 (prineipalcoplllonentarialysis,PCA)也許是多變量分析中最古老和最著名的技術(shù)。最早是由美國統(tǒng)計(jì)學(xué)家皮爾遜 (PEARsoN)在1901年的生物學(xué)理論研究中引入的。是從多指標(biāo)分析出發(fā),運(yùn)用統(tǒng)計(jì)分析原理與方法提取少數(shù)幾個(gè)彼此不相關(guān)的綜合性指標(biāo)而保持其原指標(biāo)所提供的大量信息的一種統(tǒng)計(jì)方法。1933年,HOTELLING[2]將此想法應(yīng)用于心理學(xué)研究,并得到了進(jìn)一步的發(fā)展。1947年,KARHuNEN[3]獨(dú)立地用概率論的形式再次將其研究,其后LOEVE將該理論進(jìn)一步擴(kuò)充和完善,故PCA理論也稱為KAHRUNENLOEVE變換。
主成分分析法的工作對(duì)象是樣本點(diǎn)x定量變量類型的數(shù)據(jù)表。它的工作目標(biāo),就是要對(duì)這種多變量的平面數(shù)據(jù)表進(jìn)行最佳綜合簡化。也就是說,要在力保數(shù)據(jù)信息丟失最少的原則下,對(duì)高維變量進(jìn)行降維處理[4]。
除了降低多變量數(shù)據(jù)系統(tǒng)的維度以外,主成分分析同時(shí)還簡化了變量系統(tǒng)的統(tǒng)計(jì)數(shù)字特征。對(duì)于任意p個(gè)變量,描述它們自身及相互關(guān)系的數(shù)字特征包括均值、方差、協(xié)方差等,一共有P+(1/2)p(P+l)個(gè)參數(shù)。經(jīng)過主成分分析后,每個(gè)新變量系統(tǒng)的數(shù)字特征減少了P+(1/2)p(p-1)個(gè)。假定有n個(gè)水體樣本,每個(gè)樣本共有p個(gè)指標(biāo)變量,則構(gòu)成了一個(gè)n×p階的地理數(shù)據(jù)矩陣
利用p個(gè)原始變量構(gòu)成少量幾個(gè)新的綜合變量,使得新變量為原始變量的線性組合,記原來的變量指標(biāo)為x1,x2,…,xP,z1,z2,…,zm(m≤p)為新變量指標(biāo),則:
z1,z2,…,zm分別稱為原變量指標(biāo) x1,x2,…,xP的第一,第二,…,第m主成分,在實(shí)際問題的分析中,常挑選前幾個(gè)最大的主成分。①zi與zj(i≠j;i,j=1,2,…,m)相互無關(guān);②z1是x1,x2,…,xP的一切線性組合中方差最大者,z2是與z1不相關(guān)的x1,x2,…,xP的所有線性組合中方差最大者;……;zm是與 z1,z2,……,zm-1都不相關(guān)的x1,x2,…,xP的所有線性組合中方差最大者。
MTLAB是美國Math Works公司出品的商業(yè)數(shù)學(xué)軟件,用于算法開發(fā)、數(shù)據(jù)可視化、數(shù)據(jù)分析以及數(shù)值計(jì)算的高級(jí)技術(shù)計(jì)算語言和交互式環(huán)境,主要包括MATLAB和Simulink兩大部分。本次采用MATLAB數(shù)據(jù)處理軟件主要是進(jìn)行高級(jí)矩陣和陣列語言的計(jì)算。
本次對(duì)渭河干流陜西段共選取了8個(gè)斷面,分別為咸陽鐵橋S1、草灘橋S2、耿鎮(zhèn)橋S3、新豐橋S4、黑河入渭S5、澇河入渭S6、新河入渭S7、臨河入渭S8共8個(gè)斷面進(jìn)行檢測(cè),評(píng)價(jià)選用溶解氧、生化需氧量、高錳指數(shù)、氨氮、揮發(fā)酚、氰化物、汞、六價(jià)鉻8個(gè)評(píng)價(jià)參數(shù),表1為檢測(cè)數(shù)據(jù)。
表1 渭河8個(gè)斷面檢測(cè)結(jié)果表
表2 檢測(cè)數(shù)據(jù)標(biāo)準(zhǔn)化處理后的結(jié)果
表3 檢測(cè)指標(biāo)相關(guān)系數(shù)矩陣
對(duì)同一變量減去其均值再除以標(biāo)準(zhǔn)差得到的新數(shù)據(jù)為標(biāo)準(zhǔn)化后的數(shù)據(jù)。對(duì)于特殊評(píng)價(jià)參數(shù)溶解氧,首先對(duì)其進(jìn)行導(dǎo)數(shù)處理,然后再進(jìn)行標(biāo)準(zhǔn)化處理,表2為檢測(cè)結(jié)果標(biāo)準(zhǔn)化后的數(shù)據(jù)。根據(jù)標(biāo)準(zhǔn)化數(shù)據(jù)計(jì)算相關(guān)數(shù)矩陣,檢測(cè)指標(biāo)相關(guān)系數(shù)矩陣如表3所示。
再由相關(guān)系數(shù)矩陣計(jì)算特征值,以及各個(gè)主成分的貢獻(xiàn)率與累計(jì)貢獻(xiàn)率,特征值、特征向量的計(jì)算是根據(jù)MATLAB軟件結(jié)合計(jì)算而來。計(jì)算數(shù)據(jù)見表4、5、6,由此可知,第一,第二,第三主成分的累計(jì)貢獻(xiàn)率已高達(dá)86.5%,故只需求出第一、第二、第三主成分z1,z2,z3即可。
表4 特征值
表5 特征向量表格
表6 特征值和累計(jì)貢獻(xiàn)率
根據(jù)主成分載荷公式計(jì)算主成分載荷,根據(jù)特征值 λ1=4.7927,λ2=1.4880,λ3=1.2601分別求出其特征向量e1,e2,e3,再用公式(i,j=1,2,3,…,p),計(jì)算各變量在主成分1,2,3上的載荷。
表7 檢測(cè)指標(biāo)載荷矩陣
從表3的相關(guān)矩陣出發(fā),計(jì)算各主成分的特征值、方差貢獻(xiàn)率及累積方差貢獻(xiàn)率和各監(jiān)測(cè)指標(biāo)的載荷矩陣,結(jié)果見表6和表7。由表7中相關(guān)系數(shù)陣的特征值可以看出,前3個(gè)主成分已滿足≥85%的條件,因此只需用3個(gè)主成分取代原有8個(gè)指標(biāo),就能很好地表達(dá)。由表7監(jiān)測(cè)指標(biāo)的載荷矩陣計(jì)算前3個(gè)主成分的表達(dá)方式:
將各監(jiān)測(cè)斷面的標(biāo)準(zhǔn)化數(shù)據(jù)代入所提取的3個(gè)主成分公式中,得到各斷面的主成分,再根據(jù)Prin1、Prin2、Prin3和對(duì)應(yīng)的客觀權(quán)重 e1、e2、e3(方差貢獻(xiàn)率)的積之和計(jì)算得出各監(jiān)測(cè)斷面的綜合主成分Prin1~3,監(jiān)測(cè)斷面的主成分計(jì)算結(jié)果如表8所示。根據(jù)《地面水環(huán)境質(zhì)量標(biāo)準(zhǔn)》(GB3838-2002),和《地表水資源質(zhì)量標(biāo)準(zhǔn)》(SL63-94)可得水質(zhì)分級(jí)標(biāo)準(zhǔn),如表9所示。
根據(jù)表8的各個(gè)監(jiān)測(cè)斷面綜合主成分,參考綜合主成分分級(jí)標(biāo)準(zhǔn)表8得到各個(gè)斷面的水質(zhì)類別:黑河入渭 (S5)水質(zhì)屬于Ⅰ類;耿鎮(zhèn)橋 (S3)水質(zhì)屬于Ⅲ類;咸陽鐵橋 (S1)、新豐橋 (S4)水質(zhì)屬于Ⅳ類;草灘橋 (S2)、澇河入渭 (S6)、新河入渭 (S7)以及臨河入渭 (S8)水質(zhì)屬于Ⅴ類。由此可見,黑河入渭 (S5)水質(zhì)最好,其他斷面的水質(zhì)均受到不同程度的污染,渭河陜西段水體綜合水質(zhì)為Ⅴ類,污染很嚴(yán)重,不能滿足此區(qū)域河流水體的功能要求。
表8 各監(jiān)測(cè)斷面的主成分
表9 水質(zhì)分級(jí)標(biāo)準(zhǔn)
(1)造紙企業(yè)數(shù)量多、規(guī)模小、分布廣。2007年不完全統(tǒng)計(jì)全省共有造紙企業(yè)850多家,平均規(guī)模為400 t/a,可見CODMn污染指數(shù)較高主要是造紙企業(yè)引起的。
(2)化肥和農(nóng)藥使用不合理。寶雞市土壤養(yǎng)分失衡問題一直比較突出,由于大量使用廉價(jià)劣質(zhì)的氮肥和農(nóng)藥,以及氮、磷、鉀肥施用不成比例,因此使氮肥溶解而被沖入水體中造成污染。
(3)河道生態(tài)水量不足。渭河寶雞峽林家村引渭工程近310年年平均取水量為4.83億m3,占河道水量的49.07%,造成河道生態(tài)水量大幅下降、水體污染物濃度得不到稀釋,這也是現(xiàn)今污染指數(shù)居高不下的重要原因。
(1)主成分分析法具有較好的精確度,其可以通過細(xì)化的計(jì)算數(shù)值反應(yīng),能有效地用于水環(huán)境質(zhì)量評(píng)價(jià)中;MATLAB數(shù)據(jù)處理軟件是現(xiàn)今運(yùn)用較廣泛的數(shù)據(jù)處理系統(tǒng)。
(2)渭河陜西段水體綜合水質(zhì)為Ⅴ類,污染很嚴(yán)重,不能滿足此區(qū)域河流水體的功能要求。
(3)渭河陜西段水的污染主要是由造紙企業(yè)污水排放、化肥和農(nóng)藥使用不合理及河道生態(tài)水量不足引起的。
[1]王曉鵬.河流水質(zhì)綜合評(píng)價(jià)之主成分分析法[J].數(shù)理統(tǒng)計(jì)與管理,2001,20(4):49-52.
[2]HotellingH.Analysis of a eomplex of statistieal variables into prineipal component[J].Journal of Edueational Psyehology,1933,(24):417-441,498-520.
[3]KarhunenK.Uber 1ineare methoden in der washrseheinliehkeitsreehnung [J].AnIer Aeard Sei,F(xiàn)ennieade Ser A l,1947,37:3 -79.
[4]任若恩,王惠文.多元統(tǒng)計(jì)數(shù)據(jù)與分析——理論、方法、實(shí)例[M].北京:國防工業(yè)出版社,1999.