国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

象限分析法在第二次全國污染源普查數(shù)據(jù)審核中的應(yīng)用

2020-07-22 03:54劉孝富張志苗王瑩劉柏音邱文婷羅鐳
關(guān)鍵詞:使用量象限普查

劉孝富,張志苗,王瑩,劉柏音,邱文婷,羅鐳

中國環(huán)境科學(xué)研究院環(huán)境信息研究所

第二次全國污染源普查(簡稱二污普)是我國在“十三五”期間開展的一項(xiàng)重大國情調(diào)查,普查成果為我國打贏污染防治攻堅(jiān)戰(zhàn)乃至“十四五”規(guī)劃提供強(qiáng)有力的支撐。數(shù)據(jù)的真實(shí)、準(zhǔn)確、可靠、符合邏輯是普查質(zhì)量的靈魂,為此數(shù)據(jù)審核發(fā)揮著至關(guān)重要的作用。二污普分為清查、全面入戶調(diào)查、產(chǎn)排污核算3個階段,每個階段數(shù)據(jù)審核側(cè)重點(diǎn)有所不同,但異常值的識別始終是數(shù)據(jù)審核的重要內(nèi)容[1-2]。二污普數(shù)據(jù)審核中的異常值識別方法包括直接對比法、專家經(jīng)驗(yàn)法、排序法、占比法、平均值法、直方圖法等,每種方法都有各自的優(yōu)劣勢。如直接對比法是將某些指標(biāo)與排污許可、環(huán)境統(tǒng)計(jì)或工業(yè)統(tǒng)計(jì)等資料中相同指標(biāo)進(jìn)行對比;專家經(jīng)驗(yàn)法是依據(jù)專家的知識直接判斷數(shù)據(jù)是否異常,既可以判斷單個指標(biāo),也可以判斷兩兩指標(biāo)相互關(guān)系的異常情況;排序法是將同行業(yè)的普查對象進(jìn)行升序或降序排列,識別出極大或極小值;占比法是排序法中的一種,將生產(chǎn)活動水平或者產(chǎn)排污量占同一區(qū)域或流域較大的普查對象識別出來;平均值法是通過設(shè)置一個閾值,將遠(yuǎn)離行業(yè)平均水平的普查對象識別出來;直方圖法是依據(jù)統(tǒng)計(jì)學(xué)規(guī)律設(shè)置置信度,將不在置信區(qū)間的普查對象識別出來。以上方法存在不同程度的局限性,或是在設(shè)定閾值、距離值、置信度等方面存在主觀性,或是需要較多的統(tǒng)計(jì)樣本。筆者介紹一種相對客觀、可適用于不同普查階段的數(shù)據(jù)審核方法——象限分析法,以期通過相關(guān)案例研究為各地開展二污普數(shù)據(jù)審核提供思路,也為下一次污染源普查以及其他普查工作的開展提供借鑒。

1 象限分析法簡介

1.1 基本概念

象限分析法是根據(jù)事物的2個重要屬性進(jìn)行分類分析,從而找出解決問題的方法。象限分析法的第一步是找出影響事物的2個屬性(篩選2個指標(biāo)),將一個屬性(指標(biāo))作為x軸,另一個屬性(指標(biāo))作為y軸,在坐標(biāo)軸上對指標(biāo)進(jìn)行劃分,形成不同的象限,常見的有四象限、六象限、九象限(圖1)等,分析每個象限的特征從而找出規(guī)律,識別出異常事務(wù)或者需要重點(diǎn)關(guān)注的事務(wù)。當(dāng)前,象限分析法在人才選拔[3]、防洪減災(zāi)[4-5]、國土資源評價[6-7]、健康調(diào)查[8]等領(lǐng)域應(yīng)用較廣,比較著名的應(yīng)用包括時間管理的四象限法[9]以及描述基礎(chǔ)研究和應(yīng)用研究關(guān)系的巴斯德象限[10]。

圖1 象限劃分示意Fig.1 A sketch of quadrant division

1.2 象限分析法識別異常值的技術(shù)思路

1.2.1篩選評價指標(biāo)

象限分析法要求至少篩選2個指標(biāo)開展評價,且2個指標(biāo)之間存在一定的相關(guān)性。如分析二污普數(shù)據(jù)中產(chǎn)品產(chǎn)量數(shù)據(jù)是否填報(bào)錯誤,可以通過分析產(chǎn)量與原料使用量是否一致來確定,因此篩選出產(chǎn)量和原料使用量2個指標(biāo)。

1.2.2繪制多個樣本散點(diǎn)圖

象限分析法不依賴專家的經(jīng)驗(yàn)和知識,而是通過多個樣本的指標(biāo)相關(guān)性趨勢來判定異常情況。因此需獲取多個樣本的屬性數(shù)據(jù),分別以2個屬性為x軸和y軸繪制散點(diǎn)圖(圖2)。

圖2 象限分析散點(diǎn)圖Fig.2 Scatter diagram of quadrant analysis

1.2.3象限分類及特征分析

根據(jù)所獲取的樣本數(shù)量決定需要劃分象限的數(shù)量,最少4個象限,樣本數(shù)量較多時可以設(shè)定9~16個象限,以平均每個象限樣本數(shù)占樣本總數(shù)的10%為宜。分析每個象限的基本特征,如圖2所示,第1象限表示產(chǎn)量低而原料使用量高,第9象限表示產(chǎn)量高而原料使用量少的普查對象。

1.2.4聚類劃分

確定象限數(shù)量之后,對x軸和y軸進(jìn)行分割,也稱之為聚類。聚類的方法有多種,包括K-means聚類[11]、層次聚類[12]、密度聚類[13]等方法。如圖2所示,x軸和y軸分別被劃為D、E、F和A、B、C各3類。K-means聚類算法如下。

(1)從N個樣本中隨機(jī)選取K個聚類中心,如果是分成3類就選擇3個樣本作為聚類中心。

(2)對各樣本與聚類中心間的距離進(jìn)行計(jì)算,按照最近距離原則將樣本歸屬最近的聚類中心。

(3)計(jì)算聚類中心樣本的平均值,以此作為新的聚類中心。

(4)迭代第(2)~(3)步直至新的聚類中心與上一迭代的聚類中心相等或小于指定閾值,結(jié)果呈現(xiàn)收斂特征,則算法結(jié)束。

1.2.5異常值識別

落在特征象限的點(diǎn)位表示數(shù)據(jù)有明顯異常,如圖2所示,分布在第1象限或第9象限的普查對象,存在產(chǎn)量或原料使用量填報(bào)錯誤的可能性較大,需重點(diǎn)核實(shí)。

2 象限分析法在清查階段的應(yīng)用示例

在二污普清查階段,各地上報(bào)了工業(yè)源、農(nóng)業(yè)源、集中式污染治理設(shè)施、生活源鍋爐、入河(海)排污口5類源的數(shù)量和位置,各類源是否存在漏報(bào)是該階段數(shù)據(jù)審核的重點(diǎn)。通過各地上報(bào)污染源數(shù)量與相關(guān)統(tǒng)計(jì)數(shù)據(jù)是否一致來判定是否存在漏查行為,如工業(yè)源的上報(bào)數(shù)量與固定資產(chǎn)投資、工業(yè)增加值、工業(yè)產(chǎn)品銷售產(chǎn)值是否匹配;各類畜種規(guī)?;B(yǎng)殖場數(shù)量與生豬出欄量、豬肉產(chǎn)量、牛奶產(chǎn)量、肉牛出欄量、牛肉產(chǎn)量和禽蛋產(chǎn)量是否匹配;污水處理廠數(shù)量與生活污水處理率、垃圾填埋場數(shù)量與生活垃圾集中處理率是否匹配;生活源鍋爐數(shù)量與人口、住宿餐飲企業(yè)、醫(yī)院、學(xué)校數(shù)量是否匹配;入河(海)排口與污水處理廠數(shù)量、工業(yè)廢水治理設(shè)施數(shù)量是否匹配等。

以工業(yè)源數(shù)量與固定資產(chǎn)投資為例,采用象限分析法來說明清查階段數(shù)量審核過程。表1顯示某省30個地市上報(bào)的工業(yè)源數(shù)量以及各地市近10年工業(yè)固定資產(chǎn)投資情況。

表1 某省各地市工業(yè)源數(shù)量與固定資產(chǎn)投資統(tǒng)計(jì)分析

采用九象限分析法來識別工業(yè)源數(shù)量上報(bào)異常情況。首先根據(jù)30個地市的屬性繪制散點(diǎn)圖(圖3),采用K-means聚類法將y軸清查上報(bào)工業(yè)源數(shù)量分割為A、B、C 3類,分割閾值為13 937和41 263,將x軸的近10年工業(yè)固定資產(chǎn)投資分割為D、E、F 3類,分割的閾值為1 407億和3 493億元。AF象限表示清查上報(bào)數(shù)量少,而固定資產(chǎn)投資高的地區(qū);CD象限表示清查上報(bào)數(shù)量多,而固定資產(chǎn)投資少的地區(qū)。在清查階段重點(diǎn)關(guān)注漏查行為,因此落在AF象限的點(diǎn)位清查數(shù)據(jù)存疑最大,即編號為13、15和30的地市。

圖3 工業(yè)源清查數(shù)據(jù)審核象限分析Fig.3 Inventory date audit of industrial source by quadrant analysis

3 象限分析法在普查階段的應(yīng)用示例

在二污普的全面普查階段,普查表中與產(chǎn)排污量核算密切相關(guān)的關(guān)鍵指標(biāo)是數(shù)據(jù)審核的重點(diǎn)。如工業(yè)源中的產(chǎn)品產(chǎn)量、原料使用量、燃料(煤炭、電力、天然氣、汽油等)使用量、取水量、排水量、工業(yè)總產(chǎn)值等;農(nóng)業(yè)源中畜禽養(yǎng)殖業(yè)的出欄量、存欄量、欄舍面積、糞污資源化利用率等。多數(shù)情況下,普查表中的指標(biāo)之間具有一定的相關(guān)性,如產(chǎn)量與能源消耗量,產(chǎn)量與原料使用量,產(chǎn)量與產(chǎn)值、養(yǎng)殖量、欄舍面積等,可以通過指標(biāo)之間相互關(guān)系來識別指標(biāo)填報(bào)的異常情況,象限分析法在其中發(fā)揮著重要作用。

表2為某行業(yè)33家企業(yè)填報(bào)的產(chǎn)品產(chǎn)量和燃煤使用量的情況,同樣采用九象限法來識別異常值。根據(jù)33家企業(yè)的屬性繪制散點(diǎn)圖(圖4),采用K-means聚類法將y軸燃料使用量分為A、B、C 3類,分割閾值為2 110、6 116 t;將x軸產(chǎn)品產(chǎn)量分為D、E、F 3類,分割閾值為2 245、9 380 t。在普查階段重點(diǎn)關(guān)注落在AF象限和CD象限的點(diǎn)位,AF象限表示產(chǎn)品產(chǎn)量高但燃料使用量偏低;CD象限表示產(chǎn)品產(chǎn)量低但燃料使用量偏高,落在這2個象限的點(diǎn)位數(shù)據(jù)異常的可能性最大,需重點(diǎn)核實(shí)。從圖4可以看,落在AF象限的點(diǎn)位,CD象限的點(diǎn)位有1個(編號為22的企業(yè))。落在BF、BD、CE、AE象限的點(diǎn)位數(shù)據(jù)異常的可能性也較大,需進(jìn)一步核實(shí)。

表2 某行業(yè)企業(yè)產(chǎn)品產(chǎn)量與燃料使用量統(tǒng)計(jì)分析

圖4 工業(yè)源產(chǎn)品產(chǎn)量與燃煤使用量數(shù)審核象限分析Fig.4 Output and coal usage audit of industrial source by quadrant analysis

4 討論

在污染源普查數(shù)據(jù)審核中,與其他異常值識別方法相比,象限分析法具有普適性、客觀性較強(qiáng)的特點(diǎn)。主要表現(xiàn)在以下幾個方面。

(1)象限分析法可彌補(bǔ)行業(yè)專家的缺失。如根據(jù)行業(yè)專家經(jīng)驗(yàn)判斷,生產(chǎn)1 t粗鋼的燃煤消耗量為0.49~0.56 t(以標(biāo)煤計(jì))[14],當(dāng)企業(yè)填報(bào)的粗鋼煤耗與該值偏差較大,則產(chǎn)量數(shù)據(jù)或燃料使用量數(shù)據(jù)填報(bào)錯誤。污染源普查中行業(yè)門類較多,行業(yè)的平均數(shù)據(jù)普遍缺乏,無法完全靠行業(yè)專家來審核全國百萬計(jì)的污染源,在這種情況下可匯聚同行業(yè)的樣本,采用象限分析法來識別數(shù)據(jù)填報(bào)異常情況。

(2)象限分析法避免了趨勢擬合的不確定性。如圖5所示,常規(guī)的分析方法是依據(jù)橫、縱坐標(biāo)的屬性進(jìn)行擬合,與趨勢線距離越大的點(diǎn)位數(shù)據(jù)異??赡苄栽酱骩15-16]。但在選擇擬合方程時,存在較大的不確定和主觀性,可能是線性也可能是非線性。象限分析法避免了趨勢擬合選擇函數(shù)的主觀性,通過象限的特征來識別異常情況。

圖 5 象限分析法與擬合法對比Fig.5 Comparison between quadrant analysis and trend fitting

(3)象限分析法避免了閾值選擇的主觀性。如圖5所示,與趨勢線的距離相差多少被定義為存在異常,有一定的主觀性。采用排序來識別異常值時,也存在極大、極小值判定標(biāo)準(zhǔn)制定的問題。象限分析法無閾值制定的環(huán)節(jié),橫縱坐標(biāo)分割采用非監(jiān)督聚類法,最大程度保證評估結(jié)果的客觀性。

(4)象限分析法對統(tǒng)計(jì)樣本的數(shù)量沒有太多要求,可依據(jù)樣本的數(shù)量來選擇象限的數(shù)量,樣本數(shù)量較少時可采用四象限,樣本數(shù)量較多時可采用九象限及以上。如采用直方圖法來識別異常值,則需要的樣本數(shù)量較多,數(shù)量較少時無法統(tǒng)計(jì)直方區(qū)間。

5 結(jié)論

象限分析法因其高效、便捷、簡單、客觀性較強(qiáng)、所需樣本數(shù)量少等特點(diǎn),特別適合污染源普查的數(shù)據(jù)審核。污染源普查所含的行業(yè)門類多、填報(bào)數(shù)據(jù)專業(yè)性強(qiáng),象限分析法可在一定程度上彌補(bǔ)行業(yè)專家的缺乏,在數(shù)據(jù)審核中發(fā)揮著重要作用。象限分析法也存在一些不足,當(dāng)樣本數(shù)量和象限數(shù)量不匹配時,可能會導(dǎo)致識別出的異常點(diǎn)位偏高或偏低。當(dāng)存疑最大的象限沒有識別出異常點(diǎn)位時,可能會掩蓋一些異常值。充分發(fā)揮各種數(shù)據(jù)審核方法優(yōu)勢,因地制宜采用象限分析、趨勢擬合、排序、直方圖、專家經(jīng)驗(yàn)等多種方法,可以達(dá)到事半功倍的效果。

猜你喜歡
使用量象限普查
立即全面普查 警惕二代粘蟲發(fā)生
勘 誤
減少#1爐再熱器減溫水使用量
復(fù)數(shù)知識核心考點(diǎn)綜合演練
胡春華強(qiáng)調(diào):確保脫貧攻堅(jiān)普查取得圓滿成功
“以蟲吃蟲”這家大棚農(nóng)藥使用量減少30%
常數(shù)牽手象限暢游中考
2020年 寬帶訂戶月使用量將創(chuàng)新高
2018年中國將開展第四次全國經(jīng)濟(jì)普查
平面直角坐標(biāo)系典例分析