王 勛, 喬 佳, 姜 鑫, 柴家鳳
(北京市燃?xì)饧瘓F(tuán)研究院,北京100011)
2017年底,北京市完成了近700座村的煤改氣工作。目前,大部分村采用點(diǎn)供方式,為了既能滿足供氣要求,又能最大限度節(jié)省投資,需要對(duì)所供用戶用氣規(guī)律進(jìn)行研究。為此,我們組建了相關(guān)課題組,對(duì)2017—2018年供暖期北京懷柔區(qū)、密云區(qū)、平谷區(qū)、延慶區(qū)、通州區(qū)共計(jì)14座村(小區(qū))2 800戶居民的用氣量(所有用戶供暖期用氣量、部分用戶日用氣量)進(jìn)行測(cè)量,對(duì)用戶信息(建筑類型、人口、供暖面積等)、室內(nèi)溫度、室外平均溫度等數(shù)據(jù)進(jìn)行了調(diào)研與搜集。采用箱線圖法,對(duì)不同建筑類型用戶供暖期單位供暖面積用氣量分布進(jìn)行分析,對(duì)異常值進(jìn)行檢驗(yàn)。
調(diào)研對(duì)象為:懷柔區(qū):雁西林語(yǔ)小區(qū)、紅螺湖小區(qū)、湖光山舍小區(qū)、范各莊村。密云區(qū):紅光村、楊新莊村、水泉村。平谷區(qū):前芮營(yíng)村、后芮營(yíng)村、小官莊村、周莊子村、南宅莊戶村。延慶區(qū):程家營(yíng)村。通州區(qū):西集村。調(diào)研對(duì)象均燃用低熱值為34.5 MJ/m3的天然氣。
① 調(diào)查時(shí)間
2017年11月15日—2018年3月15日。
② 調(diào)查數(shù)據(jù)
對(duì)于用氣量的調(diào)查分為人工抄表、遠(yuǎn)傳抄表。人工抄表:對(duì)于除通州區(qū)西集村外未配置遠(yuǎn)傳燃?xì)獗淼拇?小區(qū))采用人工抄表,在供暖期前后分別抄表1次。遠(yuǎn)傳抄表:對(duì)于安裝了遠(yuǎn)傳燃?xì)獗淼奈骷?,采用遠(yuǎn)傳抄表方式,每日抄表時(shí)間為0:00、12:00、24:00。
建筑類型、人口、供暖面積等:建筑類型、人口情況采用入戶調(diào)查方式進(jìn)行。我們采用多種方法對(duì)用戶供暖面積進(jìn)行確定:有些村(小區(qū))的供暖面積由村委會(huì)掌握的資料獲取,有些用戶的供暖面積來(lái)自燃?xì)饧瘓F(tuán)駐村工作人員,其他用戶則采用入戶測(cè)量的方法。
室內(nèi)溫度:采用不定期入戶測(cè)量的方式獲得。
室外平均溫度:根據(jù)氣象部門(mén)發(fā)布的氣象數(shù)據(jù)獲得。
在整理數(shù)據(jù)時(shí)發(fā)現(xiàn)粗大誤差數(shù)據(jù),這類數(shù)據(jù)可能是由于人工抄表失誤以及遠(yuǎn)傳過(guò)程中設(shè)備故障等原因產(chǎn)生的,也有部分無(wú)法知道其產(chǎn)生的確切原因,需要進(jìn)行剔除。
筆者采用拉依達(dá)準(zhǔn)則對(duì)粗大誤差數(shù)據(jù)進(jìn)行處理[1]:用3倍測(cè)量數(shù)據(jù)的標(biāo)準(zhǔn)偏差S作為取舍依據(jù),并且根據(jù)隨機(jī)誤差一般符合正態(tài)分布原則進(jìn)行判斷。
判定標(biāo)準(zhǔn)為:
|xi-xav|>3S
(1)
式中xi——第i個(gè)測(cè)量數(shù)據(jù)
xav——測(cè)量數(shù)據(jù)的算術(shù)平均值
S——由貝塞爾公式計(jì)算的測(cè)量數(shù)據(jù)標(biāo)準(zhǔn)偏差
測(cè)量數(shù)據(jù)的算術(shù)平均值xav的計(jì)算式為:
式中n——測(cè)量數(shù)據(jù)的數(shù)量
由貝塞爾公式計(jì)算的測(cè)量數(shù)據(jù)標(biāo)準(zhǔn)偏差S的計(jì)算式為:
當(dāng)測(cè)量數(shù)據(jù)xi符合式(1)的判定條件時(shí),測(cè)量數(shù)據(jù)xi即為粗大誤差數(shù)據(jù),應(yīng)予以剔除。
在采用拉依達(dá)準(zhǔn)則對(duì)粗大誤差數(shù)據(jù)進(jìn)行處理時(shí),每剔除一組粗大誤差數(shù)據(jù)后,都必須重新計(jì)算算術(shù)平均值xav、標(biāo)準(zhǔn)偏差S,最終確定符合要求的數(shù)據(jù)組。
對(duì)于剔除粗大誤差數(shù)據(jù)后的測(cè)量數(shù)據(jù),筆者采用箱線圖法進(jìn)行數(shù)據(jù)分布情況分析與異常值檢驗(yàn)。
與以假設(shè)數(shù)據(jù)服從正態(tài)分布為前提的3σ法、Z分?jǐn)?shù)法不同,箱線圖法對(duì)數(shù)據(jù)的分布不做嚴(yán)格要求,因此在樣本數(shù)據(jù)異常值的檢驗(yàn)中有較為廣泛的適用范圍。箱線圖法對(duì)于異常值的界定給出了一個(gè)標(biāo)準(zhǔn),雖然這個(gè)標(biāo)準(zhǔn)存在一定的隨意性,不能經(jīng)受嚴(yán)格的推理,但是在實(shí)際的數(shù)據(jù)處理中表現(xiàn)比較理想。這一標(biāo)準(zhǔn)就是異常值為小于最小值Qmin或大于最大值Qmax的數(shù)據(jù)。
最小值Qmin的計(jì)算式為:
Qmin=Q1-1.5(Q3-Q1)
式中Qmin——最小值
Q1——下四分位數(shù)
Q3——上四分位數(shù)
最大值Qmax的計(jì)算式為:
Qmax=Q1+1.5(Q3-Q1)
式中Qmax——最大值
對(duì)于下四分位數(shù)Q1、上四分位數(shù)Q3的計(jì)算,通常采用n+1法、n-1法[2-4],筆者采用n+1法進(jìn)行計(jì)算,n為數(shù)據(jù)數(shù)量。四分位距為Q3與Q1之間的區(qū)間,即箱子上下邊的范圍。從箱子上下邊延伸出去的線段稱為觸須,分別位于最大值Qmax、最小值Qmin的位置。
除最小值、最大值、四分位數(shù)、四分位距外,還有一個(gè)關(guān)鍵指標(biāo)——中位數(shù)。中位數(shù)是將一組數(shù)據(jù)按大小順序排列,位于最中間位置的一個(gè)數(shù)稱為這組數(shù)據(jù)的中位數(shù)。若數(shù)據(jù)數(shù)量為奇數(shù),則中位數(shù)為中間數(shù)據(jù);若數(shù)據(jù)數(shù)量為偶數(shù),則中位數(shù)為中間兩個(gè)數(shù)據(jù)的算術(shù)平均值。
箱線圖的主要功能有兩方面:一方面:從箱線圖上可以大體看出數(shù)據(jù)的分布情況、數(shù)據(jù)是否具有對(duì)稱性等信息。四分位距越小,表示落在箱子的數(shù)據(jù)越集中,反之較為分散。若數(shù)據(jù)明顯對(duì)稱,中位數(shù)將近似位于四分位距的中間,上下觸須在長(zhǎng)度上將近似相等。若數(shù)據(jù)是偏態(tài)的,中位數(shù)不位于四分位距的中間或某一觸須將顯著地比另一個(gè)長(zhǎng)。另一方面:可以直觀地識(shí)別是否存在異常值,異常值數(shù)量,以及異常值的具體值。
將村(小區(qū))按建筑類別分為平房建筑、別墅建筑、樓房建筑,將各類建筑類型用戶的單位供暖面積用氣量分別進(jìn)行粗大誤差數(shù)據(jù)處理,處理后的有效數(shù)據(jù)數(shù)量分別為:平房用戶1 155個(gè),別墅用戶131個(gè),樓房用戶146個(gè)。
平房用戶、別墅用戶、樓房用戶的每戶平均供暖面積分別為103、213、133 m2,供暖期單位供暖面積用氣量算術(shù)平均值分別為12.07、5.39、9.32 m3/m2。平房、別墅、樓房用戶供暖期單位供暖面積用氣量箱線圖見(jiàn)圖1。
圖1 平房、別墅、樓房用戶供暖期單位供暖面積用氣量箱線圖
由圖1可知,平房用戶供暖期單位供暖面積用氣量箱線圖的四分位距為6.276~17.223 m3/m2,別墅用戶為3.490~8.668 m3/m2,樓房用戶為6.338~11.624 m3/m2。這說(shuō)明,與別墅用戶、樓房用戶相比,平房用戶供暖期單位供暖面積用氣量的分布更加分散。平房用戶數(shù)據(jù)出現(xiàn)了6個(gè)異常值。
數(shù)據(jù)分布情況反映了農(nóng)村燃?xì)夤┡脩粝M(fèi)水平的不均勻性以及建筑類型導(dǎo)致的差異性。走訪發(fā)現(xiàn),農(nóng)村居民經(jīng)濟(jì)收入水平普遍較低,且參差不齊。雖然相關(guān)政策給予農(nóng)村居民很大的用氣優(yōu)惠和補(bǔ)貼,但部分用戶仍無(wú)法承擔(dān)或者不愿承擔(dān)燃?xì)赓M(fèi)用。根據(jù)入戶調(diào)查情況,3種用戶均存在以下情況:部分用戶燃?xì)夤┡療崴疇t保持著低溫運(yùn)行(室內(nèi)溫度為14 ℃左右),甚至基本不運(yùn)行。也有部分經(jīng)濟(jì)條件較好的用戶,燃?xì)夤┡療崴疇t設(shè)置溫度較高,室內(nèi)溫度達(dá)到20 ℃左右,且全天運(yùn)行,用氣量較大。經(jīng)進(jìn)一步分析,在有效數(shù)據(jù)中別墅建筑、樓房建筑數(shù)量有限,且兩種建筑在各個(gè)村中的建筑布局及建筑面積差別不大,用戶用熱習(xí)慣基本一致,可能是導(dǎo)致別墅用戶、樓房用戶供暖期單位供暖面積用氣量數(shù)據(jù)分布比較集中的原因之一。
由圖1可知,平房用戶、別墅用戶數(shù)據(jù)呈偏態(tài)分布,樓房用戶數(shù)據(jù)呈非偏態(tài)分布。我們采用Q-Q圖法對(duì)樓房用戶供暖期單位供暖面積用氣量數(shù)據(jù)是否呈正態(tài)分布進(jìn)行檢驗(yàn)。將樓房用戶的146個(gè)供暖期單位供暖面積用氣量數(shù)據(jù)輸入SPSS軟件生成Q-Q圖,觀測(cè)分布在直角坐標(biāo)系中的各數(shù)據(jù)點(diǎn)(橫坐標(biāo)為觀測(cè)值,縱坐標(biāo)為期望值)是否基本呈一條直線分布。若基本呈一條直線分布,說(shuō)明數(shù)據(jù)呈正態(tài)分布,否則不成立。由SPSS軟件生成的Q-Q圖可知,樓房用戶供暖期單位供暖面積用氣量數(shù)據(jù)呈正態(tài)分布。采用文獻(xiàn)[5]方法,可計(jì)算得到95%置信度的置信區(qū)間(即樓房用戶的供暖期單位供暖面積用氣指標(biāo)范圍)為8.722~9.916 m3/m2。該指標(biāo)與文獻(xiàn)[6]給出的北京市樓房建筑住宅小區(qū)供暖期單位供暖面積用氣指標(biāo)8.177~9.977 m3/m2基本一致。
在2017年—2018年供暖期,對(duì)北京懷柔區(qū)、密云區(qū)、平谷區(qū)、延慶區(qū)、通州區(qū)的14座村(小區(qū))2 800戶煤改氣用戶用氣數(shù)據(jù)(所有用戶供暖期用氣量、部分用戶日用氣量)進(jìn)行測(cè)量,對(duì)用戶信息(建筑類型、人口、供暖面積等)、室內(nèi)溫度、室外平均溫度等數(shù)據(jù)進(jìn)行調(diào)研與搜集。采用箱線圖法,對(duì)不同建筑類型用戶供暖期單位供暖面積用氣量分布進(jìn)行分析,對(duì)異常值進(jìn)行檢驗(yàn)。
與別墅用戶、樓房用戶相比,平房用戶供暖期單位供暖面積用氣量的分布更加分散。平房用戶數(shù)據(jù)出現(xiàn)了6個(gè)異常值。平房用戶、別墅用戶數(shù)據(jù)呈偏態(tài)分布,經(jīng)檢驗(yàn)樓房用戶數(shù)據(jù)呈正態(tài)分布。當(dāng)天然氣低熱值為34.5 MJ/m3時(shí),樓房用戶的供暖期單位供暖面積用氣指標(biāo)為8.722~9.916 m3/m2。