国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Box-Cox變換的城市火災(zāi)起數(shù)的模型研究

2013-09-28 04:57:28譚常春周嘉章
關(guān)鍵詞:起數(shù)原始數(shù)據(jù)降雨量

譚常春, 張 誠(chéng), 周嘉章

(1.合肥工業(yè)大學(xué) 數(shù)學(xué)學(xué)院,安徽 合肥 230009;2.安徽省氣象局 培訓(xùn)中心,安徽 合肥 230031)

火災(zāi)預(yù)測(cè)是火災(zāi)系統(tǒng)領(lǐng)域中一個(gè)關(guān)鍵的研究課題[1],而社會(huì)經(jīng)濟(jì)、技術(shù)、政治等因素都是影響城市火災(zāi)發(fā)生的重要外界因素,其中關(guān)于經(jīng)濟(jì)因素與火災(zāi)發(fā)生次數(shù)的關(guān)系研究比較多。

文獻(xiàn)[2]研究得出經(jīng)濟(jì)水平的落后會(huì)導(dǎo)致火災(zāi)次數(shù)上升的結(jié)論;文獻(xiàn)[3]認(rèn)為收入與火災(zāi)起數(shù)之間有強(qiáng)烈的負(fù)向關(guān)系;文獻(xiàn)[4]認(rèn)為隨著經(jīng)濟(jì)的發(fā)展,火災(zāi)形勢(shì)是先嚴(yán)重后趨于緩和。

目前主要把火災(zāi)當(dāng)作一門自然科學(xué)研究,偏重對(duì)客觀環(huán)境、微觀方面的研究[5]。氣象因素對(duì)火災(zāi)發(fā)生、防治和損失控制方面有重要的影響[6]。文獻(xiàn)[7]建立了氣象因素與日本林火發(fā)生的廣義線性預(yù)測(cè)模型[7];文獻(xiàn)[8]從 Logistic和零膨脹Poisson(ZIP)回歸模型方向,研究森林火災(zāi)與氣象因素的關(guān)系。

統(tǒng)計(jì)分析,最常用的一般線性模型假定為:

其中,Y 為n×1的列向量;X=(xij)n×p為n×p的設(shè)計(jì)矩陣;β為p×1的未知參數(shù)向量;ε為隨機(jī)誤差。當(dāng)ε服從正態(tài)分布時(shí)候,模型是最優(yōu)的,但在實(shí)際應(yīng)用中,常會(huì)遇到因變量分布不滿足正態(tài)分布的情況,不能直接應(yīng)用一般線性模型進(jìn)行數(shù)據(jù)分析[9]。Box-Cox變換就是一種常用的非線性變換,通過確定一個(gè)最優(yōu)的λ,將非正態(tài)數(shù)據(jù)變換成近似正態(tài)的數(shù)據(jù)[10],使變換后的數(shù)據(jù)比原有數(shù)據(jù)具有更好的線性性,再對(duì)變換后的數(shù)據(jù)進(jìn)行回歸分析[11]。

文獻(xiàn)[6]直接對(duì)某市11a間的月度火災(zāi)發(fā)生起數(shù)與各氣象因子建立線性回歸模型,其擬合優(yōu)度并不高。文獻(xiàn)[12]通過對(duì)原始?xì)庀蟆⒒馂?zāi)數(shù)據(jù)進(jìn)行對(duì)數(shù)變換后建模,擬合優(yōu)度雖然有所提高,但是并不特別理想。

本文應(yīng)用Box-Cox非線性變換方法,先對(duì)原始數(shù)據(jù)進(jìn)行適當(dāng)Box-Cox變換,基于變換后的數(shù)據(jù)建立了回歸模型,進(jìn)行統(tǒng)計(jì)分析比較,并用于預(yù)測(cè)火災(zāi)發(fā)生趨勢(shì)和起數(shù)。

1 方 法

1.1 Box-Cox變換

Box-Cox變換[10,13]是對(duì)變量y(y>0)進(jìn)行變換,即

其中,y為原始數(shù)據(jù)。對(duì)于不同的λ,所作的變換也不同,常用變換有對(duì)數(shù)變換(λ=0)、平方根變換(λ=1/2)及倒數(shù)變換(λ=-1)等。

當(dāng)誤差分布呈現(xiàn)正偏態(tài)時(shí),常對(duì)因變量進(jìn)行對(duì)數(shù)變換;當(dāng)誤差分布呈現(xiàn)負(fù)偏態(tài)分布時(shí),常采用平方根變換。為避免變量y≤0時(shí)無法進(jìn)行變換的情形,可應(yīng)用擴(kuò)展的Box-Cox變換,即

此時(shí)的a是為了使y+a>0。

1.2 參數(shù)λ的估計(jì)方法

無論是基本式還是擴(kuò)展式,真正需要估計(jì)的只有一個(gè)參數(shù)λ,為了確定一個(gè)最優(yōu)的λ,將非正態(tài)的數(shù)據(jù)變換為近似正態(tài)的數(shù)據(jù)。

本文利用文獻(xiàn)[13]提出的最大似然估計(jì)方法確定參數(shù)λ值,在規(guī)定范圍內(nèi)給出一系列的λ值。對(duì)固定的λ,令

為了求ln Lmax(λ)的最大值,只需求殘差平方和RSS(λ,Z(λ))的最小值。雖然很難找出RSS(λ,Z(λ))最小值點(diǎn)λ的顯式解析式,但對(duì)一系列給定的λ值,通過線性回歸模型的最小二乘估計(jì),很容易計(jì)算出相應(yīng)的 RSS(λ,Z(λ))值。畫出 RSS(λ,Z(λ))關(guān)于λ的曲線,從圖上可以近似地找出使RSS(λ,Z(λ))達(dá)到最小值的^λ。

1.3 Box-Cox變換步驟

(2)計(jì)算殘差平方和 RSS(λ,Z(λ))。

(3)對(duì)一系列λ的值,以λ為橫軸,RSS(λ,Z(λ))為縱軸,作出相應(yīng)的曲線,用直觀的方法,找出使 RSS(λ,Z(λ))達(dá)到最小值的點(diǎn)

1.4 數(shù)據(jù)預(yù)處理

本文僅對(duì)1997年及其以后的數(shù)據(jù)進(jìn)行處理,其中1997—2003年某市火災(zāi)起數(shù)來自文獻(xiàn)[14],2004—2006年某市火災(zāi)起數(shù)來自文獻(xiàn)[15],按照當(dāng)時(shí)的統(tǒng)計(jì)標(biāo)準(zhǔn),火災(zāi)起數(shù)即為消防隊(duì)出火警次數(shù)。2007年統(tǒng)計(jì)標(biāo)準(zhǔn)改變,僅將造成損失的火警數(shù)統(tǒng)計(jì)為火災(zāi)數(shù)據(jù),為保持?jǐn)?shù)據(jù)統(tǒng)計(jì)標(biāo)準(zhǔn)的連續(xù)性,本文選擇某市消防局記錄的月出火警次數(shù)作為2007年的火災(zāi)起數(shù)[14-15]。

首先對(duì)某市月火災(zāi)起數(shù)與各氣象因子的原始數(shù)據(jù)進(jìn)行Box-Cox變換,使變換后的數(shù)據(jù)具有更好的線性性,然后再進(jìn)行相關(guān)分析和回歸分析,其原始數(shù)據(jù)見表1所列。

表1 月火災(zāi)起數(shù)與各氣象因子的原始數(shù)據(jù)

原始數(shù)據(jù)的火災(zāi)起數(shù)、風(fēng)速、降雨量、溫度、濕度依次記為freq、wind、rain、tempt、humi,原始數(shù)據(jù)攝氏溫度常為負(fù)數(shù),降雨量有部分值為0。選取Box-Cox變換的擴(kuò)展公式,溫度a1=273,降雨量a2=1。對(duì)火災(zāi)起數(shù)、風(fēng)速、降雨量Box-Cox變換過程中λ值的選取,是根據(jù)最大似然估計(jì)方法確定的,火災(zāi)起數(shù)、風(fēng)速、降雨量的λ值依次為-0.6334、0.286、0.1025。Box-Cox變換后的火災(zāi)起數(shù)、風(fēng)速、降雨量依次記為bcfreq、bcwind、bcrain。但對(duì)溫度和濕度,若繼續(xù)采用最大似然估計(jì)方法選取λ,則發(fā)現(xiàn)Box-Cox變換后,溫度數(shù)據(jù)非常大,濕度數(shù)據(jù)也偏大,故需要重新確定λ。為了使變換后的數(shù)據(jù)與其他氣象因子變換后的數(shù)據(jù)在數(shù)值大小上相接近,多次選取λ對(duì)數(shù)據(jù)進(jìn)行變換,最終確定溫度和濕度的λ值為-0.5。記Box-Cox變換后的溫度和濕度為bctemp、bchumi,各數(shù)據(jù)值計(jì)算如下:

此時(shí)變換后的溫度和濕度因子數(shù)據(jù)與其他氣象因子數(shù)據(jù)大小相接近,見表2所列。

表2 Box-Cox變換后的火災(zāi)起數(shù)與各氣象因子數(shù)據(jù)

2 回歸模型建立

2.1 散點(diǎn)圖分析

為了尋找火災(zāi)起數(shù)bcfreq與各要素之間的相關(guān)關(guān)系,研究火災(zāi)起數(shù)與各氣象因子間是否存在線性趨勢(shì),通過繪制散點(diǎn)圖來進(jìn)行觀察,如圖1~圖4所示。

從圖1中的散點(diǎn)看出,bcfreq與bchumi具有明顯的負(fù)相關(guān)關(guān)系??諝庵兴趾枯^大時(shí),火災(zāi)發(fā)生的次數(shù)相對(duì)較少。

從圖2中的散點(diǎn)看出,bcfreq與bctemp成負(fù)相關(guān),隨著bctemp的增大,bcfreq反而減小,即隨著溫度升高,火災(zāi)發(fā)生起數(shù)下降。

從圖3中的散點(diǎn)看出,bctemp與bcrain成負(fù)相關(guān),隨著降雨量的增大,火災(zāi)發(fā)生起數(shù)逐漸減少。

從圖4中的散點(diǎn)看出,bcfreq與bcwind成一定的正相關(guān),但相關(guān)性不大,即降雨量的變化對(duì)火災(zāi)發(fā)生起數(shù)的影響不大。

圖1 bcfreq與bchumi的散點(diǎn)圖

圖2 bcfreq與bctemp的散點(diǎn)圖

圖3 bctemp與bcrain的散點(diǎn)圖

圖4 bcfreq與bcwind的散點(diǎn)圖

2.2 相關(guān)分析

從散點(diǎn)圖大體了解氣象各要素與bcfreq之間的相關(guān)程度,但需要知道各要素與bcfreq具體的相關(guān)性大小,因此需要計(jì)算bcfreq與各要素間的相關(guān)系數(shù),結(jié)果見表3所列。

表3 線性相關(guān)系數(shù)

從表3可以看出,對(duì)月火災(zāi)發(fā)生起數(shù)的影響大小依次是bcfreq1、bcrain、bctemp、bcfreq2、bchumi、bcwind。

bcfreq1是最主要的影響因素,表明火災(zāi)上月發(fā)生起數(shù)對(duì)火災(zāi)發(fā)生起數(shù)影響最大,如果某月的火災(zāi)發(fā)生起數(shù)偏高,必然會(huì)引起相關(guān)部門的重視,從而采取相應(yīng)措施。bcrain、bctemp、bcfreq2是次于bcfreq1的影響因素,bchumi對(duì)月火災(zāi)發(fā)生起數(shù)也有一定的影響,而bcwind與火災(zāi)發(fā)生起數(shù)的相關(guān)性不強(qiáng),說明bcwind對(duì)火災(zāi)發(fā)生起數(shù)的直接影響不大,兩者之間的相關(guān)性不強(qiáng)。bcrain、bctemp、bchumi均與bcfreq負(fù)相關(guān),說明隨著bcrain、bctemp、bchumi增大,bcfreq下降,即火災(zāi)發(fā)生起數(shù)下降;反之,bcrain、bctemp、bchumi越低,越容易發(fā)生火災(zāi)。

隨著降雨量和空氣濕度的增加,火災(zāi)發(fā)生起數(shù)會(huì)有所降低,這符合常識(shí),但隨著溫度變高,月火災(zāi)發(fā)生起數(shù)不但沒有增加反而減少,這似乎與常識(shí)不大符合,但注意到溫度高的時(shí)節(jié)一般都伴隨著強(qiáng)降雨,使空氣濕度增加,反而降低了火災(zāi)發(fā)生的可能性。

2.3 回歸模型建立

從各要素與火災(zāi)發(fā)生起數(shù)的相關(guān)性分析可知,bctemp、bchumi、bcwind、bcrain、bcfreq1對(duì)火災(zāi)發(fā)生起數(shù)都有一定的影響,以bcfreq為因變量,以bctemp、bchumi、bcwind、bcrain、bcfreq1為自變量,選擇逐步回歸法得到如下回歸模型:

經(jīng)Box-Cox變換后得到的回歸分析模型(1)式的擬合度R2為0.730,比文獻(xiàn)[6]未做變換時(shí)的擬合度0.543和文獻(xiàn)[12]做對(duì)數(shù)變換的擬合度0.7053有較大的提高。

但發(fā)現(xiàn)建立逐步回歸模型(1)式時(shí),系統(tǒng)自動(dòng)將bchumi、bcwind剔除,而從上述分析可知bchumi、bcwind對(duì)火災(zāi)起數(shù)有一定的影響,故將bchumi、bcwind強(qiáng)制加入模型中。

文獻(xiàn)[12]未考慮到上月火災(zāi)起數(shù)對(duì)火災(zāi)起數(shù)的影響,通過火災(zāi)發(fā)生次數(shù)與氣象因子的相關(guān)性分析,火災(zāi)發(fā)生起數(shù)與上月火災(zāi)發(fā)生起數(shù)也有較大的相關(guān)性,因此也嘗試著將上月火災(zāi)發(fā)生起數(shù)放入到因變量中,進(jìn)行回歸分析。

建立以bcfreq為因變量,以bctemp、bchumi、bcwind、bcrain、bcfreq1、bcfreq2為自變量的強(qiáng)制回歸模型如下:

本文發(fā)現(xiàn),將bchumi、bcwind、bcfreq2強(qiáng)制加入模型中,模型的擬合度R2有一定提高,達(dá)到0.741,但可以看出Box-Cox變換后濕度的t檢驗(yàn)P-value為0.361>0.05,未通過回歸系數(shù)檢驗(yàn),因此嘗試將bchumi剔除模型后,進(jìn)行強(qiáng)制回歸分析,再觀察回歸結(jié)果。

建立以bcfreq為因變量,以bctemp、bcrain、bcwind、bcfreq1、bcfreq2為自變量的強(qiáng)制回歸模型如下:

剔除bchumi后發(fā)現(xiàn),模型的擬合度基本保持不變,但降雨量的回歸系數(shù)也沒有通過t檢驗(yàn),其P-value為0.064,但在0.1的顯著性水平下,模型就全部通過了系數(shù)檢驗(yàn),因而確定模型3為最終預(yù)測(cè)模型。

3 模型評(píng)估

3.1 模型擬合圖

采用最終選定的預(yù)測(cè)模型,對(duì)原始數(shù)據(jù)作擬合圖,如圖5所示,其中選定每年1月數(shù)據(jù)。

圖5 預(yù)測(cè)模型擬合圖

從圖5可以看出,預(yù)測(cè)模型對(duì)原始數(shù)據(jù)的擬合效果較好,同時(shí)計(jì)算得到預(yù)測(cè)模型的相對(duì)均方誤差為0.0537,說明預(yù)測(cè)模型比較理想。

3.2 交叉驗(yàn)證

交叉驗(yàn)證方法中常用的有K次交叉驗(yàn)證(K-flod Cross Validation),基本方法是將原始數(shù)據(jù)分成K組(一般是均分),將每個(gè)子集數(shù)據(jù)分別做一次驗(yàn)證集,其余的K-1組子集數(shù)據(jù)作為訓(xùn)練集,交叉驗(yàn)證K次,每組數(shù)據(jù)都被驗(yàn)證一次,然后計(jì)算預(yù)測(cè)均方誤差,比較各個(gè)模型的預(yù)測(cè)均方誤差,選擇預(yù)測(cè)均方誤差最小的擬合模型為選擇模型。本文中K取13,得到預(yù)測(cè)模型交叉驗(yàn)證的均方誤差為2.86×10-5,均方誤差相對(duì)較小,預(yù)測(cè)模型比較理想。

3.3 模型預(yù)測(cè)與比較

采用2008年前7個(gè)月的火災(zāi)數(shù)據(jù)為數(shù)據(jù)檢驗(yàn)集,將數(shù)據(jù)代入選定的預(yù)測(cè)模型中,得到月火災(zāi)起數(shù)的預(yù)測(cè)值,見表4所列,同時(shí)可以得到2008年前7個(gè)月火災(zāi)起數(shù)的預(yù)測(cè)值和實(shí)際值的對(duì)比,如圖6所示。從圖6可以看出,預(yù)測(cè)模型較準(zhǔn)確地預(yù)測(cè)了2008年前7個(gè)月的火災(zāi)發(fā)生趨勢(shì),這7個(gè)月的火災(zāi)發(fā)生起數(shù)整體呈下降趨勢(shì),與實(shí)際值基本相符合,其中3月和5月預(yù)測(cè)值比實(shí)際值高,這可能是因?yàn)榛馂?zāi)起數(shù)的預(yù)測(cè)是一項(xiàng)較復(fù)雜的系統(tǒng),受多重因素影響,而氣象并非是影響火災(zāi)發(fā)生的唯一原因,僅采用氣象因素預(yù)測(cè)火災(zāi)發(fā)生起數(shù)有一定的局限性。

表4 2008年1—7月火災(zāi)起數(shù)對(duì)比

圖6 2008年1—7月火災(zāi)發(fā)生起數(shù)對(duì)比

4 結(jié)束語

本文首先對(duì)火災(zāi)氣象數(shù)據(jù)進(jìn)行Box-Cox變換,然后對(duì)變換后的火災(zāi)氣象數(shù)據(jù)進(jìn)行回歸分析,構(gòu)造了3種基于Box-Cox變換后火災(zāi)起數(shù)與氣象因子之間的回歸模型,并通過分析比較,選定最終模型為預(yù)測(cè)模型,且所選定的回歸預(yù)測(cè)模型能較好地反應(yīng)和預(yù)測(cè)火災(zāi)發(fā)生的趨勢(shì)和起數(shù)。結(jié)果表明,火災(zāi)氣象因子中平均溫度、平均相對(duì)濕度以及平均降雨量對(duì)火災(zāi)起數(shù)影響顯著,而風(fēng)速對(duì)火災(zāi)起數(shù)的影響不大。Box-Cox變換是將非線性的數(shù)據(jù)變換成線性數(shù)據(jù)的有效方法,Box-Cox變換后所建立的回歸方程能更好地預(yù)測(cè)火災(zāi)發(fā)生次數(shù),從而達(dá)到對(duì)城市火災(zāi)控制的目的。

[1]楚志勇.基于回歸分析方法的城市火災(zāi)預(yù)測(cè)[J].安全與環(huán)境工程,2011,18(3):90-97.

[2]Philip S.Procedures for improving the measurement of local fire protection effectiveness[M].Boston:National Fire Protection Association,1977:53-71.

[3]Gunther P.Fire-cause patterns for different socioeconomic neighborhoods in Toledo[J].Fire Journal,1981,75:52-58.

[4]楊立中,江大白.中國(guó)火災(zāi)與社會(huì)經(jīng)濟(jì)因素的關(guān)系[J].氣象,1993,19(7):47-51.

[5]吳盧榮,馬詠真,陳績(jī)馨,等.中國(guó)火災(zāi)與社會(huì)經(jīng)濟(jì)因素的相關(guān)分析[J].中國(guó)安全科學(xué)學(xué)報(bào),2007,17(6):92-97.

[6]劉 寧,祝國(guó)苓.火災(zāi)與氣象因素的相關(guān)性研究[J].武警學(xué)院學(xué)報(bào),2010,26(2):22-25.

[7]田應(yīng)福,金百鎖,繆柏其,等.日本林火的廣義線性模型[J].統(tǒng)計(jì)與決策,2006(14):49-52.

[8]繆柏其,韋 劍,宋衛(wèi)國(guó),等.林火數(shù)據(jù)的Logistic和零膨脹Poisson(ZIP)回歸模型[J].火災(zāi)科學(xué),2008,17(3):143-149.

[9]李運(yùn)明.Box-Cox變換及其在SPSS軟件中的實(shí)現(xiàn)[J].數(shù)理醫(yī)藥學(xué)雜志,2009,22(5):569-571.

[10]王 歡,袁永生.Box-Cox變換用于分位數(shù)回歸曲線相交問題的研究[J].數(shù)理統(tǒng)計(jì)與管理,2009,28(6):1024-1029.

[11]胡宏昌,樊獻(xiàn)花.廣義 Box-Cox變換[J].周口師范學(xué)院學(xué)報(bào),2006,23(5):17-19.

[12]譚常春,周 堯.城市火災(zāi)次數(shù)與氣象因素的回歸模型[J].統(tǒng)計(jì)與決策,2011(18):31-33.

[13]王松桂.線性統(tǒng)計(jì)模型[M].北京:高等教育出版社,1999.

[14]公安部消防局.中國(guó)火災(zāi)統(tǒng)計(jì)年鑒(1997—2003)[M].北京:中國(guó)人民公安大學(xué)出版社,1997—2003.

[15]公安部消防局.中國(guó)消防年鑒(2004—2006)[M].北京:中國(guó)人事出版社,2004—2006.

猜你喜歡
起數(shù)原始數(shù)據(jù)降雨量
國(guó)家礦山安全監(jiān)察局:2022年煤礦百萬噸死亡率比2012年下降86%
國(guó)家森防辦:一季度全國(guó)森林草原火災(zāi)起數(shù)較往年顯著下降
綠葉(2022年4期)2022-11-26 04:20:43
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
降雨量與面積的關(guān)系
受特定變化趨勢(shì)限制的傳感器數(shù)據(jù)處理方法研究
去年全國(guó)生產(chǎn)安全事故起數(shù)下降15.5%
全新Mentor DRS360 平臺(tái)借助集中式原始數(shù)據(jù)融合及直接實(shí)時(shí)傳感技術(shù)實(shí)現(xiàn)5 級(jí)自動(dòng)駕駛
汽車零部件(2017年4期)2017-07-12 17:05:53
洞庭湖區(qū)降雨特性分析
羅甸縣各鄉(xiāng)鎮(zhèn)實(shí)測(cè)降雨量分析及應(yīng)用研究
世界經(jīng)濟(jì)趨勢(shì)
山丹县| 自治县| 唐海县| 南皮县| 通城县| 名山县| 连平县| 德昌县| 灌阳县| 富锦市| 平乡县| 温宿县| 宁明县| 铁力市| 韶关市| 阳原县| 南充市| 临漳县| 潜山县| 佛冈县| 龙门县| 定日县| 遵化市| 永嘉县| 富阳市| 江陵县| 钦州市| 抚州市| 永泰县| 宿迁市| 通州市| 时尚| 石泉县| 砀山县| 民乐县| 武穴市| 高邮市| 筠连县| 太保市| 平邑县| 玛多县|