吳 鑫,譚三清,蔡 瓊,周 璀,張 貴
(中南林業(yè)科技大學(xué) 數(shù)字洞庭湖南省重點(diǎn)實(shí)驗(yàn)室,湖南 長(zhǎng)沙 410004)
森林火災(zāi)不僅造成經(jīng)濟(jì)損失,也嚴(yán)重地危害森林生態(tài)系統(tǒng),提高林火熱點(diǎn)監(jiān)測(cè)的準(zhǔn)確度對(duì)保護(hù)森林資源具有重大意義[1]。遙感衛(wèi)星具有監(jiān)測(cè)范圍廣、時(shí)空分辨率高和獲取數(shù)據(jù)方便的特性,其對(duì)林火熱點(diǎn)監(jiān)測(cè)具有重要作用[2]。前人利用遙感衛(wèi)星在林火熱點(diǎn)監(jiān)測(cè)方面的研究已有很多,大多采用閥值法、絕對(duì)火點(diǎn)識(shí)別法和上下文火點(diǎn)監(jiān)測(cè)算法等對(duì)林火進(jìn)行識(shí)別[3-5]。但通過(guò)遙感衛(wèi)星監(jiān)測(cè)林火熱點(diǎn)時(shí)會(huì)提取地面所有熱點(diǎn),嚴(yán)重影響林火監(jiān)測(cè)的精度。因此如何將虛假林火熱點(diǎn)從衛(wèi)星遙感林火熱點(diǎn)監(jiān)測(cè)數(shù)據(jù)中剔除是提高林火監(jiān)測(cè)精度的關(guān)鍵。
隨著遙感衛(wèi)星和地理信息系統(tǒng)的普遍應(yīng)用,積累了大量的氣象數(shù)據(jù)、數(shù)字影像數(shù)據(jù)和地理科學(xué)數(shù)據(jù)。這些時(shí)空數(shù)據(jù)同時(shí)包括了時(shí)間、空間和非空間類(lèi)型的數(shù)據(jù),在時(shí)間和空間上均存在著一定的自相關(guān)性[6]。時(shí)空數(shù)據(jù)挖掘作為一個(gè)新興的研究領(lǐng)域,已經(jīng)成為數(shù)據(jù)挖掘中的研究熱點(diǎn),在眾多領(lǐng)域中取得了一定的研究成果。時(shí)空數(shù)據(jù)挖掘是綜合了多種新興學(xué)科與多種相關(guān)技術(shù)相互交叉而形成的新領(lǐng)域,例如統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)學(xué)習(xí)等領(lǐng)域的相關(guān)技術(shù)[7],主要方法有數(shù)學(xué)統(tǒng)計(jì)方法、歸納方法、神經(jīng)網(wǎng)絡(luò)方法、聚類(lèi)與分類(lèi)方法等。本研究以湖南省為研究區(qū)域,以2015—2017年歷史林火數(shù)據(jù)為數(shù)據(jù)源,以DBSCAN算法為虛假林火挖掘方法,對(duì)計(jì)算機(jī)自動(dòng)判讀的歷史林火熱點(diǎn)數(shù)據(jù)進(jìn)行挖掘,給虛假林火熱點(diǎn)的判識(shí)提供了新的思路。
本研究數(shù)據(jù)來(lái)源于中南林業(yè)科技大學(xué)氣象衛(wèi)星地面接收站,通過(guò)研制的林火熱點(diǎn)自動(dòng)識(shí)別系統(tǒng),可處理EOS衛(wèi)星的MODIS數(shù)據(jù)、風(fēng)云3的VIRR數(shù)據(jù)以及NOAA氣象衛(wèi)星的AVHRR數(shù)據(jù),系統(tǒng)能采用相應(yīng)算法提取林火熱點(diǎn)。本研究中所采用從2015年10月至2017年12月的湖南省共3 789條歷史火點(diǎn)數(shù)據(jù),包含火點(diǎn)所在縣市、經(jīng)緯度、火場(chǎng)面積(像元數(shù))、有無(wú)煙云等相關(guān)信息。
自然界物體的溫度和其物體性質(zhì)不同,其向外發(fā)射的輻射量也有所不同。根據(jù)史蒂夫-波爾滋曼(Stefan-Boltzman)定律,物體的溫度和輻射強(qiáng)度成正比,溫度越高的物體其輻射值越高。從衛(wèi)星遙感數(shù)據(jù)中提取熱點(diǎn)的基本原理就是利用不同的波譜特征來(lái)區(qū)分地物。在識(shí)別過(guò)程中能滿(mǎn)足熱點(diǎn)條件的,除了真實(shí)的林火熱點(diǎn)外同時(shí)還可能夾雜著以下這些情況:
(1)固定熱源。固定熱源分為兩種,一種為有火、有煙霧的固定熱源;另一種為非火點(diǎn)、無(wú)煙霧的地面恒熱源。有火、有煙霧的固定熱源是指熱源位置固定、且熱源釋放具有連續(xù)性和一定規(guī)律性的熱點(diǎn)。非火點(diǎn)的地面恒熱源通常是指沙地、裸地、裸露的石頭或城市熱島。
(2)水面反射。當(dāng)太陽(yáng)光是由水面反射至衛(wèi)星掃描輻射儀中時(shí),在遙感圖像上會(huì)出現(xiàn)一塊明亮的特征,這樣的特征稱(chēng)為太陽(yáng)耀斑。由于反射率強(qiáng),對(duì)遙感圖像進(jìn)行處理時(shí),在彩色合成圖上也會(huì)被呈現(xiàn)為紅色,同樣會(huì)被認(rèn)為是高溫點(diǎn),水面包括湖泊、河流、濕地,這類(lèi)會(huì)被認(rèn)為是熱點(diǎn)的情況一般出現(xiàn)在晴朗天氣。
(3)農(nóng)用火源。農(nóng)用火源包括秸稈焚燒和傳統(tǒng)祭祀掃墓造成的人為火源。秸稈焚燒一般多為收獲季節(jié),所以具有季節(jié)性。秸稈焚燒一般都會(huì)在種植地附近或農(nóng)田的耕地表面上。秸稈焚燒造成的虛假林火熱點(diǎn)是虛假林火熱點(diǎn)類(lèi)型中特征最接近林火現(xiàn)象的虛假林火熱點(diǎn)。傳統(tǒng)祭祀掃墓造成的人為火源這類(lèi)火源在遙感影像上呈現(xiàn)的規(guī)律,通常在時(shí)間特征上很明顯,于每年的春節(jié)前后和清明節(jié)前后,且熱點(diǎn)位置相對(duì)集中。
(4)云層反射。云層是衛(wèi)星監(jiān)測(cè)森林火災(zāi)中的重要干擾因子。云具有不確定特征,時(shí)而有時(shí)而無(wú),時(shí)而厚時(shí)而薄。不同的云量和不同的形狀以及不同的厚度對(duì)太陽(yáng)的反射是不同的。
(5)不確定性異常高溫點(diǎn)。不確定性異常高溫點(diǎn)一般包括居民房屋失火、燒窯、燒磚、燒垃圾等。這些熱源有不確定性。其中燒窯、燒磚一般泛指在人工搭建的建筑物中,通過(guò)高溫?zé)起ね脸尚?。不確定性異常高溫點(diǎn)的熱源一般具有短時(shí)性,并不會(huì)引起森林火災(zāi),但又是熱源。
DBSCAN算法是一種具有代表性的基于密度的聚類(lèi)算法[8]。DBSCAN算法要聚集的簇定義為密度相連的點(diǎn)的最大集合。DBSCAN聚類(lèi)與其他聚類(lèi)方法的區(qū)別就是不用事先知道聚類(lèi)的簇為多少,通過(guò)聚類(lèi)前選取合適的聚類(lèi)半徑和聚類(lèi)的最少點(diǎn)數(shù),按照給出的參數(shù)進(jìn)行聚類(lèi)劃分。DBSCAN算法可以應(yīng)用于許多領(lǐng)域,例如位置軌跡分析、數(shù)據(jù)分區(qū)、圖像處理、預(yù)測(cè)模型等[9-12]。
DBSCAN算法的本質(zhì)是計(jì)算給定的半徑范圍內(nèi)包含了多少時(shí)空對(duì)象,算法包含兩個(gè)參數(shù)Eps和MinPts,算法的核心概念如下:
(1)Eps領(lǐng)域:在給定半徑為E內(nèi)的時(shí)空對(duì)象為該對(duì)象的E領(lǐng)域;
(2)核心對(duì)象:核心對(duì)象是指在E領(lǐng)域中達(dá)到設(shè)定密度值范圍的點(diǎn),即在Eps中的點(diǎn)數(shù)大于或者等于MinPts;
(3)直接密度可達(dá):對(duì)于任意一個(gè)以對(duì)象P為核心對(duì)象的集合G,對(duì)象D在對(duì)象P的Eps領(lǐng)域內(nèi),那么對(duì)象D到對(duì)象P之間直接密度可達(dá);
(4)密度可達(dá):當(dāng)存在集合{D1,D2,…,Dn},假如集合中任意點(diǎn)Di從Di-1都是直接密度可達(dá),那么集合中的點(diǎn)都是密度可達(dá);
(5)密度相連:當(dāng)集合G中點(diǎn)一個(gè)點(diǎn)使得任意點(diǎn)A,與對(duì)象P與對(duì)象D都是密度可達(dá),那么任意點(diǎn)P與對(duì)象P和對(duì)象D稱(chēng)為密度相連;
(6)聚類(lèi):當(dāng)樣本集合內(nèi)要素為非空集合時(shí)為一類(lèi);
(7)噪聲點(diǎn):當(dāng)樣本集合中的存在某一點(diǎn)不屬于任何類(lèi),該點(diǎn)為噪聲點(diǎn)。
DBSCAN算法進(jìn)行聚類(lèi)原理的可以總結(jié):根據(jù)輸入的鄰域參數(shù)(Eps,MinPts)和樣本的歐式距離,對(duì)樣本數(shù)據(jù)中的每個(gè)點(diǎn)的Eps領(lǐng)域來(lái)搜索成簇,當(dāng)樣本數(shù)據(jù)中的對(duì)象點(diǎn)P的Eps領(lǐng)域包含的樣本數(shù)據(jù)點(diǎn)個(gè)數(shù)多于MinPts時(shí),則建立以對(duì)象點(diǎn)P為核心對(duì)象的簇。之后DBSCAN不斷地迭代,聚集核心對(duì)象直接密度可達(dá)的所有對(duì)象點(diǎn),歷遍所有對(duì)象點(diǎn),當(dāng)沒(méi)有新對(duì)象點(diǎn)添加到任何簇時(shí),聚類(lèi)過(guò)程結(jié)束。
DBSCAN算法的聚類(lèi)結(jié)果是否合理,最大程度上取決于Eps參數(shù)的確定,當(dāng)聚類(lèi)半徑Eps過(guò)大時(shí)會(huì)導(dǎo)致過(guò)多的噪聲點(diǎn)被聚類(lèi)成一簇,也有可能將本身不為同一簇的對(duì)象聚類(lèi)。當(dāng)聚類(lèi)半徑Eps過(guò)小時(shí)又會(huì)將本身屬于同一簇的點(diǎn)給分成了不同的簇,則此聚類(lèi)沒(méi)有意義。因此,合理的Eps是聚類(lèi)成功與否的關(guān)鍵。DBSCAN聚類(lèi)所用的計(jì)算距離為歐式距離,因此需要將歷史林火熱點(diǎn)坐標(biāo)的經(jīng)緯度轉(zhuǎn)換為平面坐標(biāo)來(lái)進(jìn)行計(jì)算。
本研究中建立的林火熱點(diǎn)挖掘流程如圖1所示。
圖1 林火熱點(diǎn)挖掘流程Fig. 1 Mining flow chart of forest fire hot-spot
將采用DBSCAN算法進(jìn)行林火熱點(diǎn)挖掘的結(jié)果在ArcGIS平臺(tái)上進(jìn)行可視化分析,如圖2所示,圖中黃點(diǎn)為每個(gè)聚類(lèi)點(diǎn),每個(gè)聚類(lèi)點(diǎn)中的林火熱點(diǎn)數(shù)量在4個(gè)及以上。
圖2 林火熱點(diǎn)聚類(lèi)結(jié)果Fig. 2 Clustering result of forest fire hot-spot
對(duì)各市行政區(qū)劃范圍內(nèi)簇的數(shù)量及簇中的熱點(diǎn)數(shù)進(jìn)行統(tǒng)計(jì)匯總,如表1所示,全省共發(fā)現(xiàn)173個(gè)符合參數(shù)的簇,之后對(duì)每個(gè)簇的林火熱點(diǎn)數(shù)據(jù)查看屬性,并判斷每個(gè)林火熱點(diǎn)是否處于同一地表覆蓋類(lèi)型和是否具有時(shí)序特征。
表 1 林火熱點(diǎn)簇和數(shù)量統(tǒng)計(jì)Table 1 Statistics of forest fire hot-spots of cluster and number
滿(mǎn)足同一地表覆蓋類(lèi)型和滿(mǎn)足時(shí)序條件熱點(diǎn)的簇的個(gè)數(shù)為169個(gè),不符合的為4個(gè)。且不符合的簇內(nèi)的林火熱點(diǎn)數(shù)均為4個(gè)??梢缘贸鲈跇颖局羞M(jìn)行DBSCAN聚類(lèi)得出的熱點(diǎn)個(gè)數(shù)在4個(gè)以上時(shí)更符合虛假林火熱點(diǎn)的特征。
對(duì)169個(gè)屬于同一地表覆蓋類(lèi)型和滿(mǎn)足時(shí)序條件熱點(diǎn)的簇進(jìn)行分類(lèi)統(tǒng)計(jì),結(jié)果如表2所示。
表 2 林火熱點(diǎn)簇和數(shù)量分類(lèi)統(tǒng)計(jì)Table 2 Classification statistics of forest fire hot-spots of cluster and number
根據(jù)統(tǒng)計(jì)結(jié)果可以看出通過(guò)DBSCAN算法挖掘出的不同虛假林火熱點(diǎn)類(lèi)別的個(gè)數(shù)與占比情況,具體情況如下:
(1)固定熱源。固定熱源類(lèi)的虛假林火熱點(diǎn)占挖掘出的虛假林火熱點(diǎn)總數(shù)的44.7%。同時(shí)發(fā)現(xiàn),固定熱源幾乎都處于人造地表覆蓋類(lèi)型,且根據(jù)城市發(fā)達(dá)程度,越發(fā)達(dá)的城市由固定熱源造成的虛假林火熱點(diǎn)越多。固定熱源的時(shí)序特征以5、6、7、8月最為顯著。
(2)農(nóng)用火源。虛假林火熱點(diǎn)中由農(nóng)用火源造成的虛假熱點(diǎn)的個(gè)數(shù)占比為52.9%。同時(shí)發(fā)現(xiàn),農(nóng)用火源除了處于耕地中外,也會(huì)處于森林中。農(nóng)用火源造成的虛假熱點(diǎn)的時(shí)間特征為農(nóng)歷春節(jié)前后、清明前后以及農(nóng)作物春耕、秋耕期間,以2、4月份最為顯著。
(3)水面反射。由水面反射造成的虛假林火熱點(diǎn)僅占2.4%。通過(guò)挖掘發(fā)現(xiàn),由水面原因造成20個(gè)虛假林火熱點(diǎn)的衛(wèi)星檢測(cè)時(shí)間都為下午1:30左右。通過(guò)地圖查詢(xún),20點(diǎn)中有4個(gè)點(diǎn)在郴州的資興市東江水庫(kù)、4個(gè)點(diǎn)在岳陽(yáng)湘陰縣的湖泊、5個(gè)點(diǎn)在常德桃源縣的沅江水段,7個(gè)點(diǎn)在岳陽(yáng)縣的東洞庭湖。
根據(jù)中國(guó)森林防火網(wǎng)的數(shù)據(jù)對(duì)挖掘結(jié)果進(jìn)行對(duì)比檢驗(yàn),可知固定熱源和水面反射造成的虛假林火熱點(diǎn)非常準(zhǔn)確。因此,根據(jù)固定熱源類(lèi)和水面反射造成的虛假林火熱點(diǎn)的位置具有明顯的位置特征性,可將以DBSCAN算法聚類(lèi)的這兩類(lèi)成簇的核心對(duì)象熱點(diǎn)建立數(shù)據(jù)庫(kù)。以后接收的林火熱點(diǎn)數(shù)據(jù)中含有由核心對(duì)象點(diǎn)位置2 km范圍內(nèi)產(chǎn)生的熱點(diǎn),通過(guò)調(diào)用數(shù)據(jù)庫(kù)進(jìn)行比對(duì),便可直接將其排除。
將挖掘結(jié)果與方法對(duì)2018年2月26日的林火點(diǎn)進(jìn)行了應(yīng)用,通過(guò)本研究方法從10個(gè)林火熱點(diǎn)中找出2個(gè)由農(nóng)用火源造成的虛假林火熱點(diǎn),與中國(guó)森林防火網(wǎng)比對(duì)驗(yàn)證了結(jié)果的正確性,驗(yàn)證本方法能有效提高林火熱點(diǎn)的監(jiān)測(cè)精度。
本研究對(duì)衛(wèi)星遙感數(shù)據(jù)進(jìn)行計(jì)算機(jī)自動(dòng)判讀,獲取湖南省林火熱點(diǎn)數(shù)據(jù),采用DBSCAN算法進(jìn)行數(shù)據(jù)挖掘,從識(shí)別出的熱點(diǎn)中進(jìn)行虛假林火熱點(diǎn)判識(shí),得到以下結(jié)論:
(1)采用DBSCAN算法為挖掘算法,將Eps設(shè)置為1 km,MinPts設(shè)置為3,識(shí)別出了3種不同類(lèi)型的虛假火點(diǎn),分別為固定熱源類(lèi)、農(nóng)用火源類(lèi)和水面反射類(lèi)。
(2)將挖掘結(jié)果和方法應(yīng)用于實(shí)時(shí)虛假林火熱點(diǎn)識(shí)別,能有效提高林火監(jiān)測(cè)精度。
本研究雖然利用時(shí)空數(shù)據(jù)挖掘的方法對(duì)虛假林火熱點(diǎn)進(jìn)行了挖掘,并將方法應(yīng)用于虛假林火的實(shí)時(shí)判識(shí),但有些問(wèn)題還需要進(jìn)一步探討:
①利用計(jì)算機(jī)從衛(wèi)星遙感數(shù)據(jù)中自動(dòng)判讀出的歷史林火熱點(diǎn)數(shù)據(jù)對(duì)虛假林火熱點(diǎn)進(jìn)行判識(shí)時(shí),不能將所有類(lèi)別的虛假林火熱點(diǎn)進(jìn)行排除。如云層反射造成的虛假林火熱點(diǎn),是否能不利用遙感數(shù)據(jù)中的反射波段特征來(lái)排除是未來(lái)的一個(gè)研究方向。
②本研究應(yīng)用的算法中的參數(shù)選擇僅以2 a間的歷史林火熱點(diǎn)數(shù)據(jù)為基礎(chǔ),在算法的參數(shù)選擇上是否會(huì)隨著歷史火點(diǎn)數(shù)據(jù)的增加而發(fā)生變化,也是一個(gè)值得研究的問(wèn)題。
中南林業(yè)科技大學(xué)學(xué)報(bào)2018年8期