李星星 段超
摘 要: 森林作為陸地上重要的生態(tài)系統(tǒng),具有環(huán)境與資源雙重屬性。一旦發(fā)生火災,將對環(huán)境和大氣造成無法彌補的破壞。數(shù)據(jù)挖掘技術在森林防火中具有重要的的作用,能夠?qū)ι只馂倪M行預測,從而達到預防的效果。
關鍵詞: 森林火災;數(shù)據(jù)挖掘;應用研究
【中圖分類號】 TP311.4 【文獻標識碼】 A【文章編號】 2236-1879(2018)14-0027-01
一、研究背景及意義
森林是極其珍貴的自然資源,在凈化空氣、調(diào)節(jié)氣候等方面具有巨大的功能,對維持人類生活環(huán)境方面發(fā)揮著關鍵作用,且還是珍貴的野生動物的棲息地。一旦發(fā)生火災,將對環(huán)境和大氣造成毀滅性的、無法彌補的破壞(大氣中30%的二氧化碳來自森林火災),甚至造成重大人身事故和巨大的財產(chǎn)損失。破壞森林資源的自然災害除了火災,還有病災和蟲災,但是火災是破壞性和危害性最大的。
森林作為陸地上重要的生態(tài)系統(tǒng),具有環(huán)境與資源雙重屬性,它提供了豐富多彩的資源產(chǎn)品,營造了優(yōu)美的環(huán)境,維持著地球的生態(tài)平衡。火災的發(fā)生,不但會造成巨大的經(jīng)濟損失和人員的傷亡,而且對整個大氣的污染是巨大的,將持續(xù)影響人們的健康生活。因此,對火災發(fā)生規(guī)律進行預測并對潛在危險區(qū)進行監(jiān)測,及早發(fā)現(xiàn)火災,可以大大縮短反應時間,減少火災潛在損失和滅火成本。“預防為主,積極消滅”是我國森林防火方針。如何從大量的歷史森林火災數(shù)據(jù)中挖掘出有用的知識以供決策者參考是現(xiàn)在急需解決的問題。
二、數(shù)據(jù)挖掘技術在森林火災中應用研究
數(shù)據(jù)挖掘是一個融合了多項技術的研究范疇,它集成了數(shù)據(jù)庫技術、機器學習、人工智能、統(tǒng)計學、知識庫系統(tǒng)、信息檢索等最近技術的研究成果。還有許多與其相近的術語,如從數(shù)據(jù)庫中發(fā)現(xiàn)知識(Knowledge Discovery in Database, KDD)、數(shù)據(jù)分析(Date Analysis)、數(shù)據(jù)融合(Data Fusion)以及決策支持等。2001年,Gartner Group在一次高級技術調(diào)查中將數(shù)據(jù)挖掘和人工智能列為“未來三到五年內(nèi)將對工業(yè)產(chǎn)生深遠影響的五大關鍵技術”之首,還將并行處理體系和數(shù)據(jù)挖掘列為未來的五年內(nèi)投資焦點的十大新興科技前兩位[1]。
20世紀80年代末開始出現(xiàn)了發(fā)現(xiàn)知識(KDD)一詞,在1989年8月美國底特律市舉辦了第一屆KDD國際學術會議上第一次提到了該詞的概念。起初每兩年舉辦一次KDD 會議,到1993年后一年舉辦一次。直到1995年加拿大的蒙特利爾舉辦了首屆KDD &Data Mining的國際會議,才開始流行知識發(fā)現(xiàn)和數(shù)據(jù)挖掘。之后,在國外有關數(shù)據(jù)挖掘相關的論文發(fā)表得十分多,并形成了比較熱門的研究方向,比較集中發(fā)表的論文期刊如:《Data Mining and Knowledge Discovery》、《Artificial Intelligence Review》[1]。
在國內(nèi),1993年中科院合肥分院獲得我國自然科學基金首次在數(shù)據(jù)挖掘領域的研究的支持。通過檢索被科學引文數(shù)據(jù)庫(SCI)、工程索引數(shù)據(jù)(EI)和清華全文期刊數(shù)據(jù)庫(CNKI)收錄有關數(shù)據(jù)挖掘方面的文章,可知:1997年中國有關數(shù)據(jù)挖掘的文章在SCI收錄了2篇,CNKI中收錄了3篇,這說明在數(shù)據(jù)挖掘方向的研究,中國與國外在時間上相差不大。國內(nèi)有關數(shù)據(jù)挖掘論文的發(fā)表也逐年增加,說明中國的數(shù)據(jù)挖掘研究也正在加強[1]。
數(shù)據(jù)挖掘是面向?qū)嶋H應用的技術?,F(xiàn)已廣泛地應用在金融、電信、保險、農(nóng)業(yè)、制造業(yè)、醫(yī)療衛(wèi)生等領域,數(shù)據(jù)挖掘在農(nóng)林火災中的應用研究也引起了國內(nèi)外專家學者的關注。
Tao Cheng等探討了時空數(shù)據(jù)挖掘在森林防火中的應用,特別關注森林火災的時空預測,提出了一種集成時空預測ISTFF框架:使用一個動態(tài)遞歸神經(jīng)網(wǎng)絡的空間預測,然后以加拿大森林火險區(qū)預測為例,與其他方法做了比較。Paulo Cortez等探索了數(shù)據(jù)挖掘方法來預測森林火災的燃燒面積,在基于最近葡萄牙東北部收集的真實數(shù)據(jù),測試了五種不同的DM技術(如支持向量機(SVM)和隨機森林)和四種不同的特征選擇設置(使用空間、時間、火災森林指數(shù)(FWI)和天氣屬性)。最好的配置是使用了一個支持向量機(SVM)和四個氣象輸入(即溫度、相對濕度、雨、風),它能預測更加頻繁小火的燃燒面積。這對提高消防管理尤其有用。
劉芳[2]針對K均值中容易出現(xiàn)局部最優(yōu)的缺點,引入了蟻群算法ICACA對其進行優(yōu)化,提出一種改良的蟻群聚類算法,利用實驗對比,新的算法能夠在時間上和聚類的準確性上獲得一個平衡,然后運用在預測分析實際的森林火災中。蘇成偉[3]將模擬退火算法與遺傳算法結合起來,形成了模擬退火遺傳算法,將該算法應用于關聯(lián)規(guī)則的挖掘中,然后在森林火災數(shù)據(jù)中應用改良的算法。印世樂針對傳統(tǒng)的遺傳算法容易陷入局部最優(yōu)和早熟的缺點,提出了一種改進的多種群遺傳算法,然后將算法應用于森林火災數(shù)據(jù)進行關聯(lián)規(guī)則挖掘。王軒為了能夠?qū)崟r監(jiān)控林中的溫度、相對濕度等火災因子,運用ZigBee無線傳感器網(wǎng)絡、Internet網(wǎng)絡、GPRS數(shù)據(jù)通信等技術構建了基于物聯(lián)網(wǎng)技術的遠程監(jiān)測系統(tǒng)。許志卿在研究中運用半正規(guī)規(guī)劃建模方法,建立了自定義核函數(shù)的SVM模型,對比了線性核函數(shù)的模型、基于自定義核函數(shù)的SVM模型和基于高斯核函數(shù)SVM模型三種林火預測模型的預測效果,設計并實現(xiàn)了基于這三種模型的林火預測系統(tǒng)。
參考文獻
[1] 李菁菁,邵培基,黃亦瀟.數(shù)據(jù)挖掘在中國的現(xiàn)狀和發(fā)展研究[J].管理工程學報,2004(03):10-15.
[2] 劉芳.改進的蟻群聚類算法在森林火災預測中的應用研究:[碩士學位論文].阜新:遼寧工程技術大學,2009.
[3] 蘇成偉.一種改進的遺傳算法在數(shù)據(jù)挖掘中的應用研究:[碩士學位論文].合肥:合肥工業(yè)大學,2013.