常杪,馮雁,郭培坤,解惠婷,王世汶
(1. 清華大學(xué)環(huán)境學(xué)院,北京 100084;2. 中國社科院數(shù)量經(jīng)濟(jì)與技術(shù)經(jīng)濟(jì)研究所,北京 100732)
環(huán)境大數(shù)據(jù)概念、特征及在環(huán)境管理中的應(yīng)用
常杪1*,馮雁1,郭培坤1,解惠婷1,王世汶2
(1. 清華大學(xué)環(huán)境學(xué)院,北京 100084;2. 中國社科院數(shù)量經(jīng)濟(jì)與技術(shù)經(jīng)濟(jì)研究所,北京 100732)
摘 要將大數(shù)據(jù)運(yùn)用到環(huán)境管理領(lǐng)域是我國環(huán)境管理戰(zhàn)略轉(zhuǎn)型的重要舉措。本文基于對大數(shù)據(jù)概念與特征分析,并結(jié)合環(huán)境領(lǐng)域的特點(diǎn),闡述了環(huán)境大數(shù)據(jù)的概念、特征及在環(huán)境管理中所能發(fā)揮的作用。環(huán)境大數(shù)據(jù)即把大數(shù)據(jù)的核心理念和關(guān)鍵技術(shù)應(yīng)用到環(huán)境領(lǐng)域,對海量環(huán)境數(shù)據(jù)進(jìn)行采集、整合、存儲、分析與應(yīng)用等,具有數(shù)據(jù)規(guī)模大、種類多、處理速度快、價值密度低等特征。環(huán)境大數(shù)據(jù)的應(yīng)用,對于政府、企業(yè)和公眾都有重要意義。進(jìn)一步對其在環(huán)境管理中的應(yīng)用場景進(jìn)行設(shè)想,發(fā)現(xiàn)其在環(huán)境規(guī)劃編制、環(huán)境質(zhì)量管理、污染源生命周期管理、環(huán)境應(yīng)急以及公眾參與等多方面都能發(fā)揮重要作用,以促使環(huán)境管理向數(shù)字化、網(wǎng)絡(luò)化和精細(xì)化轉(zhuǎn)變。最后針對環(huán)境大數(shù)據(jù)在數(shù)據(jù)處理、數(shù)據(jù)管理、數(shù)據(jù)應(yīng)用現(xiàn)狀方面存在的問題,提出了可能的解決思路。
關(guān)鍵詞大數(shù)據(jù);環(huán)境大數(shù)據(jù);環(huán)境管理;應(yīng)用場景
當(dāng)前,大數(shù)據(jù)不僅在信息技術(shù)、電子商務(wù)行業(yè)備受矚目,更成為科研變革、商業(yè)革新、政府運(yùn)作乃至人類思維方式轉(zhuǎn)變的一個熱點(diǎn)[1]。2012年3月,美國總統(tǒng)奧巴馬于白宮正式宣布啟動“大數(shù)據(jù)研究與發(fā)展計劃”,提出利用大數(shù)據(jù)技術(shù)在科學(xué)發(fā)現(xiàn)、環(huán)境保護(hù)等領(lǐng)域大力開展研究,將大數(shù)據(jù)研究作為國家戰(zhàn)略提出。隨后,我國也出臺了《十二五國家政務(wù)信息化建設(shè)工程規(guī)劃》(2012年5月)、《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》(2015年7月)等戰(zhàn)略性文件,推動大數(shù)據(jù)在我國各個領(lǐng)域的發(fā)展和運(yùn)用。2015年8月,國務(wù)院辦公廳印發(fā)的《生態(tài)環(huán)境監(jiān)測網(wǎng)絡(luò)建設(shè)方案》明確指出利用大數(shù)據(jù)實現(xiàn)生態(tài)環(huán)境監(jiān)測與監(jiān)管有效聯(lián)動,從政策層面對大數(shù)據(jù)應(yīng)用于環(huán)境管理領(lǐng)域提出要求。
與此同時,我國環(huán)境管理戰(zhàn)略逐漸由污染減排總量控制為主向環(huán)境質(zhì)量改善為目標(biāo)導(dǎo)向轉(zhuǎn)變。環(huán)境質(zhì)量改善的目標(biāo)導(dǎo)向要求提升環(huán)境管理的精細(xì)化水平,實現(xiàn)分地區(qū)、分類別的差異化管理并實施精準(zhǔn)治理。傳統(tǒng)的以經(jīng)驗性的預(yù)測、決策為主導(dǎo)的粗放式管理思維很難滿足新的考核要求。大數(shù)據(jù)作為新的技術(shù)手段和思維方式,打破了傳統(tǒng)收集、整合、存儲、處理、分析和可視化數(shù)據(jù)信息的方式,管理的定量化水平和決策的科學(xué)性提高,為環(huán)境管理逐漸向網(wǎng)絡(luò)化和智能化轉(zhuǎn)變帶來新的機(jī)遇。
人、機(jī)、物三元世界的高度融合引發(fā)了數(shù)據(jù)規(guī)模的爆炸式增長和數(shù)據(jù)模式的高度復(fù)雜化,世界已進(jìn)入網(wǎng)絡(luò)化的大數(shù)據(jù)(Big Data)時代[2]?;ヂ?lián)網(wǎng)在線用戶、各種類型的傳感器等,每時每刻都在產(chǎn)生巨量不同類型的數(shù)據(jù)。根據(jù)國際市場研究機(jī)構(gòu)IDC的統(tǒng)計,2011年全球的數(shù)據(jù)量為1.8ZB,并預(yù)測到2020年全球的數(shù)據(jù)總量將達(dá)到40ZB,屆時人均將產(chǎn)生5.2TB的數(shù)據(jù)。另外,目前采集到的數(shù)據(jù)只有少量的結(jié)構(gòu)化數(shù)據(jù),85%以上為非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)[2]。
1.1 大數(shù)據(jù)的概念與基本特征
對于如何界定大數(shù)據(jù),相關(guān)研究者看法不一。麥肯錫、IDC、維基百科等的定義主要突出其“大”,如麥肯錫認(rèn)為大數(shù)據(jù)指的是大小超出常規(guī)的數(shù)據(jù)庫工具獲取、存儲、管理和分析能力的數(shù)據(jù)集[3]。涂子沛則認(rèn)為作為一種新的價值觀和方法論,大數(shù)據(jù)的本質(zhì)并不限于數(shù)據(jù)的規(guī)模大,而在于用嶄新的思維和技術(shù)對海量數(shù)據(jù)進(jìn)行整合分析,從中發(fā)現(xiàn)新的知識,創(chuàng)造新的價值,帶來“大知識”、“大科技”、“大利潤”和“大發(fā)展”[4]。趙國棟等也強(qiáng)調(diào)數(shù)據(jù)的功用價值,認(rèn)為大數(shù)據(jù)是在多樣的或者大量數(shù)據(jù)中,迅速獲取信息的能力[5]。但得到普遍認(rèn)可的是大數(shù)據(jù)具有以下4“V”特征:數(shù)據(jù)規(guī)模大(Volume)、種類多(Variety)、速度快(Velocity)和價值密度低、應(yīng)用價值高(Value)。近期頒布的《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》也是基于上述四個特征來定義大數(shù)據(jù)的。
1.2 大數(shù)據(jù)處理流程及相關(guān)技術(shù)
在各個領(lǐng)域,數(shù)據(jù)量都逐漸由稀缺走向極大豐富,但這些數(shù)據(jù)信息本身并不能產(chǎn)生價值,只有對其進(jìn)行專業(yè)化的分析處理,發(fā)現(xiàn)數(shù)據(jù)內(nèi)在的規(guī)律性特點(diǎn)和數(shù)據(jù)之間的關(guān)系[6],才能夠真正產(chǎn)生價值。然而大數(shù)據(jù)本身海量多源異構(gòu)等特征決定了其處理過程復(fù)雜。傳統(tǒng)的數(shù)據(jù)分析工具,無法在合理時間內(nèi)收集、管理、處理原始數(shù)據(jù),并整理成為幫助企業(yè)經(jīng)營或主管部門決策提供支持的數(shù)據(jù)[7],大數(shù)據(jù)技術(shù)的開發(fā)與應(yīng)用勢在必行。
大數(shù)據(jù)的處理流程可劃分為數(shù)據(jù)采集與預(yù)處理、數(shù)據(jù)存儲、數(shù)據(jù)分析以及數(shù)據(jù)可視化。由此可將大數(shù)據(jù)技術(shù)劃分為大數(shù)據(jù)的采集與預(yù)處理技術(shù)、存儲技術(shù)、分析技術(shù)、可視化技術(shù)等。
大數(shù)據(jù)的數(shù)據(jù)來源廣泛,其采集主要有四種來源:管理信息系統(tǒng)、Web 信息系統(tǒng)、物理信息系統(tǒng)、科學(xué)實驗系統(tǒng)[8]。獲取這些數(shù)據(jù)通常依靠傳感器技術(shù)、Web2.0技術(shù)、條形碼技術(shù)、RFID技術(shù)、移動終端技術(shù)等[9]。而從不同來源獲取的數(shù)據(jù)可能結(jié)構(gòu)和類型復(fù)雜,會給之后的分析帶來困難,需要將其轉(zhuǎn)換為單一的或者便于處理的結(jié)構(gòu)。同時,多源異構(gòu)的特性導(dǎo)致數(shù)據(jù)質(zhì)量存在差異,需要對這些數(shù)據(jù)進(jìn)行清洗,如采用聚類或者關(guān)聯(lián)規(guī)則分析的方法將冗余及錯誤數(shù)據(jù)過濾。當(dāng)前已有的數(shù)據(jù)清洗工具有Data Flux、Data Stage、Informatica Power Center等。
大數(shù)據(jù)規(guī)模大、類型復(fù)雜、處理速度快等給存儲系統(tǒng)帶來挑戰(zhàn),目前可適用大數(shù)據(jù)環(huán)境的技術(shù)包括是分布式文件系統(tǒng)、分布式數(shù)據(jù)庫以及訪問接口和查詢語言等[8]。最著名的是Apache Hadoop系列開源平臺,包括Hadoop Common,HDFS,MapReduce,Zookeeper,Avro,Chukwa,HBase等子項目[10]。
預(yù)處理及存儲得到的數(shù)據(jù)是數(shù)據(jù)分析的原始數(shù)據(jù),即需要對這些數(shù)據(jù)進(jìn)行深入的處理與分析,這是整個處理流程中最核心的部分。人工智能技術(shù)領(lǐng)域的很多技術(shù)方法,包括統(tǒng)計分析(如A/B測試)、數(shù)據(jù)挖掘(如聚類分析)、機(jī)器學(xué)習(xí)、自然語言處理、神經(jīng)網(wǎng)絡(luò)等,都可用于大數(shù)據(jù)分析。新的技術(shù)方法使我們能夠?qū)崟r數(shù)據(jù)進(jìn)行深入分析,對數(shù)據(jù)變化趨勢的分析更可靠。
數(shù)據(jù)處理流程的最后一步是將分析結(jié)果展現(xiàn)給最終用戶,巨量數(shù)據(jù)的分析結(jié)果的復(fù)雜性使其很難用傳統(tǒng)的數(shù)據(jù)顯示方式展示,可視化成為大數(shù)據(jù)技術(shù)重要的研究方向。常見的可視化技術(shù)有基于集合/圖標(biāo)/圖像的技術(shù)、面向像素的技術(shù)和分布式技術(shù)等[11]。當(dāng)前成功的應(yīng)用案例、典型的可視化技術(shù)主要包括互聯(lián)網(wǎng)宇宙、標(biāo)簽云和歷史流圖等[12]。
從20世紀(jì)80年代以來,環(huán)境信息技術(shù)得到了飛速發(fā)展,環(huán)保部門開展了多種環(huán)境質(zhì)量監(jiān)測工作、生態(tài)環(huán)境調(diào)查工作及污染源管理工作,積累了大量數(shù)據(jù),包括污染源數(shù)據(jù)和環(huán)境質(zhì)量數(shù)據(jù)。近十年來,一些新的環(huán)境管理工作,如污染物減排“三大體系”建設(shè)、應(yīng)急管理、輻射管理職能的全面調(diào)整、環(huán)境訴訟和公眾監(jiān)督的發(fā)展、清潔生產(chǎn)和循環(huán)經(jīng)濟(jì)的興起、污染源調(diào)查工作的籌備等,又都帶來了大量新的環(huán)境信息。據(jù)統(tǒng)計,2015年我國對367個城市的空氣質(zhì)量進(jìn)行了在線監(jiān)控,設(shè)置了145個重點(diǎn)斷面水質(zhì)自動監(jiān)測站,對14920家重點(diǎn)污染企業(yè)實行在線監(jiān)控,實時環(huán)境數(shù)據(jù)不斷增加并逐步實現(xiàn)了信息的聯(lián)網(wǎng)發(fā)布,環(huán)境大數(shù)據(jù)時代到來。
2.1 環(huán)境大數(shù)據(jù)的界定
通過聲學(xué)傳感器、生物傳感器、化學(xué)傳感器、RFID技術(shù)、衛(wèi)星遙感、視頻感知、光學(xué)傳感器、人工監(jiān)察等可感知和采集海量環(huán)境數(shù)據(jù),為大數(shù)據(jù)應(yīng)用于環(huán)保提供了基礎(chǔ),而大數(shù)據(jù)技術(shù)又為解決當(dāng)前復(fù)雜的環(huán)境問題帶來了新的機(jī)遇。環(huán)境大數(shù)據(jù)即把大數(shù)據(jù)的核心理念和關(guān)鍵技術(shù)應(yīng)用到環(huán)境領(lǐng)域,對海量環(huán)境數(shù)據(jù)進(jìn)行采集、整合、存儲、分析與應(yīng)用等。
2.2 環(huán)境大數(shù)據(jù)的基本特征
環(huán)境大數(shù)據(jù)同樣具有大數(shù)據(jù)的4“V”特征。
從數(shù)據(jù)規(guī)模來看,據(jù)不完全統(tǒng)計,目前各類環(huán)保數(shù)據(jù)達(dá)幾十億條,且將呈爆發(fā)式增長,若考慮實際環(huán)境管理中與環(huán)保間接相關(guān)的經(jīng)濟(jì)、社會等數(shù)據(jù)(如環(huán)保投入金額、居民健康狀況),數(shù)據(jù)的規(guī)模將更大。
從數(shù)據(jù)種類來看,環(huán)境大數(shù)據(jù)涉及部門政務(wù)信息、環(huán)境質(zhì)量數(shù)據(jù)(大氣、水、土壤、輻射、聲、氣象等)、污染排放數(shù)據(jù)(污染源基本信息、污染源監(jiān)測、總量控制等各項環(huán)境監(jiān)管信息)、個人活動信息(個人用水量、用電量、廢棄物產(chǎn)生量等)等。各級政府部門、社會公眾、媒體、環(huán)保NGO等都是可能的披露主體。它不僅包括關(guān)于事物物理、化學(xué)、生物等性質(zhì)和狀態(tài)的基本測量值,即可用二維表結(jié)構(gòu)進(jìn)行邏輯表示的結(jié)構(gòu)數(shù)據(jù),也包括了隨著互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)與傳感器飛速發(fā)展涌現(xiàn)的各種文檔、圖片、音頻、視頻、地理位置信息等半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。
從數(shù)據(jù)處理速度來看,數(shù)據(jù)量的快速增長要求對環(huán)境數(shù)據(jù)進(jìn)行實時的分析并及時作出決策,否則處理的結(jié)果就是過時和無價值的,有時延遲的信息甚至?xí)`導(dǎo)用戶,比如空氣質(zhì)量的預(yù)警預(yù)報。
從數(shù)據(jù)價值來看,無疑環(huán)境大數(shù)據(jù)具有巨大的應(yīng)用價值,為精細(xì)化、定量化管理和科學(xué)決策提供了新思路。但同時海量數(shù)據(jù)特別是其中快速增長的非結(jié)構(gòu)化數(shù)據(jù),在保留數(shù)據(jù)原貌和呈現(xiàn)全部細(xì)節(jié)以供提取有效信息的同時,也帶來了大量沒有價值甚至是錯誤的信息,使其在特定應(yīng)用中呈現(xiàn)出較低的價值密度。比如各類環(huán)境傳感器、視頻等智能設(shè)備可以對特定環(huán)境進(jìn)行360天×24小時的連續(xù)監(jiān)控,但可能有用的監(jiān)控信息僅有一兩秒。如何利用大數(shù)據(jù)技術(shù)快速地完成環(huán)境數(shù)據(jù)價值的“提純”是大數(shù)據(jù)背景下環(huán)境管理亟待解決的問題。
另外,IBM的報告提到了數(shù)據(jù)真實性(Veracity)。環(huán)境大數(shù)據(jù)也存在數(shù)據(jù)精確性即數(shù)據(jù)反映客觀事實程度的問題。我國現(xiàn)行公開的污染排放數(shù)據(jù)的真實性及有效性一直備受質(zhì)疑,擴(kuò)展數(shù)據(jù)來源從而實現(xiàn)數(shù)據(jù)間的校驗成為可能的解決途徑。
2.3 環(huán)境大數(shù)據(jù)的作用
在環(huán)境領(lǐng)域,可利用物聯(lián)網(wǎng)技術(shù)將感知到的環(huán)境監(jiān)測、環(huán)境管理數(shù)據(jù)通過處理和集成,再運(yùn)用合適的數(shù)據(jù)分析方法進(jìn)行分析整理后,將分析結(jié)果展現(xiàn)給環(huán)境用戶,指導(dǎo)治理方案的制定,并根據(jù)監(jiān)測到的治理效果動態(tài)更新方案。環(huán)境大數(shù)據(jù)的應(yīng)用,對于政府、企業(yè)和公眾都有重要意義。
具體來說,對政府而言,大數(shù)據(jù)可幫助其掌握全面的數(shù)據(jù)信息,為各項環(huán)境政策的制定提供更為科學(xué)、更為堅實的數(shù)據(jù)和技術(shù)支撐;實時的監(jiān)控和分析可以提升環(huán)境監(jiān)管、預(yù)警和應(yīng)急能力;數(shù)據(jù)量的劇增及互聯(lián)共享可以加強(qiáng)部門間協(xié)作性,提升管理效率等。對企業(yè)來說,大數(shù)據(jù)可實時提供生產(chǎn)各環(huán)節(jié)能耗和污染排放情況、生產(chǎn)設(shè)施和環(huán)境設(shè)施運(yùn)行情況等,幫助其降低生產(chǎn)和污染治理成本,也體現(xiàn)企業(yè)社會責(zé)任。另外,大數(shù)據(jù)也可以幫助公眾準(zhǔn)確了解身邊的環(huán)境狀況,并及時獲得生活中的注意事項。以下將對環(huán)境大數(shù)據(jù)在政府環(huán)境管理中可能的應(yīng)用場景進(jìn)行說明。
“十三五”開始,我國的環(huán)境管理戰(zhàn)略將逐漸轉(zhuǎn)變?yōu)橐再|(zhì)量改善為導(dǎo)向。在以質(zhì)量改善為主的考核標(biāo)準(zhǔn),迫切要求管理方式從經(jīng)驗型粗放管理向科學(xué)、精細(xì)化管理轉(zhuǎn)變。而環(huán)境系統(tǒng)的分布性、復(fù)雜性和動態(tài)性使得過去的管理很難達(dá)到量化決策、動態(tài)調(diào)整等要求。環(huán)境大數(shù)據(jù)作為新的技術(shù)手段和思維方式,可將海量、互相關(guān)聯(lián)的環(huán)境信息進(jìn)行有效鏈接,做到數(shù)據(jù)驅(qū)動環(huán)境管理與決策,使得環(huán)境管理逐漸向數(shù)字化、網(wǎng)絡(luò)化和精細(xì)化轉(zhuǎn)變。以下是可能的應(yīng)用場景。
3.1 在環(huán)境規(guī)劃編制中的應(yīng)用
過去利用環(huán)境數(shù)據(jù)進(jìn)行規(guī)劃分析,只能簡單的回答“環(huán)境發(fā)生了什么事情”,并且由于涉及要素有限且以歷史的統(tǒng)計數(shù)據(jù)為主,得到的結(jié)論很難精準(zhǔn)的反映客觀情況。利用大數(shù)據(jù)系統(tǒng)可以帶來研究技術(shù)方法的變革,其處理迅速、實時展示、多因素分析、智能決策等作用可促進(jìn)規(guī)劃編制的變革。
納入考慮的環(huán)境統(tǒng)計數(shù)據(jù)實時性更強(qiáng),另外大量相互關(guān)聯(lián)的自然、經(jīng)濟(jì)、社會等數(shù)據(jù)也納入分析,得到結(jié)論更快、更精準(zhǔn)有效。并且,對于“為什么環(huán)境會發(fā)生這種事情”,大數(shù)據(jù)系統(tǒng)也進(jìn)行了回答。若進(jìn)一步進(jìn)行數(shù)據(jù)挖掘與數(shù)據(jù)分析,將環(huán)境數(shù)據(jù)與污染擴(kuò)散模型、預(yù)測模型等結(jié)合,模擬復(fù)雜的環(huán)境過程,預(yù)測環(huán)境系統(tǒng)演變的發(fā)展方向,還可預(yù)言“將來環(huán)境發(fā)生什么事情”。比如通過仿真模擬新建項目會對環(huán)境產(chǎn)生怎樣的影響來調(diào)整新建項目的數(shù)量、規(guī)模、選址、環(huán)保要求等。最終環(huán)境大數(shù)據(jù)可成為活躍的數(shù)據(jù)倉庫,用來進(jìn)行“環(huán)境想要什么事情發(fā)生”。按照這樣的思路利用大數(shù)據(jù),可以給環(huán)境規(guī)劃提供科學(xué)可量化的決策支持,環(huán)境質(zhì)量目標(biāo)的實現(xiàn)路徑清晰可見[13]。
3.2 在環(huán)境質(zhì)量管理中的應(yīng)用
一方面可應(yīng)用于環(huán)境質(zhì)量信息的發(fā)布。當(dāng)前城市空氣質(zhì)量信息已基本實現(xiàn)了實時發(fā)布,并運(yùn)用地圖進(jìn)行直觀展示,但仍存在監(jiān)測點(diǎn)布置的科學(xué)性不足,密度低等問題。而借助微小傳感器以及大數(shù)據(jù)算法等方式,可得到各細(xì)分區(qū)域更精確的大氣質(zhì)量狀況。微軟提出的基于大數(shù)據(jù)的城市空氣質(zhì)量細(xì)粒度計算和預(yù)測模型Urban Air是這一方面的成功案例。Urban Air模型利用監(jiān)測站提供的有限的空氣質(zhì)量數(shù)據(jù),結(jié)合交通流、道路結(jié)構(gòu)、興趣點(diǎn)分布、氣象條件和人們流動規(guī)律等大數(shù)據(jù),基于機(jī)器學(xué)習(xí)算法建立數(shù)據(jù)和空氣質(zhì)量的映射關(guān)系,從而推斷出整個城市細(xì)粒度的空氣質(zhì)量。利用少量的環(huán)境數(shù)據(jù),再結(jié)合其他看似與環(huán)境數(shù)據(jù)并不直接相關(guān)的異構(gòu)數(shù)據(jù)源,就可以建立一個區(qū)域的數(shù)據(jù)分布及空氣質(zhì)量觀測值的網(wǎng)絡(luò)模型,最后得到1km×1km范圍的細(xì)粒度[14]?;谶@樣的細(xì)分區(qū)域的高準(zhǔn)確度的數(shù)據(jù),可為環(huán)境管理者在決策中提供科學(xué)依據(jù)。水、聲、固廢、輻射等環(huán)境質(zhì)量信息的發(fā)布也可借鑒空氣質(zhì)量管理經(jīng)驗,提升環(huán)境管理的精細(xì)化水平。
另一方面可用于環(huán)境質(zhì)量的預(yù)警預(yù)報。預(yù)測性分析是大數(shù)據(jù)分析很重要的應(yīng)用領(lǐng)域,環(huán)境預(yù)測性分析常用于空氣及水環(huán)境質(zhì)量預(yù)測。以空氣質(zhì)量預(yù)報預(yù)警為例,過去主要依靠對歷史氣象、空氣質(zhì)量監(jiān)測數(shù)據(jù)進(jìn)行統(tǒng)計分析處理,預(yù)報的精度及對污染防治的決策支持作用有限。當(dāng)前,數(shù)值預(yù)報結(jié)合區(qū)域地形地貌特征、氣象觀測數(shù)據(jù)、空氣質(zhì)量監(jiān)測數(shù)據(jù)、污染源數(shù)據(jù)等,基于大氣動力學(xué)理論建立大氣擴(kuò)散模型,可預(yù)報大氣污染物濃度在空氣中的動態(tài)分布情況,為區(qū)域大氣污染聯(lián)防聯(lián)控等提供更科學(xué)的決策支持。
3.3 在污染源生命周期管理中的應(yīng)用
可實現(xiàn)污染源的全生命周期管理,切實提高管理效率。利用物聯(lián)網(wǎng)等新技術(shù),將污染源在線監(jiān)測系統(tǒng)、視頻監(jiān)控系統(tǒng)、動態(tài)管控系統(tǒng)、工況在線監(jiān)測系統(tǒng)、刷卡排污總量控制系統(tǒng)等進(jìn)行整合,形成全方位的智能監(jiān)測網(wǎng)絡(luò),實時收集污染源生命周期的全部數(shù)據(jù)。然后基于每個節(jié)點(diǎn)每時的各類數(shù)據(jù),利用大數(shù)據(jù)分析技術(shù),進(jìn)行“點(diǎn)對點(diǎn)”的數(shù)據(jù)化、圖像化展示。這有利于快速識別排放異?;虺瑯?biāo)數(shù)據(jù),并分析其產(chǎn)生原因,以幫助環(huán)境管理者動態(tài)管理污染源企業(yè),有針對性的提出對策。
3.4 在環(huán)境應(yīng)急管理中的應(yīng)用
環(huán)境應(yīng)急包括日常管理、事中應(yīng)急和事后評估三個階段。在日常管理中,主要是環(huán)境應(yīng)急人才建設(shè)、大數(shù)據(jù)感知設(shè)備的安裝以及相關(guān)大數(shù)據(jù)處理技術(shù)的應(yīng)用能力建設(shè),以建立海量信息的實時收集、高效計算、迅速傳遞、結(jié)果可視化和機(jī)器預(yù)判的能力。實時監(jiān)測和機(jī)器決策有利于及時發(fā)現(xiàn)風(fēng)險隱患,降低突發(fā)污染事件產(chǎn)生機(jī)率。環(huán)境事件發(fā)生后,大數(shù)據(jù)管理系統(tǒng)可快速反應(yīng),實現(xiàn)各部門信息的融合分析和實時報告,全面感知應(yīng)急事故的變化過程,并快速集合多項關(guān)鍵指標(biāo)信息以輔助決策。在事后評估中,運(yùn)用大數(shù)據(jù)可有效判定應(yīng)急處置工作的狀態(tài)與實際效果??傊髷?shù)據(jù)的應(yīng)用可提高環(huán)境應(yīng)急的管理效率和智能化水平,從而節(jié)省成本和減少不必要的損失。
3.5 在環(huán)保公眾參與中的應(yīng)用
隨著互聯(lián)網(wǎng)和GPS設(shè)備的普及,NGO或者民眾可以發(fā)布各類自發(fā)式地理信息,比如通過環(huán)保隨手拍上傳的圖片等信息。將這些碎片化的異構(gòu)數(shù)據(jù)進(jìn)行整合處理,可驗證官方公開數(shù)據(jù)的質(zhì)量,或者對已有信息進(jìn)行詳細(xì)補(bǔ)充。另外,利用社交媒體上公開的海量數(shù)據(jù),也可幫助環(huán)保部門了解公眾需求,進(jìn)而提供差異化和精細(xì)化的公共服務(wù),改善公眾的環(huán)保感受。
將大數(shù)據(jù)的技術(shù)手段和思維方式引入環(huán)境管理,為環(huán)境管理者、研究人員等提供了認(rèn)識問題和解決問題的新思路。但在實際的研究和應(yīng)用中,還有一些問題亟待解決。
從數(shù)據(jù)處理來說,現(xiàn)有的環(huán)境數(shù)據(jù)來源多樣、類型混雜,數(shù)字、視頻、文本等大量異構(gòu)數(shù)據(jù)的共存加大了處理和利用的難度。這要求研究者結(jié)合環(huán)境數(shù)據(jù)的特性和現(xiàn)有的大數(shù)據(jù)整合技術(shù),提高快速整合各種復(fù)雜環(huán)境信息的能力,為進(jìn)一步挖掘環(huán)境數(shù)據(jù)價值提供基礎(chǔ)。
從環(huán)境數(shù)據(jù)管理來說,第一,環(huán)境數(shù)據(jù)的質(zhì)量長期被公眾質(zhì)疑,即使是官方平臺公布的數(shù)據(jù),篡改、造假等現(xiàn)象也大量存在;第二,政府和企業(yè)直接公開的環(huán)境數(shù)據(jù)有限且與公眾需求不對稱,如污染源排放量的數(shù)據(jù),部分省市既不直接公布也很難間接估算;第三,部門之間數(shù)據(jù)封鎖,“信息孤島”問題普遍存在。這使得環(huán)境數(shù)據(jù)的利用效率降低,也導(dǎo)致分析結(jié)果失真的可能性加大。要完善環(huán)境大數(shù)據(jù)管理,一方面需要政府提高自身環(huán)境信息的公開程度,激勵企業(yè)公開環(huán)境信息,并建立機(jī)制確保公開信息的質(zhì)量;另一方面,也需要建立利益協(xié)調(diào)機(jī)制,加強(qiáng)部門間合作,推動統(tǒng)一環(huán)境信息管理平臺的建設(shè)。
從大數(shù)據(jù)的應(yīng)用現(xiàn)狀來說,當(dāng)前大數(shù)據(jù)在我國尚處于起步階段,它在環(huán)境管理領(lǐng)域應(yīng)用的成熟案例較少。存在的主要問題是環(huán)境大數(shù)據(jù)應(yīng)用方法不清晰,應(yīng)用工具缺乏,難以清晰反映環(huán)境問題并進(jìn)行深入分析。這需要信息技術(shù)和環(huán)境學(xué)科進(jìn)一步融合,培養(yǎng)出大數(shù)據(jù)和環(huán)境管理兼通的復(fù)合型人才,為大數(shù)據(jù)在環(huán)境管理的深入應(yīng)用提供智力支持。另外,部分管理者的決策思維仍未轉(zhuǎn)變,已開發(fā)的環(huán)境大數(shù)據(jù)工具在驅(qū)動科學(xué)決策上作用有限。環(huán)境管理戰(zhàn)略轉(zhuǎn)型以環(huán)境質(zhì)量考核為目標(biāo)導(dǎo)向,這將迫使環(huán)境管理者重視大數(shù)據(jù)的應(yīng)用,以實現(xiàn)定量決策和精細(xì)管理。
大數(shù)據(jù)作為環(huán)境管理與規(guī)劃、科研以及支撐環(huán)境管理決策的新手段會越來越受到關(guān)注,科學(xué)有效的應(yīng)用場景亟待探索開發(fā),在信息公開程度加大、質(zhì)量不斷提升與改進(jìn)的情況下,大數(shù)據(jù)在環(huán)境管理中的應(yīng)用將對我國環(huán)境管理水平的跨越式發(fā)展發(fā)揮重要作用。
參考文獻(xiàn)
[1] 徐繼華, 馮啟娜, 陳貞汝. 智慧政府: 大數(shù)據(jù)治國時代的來臨[M]. 北京: 中信出版社, 2014.
[2] 李國杰, 程學(xué)旗. 大數(shù)據(jù)研究: 未來科技及經(jīng)濟(jì)社會 發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國科學(xué)院院刊, 2012, 27(6): 647-657.
[3] Manyika J,Chui M,Brown B, et al.Big data: the next frontier for innovation, c ompetition, and productivity[R]. McKinsey Global Institute, 2011.
[4] 涂子沛. 大數(shù)據(jù)[M]. 桂林: 廣西師范大學(xué)出版社, 2012.
[5] 趙國棟, 易歡歡, 糜萬軍, 等. 大數(shù)據(jù)時代的歷史機(jī)遇[M].北京: 清華大學(xué)出版社, 2013.
[6] 苗國厚, 謝霄男. 大數(shù)據(jù)技術(shù): 提高互聯(lián)網(wǎng)治理主動性的利器[J]. 新聞界, 2014, (23): 37-41.
[7] 方巍, 鄭玉, 徐江. 大數(shù)據(jù): 概念、技術(shù)及應(yīng)用研究綜述[J]. 南京信息工程大學(xué)學(xué)報(自然科學(xué)版), 2014, 6(5): 405-419.
[8] 中國計算機(jī)學(xué)會大數(shù)據(jù)專家委員會. 中國大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)發(fā)展白皮書[M]. 2013.
[9] 竇萬春, 江澄. 大數(shù)據(jù) 應(yīng)用的技術(shù)體系及潛在問題[J]. 中興通訊技術(shù), 2013, 19(4): 8-16.
[10] 劉軍. Hadoop大數(shù)據(jù)處理[M]. 北京: 人民郵電出版社, 2013.
[11] 劉勘, 周曉崢, 周洞汝. 數(shù)據(jù)可視化的研究與發(fā)展[J]. 計算機(jī)工程, 2002, 28(8): 1-2, 63-63.
[12] 劉智慧, 張泉靈. 大數(shù)據(jù)技術(shù)研究綜述[J]. 浙江大學(xué)學(xué)報(工學(xué)版), 2014, 48(6): 957-972.
[13] 薛云志, 孟令中. 大數(shù)據(jù)技術(shù)在環(huán)境規(guī)劃中的應(yīng)用與展望[C] //全國環(huán)境規(guī)劃院(所)長聯(lián)席會暨中國環(huán)境科學(xué)學(xué)會環(huán)境規(guī)劃專業(yè)委員會 2013年學(xué)術(shù)年會論文集. 太原, 2013: 239-242.
[14] 鄭宇. 城市計算與大數(shù)據(jù)[J]. 中國計算機(jī)學(xué)會通訊, 2 013, 9(8): 8-18.
Enviromental Big Data: Concept, Characteristics and Application in Enviromental Management
Chang Miao1*, Feng Yan1, Guo Peikun1, Xie Huiting1, Wang Shiwen2
(1. School of Environment, Tsinghua University, Beijing 100084; 2. Insititute of Quantitative & Technical Economics, Chinese Academy of Social Sciences, Beijing 100732)
Abstract:The application of big data in environmental management is a key step towards China’s strategy transitions in this fi eld. Combining the characteristics of environmental research and big data technology, this work elaborates the concepts, features and function of environmental big data in the fi eld of environmental management. Environmental big data makes full use of the core concepts and key technology of big data into environmental management and achieves the collection, integration, storage, analysis and application of mass environmental big data, with characteristics of large scale, great variety, rapid processing speed and low value density. There is no denying the fact that it will bring application prospect on the government, the industry and the public. Specifically, environmental big data plays an important role in the process ranging environmental planning, environmental quality management, life-cycle-based pollution source management, environmental emergency to public participation, thus promoting a digital, networking and meticulous transformation of environmental management. Lastly, the possible solutions to data processing, data management and data application status are put forward accordingly.
Keywords:big data; environmental big data; environmental management; application scenario
中圖分類號:X32;TP311.13
文獻(xiàn)標(biāo)識碼:A
文章編號:1674-6252(2015)06-0026-05
基金項目:國家自然科學(xué)基金資助項目“基于大數(shù)據(jù)的城市環(huán)境質(zhì)量改善管理調(diào)控決策系統(tǒng)研究”(71573149)。
*責(zé)任作者: 常杪(1971—),女,清華大學(xué)環(huán)境學(xué)院環(huán)境管理與政策教研所所長,副研究員,主要研究方向為環(huán)境政策與管理。