諸云強,趙曉宏,馮卓,潘鵬,李時蓓,孫凱,4
(1.中國科學院地理科學與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室,北京 100101; 2.江蘇省地理信息
資源開發(fā)與利用協(xié)同創(chuàng)新中心,南京 210023; 3.環(huán)境保護部環(huán)境工程評估中心,北京 100012;
4.中國科學院大學,北京 100049)
?
環(huán)境影響評價大數(shù)據(jù)分析與創(chuàng)新服務
諸云強1,2,趙曉宏3,馮卓1,潘鵬3,李時蓓3,孫凱1,4
(1.中國科學院地理科學與資源研究所資源與環(huán)境信息系統(tǒng)國家重點實驗室,北京100101; 2.江蘇省地理信息
資源開發(fā)與利用協(xié)同創(chuàng)新中心,南京210023; 3.環(huán)境保護部環(huán)境工程評估中心,北京100012;
4.中國科學院大學,北京100049)
摘要:環(huán)境影響評價是一項數(shù)據(jù)密集型工作,不僅需要跨部門、多類型的大數(shù)據(jù)支撐,而且會產生相互關聯(lián)的整體價值非常高的成果數(shù)據(jù)。如何共享和利用環(huán)評大數(shù)據(jù),是充分發(fā)揮環(huán)評作用的基礎和前提。通過分析環(huán)評業(yè)務流程,提出了環(huán)評數(shù)據(jù)的概念模型和組成內容,重點探討了利用大數(shù)據(jù)、云計算、“互聯(lián)網(wǎng)+”等新一代信息技術和思維模式,以期未來能夠實現(xiàn)環(huán)評大數(shù)據(jù)的開放共享、關聯(lián)發(fā)現(xiàn)、在線計算和創(chuàng)新應用。
關鍵詞:環(huán)境影響評價;大數(shù)據(jù);云計算;互聯(lián)網(wǎng)+;共享服務
環(huán)境影響評價是一項覆蓋范圍廣、多主體參與的數(shù)據(jù)密集型工作,既需要基礎地理、水文、地質、氣象、海洋和環(huán)境監(jiān)測等大量數(shù)據(jù)資源的支撐,又會在環(huán)評、技術評估、審批、監(jiān)督后評價、公眾參與等過程中產生大量的數(shù)據(jù)資源。在經歷引入確定、規(guī)范建設、強化完善、提高拓展四大階段的發(fā)展后[1],我國的環(huán)境影響評價已經積累了海量的環(huán)境影響報告書、報告表、登記表以及技術評估報告、竣工驗收報告、審批報告等數(shù)據(jù)資源。
然而,環(huán)評大數(shù)據(jù)的共享和利用并不理想。2008年,全國人大在《環(huán)評法》執(zhí)法檢查中指出,“水文、地質、氣象、海洋和環(huán)境監(jiān)測等相關數(shù)據(jù)沒有實現(xiàn)共享,要加快整合現(xiàn)有基礎數(shù)據(jù),逐步建立統(tǒng)一的環(huán)評基礎數(shù)據(jù)庫、環(huán)評審批數(shù)據(jù)庫和污染源跟蹤數(shù)據(jù)庫,形成環(huán)評信息共享機制和交流平臺”。全國1 000多家環(huán)評單位各自以不同的方式和渠道獲取有關數(shù)據(jù),這些數(shù)據(jù)質量參差不齊,標準不統(tǒng)一,收集耗時長、成本高[2]。從2010年開始,環(huán)保部環(huán)境工程評估中心主持開展了環(huán)評基礎數(shù)據(jù)庫建設工作。到目前為止,已經制定了較為完善的標準規(guī)范體系[3],建設形成了環(huán)評法律法規(guī)庫、專家?guī)?、地理信息庫、環(huán)境敏感區(qū)等基礎支撐數(shù)據(jù)庫,以及建設項目環(huán)評報告書、重點行業(yè)環(huán)評指標庫、環(huán)評資質庫等環(huán)評核心業(yè)務數(shù)據(jù)庫。盡管環(huán)評基礎數(shù)據(jù)庫取得了豐碩的成果,但還需要繼續(xù)推進數(shù)據(jù)共享機制、數(shù)據(jù)資源整合以及環(huán)評技術支持系統(tǒng)的建設[4]。
隨著物聯(lián)網(wǎng)、云計算等信息技術和電子商務、社交網(wǎng)絡等互聯(lián)網(wǎng)應用的發(fā)展,大數(shù)據(jù)時代已經悄然來臨。大數(shù)據(jù)的出現(xiàn),迅速引起政府部門、產業(yè)界、科技界的廣泛關注,已成為國家戰(zhàn)略、產業(yè)投資和科學研究的熱點,滲透到各個領域。大數(shù)據(jù)應用的層出不窮和巨大的潛力,讓人們開始重新審視和關注數(shù)據(jù)的價值[5]。在此背景下,本文在系統(tǒng)分析環(huán)評數(shù)據(jù)資源的基礎上,研究探討符合大數(shù)據(jù)思維的環(huán)評數(shù)據(jù)創(chuàng)新服務模式。
1環(huán)境影響評價數(shù)據(jù)分析
環(huán)評的本質在于預防或減輕規(guī)劃或建設項目的決策對環(huán)境的不良影響[6],其核心業(yè)務流程是環(huán)評單位依據(jù)法規(guī)政策和技術標準對實施單位的建設項目(或規(guī)劃)可能對環(huán)境造成的影響進行評價(過程中要對公眾意見進行調查),評估機構(專家參與)對環(huán)評報告(表)進行技術評估后,再由環(huán)境保護主管部門對環(huán)境影響評價進行審批,最終決定是否通過環(huán)評,如圖1所示。
圖1 環(huán)評核心業(yè)務流程Fig.1 The core business workflow of environmentalimpact assessment
環(huán)評一般包括:評價區(qū)域自然和社會環(huán)境調查、建設項目工程分析、環(huán)境質量監(jiān)測、環(huán)境影響分析、環(huán)境保護措施分析與建設等步驟。從環(huán)評全生命周期來看,環(huán)評完成后,還要進行環(huán)境保護的竣工驗收和后評價,以便對其中的環(huán)境保護措施落實情況及環(huán)保效果進行評估。環(huán)評全生命周期流程如圖2所示。
圖2 環(huán)評全生命周期流程Fig.2 The full lifecycle of environmental impactassessment
根據(jù)前述環(huán)評業(yè)務流程的分析,可得到環(huán)評數(shù)據(jù)概念模型,如圖3所示,即承受客體(環(huán)境)承載或支撐著實施主體(建設項目或規(guī)劃等),而實施主體作用于承受客體可能產生環(huán)境影響;參與主體(環(huán)評機構、評估機構、專家、審批機構、社會公眾等)按照各自職責收集或生產基礎數(shù)據(jù)(基礎地理、水文地質、生態(tài)環(huán)境、氣候氣象等),參與環(huán)評不同環(huán)節(jié)的工作中,并最終形成環(huán)境影響評價成果(報告書、報告表或登記表等)。
基于概念模型,環(huán)評數(shù)據(jù)涉及的主要數(shù)據(jù)實體及其關系如圖4所示,主要包括:實施主體、環(huán)境客體、參與主體、環(huán)評依據(jù)和環(huán)評成果5個一級實體。實施主體主要包括:可能對環(huán)境造成影響的建設項目、政府政策、規(guī)劃、計劃等;環(huán)境客體包括:自然地理環(huán)境、人文社會環(huán)境、大氣環(huán)境、水環(huán)境、聲環(huán)境、土壤環(huán)境等,其中自然地理環(huán)境和人文社會環(huán)境中又會包含環(huán)評最為關注的環(huán)境影響敏感點(區(qū)),包括:需特殊保護地區(qū)(飲用水水源保護區(qū)、自然保護區(qū)、生態(tài)功能保護區(qū)、基本農田保護區(qū)、世界遺產地、國家重點文物保護地等),生態(tài)敏感與脆弱區(qū)(沙塵暴源區(qū)、荒漠綠洲、濕地、熱帶雨林、紅樹林等),社會關注區(qū)(人口密集區(qū)、文教區(qū)、醫(yī)院等);參與主體包括:建設單位、環(huán)評單位、評估單位、審批機構、專家和社會公眾等;環(huán)評依據(jù)包括:法律法規(guī)、部門規(guī)章、地方政策、區(qū)劃/規(guī)劃、評估導則、環(huán)境標準等;環(huán)評成果包括:環(huán)評報告書(報告表/登記表)及其衍生的重點行業(yè)環(huán)評指標數(shù)據(jù)、技術評估報告、審批意見,建設項目竣工環(huán)境保護驗收報告、后評價報告等。
圖3 環(huán)評數(shù)據(jù)概念模型Fig.3 The concept model of environmental impactassessment data
注:N表示數(shù)據(jù)實體之間是多對多的關系。圖4 環(huán)評核心數(shù)據(jù)實體關系模型Fig.4 The E-R model of core data of environmental impact assessment
因此,環(huán)評數(shù)據(jù)庫組成主要包括:環(huán)評依據(jù)庫、基礎支撐庫、核心成果庫以及成果描述庫,其中成果描述庫主要用于數(shù)據(jù)的交換與共享服務,通過元數(shù)據(jù)和數(shù)據(jù)服務的形式對外提供服務。環(huán)評數(shù)據(jù)庫組成如圖5所示。
圖5 環(huán)評數(shù)據(jù)庫組成Fig.5 The components of environmental impact assessment database
2環(huán)評大數(shù)據(jù)創(chuàng)新服務
大數(shù)據(jù)是指無法在可容忍的時間內用傳統(tǒng)信息技術和軟硬件工具對其進行感知、獲取、管理、處理和服務的數(shù)據(jù)集合[7]。通常,人們認為大數(shù)據(jù)具有“4V”特征(體量大——Volume、類型多——Variety、快速化——Velocity、價值化——Value)。大數(shù)據(jù)還體現(xiàn)出個體或部分數(shù)據(jù)呈現(xiàn)低價值而數(shù)據(jù)整體呈現(xiàn)高價值的特點[8]。大數(shù)據(jù)直接帶來三個思維模式的轉變[9]:(1)數(shù)據(jù)分析不是依靠少量的隨機樣本,而是全體數(shù)據(jù);(2)允許數(shù)據(jù)不精確性和混雜性;(3)關注數(shù)據(jù)間的相關關系而不是因果關系。從科研的角度,大數(shù)據(jù)的本質在于從模型驅動到數(shù)據(jù)驅動范式的轉變以及數(shù)據(jù)密集型科學方法的確立[10]。
對比大數(shù)據(jù),環(huán)評數(shù)據(jù)資源盡管已經具備資源體量大、類型多、數(shù)據(jù)整體呈現(xiàn)高價值等特點,但其開放共享、關聯(lián)分析與挖掘利用還需要進一步提高。
環(huán)評數(shù)據(jù)資源必須實現(xiàn)向大數(shù)據(jù)的轉變,加強管理與應用服務的創(chuàng)新,才能進一步提高環(huán)評的科學性和效率,更加有效地支撐“科學、智能、陽光”的環(huán)評,進一步提升環(huán)評在參與國家宏觀調控、優(yōu)化產業(yè)結構、轉變經濟增長方式、推進節(jié)能減排、遏制環(huán)境違法行為等方面的作用。環(huán)評大數(shù)據(jù)需要解決跨部門開放共享、全生命周期關聯(lián)、智能發(fā)現(xiàn)與推薦以及高效的在線計算分析與便捷的公眾服務等問題。
(1)創(chuàng)新共享機制,促進大數(shù)據(jù)開放共享
大數(shù)據(jù)的開放共享是發(fā)揮其價值的基礎和前提。2015年9月國務院發(fā)布的《促進大數(shù)據(jù)發(fā)展行動綱要》中將政府數(shù)據(jù)的開放共享列為首要任務。早在2009年,美國就啟動了政府開放數(shù)據(jù)計劃,通過網(wǎng)站Data.gov共享政府數(shù)據(jù),以CSV、HTML、XLS、PDF、WMS、WFS等格式向社會公眾開放,并逐漸向政府關聯(lián)數(shù)據(jù)轉換[11]。英國也建立了政府開放數(shù)據(jù)網(wǎng)站。2011年,美國、英國、挪威、巴西、南非、墨西哥、印度尼西亞、菲律賓8個國家聯(lián)合簽署了《開放數(shù)據(jù)聲明》,成立開放政府聯(lián)盟(OGP);2013年又簽署了《開放數(shù)據(jù)憲章》,規(guī)定了政府開放數(shù)據(jù)的五大原則[12],其中最重要的一條就是“開放為默認,不開放為特例”。通過該原則可以使政府部門盡最大可能地公開所有數(shù)據(jù)。截至2014年底,全球有63個國家加入了開放政府聯(lián)盟。
因此,作為政府投資的環(huán)評基礎支撐數(shù)據(jù),如基礎地理、地質、水文、氣象數(shù)據(jù),以及作為環(huán)境保護基本制度的環(huán)評成果數(shù)據(jù)等,應在充分尊重數(shù)據(jù)生產者知識產權(數(shù)據(jù)使用的知情權、被引用權等)的基礎上,進一步推動數(shù)據(jù)開放共享,并且應使用元數(shù)據(jù)、數(shù)據(jù)目錄等形式,方便數(shù)據(jù)的查詢和使用。
(2)實現(xiàn)數(shù)據(jù)關聯(lián),促進全生命周期追溯
關聯(lián)數(shù)據(jù)(Linked Data)被認為是語義網(wǎng)的一種實現(xiàn),通過明確的語義表達,使不同領域、來源和結構的數(shù)據(jù)可以相互鏈接,從而促進數(shù)據(jù)的查找、集成與利用,為構建一個富含語義、人機都可理解的、互聯(lián)互通的全球數(shù)據(jù)網(wǎng)絡奠定基礎[13- 14]。
如前文所述,環(huán)評數(shù)據(jù)橫向上包括同一個區(qū)域內的戰(zhàn)略環(huán)評、規(guī)劃環(huán)評、建設項目環(huán)評等的數(shù)據(jù);縱向上包括環(huán)境影響評價、技術評估、審批、驗收、后評價等數(shù)據(jù)。這些數(shù)據(jù)資源應參照關聯(lián)數(shù)據(jù)技術,實現(xiàn)縱向、橫向以及特定維度的關聯(lián),如建設項目環(huán)評與所在區(qū)域戰(zhàn)略環(huán)評、規(guī)劃環(huán)評的關聯(lián),建設項目環(huán)評報告書、技術評估報告、審批意見以及項目竣工環(huán)保驗收報告、后評價報告的關聯(lián),建設項目環(huán)評與環(huán)評單位、人員資質的關聯(lián),同類同規(guī)模建設項目的關聯(lián)等。通過數(shù)據(jù)關聯(lián),構建形成互連互通的環(huán)評數(shù)據(jù)語義網(wǎng)絡,可以方便地進行各類信息的智能查找和全生命周期的追溯分析等。
(3)構建一體化平臺,提升預測分析效率
環(huán)評的核心是對實施主體可能對環(huán)境客體造成的影響進行預測分析,包括大氣、地表水、地下水、噪聲等。這些預測分析需要利用不同的環(huán)境預測模型以及相應的輸入?yún)?shù)數(shù)據(jù)。安裝調試環(huán)境預測模型、準備模型輸入數(shù)據(jù)往往非常費時費力,而且如果進行大范圍的預測分析,往往還需要高性能計算能力的支持。
因此,應利用云計算技術,發(fā)展“模型-數(shù)據(jù)”一體化共享平臺。在高性能或分布式計算環(huán)境下,實現(xiàn)大氣、水、聲等常用的環(huán)境影響預測分析模型的共享與在線計算。同時,基于已經整合集成的環(huán)評大數(shù)據(jù),實現(xiàn)環(huán)境影響預測分析模型輸入數(shù)據(jù)的自動匹配與推薦,進而提升環(huán)境影響預測分析的效率與水平。
(4)利用“互聯(lián)網(wǎng)+”,實現(xiàn)大數(shù)據(jù)創(chuàng)新應用
“互聯(lián)網(wǎng)+”是把互聯(lián)網(wǎng)和傳統(tǒng)行業(yè)應用結合起來,形成一種新的生產和服務模式,推動傳統(tǒng)產業(yè)換代升級。如傳統(tǒng)銀行+互聯(lián)網(wǎng)產生了支付寶,傳統(tǒng)集市+互聯(lián)網(wǎng)產生了淘寶,傳統(tǒng)百貨賣場+互聯(lián)網(wǎng)產生了京東,傳統(tǒng)打車+移動互聯(lián)網(wǎng)產生了滴滴快的等。2015年7月,國務院印發(fā)了《關于積極推進“互聯(lián)網(wǎng)+”行動的指導意見》,提出“到2018年,互聯(lián)網(wǎng)與經濟社會各領域的融合發(fā)展進一步深化,互聯(lián)網(wǎng)成為提供公共服務的重要手段。到2025年,‘互聯(lián)網(wǎng)+’成為我國經濟社會創(chuàng)新發(fā)展的重要驅動力量”。
因此,環(huán)評大數(shù)據(jù)的應用必須利用“互聯(lián)網(wǎng)+”思維,把互聯(lián)網(wǎng)應用到環(huán)評數(shù)據(jù)資源的收集(如基于網(wǎng)絡的公眾意見調查、環(huán)評報告書等資料報送,基于移動終端的環(huán)境敏感點調查、流域生物多樣性調查等)、處理(如在線環(huán)境影響預測分析)、開放共享(如網(wǎng)絡環(huán)評數(shù)據(jù)交換共享、環(huán)評信息公開與推送)、利用(如建設項目時空分布、產業(yè)結構分析、產業(yè)結構調整與環(huán)境質量關聯(lián)分析)等各個環(huán)節(jié)中。
3結語
環(huán)評作為環(huán)境保護的一項基本制度,在控制污染物排放、提高清潔生產水平、減小生態(tài)破壞、節(jié)約自然資源、調整產業(yè)結構和布局優(yōu)化經濟增長、推動決策的科學化和民主化等方面發(fā)揮了重要作用。但近年來,環(huán)評執(zhí)行率和措施落實率不到位[4]也致使環(huán)評制度飽受爭議。環(huán)評是一項數(shù)據(jù)密集型的工作,一方面需要跨部門、多類型的大數(shù)據(jù)支撐,另一方面又會產生大量的、相互關聯(lián)的數(shù)據(jù)。要讓環(huán)評回歸本質,必須“依靠數(shù)據(jù)、拿數(shù)據(jù)說話、用數(shù)據(jù)決策”。盡管環(huán)評數(shù)據(jù)已經具備大數(shù)據(jù)資源體量大、類型多、數(shù)據(jù)整體呈現(xiàn)高價值等特點,但還需進一步利用大數(shù)據(jù)、云計算、“互聯(lián)網(wǎng)+”的思維和技術,加強環(huán)評數(shù)據(jù)的開放共享、語義關聯(lián)、在線計算和創(chuàng)新應用。
參考文獻(References):
[1]張云懷, 姚建玉, 董西哲. 我國環(huán)境影響評價的回顧與發(fā)展[J]. 北方環(huán)境, 2011, 23(4): 82- 83.
[2]趙曉宏, 李時蓓, 諸云強. 加強基礎庫建設提高環(huán)評科學性[J]. 環(huán)境保護, 2012(22): 59- 62.
[3]王卷樂, 趙曉宏, 馬勝男, 等. 環(huán)境影響評價基礎數(shù)據(jù)庫標準規(guī)范體系研究[J]. 環(huán)境科學與管理, 2011, 36(8): 168- 173.
[4]趙曉宏, 丁峰, 李時蓓, 等. 環(huán)評基礎數(shù)據(jù)庫建設與展望[J]. 環(huán)境影響評價, 2014(4): 33- 35.
[5]諸云強, 孫九林, 王卷樂, 等. 論地球數(shù)據(jù)科學與共享[J]. 國土資源信息化, 2015(1): 3- 9.
[6]包存寬. 環(huán)境影響評價制度改革應著力回歸環(huán)評本質[J]. 中國環(huán)境管理, 2015, 7(3): 33- 39.
[7]李國杰, 程學旗. 大數(shù)據(jù)研究:未來科技及經濟社會發(fā)展的重大戰(zhàn)略領域——大數(shù)據(jù)的研究現(xiàn)狀與科學思考[J]. 中國科學院院刊, 2012, 27(6): 647- 657.
[8]徐宗本. 大數(shù)據(jù)研究的若干科學問題[J]. 科技促進發(fā)展, 2014, 10(1): 66- 69.
[9]維克托·邁爾-舍恩伯格, 肯尼思·庫克耶. 大數(shù)據(jù)時代[M]. 盛楊燕, 周濤,譯. 杭州: 浙江人民出版社, 2013.
[10]郭華東, 王力哲, 陳方, 等. 科學大數(shù)據(jù)與數(shù)字地球[J]. 科學通報, 2014, 59(12): 1047- 1054.
[11]Ding L., Lebo T., Erickson J.S.,etal. TWC LOGD: A portal for linked open government data ecosystems[J]. Web Semantics: Science, Services and Agents on the World Wide Web, 2011, 9(3):325- 333.
[12]Castro D. , Korte T.. Open Data in the G8: A Review of Progress on the G8 Open Data Charter[EB/OA]. [2015-10-20]. http://www2.datainnovation.org/2015-open-data-g8.pdf.
[13]Bernhard Haslhofer, Bernhard Schandl. Interweaving OAI-PMH data sourceswith the linked data cloud[J]. International Journal of Metadata, Semantics and Ontologies,2010, 5(1): 17- 31.
[14]Christian Bizer, Tom Heath, Tim Berners-Lee. Linked Data - The Story So Far[J]. International Journal on Semantic Web and Information Systems, 2009, 5(3): 1- 22.
Big Data Analysis and Innovative Service on Environmental Impact Assessment
ZHU Yun-qiang1,2, ZHAO Xiao-hong3, FENG Zhuo1, PAN Peng3, LI Shi-bei3,SUN Kai1,4
(1.State Key Lab of Resources and Environmental Information System, Institute of Geographic Sciences and Natural
Resources Research, Chinese Academy of Sciences, Beijing 100101, China; 2.Jiangsu Center for Collaborative
Innovation in Geographical Information Resource Development and Application, Nanjing 210023, China;
3.Appraisal Center for Environmental & Engineering, Ministry of Environmental Protection,
Beijing 100012, China; 4.University of Chinese Academy of Sciences, Beijing 100049, China)
Abstract:Environmental impact assessment (EIA) is a data-intensive research work that not only requires support of cross-department and multi-type big data, but also produces lots of linked and high value data achievements. How to share and exploit these data is the fundamental and precondition of fully playing the role of EIA. After analyzing the core business workflow of EIA, this paper puts forward the conceptual model and content of EIA data. And then it focuses on discussion about the usage of new generation of information technologies such as big data, cloud computing, “Internet Plus”, etc., and the thinking mode. Thereof it will achieve the open sharing, association discovery, online calculation and innovative applications of big data of environmental impact assessment in the future.
Key words:environmental impact assessment; big data; cloud computing; Internet Plus; sharing service
中圖分類號:X820.3
文獻標識碼:A
文章編號:2095-6444(2016)01-0005-05
DOI:10.14068/j.ceia.2016.01.002