国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于實時技術(shù)的大氣顆粒物在線分析系統(tǒng)①

2017-10-13 12:07潘爭光王鴻亮王俊霖
計算機系統(tǒng)應(yīng)用 2017年1期
關(guān)鍵詞:海量顆粒物大氣

潘爭光, 趙 奎, 王鴻亮, 王俊霖

?

基于實時技術(shù)的大氣顆粒物在線分析系統(tǒng)①

潘爭光1,2, 趙 奎2, 王鴻亮2, 王俊霖3

1(中國科學(xué)院大學(xué), 北京 100049)2(中國科學(xué)院沈陽計算技術(shù)研究所, 沈陽 110168)3(大連理工大學(xué)軟件學(xué)院, 大連 116024)

針對環(huán)境監(jiān)測中, 難以實時在線處理海量顆粒物數(shù)據(jù)的問題, 提出了一種基于實時技術(shù)的大氣顆粒物在線分析系統(tǒng), 實現(xiàn)了顆粒物統(tǒng)計、濃度變化、來源解析等功能. 該系統(tǒng)利用實時數(shù)據(jù)庫來實時采集、存儲海量大氣數(shù)據(jù), 解決了環(huán)境監(jiān)測中數(shù)據(jù)的海量問題; 同時, 引入自適應(yīng)共振神經(jīng)網(wǎng)絡(luò)算法和邏輯回歸模型進行數(shù)據(jù)分析, 成功降低數(shù)據(jù)規(guī)模, 提升數(shù)據(jù)分析速度. 實踐表明, 該在線分析系統(tǒng)能在合理時間內(nèi)得到準確的分析結(jié)果, 具有重要的實際意義.

實時技術(shù); 海量數(shù)據(jù); 聚類分析; 在線分析; 環(huán)境監(jiān)測

1 引言

當(dāng)前, 大氣環(huán)境污染問題日益嚴重, 大氣中各種細小顆粒物對人體健康極為有害. 速度開展環(huán)境狀況及影響分析, 已經(jīng)是擺在科研人員面前的緊迫任務(wù). 傳統(tǒng)的環(huán)境數(shù)據(jù)分析方法是以人工的方式進行數(shù)據(jù)采集、手動或半自動化地進行數(shù)據(jù)分析、最后以靜態(tài)的表格形式存儲, 整個過程費時費力; 再者我國經(jīng)濟處于高速發(fā)展的階段, 環(huán)境數(shù)據(jù)更新迅速, 這就對環(huán)境數(shù)據(jù)分析方法提出了時效性要求; 另外一方面, 隨著現(xiàn)在環(huán)境監(jiān)測手段的多樣化、自動化, 比如質(zhì)譜儀每分鐘采集到數(shù)百的質(zhì)譜數(shù)據(jù), 如何高效、自動化地存儲分析數(shù)據(jù)顯然十分必要[1,2].

本系統(tǒng)利用實時數(shù)據(jù)庫來采集、存儲、管理海量顆粒物數(shù)據(jù), 再通過相應(yīng)的數(shù)據(jù)庫接口, 提供給上層數(shù)據(jù)分析系統(tǒng), 上層數(shù)據(jù)分析系統(tǒng)再從海量大氣信息中, 通過各種數(shù)據(jù)分析方法, 實現(xiàn)海量大氣顆粒物的統(tǒng)計譜圖、粒徑分布、濃度變化曲線圖、自動命名、源解析等分析功能, 實時、在線地提取有效信息, 助力環(huán)境中心的空氣污染監(jiān)測.

2 技術(shù)概述

2.1 實時技術(shù)與實時數(shù)據(jù)庫

實時技術(shù)具有低延遲、快速反應(yīng)、實時處理的特點, 實時數(shù)據(jù)庫技術(shù)自上世紀80年代開始飛速發(fā)展, 其作為數(shù)據(jù)庫系統(tǒng)的一個分支, 是傳統(tǒng)數(shù)據(jù)庫技術(shù)與實時技術(shù)結(jié)合的產(chǎn)物, 它具有高實時性、高數(shù)據(jù)吞吐量等特點, 是各種信息監(jiān)測系統(tǒng)的基礎(chǔ), 廣泛應(yīng)用在工業(yè)生產(chǎn)現(xiàn)場的信息采集、裝置監(jiān)控、歷史數(shù)據(jù)管理[3], 已經(jīng)在各行業(yè)的實時在線系統(tǒng)中扮演重要角色.

2.2 大氣顆粒在線分析方法

現(xiàn)行多種大氣顆粒物數(shù)據(jù)分析方法, 比如顆粒物總體分析和單顆粒分析[4]. 總體分析是以采集樣本的總體作為研究對象. 通過X射線熒光光譜或者中子活化分析法來對顆粒物中的元素進行檢測, 分析出樣本整體表現(xiàn)出的光譜或化學(xué)特征, 從而得到總體數(shù)據(jù); 單顆粒分析法以單個空氣顆粒為分析單位, 利用空氣動力學(xué)和光學(xué)相關(guān)知識, 能夠?qū)蝹€顆粒的粒徑和化學(xué)成分進行分析, 精確程度較高, 但會產(chǎn)生海量離子、譜圖數(shù)據(jù).

2.3 顆粒物聚類分類方法

單顆粒分析法在分析大氣顆粒物時, 會產(chǎn)生海量數(shù)據(jù), 因此需要利用數(shù)據(jù)挖掘技術(shù)來進行高效的、自動化的數(shù)據(jù)分析.

數(shù)據(jù)挖掘中有多種聚類算法, 適用于質(zhì)譜儀數(shù)據(jù)的聚類算法多采用基于密度的聚類方法, 如K-means算法、模糊c均值、ART-2a(自適應(yīng)共振神經(jīng)網(wǎng)絡(luò))等, 綜合考慮大氣數(shù)據(jù)特征與算法效率特征, 本系統(tǒng)采用的是ART-2a算法.

3 系統(tǒng)設(shè)計

3.1 系統(tǒng)需求分析

本系統(tǒng)旨在實現(xiàn)一個基于實時技術(shù)的大氣顆粒物在線分析系統(tǒng), 主要包含以下功能子模塊: 數(shù)據(jù)來源配置、化學(xué)成分分析、顆粒物來源解析、查詢統(tǒng)計等模塊[5]. 具體功能劃分如圖1所示.

3.2 架構(gòu)設(shè)計

本系統(tǒng)采用C/S架構(gòu), 在架構(gòu)設(shè)計上分為表示層、邏輯層和數(shù)據(jù)層, 如圖2所示.

圖1 功能模塊圖

3.2.1 數(shù)據(jù)服務(wù)層

數(shù)據(jù)服務(wù)層是系統(tǒng)的基石, 在本系統(tǒng)中, 采用某品牌實時數(shù)據(jù)庫與MySQL數(shù)據(jù)庫結(jié)合的方式來構(gòu)建數(shù)據(jù)采集、存儲和管理系統(tǒng), 解決了海量大氣顆粒數(shù)據(jù)監(jiān)測中的實時性需求和海量數(shù)據(jù)存儲需求, 為上層的業(yè)務(wù)邏輯層提供高速的數(shù)據(jù)服務(wù).

3.2.2 業(yè)務(wù)邏輯層

業(yè)務(wù)層是各種數(shù)據(jù)分析過程的具體實現(xiàn), 是整個系統(tǒng)的核心部分, 包含眾多的數(shù)據(jù)分析過程, 如數(shù)據(jù)導(dǎo)入導(dǎo)出、顆粒物聚類、顆粒物自動命名、統(tǒng)計分析、濃度變化曲線圖、顆粒物來源解析等.

圖3是對空氣顆粒物進行來源解析的流程圖.

圖3 源解析流程圖

4 系統(tǒng)實現(xiàn)

本系統(tǒng)基于Visual Studio 2010平臺, 采用C++語言, 使用某品牌實時數(shù)據(jù)庫系統(tǒng)做實時數(shù)據(jù)采集和存儲, 使用MySQL數(shù)據(jù)庫來存儲數(shù)據(jù)分析結(jié)果和存儲本系統(tǒng)的管理數(shù)據(jù)[6].

本系統(tǒng)具有多種優(yōu)點: (1)界面友好、操作方便; (2)可以對海量大氣數(shù)據(jù)進行快速分析; (3)對分析結(jié)果以圖表的形式進行展示, 并可以對結(jié)果進行導(dǎo)入導(dǎo)出; (4)對數(shù)據(jù)分析的參數(shù)可以動態(tài)配置; (5)可以對顆粒物聚類結(jié)果實現(xiàn)自動命令, 高度自動化, 節(jié)省人力物力; (6)提供管理員等多角色管理功能.

下面主要介紹數(shù)據(jù)服務(wù)層、數(shù)據(jù)預(yù)處理、數(shù)據(jù)聚類分類分析、數(shù)據(jù)統(tǒng)計等四個關(guān)鍵模塊的實現(xiàn).

4.1 數(shù)據(jù)服務(wù)層的實現(xiàn)

實時數(shù)據(jù)采集和歷史數(shù)據(jù)都可以通過相應(yīng)的API或者數(shù)據(jù)庫管理系統(tǒng)來完成, 其提供C/C++二次開發(fā)API讓客戶很方便地對實時采集和歷史數(shù)據(jù)進行增刪查改, 如goh_get_archived_values可獲取單個標簽點一段時間內(nèi)的存儲數(shù)據(jù), goh_get_single_value獲取某標簽?zāi)硶r間點的數(shù)據(jù), goh_update_value可修改某標簽?zāi)硶r間段的數(shù)據(jù)值, goh_remove_values可刪除某標簽一段時間內(nèi)的數(shù)據(jù)值, goh_get_cross_section_values可獲取批量標簽點的數(shù)據(jù)值.

用MySQL數(shù)據(jù)庫可以存儲數(shù)據(jù)分析后的結(jié)果, 方便數(shù)據(jù)的存儲、查詢、導(dǎo)入、導(dǎo)出.

4.2 數(shù)據(jù)預(yù)處理模塊

數(shù)據(jù)預(yù)處理階段, 主要是針對實時采集的顆粒物數(shù)據(jù), 從中提取到系統(tǒng)數(shù)據(jù)分析模塊所需要的電離離子的峰高、峰面積、相對峰面積等數(shù)據(jù), 并根據(jù)需求選擇一個指標作為后續(xù)處理的基準.

4.3 顆粒物聚類分析

本系統(tǒng)通過ART-2a自適應(yīng)共振神經(jīng)網(wǎng)絡(luò)算法來將相似的顆粒物聚集到同一個分組中, ART-2a神經(jīng)網(wǎng)絡(luò)是一種無監(jiān)督的矢量分類器, 能有效地處理大數(shù)據(jù)集和高維數(shù)據(jù)集, 大大降低數(shù)據(jù)的規(guī)模. 并且當(dāng)某個數(shù)據(jù)點與當(dāng)前存在的所有分類都沒有達到預(yù)設(shè)的相似度時, ART-2a為其自動產(chǎn)生一個新的類別, 而不影響其它已經(jīng)存在的顆粒物聚類, 因此該算法很適用于質(zhì)譜儀數(shù)據(jù)聚類分析[7].

ART-2a算法的流程如下:

1). 利用數(shù)據(jù)矩陣, 隨機初始化輸入向量;

2). 對輸入向量進行歸一化處理;

3). 計算輸入向量與已存在的感知器進行相似度計算, 即向量內(nèi)積計算;

4). 若相似度達到閾值參數(shù), 則該顆粒物屬于該分組, 并進行共振, 更新感知器位置; 若未達到相似度閾值, 則自動產(chǎn)生新類;

5). 將所有的顆粒重復(fù)上面的步驟, 并進行多輪迭代直到分類結(jié)果穩(wěn)定.

聚類效果如圖4所示.

圖4 聚類效果示意圖

4.4 顆粒物自動命名

本模塊給出了基于邏輯回歸模型的分類系統(tǒng), 來實現(xiàn)對顆粒物自動命名. 主要思路是: 以離子信息的峰高、峰面積、相對峰面積等參數(shù)作為特征值, 通過訓(xùn)練樣本來調(diào)整分類器的參數(shù), 在訓(xùn)練樣本充足的情況下, 會得到相應(yīng)顆粒物的回歸模型, 隨著后期用戶的不斷反饋, 進行在線學(xué)習(xí), 可以進一步更新模型參數(shù), 提高分類精確度[8].

圖5 回歸模型

邏輯回歸模型用于二分類問題, 大氣中常見的有七種顆粒: 元素碳(EC)、鈉鉀(NaK)、鉀(K)、礦物質(zhì)(M)、重金屬(HM)、大分子有機物(HOC)、有機碳(OC). 因此, 我們需要對此七種顆粒物分別建立模型, 需要相應(yīng)的回歸模型. 在對實際數(shù)據(jù)進行分類測試時, 只需分別對每個顆粒物進行二分類即可.

自動命名結(jié)果如圖6所示.

圖6 自動命名示意圖

4.5 顆粒物數(shù)據(jù)統(tǒng)計

為更加宏觀直觀地顯示空氣數(shù)據(jù), 需要對分析后的數(shù)據(jù)進行統(tǒng)計, 以便制定應(yīng)對方案, 助力環(huán)境保護. 圖7是顆粒物粒徑分布圖; 圖8表示顆粒物濃度變化曲線圖; 圖9表示顆粒物來源分布餅狀圖.

圖7 顆粒物粒徑分布圖

圖8 顆粒物濃度變化曲線圖

圖9 顆粒物來源分布餅狀圖

根據(jù)顆粒物來源分布餅狀圖, 可以進一步對顆粒物來源進行解析, 判斷出可能的污染源, 如: 生物質(zhì)燃燒、工業(yè)、尾氣、燃煤等.

5 實驗分析

本系統(tǒng)測試服務(wù)器配置如下: Intel Xeon E4-1235v2 CPU、64G內(nèi)存、Windows Server2008(64位), 然后于遼寧大學(xué)、沈撫新城等位置獲取12W、22W、32W組顆粒物測試數(shù)據(jù), 分別測試數(shù)據(jù)預(yù)處理、聚類分析、自動命名等模塊的運行時間.

圖10 來源分析結(jié)果

本文中以采用MySQL數(shù)據(jù)庫為系統(tǒng)優(yōu)化前的速度, 采用實時數(shù)據(jù)庫后為系統(tǒng)優(yōu)化后的速度, 下面是兩者在各階段的處理性能, 數(shù)據(jù)規(guī)模單位為W(萬組), 時間指標單位為min(分鐘).

表1 系統(tǒng)性能測試

由上表可以看出, 本系統(tǒng)在未優(yōu)化前, 時間分別為46分、85分、119分, 對比于半自動化或者手動數(shù)據(jù)分析, 整個系統(tǒng)分析速度提升數(shù)十倍以上; 同時, 采用實時技術(shù)的優(yōu)化策略后, 本系統(tǒng)的運行時間為30分、50分、76分, 系統(tǒng)運行速度提升35%.

6 結(jié)語

在本文中, 一種基于實時技術(shù)的大氣顆粒物在線分析系統(tǒng)被實現(xiàn), 該系統(tǒng)采用實時數(shù)據(jù)庫來解決大氣監(jiān)測中的海量數(shù)據(jù)和數(shù)據(jù)存儲的實時性兩大問題, 上層數(shù)據(jù)分析中采用了ART-2a自適應(yīng)共振神經(jīng)網(wǎng)絡(luò)算法和邏輯回歸模型等數(shù)據(jù)分析方法來降低數(shù)據(jù)規(guī)模, 提升數(shù)據(jù)分析速度, 成功地處理海量大氣顆粒物數(shù)據(jù).

實驗數(shù)據(jù)表明, 本在線分析系統(tǒng)可以有效地處理大氣監(jiān)測中的海量數(shù)據(jù)問題, 同時整個系統(tǒng)的運行速度在期望范圍內(nèi), 滿足環(huán)境監(jiān)測中的實時性需求. 在實際測試中, 分組數(shù)據(jù)的正確性能達到80%; 同時, 采用實時數(shù)據(jù)庫優(yōu)化后, 相比基于MySQL的傳統(tǒng)分析系統(tǒng)能提升35%的速度. 由此可見, 本系統(tǒng)對于自動化分析大氣顆粒數(shù)據(jù)具有重要實際應(yīng)用意義和價值.

1 尹洧.大氣顆粒物及其組成研究進展(上).現(xiàn)代儀器,2012, 18(2):1–5.

2 張莉.基于單顆粒氣溶膠質(zhì)譜信息的分類方法研究及其應(yīng)用[碩士學(xué)位論文].上海:上海大學(xué),2013.

3 翟明玉,王瑾,吳慶曦,等.電網(wǎng)調(diào)度廣域分布式實時數(shù)據(jù)庫系統(tǒng)體系架構(gòu)和關(guān)鍵技術(shù).電力系統(tǒng)自動化,2013,37(2): 67–71.

4 楊新興,尉鵬,馮麗華.大氣顆粒物PM2.5及其源解析.前沿科學(xué),2013,7(2):12–19.

5 王丹.遼寧省大氣環(huán)境監(jiān)測數(shù)據(jù)分析系統(tǒng)研究[碩士學(xué)位論文].沈陽:東北大學(xué),2009.

6 Yin YF, Gong GH, Han L. Air-combat behavior data mining based on truncation method. Journal of Systems Engineering and Electronics, 2010, 10: 827–834.

7 李法運,陳亮.基于改進BP網(wǎng)絡(luò)的網(wǎng)絡(luò)論壇熱點主題挖掘. 計算機系統(tǒng)應(yīng)用,2016,25(3):113–118.

8 曹占峰,劉海濤,張啟偉.智能統(tǒng)計分析系統(tǒng).計算機系統(tǒng)應(yīng)用,2015,24(7):41–45.

Atmospheric Particle Online Analysis System Based on Real-Time Technology

PAN Zheng-Guang1,2, ZHAO Kui2, WANG Hong-Liang2, WANG Jun-Lin3

1(University of Chinese Academy of Sciences, Beijing 100049, China)2(Shenyang Institute of Computing Technology, Chinese Academy of Sciences, Shenyang 110168, China)3(School of Software Technology, Dalian University of Technology, Dalian 116024, China)

For environmental monitoring, the existing online analysis system is difficult to deal with massive atmospheric particle data. In this paper, we propose an atmospheric particle online analysis system based on real-time technologies, which aims to achieve atmospheric particle statistics, concentration change and the source analysis. The system adopts real-time databases to realize real-time capturing, stores massive atmospheric particle data, and solves the massive data problem in environmental monitoring. Besides, to accelerate data analysis and reduce data scale, the system adopts the ART-2a neural network algorithm and logistic regression model. The experiment results prove that the online analysis system could get accurate analysis result within a reasonable time. Besides, the experiment demonstrates the practical significance of our system.

real-time technology; massive data; clustering analysis; online analysis; environmental monitoring

國家水體污染控制與治理科技重大專項(2012ZX07505003)

2016-04-26;收到修改稿時間:2016-06-21

[10.15888/j.cnki.csa.005532]

猜你喜歡
海量顆粒物大氣
一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
住宅室內(nèi)細顆粒物質(zhì)量濃度及預(yù)測研究
宏偉大氣,氣勢與細膩兼?zhèn)?Vivid Audio Giya G3 S2
如何“看清”大氣中的二氧化碳
海量快遞垃圾正在“圍城”——“綠色快遞”勢在必行
大氣穩(wěn)健的美式之風(fēng)Polk Audio Signature系列
“海量+”:大學(xué)生品格提升的浸潤方——以高職藝術(shù)設(shè)計專業(yè)為例
一個圖形所蘊含的“海量”巧題
對于我國環(huán)境空氣顆粒物術(shù)語定名的建議
關(guān)于環(huán)境領(lǐng)域英文符號PM2.5 中文名稱的建議
渝中区| 宝清县| 安塞县| 安泽县| 简阳市| 日照市| 扎兰屯市| 子长县| 广德县| 沙雅县| 宝鸡市| 铜山县| 莱阳市| 阿坝县| 来宾市| 清涧县| 康定县| 婺源县| 新郑市| 太仓市| 彰化市| 紫阳县| 靖安县| 建德市| 望都县| 西贡区| 蒙自县| 垣曲县| 凤山县| 融水| 德惠市| 夏邑县| 吐鲁番市| 邹平县| 田阳县| 金昌市| 乐亭县| 拜泉县| 乳山市| 达拉特旗| 邢台市|