[藍(lán)海盛 張文娟]
物聯(lián)網(wǎng)是通過智能感知、識(shí)別技術(shù)與普適計(jì)算、泛在網(wǎng)絡(luò)的融合應(yīng)用,在5G的萬物互聯(lián)時(shí)代, 物聯(lián)網(wǎng)要通過大規(guī)模的不同類型的傳感器去感知周邊物體和物理環(huán)境,為物聯(lián)網(wǎng)應(yīng)用層的數(shù)據(jù)分析提供依據(jù)。傳感器采集系統(tǒng)實(shí)時(shí)監(jiān)測(cè)、感知和采集各種環(huán)境或監(jiān)測(cè)對(duì)象信息,實(shí)現(xiàn)物理世界多種元素、信息空間以及人類社會(huì)之間的交流,不同規(guī)模,不同采集頻率對(duì)傳感器采集系統(tǒng)的要求不一樣,對(duì)大規(guī)模傳感器進(jìn)行高頻次采集,要求傳感器采集系統(tǒng)具備大范圍高帶寬的實(shí)時(shí)傳輸、計(jì)算、存儲(chǔ)和處理能力,統(tǒng)一集中式的云計(jì)算模式無法滿足此要求,多接入邊緣計(jì)算(Muti-access Edge Computing, MEC)技術(shù)的出現(xiàn)才使其成為可能。
多接入邊緣計(jì)算MEC是一種在物理上靠近數(shù)據(jù)生成位置的處理數(shù)據(jù)的方法,是5G的關(guān)鍵技術(shù)之一[1]。邊緣計(jì)算通過使業(yè)務(wù)靠近網(wǎng)絡(luò)邊緣擴(kuò)展了云計(jì)算能力,在5G網(wǎng)絡(luò)中,被認(rèn)為是能高效處理大量業(yè)務(wù)數(shù)據(jù),滿足用戶對(duì)業(yè)務(wù)需求的有效技術(shù)之一。
大規(guī)模傳感器高頻采集系統(tǒng)將傳感器技術(shù)、現(xiàn)代網(wǎng)絡(luò)及無線通信技術(shù)、分布式信息處理技術(shù)、大規(guī)模信息處理系統(tǒng)等多項(xiàng)先進(jìn)技術(shù)集中應(yīng)用,基于邊緣計(jì)算,通過研究大規(guī)模高頻率采集傳感器數(shù)據(jù)情況下傳感器數(shù)據(jù)傳輸、存儲(chǔ)、處理和展示技術(shù),開發(fā)一套通用的大規(guī)模高頻采集數(shù)據(jù)分析處理軟件,長(zhǎng)時(shí)間持續(xù)綜合分析多個(gè)高頻采集設(shè)備的數(shù)據(jù),并提供二次開發(fā)接口,為傳感器數(shù)據(jù)進(jìn)一步挖掘處理提供基礎(chǔ),可為傳感器采集系統(tǒng)的發(fā)展和應(yīng)用推廣提供更廣闊的平臺(tái)。
常見傳感器(如溫濕度、水量等)采集系統(tǒng)規(guī)模通常較小,覆蓋區(qū)域集中在企業(yè)內(nèi)部,其采集時(shí)間通常不超過毫秒級(jí),也即采集頻率為1 000 Hz以下;相對(duì)而言,大規(guī)模傳感器高頻采集系統(tǒng)其覆蓋區(qū)域廣(行政區(qū)一級(jí)以上區(qū)域),涉及數(shù)量多(大于1 000個(gè)以上),采集頻率高(大于1 000 Hz以上)。
從國(guó)內(nèi)外已有的相關(guān)研究來看,在國(guó)家、省、市相關(guān)物聯(lián)網(wǎng)的項(xiàng)目中,雖全方位地涵蓋了低速和中高速傳感器網(wǎng)絡(luò)的體系結(jié)構(gòu)、自主組網(wǎng)和通信協(xié)議、數(shù)據(jù)融合與管理、應(yīng)用示范和測(cè)試等研究?jī)?nèi)容,但大都基于對(duì)傳感器數(shù)據(jù)進(jìn)行低頻率采集,對(duì)高頻率采集的相關(guān)研究不多。
市場(chǎng)上的物聯(lián)網(wǎng)相關(guān)廠家尚在集中精力于傳輸協(xié)議的研究和設(shè)備的研制,以及監(jiān)控系統(tǒng)的開發(fā),也是基于低頻次采集的,對(duì)大規(guī)模的高頻次采集傳感器數(shù)據(jù)處理分析技術(shù)未見報(bào)道。
對(duì)高頻傳感器采集進(jìn)行分析的產(chǎn)品硬件有測(cè)量?jī)x器,軟件有NI公司的Labview,這些都是少量幾個(gè)通道的短時(shí)間直接分析,未有長(zhǎng)時(shí)間的多設(shè)備的持續(xù)綜合數(shù)據(jù)分析。
在電力、管網(wǎng)、地震、環(huán)境等監(jiān)測(cè)應(yīng)用中,都有對(duì)大范圍高密集的傳感器進(jìn)行長(zhǎng)時(shí)間高頻次采集監(jiān)測(cè)的需求,有必要對(duì)此開展相關(guān)研究。
大規(guī)模傳感器高頻采集系統(tǒng)具有如下特點(diǎn):
(1)采集數(shù)據(jù)量大:采樣精度和頻率高,單位時(shí)間內(nèi)采集的數(shù)據(jù)量大;
(2)數(shù)據(jù)傳輸帶寬:要傳輸?shù)膫鞲衅鲾?shù)據(jù)量大,必須要求網(wǎng)絡(luò)帶寬高;
(3)存儲(chǔ)線性增加:?jiǎn)蝹€(gè)傳感器的采集數(shù)據(jù)隨時(shí)間線性增長(zhǎng);
(4)采集時(shí)間同步:存在不同的采集設(shè)備之間的時(shí)間同步問題;
(5)系統(tǒng)規(guī)模大:系統(tǒng)需要綜合分析多個(gè)傳感器的數(shù)據(jù)才能得到有意義的結(jié)果;
(6)計(jì)算處理要求高:由于需要對(duì)數(shù)據(jù)進(jìn)行信號(hào)分析,濾波等處理,計(jì)算量非常大。
針對(duì)系統(tǒng)特點(diǎn)需求,首要研究大規(guī)模傳感器高頻采集系統(tǒng)體系結(jié)構(gòu)和相關(guān)實(shí)現(xiàn)技術(shù),研究大規(guī)模高頻率采集傳感器數(shù)據(jù)情況下傳感器數(shù)據(jù)傳輸、存儲(chǔ)、處理分析和展示技術(shù)。
其次要研制一款傳感器高頻采集設(shè)備作為系統(tǒng)的數(shù)據(jù)源,開發(fā)一個(gè)大規(guī)模高頻采集數(shù)據(jù)分析處理軟件以供傳感信息查看和管理,基于邊緣計(jì)算構(gòu)建一個(gè)大規(guī)模高頻采集數(shù)據(jù)服務(wù)平臺(tái)進(jìn)行傳感數(shù)據(jù)的上傳、存儲(chǔ)、計(jì)算和分析。
下面從網(wǎng)絡(luò)體系結(jié)構(gòu)、中心平臺(tái)架構(gòu)、高頻采集設(shè)備硬件組成和軟件框架、相關(guān)關(guān)鍵技術(shù)和系統(tǒng)應(yīng)用場(chǎng)景幾個(gè)方面進(jìn)行論述。
如圖1所示,大規(guī)模傳感器高頻采集系統(tǒng)是由高頻采集設(shè)備、分布式MEC在線計(jì)算服務(wù)器和集中式云端中心服務(wù)平臺(tái)組成。高頻采集設(shè)備實(shí)時(shí)高頻次收集傳感器監(jiān)測(cè)數(shù)據(jù),通過4G/5G移動(dòng)網(wǎng)或固網(wǎng)傳送至分布式MEC在線計(jì)算服務(wù)器進(jìn)行處理,分布式MEC在線計(jì)算服務(wù)器再把原始數(shù)據(jù)和計(jì)算結(jié)果傳輸?shù)郊惺皆贫酥行姆?wù)平臺(tái),在服務(wù)平臺(tái)中數(shù)據(jù)上傳集群接收傳感器數(shù)據(jù)流,存儲(chǔ)到數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)。
圖1 系統(tǒng)體系結(jié)構(gòu)圖
系統(tǒng)采用分布式架構(gòu),充分利用MEC計(jì)算服務(wù)器的高性能運(yùn)算能力,對(duì)異構(gòu)數(shù)據(jù)實(shí)施高效的存儲(chǔ)、管理、同化、分析與信息發(fā)現(xiàn),以實(shí)現(xiàn)高可信度的實(shí)時(shí)預(yù)警決策。其中,數(shù)據(jù)存儲(chǔ)和管理涉及異構(gòu)數(shù)據(jù)整合和數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì);異構(gòu)數(shù)據(jù)同化、分析和信息發(fā)現(xiàn)則是評(píng)估與預(yù)警服務(wù)的關(guān)鍵。
如圖2所示,中心服務(wù)平臺(tái)由數(shù)據(jù)上傳集群、離線分析集群、分布式計(jì)算集群、數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)和應(yīng)用服務(wù)集群組成。
圖2 平臺(tái)架構(gòu)圖
多個(gè)高頻采集設(shè)備采集的數(shù)據(jù)通過網(wǎng)絡(luò)(以太網(wǎng)、移動(dòng)通信網(wǎng)、無線網(wǎng)絡(luò)等)上傳到MEC在線計(jì)算服務(wù)器,MEC在線計(jì)算服務(wù)器形成的分布式計(jì)算集群實(shí)時(shí)對(duì)原始數(shù)據(jù)進(jìn)行壓縮傳輸、整形清洗等預(yù)處理,產(chǎn)生相關(guān)頻諳等計(jì)算結(jié)果,原始數(shù)據(jù)和計(jì)算結(jié)果都傳送到數(shù)據(jù)上傳集群,由數(shù)據(jù)上傳集群進(jìn)行分片接收處理,存儲(chǔ)到數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù),更新業(yè)務(wù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)索引。
用戶、維護(hù)和管理人員訪問應(yīng)用服務(wù)集群,從業(yè)務(wù)數(shù)據(jù)庫(kù)獲取設(shè)備和數(shù)據(jù)索引信息,當(dāng)查看波形、頻譜等傳感信息時(shí),由應(yīng)用服務(wù)集群請(qǐng)求分布式計(jì)算計(jì)算集群進(jìn)行計(jì)算,計(jì)算結(jié)果由應(yīng)用服務(wù)集群返回給客戶端。
離線分析集群通過構(gòu)建數(shù)據(jù)分析模型,對(duì)采集的高頻次傳感器原始數(shù)據(jù)和計(jì)算結(jié)果進(jìn)行多角度分析、深度挖掘?qū)W習(xí)和綜合分析處理,以得到有意義的結(jié)果,同時(shí)能生成分析報(bào)告,供管理者決策。當(dāng)大量傳感數(shù)據(jù)具備空間地理信息之后,并結(jié)合入GIS系統(tǒng)之后,使得結(jié)合空間地理信息的實(shí)現(xiàn)多角度多面向個(gè)性化的傳感信息分析模式成為可能。通過數(shù)據(jù)挖掘及模式匹配、多樣化輸出模式及圖形化控制終端系統(tǒng)設(shè)計(jì),對(duì)傳感數(shù)據(jù)結(jié)合空間地理信息數(shù)據(jù)進(jìn)行管理和計(jì)算,能直觀詮釋空間、時(shí)間及各感知信息之間的相互關(guān)系。
在數(shù)據(jù)上傳和客戶端訪問的前端,都通過負(fù)載均衡來實(shí)現(xiàn)對(duì)高并發(fā)訪問的分流控制。
如圖3所示,設(shè)備由多個(gè)模塊組成,高精度時(shí)鐘模塊經(jīng)校準(zhǔn)后,為設(shè)備提供高精度的時(shí)間同步功能;移動(dòng)通信模塊支持與4G/5G移動(dòng)網(wǎng)絡(luò)進(jìn)行通信;傳感器網(wǎng)絡(luò)通信模塊具備協(xié)議棧處理功能,提供與低速/高速傳感器網(wǎng)絡(luò)及設(shè)備的通信,并通過總線(SPI)與主處理器相連;WiFi模塊提供到無線局域網(wǎng)的接入能力;信息顯示模塊為設(shè)備提供圖形化信息顯示;外部采控提供高頻采集設(shè)備連接多種傳感器的接口,并進(jìn)行接口轉(zhuǎn)換和防護(hù)處理;GPS/北斗模塊提供設(shè)備位置信息;數(shù)據(jù)處理和控制模塊為高頻采集設(shè)備提供高性能的處理能力;電源模塊為設(shè)備所有其它模塊供電。
圖3 硬件組成圖
圖4 設(shè)備軟件框架圖
如圖4所示,軟件布署在數(shù)據(jù)處理和控制模塊中,數(shù)據(jù)服務(wù)完成高頻采集傳感器數(shù)據(jù)的匯聚與傳輸,實(shí)現(xiàn)傳感網(wǎng)數(shù)據(jù)到無線局域網(wǎng)、移動(dòng)通信網(wǎng)絡(luò)、有線網(wǎng)絡(luò)的傳輸。采集控制實(shí)現(xiàn)外部采控接口中傳感器數(shù)據(jù)的高頻采集。協(xié)議管理實(shí)現(xiàn)對(duì)傳感器網(wǎng)絡(luò)的管理,實(shí)現(xiàn)RS-485 Modbus RTU、Modbus TCP應(yīng)用協(xié)議支持;參數(shù)配置功能實(shí)現(xiàn)管理中心對(duì)設(shè)備參數(shù)進(jìn)行配置,通過RJ45或USB進(jìn)行配置。
TCP/IP協(xié)議棧提供網(wǎng)絡(luò)通信支持。WiFi協(xié)議棧提供無線局域網(wǎng)通信。4G/5G通信RIL框架提供移動(dòng)網(wǎng)絡(luò)通信框架。傳感器網(wǎng)絡(luò)通信接口實(shí)現(xiàn)與傳感器網(wǎng)絡(luò)的信息交互,實(shí)現(xiàn)傳感網(wǎng)數(shù)據(jù)的匯聚和控制指令的分發(fā)。
操作系統(tǒng)提供應(yīng)用軟件的平臺(tái)支持。
驅(qū)動(dòng)提供對(duì)硬件的抽象接口。包括:SPI、LAN、UART、USB、4G模塊、GPIO、AD/DA、I2C、WiFi、LCD顯示、按鍵、傳感器驅(qū)動(dòng)。
如圖5所示,數(shù)據(jù)分析處理軟件使用組態(tài)軟件架構(gòu),把處理、顯示、分析等模塊分離,易于修改顯示方式和增加分析處理功能。
圖5 分析處理軟件框架圖
分析處理軟件包括底部驅(qū)動(dòng)程序,通訊協(xié)議等與設(shè)備配套使用的控制軟件,自動(dòng)識(shí)別設(shè)備配置,遠(yuǎn)程設(shè)置設(shè)備的量程、濾波及采樣參數(shù),完成信號(hào)的實(shí)時(shí)采集分析處理。
控制界面提供設(shè)備識(shí)別、參數(shù)配置、實(shí)時(shí)采集、數(shù)據(jù)預(yù)處理、格式轉(zhuǎn)換及數(shù)據(jù)保存功能。分析界面提供時(shí)差域、幅值域、頻率域和相關(guān)分析功能。
決策界面部分,通過長(zhǎng)時(shí)間統(tǒng)計(jì)分析,多設(shè)備綜合計(jì)算,對(duì)結(jié)果進(jìn)行數(shù)據(jù)可視化顯示,生成決策報(bào)告,并提供在線操作幫助。
時(shí)間同步是對(duì)多傳感器綜合分析的前提,需要在統(tǒng)一的時(shí)間軸上,方可通過傳感器數(shù)據(jù)時(shí)間分析多傳感器之間的相關(guān)性。可通過兩種途徑保證傳感器數(shù)據(jù)的同時(shí)性(誤差在較小范圍),一是采集設(shè)備統(tǒng)一使用GPS授時(shí),結(jié)合自身的高精度時(shí)鐘持續(xù)采集;二是由分布式MEC在線計(jì)算服務(wù)器校正傳感器數(shù)據(jù)時(shí)間。
基于高頻次采集的大量實(shí)時(shí)數(shù)據(jù),以及傳感器的位置信息,可實(shí)時(shí)在GIS空間信息上顯示相關(guān)區(qū)域的傳感信息,通過提供一系列的分析和處理的手段,使用戶直觀的獲得相關(guān)可視化分析結(jié)果。
可視化要求能對(duì)被傳感器采集系統(tǒng)覆蓋區(qū)域進(jìn)行空間數(shù)據(jù)查詢,同時(shí)獲得對(duì)應(yīng)的傳感采集數(shù)據(jù)信息。系統(tǒng)需提供可拖動(dòng)時(shí)間軸,獲取相關(guān)區(qū)域的歷史傳感信息,或獲取指定區(qū)域的歷史環(huán)境的變化過程圖。
要實(shí)時(shí)在GIS中顯示某區(qū)域的傳感器數(shù)據(jù),其難點(diǎn)在于接收、解析及處理遠(yuǎn)程采集設(shè)備的地理位置信息及傳感信息,在大數(shù)據(jù)吞吐量下須具備高可靠性。歷史數(shù)據(jù)可視化回放的難點(diǎn)在于允許用戶可以通過拖拉滾動(dòng)條或者指定時(shí)間范圍自動(dòng)播放,還原指定區(qū)域環(huán)境信息歷史的走向。
可視化分析則要求系統(tǒng)能對(duì)用戶指定的服務(wù)端接收到的原始數(shù)據(jù)進(jìn)行自定義的可視化分析處理,包括簡(jiǎn)單的數(shù)學(xué)運(yùn)算、復(fù)雜的聚類、模式匹配等數(shù)據(jù)處理。
傳感器采集的數(shù)據(jù)具有一定的冗余,通過數(shù)據(jù)融合技術(shù)可提高數(shù)據(jù)收集的效率和準(zhǔn)確性。傳統(tǒng)的數(shù)據(jù)融合技術(shù)優(yōu)先考慮節(jié)省能量,為融合盡量多的合并數(shù)據(jù)包,降低數(shù)據(jù)傳輸量,通常會(huì)犧牲數(shù)據(jù)包的傳輸延時(shí)。
由于高頻采集的傳感器數(shù)據(jù)量大、實(shí)時(shí)性要求高,需研究在滿足時(shí)間性和信息完整性的要求下,對(duì)大量的信息進(jìn)行編碼融合,以減少傳輸帶寬并壓縮存儲(chǔ)。數(shù)據(jù)融合機(jī)制需根據(jù)信息與業(yè)務(wù)的實(shí)時(shí)性要求選擇不同的數(shù)據(jù)融合度,且能根據(jù)網(wǎng)絡(luò)各層協(xié)議的信息,調(diào)整數(shù)據(jù)融合的融合度、緩存大小、融合等待時(shí)間等參數(shù),在節(jié)省能量和傳輸速度方面達(dá)成平衡。
高頻傳感器采集的數(shù)據(jù)量大,數(shù)據(jù)流有連續(xù)和間斷的,數(shù)據(jù)量隨時(shí)間的增加而線性增長(zhǎng),在分布式MEC在線計(jì)算服務(wù)器及數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)中,必須設(shè)計(jì)特定的存儲(chǔ)結(jié)構(gòu)存儲(chǔ),方便插入和查詢。通過把間斷分散的高頻傳感器數(shù)據(jù)片按時(shí)間順序整理成連續(xù)的數(shù)據(jù)流,方便進(jìn)一步的查看和處理。
高頻采集設(shè)備上傳的傳感器數(shù)據(jù)經(jīng)過整形等預(yù)處理過程寫入數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)的同時(shí),必須實(shí)時(shí)計(jì)算出波形、頻譜等圖形推送給客戶端查看。由于傳感器數(shù)量多,分布式MEC在線計(jì)算集群必須在短時(shí)間內(nèi)計(jì)算出大量的傳感器圖形,就需要研究并發(fā)度高,計(jì)算速度快的系統(tǒng)架構(gòu)及算法。
數(shù)據(jù)挖掘在時(shí)間節(jié)點(diǎn)上包括以下層面:對(duì)已有數(shù)據(jù)庫(kù),通過專家知識(shí)建立數(shù)據(jù)挖掘的算法基礎(chǔ)和相應(yīng)的挖掘引擎,挖掘出相應(yīng)的數(shù)據(jù)模式;在采集信號(hào)異常時(shí),通過待分析數(shù)據(jù)和經(jīng)驗(yàn)數(shù)據(jù)模式的數(shù)據(jù)比對(duì),進(jìn)行實(shí)時(shí)預(yù)測(cè)和警報(bào),并更新警報(bào)于數(shù)據(jù)庫(kù)。
系統(tǒng)可應(yīng)用在需要對(duì)大量傳感器進(jìn)行長(zhǎng)時(shí)間持續(xù)綜合分析的場(chǎng)合,根據(jù)不同的應(yīng)用領(lǐng)域,進(jìn)行定制開發(fā)形成特定的監(jiān)測(cè)系統(tǒng)。
橋梁應(yīng)變?cè)诰€監(jiān)測(cè)需要在一座橋梁部署幾十個(gè)應(yīng)變傳感器,監(jiān)測(cè)橋梁形變情況,提前預(yù)警斷裂。當(dāng)選用應(yīng)變信號(hào)傳感器作為高頻采集傳感器,則可把系統(tǒng)用于橋梁應(yīng)變?cè)诰€監(jiān)測(cè)。
管道(水、天然氣、石油等)在線監(jiān)測(cè)需要監(jiān)測(cè)管道中的壓力、流量、流速等,綜合多采集點(diǎn)信號(hào)實(shí)時(shí)計(jì)算反應(yīng)其泄漏情況。當(dāng)選用流量、壓力信號(hào)傳感器作為高頻采集傳感器,則可把系統(tǒng)用于管道在線監(jiān)測(cè)。
電力在線監(jiān)測(cè)需要監(jiān)測(cè)電力線路的電壓電流變化,計(jì)算電力網(wǎng)絡(luò)的功率、相位信息,用于漏電檢測(cè)和電能分配調(diào)度等。當(dāng)選用電流、電壓信號(hào)傳感器作為高頻采集傳感器,則可把系統(tǒng)用于電力在線監(jiān)測(cè)。
文中分析大規(guī)模傳感器高頻采集系統(tǒng)特點(diǎn),提出基于邊緣計(jì)算的大規(guī)模傳感器高頻采集系統(tǒng),對(duì)其關(guān)鍵技術(shù)和分析軟件架構(gòu)進(jìn)行研究,為大規(guī)模傳感器高頻采集系統(tǒng)應(yīng)用提供基礎(chǔ),推動(dòng)5G垂直行業(yè)應(yīng)用發(fā)展。