文/胡鵬偉 劉璐 戴昭騫 葉蕾 林鈺峰 尹浪 王星
大數(shù)據(jù)與人工智能等技術(shù)近年來正在促進傳統(tǒng)基礎(chǔ)設(shè)施轉(zhuǎn)型升級,使傳統(tǒng)與創(chuàng)新融合,如智慧能源基礎(chǔ)設(shè)施、智慧城市基礎(chǔ)設(shè)施等。在城市基礎(chǔ)設(shè)施建設(shè)中,城市地下供水管網(wǎng)建設(shè)是一個重要的組成部分,其負(fù)責(zé)著整個城市用水的供應(yīng),對城市的居民生活工作、工業(yè)生產(chǎn)等許多方面有著非常大的影響。隨著城市的不斷發(fā)展,地下管道網(wǎng)絡(luò)越來越復(fù)雜,而其中的安全隱患也愈發(fā)嚴(yán)重,建設(shè)良好的管理城市地下供水管道網(wǎng)絡(luò),構(gòu)建科學(xué)的管網(wǎng)系統(tǒng)是城市建設(shè)中亟待解決的難題。在智慧城市建設(shè)的語境下,物聯(lián)網(wǎng)和人工智能技術(shù)為傳統(tǒng)地下供水管網(wǎng)問題提供了新的解決思路。本文主要探討了傳感器網(wǎng)絡(luò)部署與機器學(xué)習(xí)算法在供水管網(wǎng)中應(yīng)用的問題和挑戰(zhàn),提出了使用傳感器融合模型解決管網(wǎng)漏點識別的問題,并基于管網(wǎng)漏點檢測的場景設(shè)計實驗進行了可行性驗證,最終得出對利用多視圖學(xué)習(xí)模型構(gòu)建智慧供水管網(wǎng)漏損識別方法的可行性分析。
水資源是城市生存發(fā)展的物質(zhì)基礎(chǔ),由于水資源的供給不均衡,世界上許多國家和地區(qū)處在極端缺水狀態(tài);而另一方面,城鎮(zhèn)水資源的低效利用和漏損浪費也十分嚴(yán)重。城市供水管網(wǎng),作為城市供水的最主要途徑,有著城市的“生命線”之稱。供水管網(wǎng)的管道由于深埋在路面下,當(dāng)其發(fā)生漏損時常常難以及時發(fā)覺,不僅給供水企業(yè)帶來經(jīng)濟利益和社會效益的影響,同時可能造成區(qū)域性停水等影響居民生活品質(zhì)的問題發(fā)生。發(fā)展中國家的城市供水管網(wǎng)漏損率達15%以上。因此,有效地降低供水管網(wǎng)漏損率,有效地提高漏損檢測搶修的及時性,可以為供水企業(yè)節(jié)省非??捎^的資源成本,提升經(jīng)濟效益。水管漏損主要存在以下兩種形式:
(1)明漏,是由管道內(nèi)水浸蝕管道覆蓋層涌出地表形成。明漏主要包括爆管、接口滴漏等情況。爆管主要指的是由意外導(dǎo)致的管道破損,這種情況通常會造成水資源的大量流失;接口滴漏主要是由于施工原因、材質(zhì)原因、環(huán)境原因等導(dǎo)致閥門或其他管網(wǎng)設(shè)施滴漏水,這種漏水速率不大,不易被人們重視,但實際上長期的滴漏也會造成不小的經(jīng)濟損失和潛在安全隱患。
(2)暗漏,是指發(fā)生了管道漏水但沒有冒出地面的情況。暗漏中浸蝕出來的水可能通過浸入,或自成流徑等方式流入地下水層或城市溝網(wǎng)系統(tǒng)。這種漏水常常難以被人們察覺,也難以檢測或定位。
城市供水網(wǎng)絡(luò)中的漏水現(xiàn)象十分普遍。一方面,這將直接影響供水公司的利潤,另一方面將影響管道,會對自身和道路基礎(chǔ)設(shè)施造成損害,并對周圍建筑物等公共設(shè)施造成潛在影響和威脅。因此,及時發(fā)現(xiàn)和控制供水管網(wǎng)泄漏已成為維持管網(wǎng)健康運行的關(guān)鍵。領(lǐng)域內(nèi)的研究人員都非常重視管網(wǎng)泄漏的檢測與控制,近年來還開發(fā)并研究了大量泄漏檢測儀器和泄漏控制模型。城市供水管網(wǎng)漏損的 評價指標(biāo)主要包括漏損率和漏失率。
綜合漏損率:
漏失率:
供水單位的綜合漏損率:
近幾十年來,供水行業(yè)非常重視供水網(wǎng)絡(luò)的事故和泄漏控制,傳統(tǒng)的方法大部分是針對特定管道網(wǎng)絡(luò)或管線開發(fā)的定制檢測系統(tǒng),最新的研究方向則是嘗試使用一種對泄漏噪聲沿管道壁傳播信號進行相關(guān)分析的測試儀器,即利用頻譜分析的方法提取相應(yīng)的傳感器信號,使用專用的數(shù)字處理芯片,開發(fā)了應(yīng)力波法泄漏測試儀,對強噪聲環(huán)境下地下管道的泄漏方法進行了相關(guān)研究。目前,供水管網(wǎng)檢漏儀的研究和應(yīng)用大多基于聲學(xué)或電聲原理。常用的檢漏設(shè)備如下:
聽漏棒。這是最簡單、最常用的檢漏設(shè)備。它很長,一端直接接觸管壁,另一端連接到泄漏檢測人員的耳朵上,桿發(fā)出的聲音使振動板產(chǎn)生共振,并通過耳朵感知判斷是否漏水。適用于各種類型的管道泄漏檢測。
檢漏餅。其原理類似于聽漏棒,探頭也是一種高度靈敏的振動傳感器,通過傳感器與地面的接觸,并通過地面振動經(jīng)薄膜放大傳至檢漏人員耳中。
相關(guān)的檢漏儀。由相關(guān)的儀器主機、兩個無線電發(fā)射器和兩個高靈敏度振動傳感器組成。它的工作原理是,在泄點處,水和泄漏點之間的摩擦將產(chǎn)生聲音,并且該聲音將沿著管道傳播到兩側(cè)。相關(guān)的檢漏儀使用兩個傳感器檢測泄漏的聲波并將其轉(zhuǎn)換為電信號,當(dāng)電信號到達兩個擴展部分后,將對電信號進行放大和濾波,然后通過電纜或者無線電分別傳送到主機,根據(jù)偵測到的兩個電信號接收的時間差異,求出聲波時間差異,由此求出漏點到傳感器的實際距離。計算公式如下:
式中:l——漏點到最近傳感器的距離(m)
d——兩個傳感器間實際的管長(m)
v——聲速(m/s)
其他檢漏設(shè)備。除上述檢漏設(shè)備外,常用的供水管網(wǎng)檢漏設(shè)備還包括自動噪聲記錄儀、多探頭關(guān)聯(lián)儀、抗干擾雙探頭檢漏儀、自適應(yīng)檢漏儀等。
目前,有兩種主要的泄漏檢測方法:被動泄漏檢測和主動泄漏檢測。
被動泄漏檢測方法是管道檢查人員定期檢查管道,以檢查是否有自來水從地面溢出,以確定是否存在泄漏。如果發(fā)現(xiàn)的泄漏點是開放式泄漏點,無需采用任何測試設(shè)備。這種方法的優(yōu)點是簡單且投資金額少,但是在造成大量漏水之后才會發(fā)現(xiàn),水資源嚴(yán)重浪費并且損失太大;而且,這些泄漏點的位置和管段的泄漏點總是大不相同,這常常使維修需要挖掘量太大和維護時間太長。
主動泄漏檢測方法是使用一些先進的檢測儀器來檢測管道網(wǎng)絡(luò)中的泄漏。傳統(tǒng)的主動泄漏檢測方法主要包括視聽泄漏檢測方法、泄漏自動記錄監(jiān)控方、區(qū)域泄漏檢測方法、雷達泄漏檢測方法和壓力調(diào)節(jié)方法等。自20世紀(jì)70年代以來,研發(fā)人員開發(fā)了許多用于管道網(wǎng)絡(luò)泄漏檢測和定位的新技術(shù),包括基于磁通量的管道檢測方法,超聲和其他技術(shù),負(fù)壓波法,壓力梯度法,神經(jīng)網(wǎng)絡(luò)法,光纖泄漏檢測法,質(zhì)量或體積平衡法,監(jiān)視和數(shù)據(jù)采集系統(tǒng)(SCADA),聲波檢測法,壓力波檢測法等。
隨著新技術(shù)的發(fā)展,越來越多的城市對供水管網(wǎng)進行了普查和精確定位,建立了供水管網(wǎng)計算機管理系統(tǒng),實現(xiàn)了動態(tài)管理。但是,由于大多數(shù)城市供水管線的分布比較復(fù)雜,不同的國家、地區(qū)的方法計量和泄漏檢測方法不盡相同;另外,管理等諸多方面的問題也導(dǎo)致了多數(shù)供水企業(yè)的泄漏檢測仍然以被動法為主,泄漏損失控制水平仍然處于較低的狀態(tài)。
以往,業(yè)界普遍采用回歸分析的方法建立管網(wǎng)泄漏預(yù)測模型。Shamir 和Howard(1979)使用回歸分析方法建立了預(yù)測模型,以預(yù)測隨著供水管道鋪設(shè)年限增加,供水網(wǎng)絡(luò)泄漏頻率的變化。Walski(1982)將管道直徑和溫度因子引入了Shamir 和Howard 建立的預(yù)測模型中。Thomas(1987)和Enrique(1995)使用統(tǒng)計回歸方法,通過有關(guān)管網(wǎng)使用壽命和漏水率的統(tǒng)計數(shù)據(jù)來建立供水管壽命隨時間變化的回歸預(yù)測模型。Shridhar(2008)利用供水系統(tǒng)的管道泄漏數(shù)據(jù)建立了統(tǒng)計分析預(yù)測模型。除了使用泄漏檢測設(shè)備控制管網(wǎng)泄漏外,一些供水企業(yè)還建立了供水管網(wǎng)泄漏預(yù)測模型,使管網(wǎng)泄漏控制變被動為主動,這一類的管網(wǎng)泄漏預(yù)測模型主要包括:張宏偉(2001)建立的多元線性回歸模型;趙宏斌(2001)的指數(shù)平滑模型;傅玉芬(2004)的灰色預(yù)測模型;王圃(2006)的組合模型;王麗娟(2010)的差分自回歸移動平均模型。 而近十年來,計算機和Internet 技術(shù)已滲透到人們生活的各個方面,可以使用各種儀器和設(shè)備來建立一套完整的在線連續(xù)監(jiān)視系統(tǒng),使人們可以坐在可顯示整個城市供水網(wǎng)絡(luò)的計算機屏幕前系統(tǒng)地監(jiān)控供水網(wǎng)絡(luò)。城市供水網(wǎng)絡(luò)的計算機監(jiān)控工作原理主要是:硬件系統(tǒng)通過無線網(wǎng)絡(luò)將監(jiān)控到的管網(wǎng)數(shù)據(jù)(包括水壓、噪聲、流量等數(shù)據(jù))發(fā)送到中央控制室,然后由軟件系統(tǒng)自動判斷并自動調(diào)整這些數(shù)據(jù)。如果發(fā)現(xiàn)造成管網(wǎng)泄漏的因素,則會發(fā)出告警。以下是幾種常用的管網(wǎng)泄漏檢測與定位系統(tǒng)。
(1) SCADA系統(tǒng),SCADA(Supervisory Control and Data Acquisition)系統(tǒng),即監(jiān)視和數(shù)據(jù)采集系統(tǒng)。將通過判斷所采集的數(shù)據(jù)(水質(zhì)、水壓、流量、流速等)來監(jiān)視安裝在管道上的數(shù)據(jù)收集器,可遠程調(diào)整管道參數(shù),實現(xiàn)供水管網(wǎng)各參數(shù)的實時調(diào)整和泄露告警。
(2)GIS(Geographical Information System)系統(tǒng),即地理信息系統(tǒng),是一種將電子計算機技術(shù)、地質(zhì)科學(xué)、傳感技術(shù)和信息科學(xué)相結(jié)合的高科技技術(shù)。它從簡單的數(shù)據(jù)存儲、調(diào)查、統(tǒng)計和其他基本系統(tǒng)轉(zhuǎn)變?yōu)閷iT的智能分析和決策集成系統(tǒng)。
(3)供水管網(wǎng)動態(tài)模型。與GIS 系統(tǒng)有關(guān)的供水管網(wǎng)的動態(tài)模型始于供水管網(wǎng)中水力的動態(tài)問題,模擬了管道的流動狀態(tài)。目前,大多數(shù)城市的供水網(wǎng)絡(luò)動態(tài)模擬并不理想,模擬的工作條件不能與實際的工作條件相匹配,一方面,實際工作條件會隨著時間不斷變化,另一方面,供水網(wǎng)絡(luò)也會發(fā)生變化,但模型卻無法根據(jù)這些狀態(tài)及時變化和調(diào)整,因此,一套能融合多個傳感器信號并且能準(zhǔn)確識別漏點的系統(tǒng)是供水管道建設(shè)中的急切需求。
本研究中搭建的智慧管網(wǎng)平臺是經(jīng)由水管管路配置的傳感器傳送流量、流速與壓力等信息至網(wǎng)關(guān),再經(jīng)由網(wǎng)關(guān)傳輸至邊緣節(jié)點伺服器實現(xiàn)模型計算與模型學(xué)習(xí),通過系統(tǒng)能夠?qū)崟r觀察管路狀態(tài)與管路漏點,依樹狀結(jié)構(gòu)可管理邊緣節(jié)點、網(wǎng)關(guān)與每個傳感器,重現(xiàn)未來智慧城市中管網(wǎng)信息的漏水場景。該沙盤場景一共設(shè)計了5個漏點,這些漏點也可作為正常用水的出水口。在實驗過程中,會任意切換漏點和出水口的位置,并隨之切換水流大小,以模擬多種漏點和不同用水量的情況。具體沙盤設(shè)計視圖如圖1所示,通過可視化的前端界面,可實時展示漏點的位置和各指標(biāo)數(shù)據(jù)隨時間的波變化,具體界面如圖2所示。
圖1 供水管網(wǎng)漏損預(yù)測實驗?zāi)M沙盤
圖2 城市供水管網(wǎng)漏損預(yù)測系統(tǒng)實時界面
通過沙盤場景采集得到的數(shù)據(jù)指標(biāo)包括11個傳感器的ROF 瞬時流速、QOF 瞬時流量、PRESS 壓力、PAQOFI 正向累積流量整數(shù)部分、PAQOFD 正向累積流量小數(shù)部分、NAQOFI 反向累積流量整數(shù)部分以及NAQOFD 反向累積流量小數(shù)部分。在多種場景的切換過程中,隨時給當(dāng)前場景記錄標(biāo)簽,在數(shù)據(jù)庫中標(biāo)記為‘label’字段以表明實驗時的漏點位置。由于2號、4號、6號、8號和10號傳感器在5個漏水點或出水口上,因此在模型中不可應(yīng)用這些傳感器的數(shù)據(jù)。模型最終應(yīng)用到的數(shù)據(jù)結(jié)構(gòu)如表1所示。由于原始數(shù)據(jù)范圍不一致,對數(shù)據(jù)做標(biāo)準(zhǔn)化處理,由圖3實驗數(shù)據(jù)分布可見,數(shù)據(jù)分布確實存在一些異常值,尤其是壓力數(shù)據(jù)異常值較大且較多,這是由于沙盤放置的增壓泵壓力傳輸不穩(wěn)定造成的。此現(xiàn)象也會造成模型在不斷運行過程中的偏差,因為現(xiàn)階段不可預(yù)知的劇烈壓力變化是無法通過模型來學(xué)習(xí)的。
表1 城市供水管網(wǎng)漏損預(yù)測模型數(shù)據(jù)結(jié)構(gòu)
表1(續(xù))
圖3 城市供水管網(wǎng)漏損預(yù)測實驗數(shù)據(jù)分布
如圖4所示,通過對各傳感器的指標(biāo)進行相關(guān)性分析(顏色越深相關(guān)性越高)可看出,傳感器的流量和流速對目標(biāo)值影響比較大,且各指標(biāo)之間的相關(guān)性也比較高。傳感器1~傳應(yīng)器5對目標(biāo)值的影響比較明顯,符合沙盤布局規(guī)律。
圖4 城市供水管網(wǎng)漏損測實驗中傳感器數(shù)據(jù)指標(biāo)熱力
供水狀態(tài)重新穩(wěn)定之間的信號變化,解決了短時記憶的弊端。在這其中,“門”的概念會在訓(xùn)練過程中學(xué)習(xí)保存或遺忘哪些信息。然而,直接利用LSTM 的輸出層作為分類器的輸入表示層,會丟失每個時刻不同傳感器輸出信息的不同重要程度。針對這些場景中的特點,我們選擇引入一個Attention 層放置在原數(shù)據(jù)和LSTM 模型之間,即在LSTM 輸入層之前引入Attention 的Attention+LSTM 結(jié)構(gòu)以解決當(dāng)前的問題,整體結(jié)構(gòu)如圖5所示。具體來說,我們將使用Attention 機制的空間特征作為LSTM 的輸入,實現(xiàn)Attention+LSTM 預(yù)測模型。Attention 將從多個傳感器的輸入信號中捕捉到關(guān)鍵特征。最終我們將Attention+LSTM 模型的輸出設(shè)計為二分類問題,即給定特征和標(biāo)簽訓(xùn)練識別漏水點的模型。圖5中輸入序列為各個傳感器上收集到的各個信號x0,x1,x2,…xt,將每個輸入傳入LSTM 單元,得到對應(yīng)隱藏層的輸出h0,h1,h2,…h(huán)t。這里,在LSTM 和輸入層之間引入Attention,通過計算給各個輸入分配注意力概率分布值, 也就是計算某一時刻的LSTM 輸入與整個傳感器表示向量的匹配得分占總體得分的比重。最終,yi是實際類別標(biāo)簽值,yi是利用softmax 函數(shù)計算的預(yù)測類別標(biāo)簽值。
對一個智慧管網(wǎng)系統(tǒng)而言,其每個傳感器所產(chǎn)生的信息和代表的區(qū)域顯然是不同的,即權(quán)重不同,在這種情況下,捕捉管網(wǎng)中不同區(qū)域的關(guān)鍵特征是有重要意義的。另一個不同于傳統(tǒng)多傳感器場景的特點是供水管網(wǎng)中還有時間特征,在發(fā)生泄漏和用水量浮動較大時,發(fā)生點周邊的傳感器在一定時間內(nèi)會采集到一個管內(nèi)的數(shù)據(jù)變化趨勢。LSTM 模型在過去數(shù)年被驗證了是一個有效的方法,在包含有時間維度的多傳感器場景下都展示出優(yōu)于傳統(tǒng)模型的表現(xiàn)。LSTM 的計算流程與循環(huán)網(wǎng)絡(luò)相似,會在一個前向傳播的過程中處理流經(jīng)“細(xì)胞”的數(shù)據(jù),并且LSTM 具有能選擇保存信息或遺忘信息的功能。LSTM 通過引入“細(xì)胞”狀態(tài)以及“門”結(jié)構(gòu),這就可以在信息的傳輸過程中讓信息能在序列鏈中傳輸下去,通過這種方式,LSTM 實現(xiàn)對網(wǎng)絡(luò)的記憶功能,這在含有時間維度并且需要實時監(jiān)測的供水管網(wǎng)場景下非常適用。通過這種方法,系統(tǒng)可以捕捉從發(fā)生漏水開始的前期到后期
圖5 Attention+LSTM模型結(jié)構(gòu)
為收集數(shù)據(jù)設(shè)計的管道網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖6所示。從水箱(左下角)出水到管道,再從水槽(中間長方形)收集水回到水箱,整個管網(wǎng)構(gòu)成了一個簡單的回路結(jié)構(gòu)。水槽上方架設(shè)了五個水龍頭(編號1至5),分別從主干管道的五處不同位置接出,模擬的是5個用水場景。由于當(dāng)前沙盤中水龍頭全部需要手動控制,模擬一個日常的區(qū)域用水行為疊加漏水情況難度較大,于是設(shè)計為如下場景:
1. 編號1、2為兩個漏水點,即開關(guān)打開時說明該用水區(qū)域存在漏水情況,開關(guān)關(guān)閉時說明無漏水。其中漏水的大小可通過擰水龍頭進行自由調(diào)整。
2. 編號3、4、5為三個正常用水點,即這幾處水龍頭開關(guān)導(dǎo)致的管道內(nèi)環(huán)境變化不應(yīng)被檢測為漏水。為簡化問題,此三處的平均用水速度在一定時間內(nèi)會保持恒定。
根據(jù)管道漏點檢測場景的傳感器部署設(shè)計(如圖7),在模擬沙盤中共部署了11個傳感器,其中6個均勻分布在主干管道中作為特征收集(數(shù)據(jù)),另外五個分別部署在水龍頭所在管道分支處作為結(jié)果輸出(標(biāo)簽)。傳感器收集的數(shù)據(jù)特征及表示方法如表2所示。
圖6 城市供水管道網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
1. 以漏點檢測分類問題為目的的數(shù)據(jù)采集
在該分類問題的情境下,一共存在以下幾種情形:水龍頭1和水龍頭2均關(guān)閉(無漏水);水龍頭1關(guān)閉且水龍頭2打開(漏點2漏水);水龍頭1打開且水龍頭2關(guān)閉(漏點1漏水);水龍頭1和水龍頭2皆打開(漏電1和漏電2都漏水)。針對以上四種情形依次設(shè)置為標(biāo)簽0、1、2和3進行分標(biāo)簽采數(shù)。傳感器數(shù)據(jù)的采集頻率約為每3秒采集一次。
圖7 城市供水管網(wǎng)漏損預(yù)測實驗中傳感器部署設(shè)計
(1)無漏水(標(biāo)簽0)采集數(shù)據(jù)方式。保持水龍頭1和2關(guān)閉狀態(tài),3、4、5狀態(tài)隨意。每隔2分鐘安排不同的工作人員調(diào)試水龍頭3、4、5,調(diào)整方式完全主觀,既可以擰大或擰小出水速率,也可以直接選擇關(guān)閉水龍頭。數(shù)據(jù)采集兩個小時,共計收集2400組數(shù)據(jù);
(2)1號口漏水(標(biāo)簽1)采集數(shù)據(jù)方式。水龍頭的閥口可擰的最大角度為90度,以15度為每段的長度可以將漏水的程度分為6級:15度,30度,45度,60度,75度,90度。保持水龍頭2的關(guān)閉狀態(tài),水龍頭1每20分鐘由工作人員調(diào)整一次,改變漏水速率,2小時總共測六組不同的數(shù)據(jù)。在這個過程中,每隔兩分鐘同樣有工作人員來隨機打亂水龍頭3、4、5的流速和開閉狀態(tài)。該標(biāo)簽同樣收集2400組數(shù)據(jù);
(3)2號口漏水(標(biāo)簽2)采集數(shù)據(jù)方式。同1號口漏水的采集方式,只是關(guān)閉的水龍頭為1,漏水口為2,收集2小時2400組數(shù)據(jù)。
(4)1號口和2號口均漏水(標(biāo)簽3)采集方式。用兩個漏水口漏水程度進行排列組合,共存在6X6種情況。同樣安排人員每20分鐘調(diào)整一次換另一種情況,水龍頭3、4、5每兩分鐘隨機調(diào)整一次,共收集12個小時14400組數(shù)據(jù)。
數(shù)據(jù)采集后,將標(biāo)簽0、1、2的所有數(shù)據(jù)與標(biāo)簽3中均勻采樣的2400組數(shù)據(jù)組合拼成9600組實驗用數(shù)據(jù)。
通過數(shù)據(jù)梳理與驗證,傳感器上傳的數(shù)據(jù)中,QOF(瞬時流量)、ROF(瞬時流速)和PRESS(壓力)與輸出的相關(guān)性較強,另外四個參數(shù)基本不相關(guān)。此外,傳感器2、4、6、8、10由于直接部署在水龍頭處,不可作為數(shù)據(jù)特征使用。因此,最后梳理的每組的數(shù)據(jù)格式如表2所示。
數(shù)據(jù)特征x:PRESS1, ROF1, QOF1, PRESS3,ROF3, QOF3, PRESS5, ROF5, QOF5, PRESS7,ROF7, QOF7, PRESS9, ROF9, QOF9, PRESS11,ROF11, QOF11。
數(shù)據(jù)輸出y:Label(0/1/2/3)。
在該種情況下,依然可以利用分類問題下采集的數(shù)據(jù)當(dāng)作數(shù)據(jù)特征。在輸出上,與輸出分類標(biāo)簽不同的是,每組數(shù)據(jù)需要將傳感器2和傳感器4(分別檢測水龍頭1和水龍頭2處的數(shù)據(jù))的QOF 數(shù)據(jù)提取拼接成一個2維向量作為輸出。
數(shù)據(jù)特征x:PRESS1, ROF1, QOF1, PRESS3,ROF3, QOF3, PRESS5, ROF5, QOF5, PRESS7,ROF7, QOF7, PRESS9, ROF9, QOF9, PRESS11,ROF11, QOF11。
表2 城市供水管網(wǎng)漏損預(yù)測實驗中傳感器收集的數(shù)據(jù)特征及表示方法
數(shù)據(jù)輸出y:QOF2, QOF4。
結(jié)果對比見表3 預(yù)測模型預(yù)測結(jié)果對比。
為了驗證本研究設(shè)計方案的可行性,我們挑選了以下幾個傳統(tǒng)的機器學(xué)習(xí)分類和回歸方法對收集到的數(shù)據(jù)集進行測試,并將測試結(jié)果作為本次試驗的基線對比。
(1)SVM 支持向量機。
市供水城市供水支持向量機的思想主要結(jié)合了線性可分和結(jié)構(gòu)風(fēng)險最小化兩部分理論,能夠在高維空間內(nèi)有效地解決分類、回歸、異常檢測等多種問題,且由于只利用關(guān)鍵樣本構(gòu)成支持向量的邏輯,所建立的模型通常具有較好的魯棒性。
(2)決策樹(Decision Tree)與隨機森林(Ra ndom Forest)。
決策樹是一類利用信息熵與概率分析實現(xiàn)分類與回歸的有監(jiān)督預(yù)測模型,由于其采用圖解法,決策分支具有樹形結(jié)構(gòu)而得名。隨機森林是基于集成學(xué)習(xí)理論,結(jié)合多個決策樹從而提高整體的準(zhǔn)確率。隨機森林的算法優(yōu)勢在于,首先數(shù)據(jù)準(zhǔn)備階段不需要做太多的特征選擇,非常適合實驗驗證;其次訓(xùn)練速度較快,樹與樹之間的訓(xùn)練可并行化;最后從訓(xùn)練結(jié)果中可以反饋得到特征的重要性量化值。
表3 城市供水管網(wǎng)漏損預(yù)測模型預(yù)測結(jié)果對比
(3)KNN 鄰近算法。
該算法的核心思想是對于一個未知點,在其特種空間中找到與之相似度最近的k個鄰近點去推斷該點的相應(yīng)未知值。由于該算法屬于無監(jiān)督學(xué)習(xí),不需要模型訓(xùn)練,因此適合數(shù)據(jù)量較大的分類問題,能夠較快速地反饋出驗證結(jié)果。
(4)線性回歸。
使用線性模型對輸入變量和輸出變量之間的關(guān)系建模,可以最快速地對回歸問題進行驗證,該方法在關(guān)系不是非常復(fù)雜且數(shù)據(jù)量不是特別多的情況下效果較好。在本實驗中,除了效果驗證,利用線性回歸的另一個目的是因其具有較好的可理解性,可能可以從數(shù)據(jù)中抽象出一個有價值的公式來代表變量間的關(guān)系。
為了對比Attention-LSTM 模型與傳統(tǒng)模型在管網(wǎng)應(yīng)用場景下的性能表現(xiàn),我們采用ACC(準(zhǔn)確率)和 AUROC(曲線下面積)這兩個指標(biāo)來評測模型的表現(xiàn)。由表3可知,SVM 模型和Random Forest模型在傳統(tǒng)機器學(xué)習(xí)模型中表現(xiàn)出極大的優(yōu)勢,在ACC 和AUROC 指標(biāo)上都取得了第二和第三好的表現(xiàn),本研究提出的 Attention+LSTM 預(yù)測方法對比SVM、Decision Tree、Random Forest、KNN、LR模型的ACC 和AUROC 又獲得了一定的提高。實際的計算過程中,Attention+LSTM 模型因為引入了Attention 機制并且包含了時間維度,其網(wǎng)絡(luò)建模耗時相對較長,但由于漏水點識別并非一個需要實時獲得識別結(jié)果的任務(wù),實際使用中對漏水點的位置定位準(zhǔn)確性是優(yōu)先保證的,因此,我們在此不將各模型之間的微小計算時間差別計作評價指標(biāo)。
基于多傳感器融合獲取更全面的管道信息、供水狀態(tài)信息和每個管道內(nèi)的水流信息,并以此為基礎(chǔ)識別城市供水管道中的泄漏點已成為未來智慧管網(wǎng)建設(shè)的必備能力。在我們的實驗系統(tǒng)中,我們搭建了一套完整智慧管網(wǎng)平臺,包括水管管路配置的傳感器傳送流量、流速與壓力等信息至網(wǎng)關(guān),再經(jīng)由網(wǎng)關(guān)傳輸至邊緣節(jié)點伺服器實現(xiàn)模型計算與模型學(xué)習(xí)。在實驗環(huán)境下,我們應(yīng)用了 Attention+LSTM 模型實時觀察管路狀態(tài)與管路漏點,通過部署的傳感器實現(xiàn)以上需求。在實驗過程中,我們通過隨機切換漏點和出水口的位置,并隨之切換水流大小,以模擬多種漏點和不同用水量的情況,通過仿真和模擬環(huán)境驗證了模型的有效性。相對于傳統(tǒng)的機器學(xué)習(xí)模型,Attention+LSTM 模型能捕捉供水管道全天不同時間用水變化大的特點。優(yōu)秀的實驗結(jié)果證明了本研究建構(gòu)的模型的優(yōu)勢,在今后的模型優(yōu)化中我們還需要進一步考慮目標(biāo)管道周圍管道信號的相互影響。