Tom Macaulay Charles
數據科學家正在分析列車和基礎設施故障,以支持預測性維護.
倫敦交通局(TfL,Transport for London)正在利用數據科學找出倫敦地鐵列車和基礎設施中斷的原因,并預測這些故障什么時候會出現,從而提高服務質量。
為幫助倫敦交通局實現“讓倫敦跑起來”的宣傳口號,所有列車、車站、信號、軌道和自動扶梯每天都要投入運營。其中任何一個出現小問題都有可能導致大的中斷。
為提高其可靠性并降低維護成本,一個由三個數據科學家組成的團隊以及可靠性分析人員小組一直在研究故障原因,怎樣減少故障。
他們正在研究預測性維護怎樣降低成本,改進服務。目前在中心線路上正在進行的一個項目分析地鐵事件,以預測發(fā)動機什么時候會出現故障。
倫敦交通局的數據科學家Akis Tsiotsios在一次人工智能大會上解釋說:“預計每年能節(jié)約300萬英鎊,這極其重要,因為這類故障成本非常高,已經采取了很多計劃維護措施,以防止發(fā)生故障?!?/p>
老地鐵繼續(xù)運行
1863年在帕丁頓(Paddington)和法靈頓街(Farringdon Street)之間開通了世界上的第一條地鐵,現在它已成為環(huán)線、中心線、漢默史密斯線和城市線的一部分。
它仍然是世界上最繁忙的地鐵網絡之一。每天早上,538趟列車運行在270個車站之間,預計該網絡今年將運送14億人次,覆蓋8600萬公里,相當于110次往返月球。
需要定期維護維多利亞時代的基礎設施和老化的車廂,以避免停運。
大概一半的延誤是由倫敦交通局資產問題引起的,其維護成本占總預算的59%。
外部因素也會導致服務中斷。在一個數據科學項目中,倫敦交通局通過找出故障與溫度、濕度和降雨之間的關系,研究了天氣條件怎樣影響列車編組的可靠性。
研究小組考慮了一個匯合了所有系統(tǒng)的失敗概率模型,但決定應該有更強大的選項來確定單個子系統(tǒng)組件是否更容易出現故障。
分析結果產生了熱圖,顯示每一因素對每一系統(tǒng)和組件的影響。
發(fā)現高溫是導致故障的主要原因。低溫也有顯著的影響。
研究人員將這些反饋給相關方,幫助他們圍繞維護和更新做出決策。
他們的最終目的是查明導致所有資產故障的原因,以便進行預防性維護。
選擇最佳數據分析模型
為了了解故障的原因,研究小組研究了倫敦交通局資產、故障、維護、服務操作和天氣等外部問題的數據集。故障發(fā)生的因素包括溫度、出發(fā)地點、使用率和維修率。
他們分析了每一因素對故障率的影響,基于故障發(fā)生頻率的影響程度,以及與故障相關的成本。
Tsiotsios說:“這樣使我們能夠大概了解不同因素的影響,對其進行對比以便知道應采取什么措施來進行緩解?!?/p>
其難點包括信息孤島、數據丟失、由于倫敦交通局不斷更新其資產而導致時間受限,以及故障出現頻率較低而使得數據比較稀疏,等等。
倫敦交通局是非常依賴于安全關鍵應用的大企業(yè),因此數據科學團隊需要與不同的部門合作,實施有效的時間表。
Tsiotsios說:“我們想讓相關方盡可能的參與進來,因為這些項目每一個都涉及很多不同的部門,我們對工作人員的期望以及我們要努力實現的目標都有一些時間要求。”
工作人員采取的維修決策應盡可能減少故障和維護成本。
他們可以根據里程或者運行時間進行維護,但這可能最終會因為過度維護資產而浪費資金,也有可能因維護不足而導致出現太多的故障。
數據科學家認為更好的選擇是分析歷史故障和維護數據,以確定故障概率。這樣他們才能查明可能的原因。
然后,他們可以評估故障成本,確定有多少是可以接受的,設置固定的維護頻率。
這種選擇是一個進步,但仍然不是最佳的,因為有一些故障是不可避免的,而很多故障則可以通過維護來避免。
Tsiotsios說:“我們要做的是,在某一資產即將出現故障之前,獨立地維護每一項資產。
“我們討論的是預測性維護,這里的問題是當某一類系統(tǒng)要出現故障時,我們怎樣才能預測出來?!?/p>
倫敦交通局的預測性維護
倫敦交通局通過分析已經收集的遠程狀態(tài)監(jiān)測數據,進行預測性維護。
倫敦交通局某些資產上的傳感器不斷監(jiān)測基本狀態(tài),確認軌道上發(fā)生的事件。
有成百上千的這類事件,從車門關閉到列車以一定速度經過等。
例如,如果車門出現故障,那么故障出現前就會有相應的征兆。
Tsiotsios說:“這里的想法是,出現故障之前的事件模式應該反映這些征兆。
“換句話說,故障前的事件模式應該與正常或者健康運行的事件模式有明顯的不同?!?/p>
為了對所有這些數據進行建模,他們開發(fā)了一個機器學習分類器,可以區(qū)分這些不同的模式。
然后,算法可以評估在前幾天或者幾小時內發(fā)生的事件的模式,然后預測是否會發(fā)生故障。
機器學習模型被應用于數據,以預測是否會發(fā)生故障,預計將出現故障的資產很快就會出現在工程師的顯示屏上。在出現故障之前,就會把有問題的資產從服務中撤出并進行維護。
倫敦交通局的數據科學項目
倫敦交通局正在進行一些數據分析實驗以改進地鐵服務,包括上述的中心線路項目。
這使用了每天從制造商狀態(tài)監(jiān)控系統(tǒng)下載到服務器上的數據。然后算法評估過去五天里的事件模式,預測第二天是否會出現故障。
他們還在維多利亞線路上進行了概念驗證,通過異常檢測來預測車門故障,還有一些其他項目來分析傳感器產生的信號,持續(xù)監(jiān)測性能。
另一個數據科學項目則支持倫敦交通局開展監(jiān)測并改進其數據質量的工作。
很多倫敦交通局的數據都有錯誤,或者丟失了信息。數據科學小組正在使用自由文本字段,工程師利用這些字段輸入關于故障征兆的詳細信息,以及為解決問題所采取的行動,訓練機器學習分類器,這些分類器分析文本中的模式以預測哪些組件會出現故障。
到目前為止,該算法在識別組件時已被證明正確率達到75%。
任何被標記的組件都會由專家進行檢查。
Tsiotsios說:“我們的目標不是建立一款自動為我們填充數據的機器學習工具。我們不想用一個也會出錯的工具來代替我們工程師的專業(yè)知識。
“我們想開發(fā)一款質量保證工具來監(jiān)控數據質量,以便自動檢測什么時候記錄了錯誤的數據,并建立一個過程,在此過程中我們會向輸入團隊提供反饋,這樣,將來會變得越來越好?!?/p>