摘要:本文全面分析了數(shù)據(jù)挖掘技術(shù)的整體概念理論,闡述了城市軌道交通信息系統(tǒng)的概念和發(fā)展態(tài)勢,總結(jié)了城市軌道交通信息系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用基礎(chǔ),從軌道交通運(yùn)行評價、客流信息數(shù)據(jù)處理和設(shè)備維修檢測三個維度研討了數(shù)據(jù)挖掘技術(shù)在城市軌道交通信息系統(tǒng)中的具體應(yīng)用。
關(guān)鍵詞:數(shù)據(jù)挖掘;城市軌道交通;信息系統(tǒng)
引言
城市軌道交通線路新增和客流上漲,對城市軌道交通信息系統(tǒng)的智能化、自動化以及全面化發(fā)展提出了更高要求。數(shù)據(jù)挖掘技術(shù)是現(xiàn)階段基于數(shù)據(jù)庫管理系統(tǒng)的新興的網(wǎng)絡(luò)信息技術(shù),隨著網(wǎng)絡(luò)信息技術(shù)的不斷成熟和發(fā)展,數(shù)據(jù)挖掘技術(shù)與計算機(jī)技術(shù)、數(shù)據(jù)庫技術(shù)、機(jī)器學(xué)習(xí)、統(tǒng)計學(xué)管理、模式識別等進(jìn)行了深入廣泛的融合。這就保證了數(shù)據(jù)挖掘技術(shù)在大數(shù)據(jù)信息管理、信息分析、信息提取以及事務(wù)管理中重要作用的發(fā)揮,有效解決了數(shù)據(jù)管理中復(fù)雜性和多樣性引發(fā)的管理困難和障礙。
1. 數(shù)據(jù)挖掘技術(shù)的整體概念理論
1.1 數(shù)據(jù)挖掘技術(shù)的基本概念
數(shù)據(jù)挖掘技術(shù)是基于信息技術(shù)、網(wǎng)絡(luò)技術(shù)、多媒體技術(shù)、大數(shù)據(jù)技術(shù)等應(yīng)運(yùn)而生的一種新型技術(shù)手段。具體來說,數(shù)據(jù)挖掘技術(shù)是指在體量較大、數(shù)據(jù)信息不完備、數(shù)據(jù)信息隨機(jī)的數(shù)據(jù)“庫”中進(jìn)行甄別、篩選、識別,并獲取有用的數(shù)據(jù)信息或者資料信息[1]。因?yàn)槌浞纸Y(jié)合了大數(shù)據(jù)技術(shù)、網(wǎng)絡(luò)技術(shù)、信息技術(shù)等,所以數(shù)據(jù)挖掘技術(shù)自身具有廣泛性、多元性的特征,還將數(shù)據(jù)資料統(tǒng)計、模式判定技術(shù)、模糊數(shù)學(xué)、神經(jīng)網(wǎng)絡(luò)等融合其中,所以其本質(zhì)屬于多樣化技術(shù)、多元化學(xué)科交叉而生成的一項(xiàng)技術(shù)[2]。
1.2 數(shù)據(jù)挖掘技術(shù)的具體劃分
根據(jù)數(shù)據(jù)挖掘技術(shù)的技術(shù)核心和組成,現(xiàn)階段數(shù)據(jù)挖掘技術(shù)的類別主要從四個維度進(jìn)行劃分,即統(tǒng)計學(xué)理念、神經(jīng)網(wǎng)絡(luò)理論、數(shù)據(jù)資料庫、人機(jī)交互。從統(tǒng)計學(xué)理念來看,數(shù)據(jù)挖掘技術(shù)又包含了判定解析、遺傳算法等內(nèi)容;神經(jīng)網(wǎng)絡(luò)理論又將數(shù)據(jù)挖掘技術(shù)解構(gòu)為競爭學(xué)習(xí)、自主神經(jīng)網(wǎng)絡(luò)等;數(shù)據(jù)庫資料往往需要對數(shù)據(jù)挖掘技術(shù)過程進(jìn)行全方位多角度的數(shù)據(jù)信息解析,且保證數(shù)據(jù)信息的可視化;人機(jī)交互主要針對的是機(jī)器學(xué)習(xí)實(shí)現(xiàn)數(shù)據(jù)挖掘。
因此,隨著我國城市軌道交通的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)能夠在城市軌道交通信息系統(tǒng)中產(chǎn)生重要價值,對軌道交通通信、軌道交通網(wǎng)絡(luò)管理、軌道交通運(yùn)行數(shù)據(jù)管理、軌道交通檢票系統(tǒng)等都能實(shí)現(xiàn)操作,提高城市軌道交通信息系統(tǒng)中信息流動的速率[3]。比如,依托數(shù)據(jù)挖掘技術(shù),城市軌道交通信息系統(tǒng)能有針對性地進(jìn)行乘客資料歸納整理、出行高峰時間判斷、列車運(yùn)行時間規(guī)劃等,幫助城市軌道交通進(jìn)行可視化管理。此外,傳統(tǒng)城市軌道交通信息系統(tǒng)中,數(shù)據(jù)資料或者數(shù)據(jù)結(jié)果往往會受到一些突發(fā)情況的干擾,如果出現(xiàn)突發(fā)情況影響運(yùn)行數(shù)據(jù),信息系統(tǒng)就會出現(xiàn)誤差。依托數(shù)據(jù)挖掘技術(shù),有效規(guī)避了突發(fā)情況的信息干擾和數(shù)據(jù)異常干擾情況,提高了城市軌道交通信息系統(tǒng)運(yùn)營的客觀性和穩(wěn)定性[4]。
1.3 數(shù)據(jù)挖掘技術(shù)的應(yīng)用價值
1.3.1 乘客信息管理
對于城市軌道交通信息系統(tǒng)而言,不僅承擔(dān)了軌道交通規(guī)劃、軌道交通運(yùn)行的主要任務(wù),還在乘客信息管理、票務(wù)資料管理方面有著重要價值。所以,數(shù)據(jù)挖掘技術(shù)在城市軌道交通信息系統(tǒng)中的運(yùn)用,首先可以進(jìn)行乘客數(shù)據(jù)資料的細(xì)致化管理和有效管控,針對乘客的出行習(xí)慣、出行時間、出行偏好、出行支付方式等進(jìn)行數(shù)據(jù)挖掘和數(shù)學(xué)分析,進(jìn)而為城市軌道交通的運(yùn)營提供支持[5]。這樣,依托乘客信息挖掘、乘客信息分析,城市軌道交通信息系統(tǒng)就能通過信號系統(tǒng)、列車管理系統(tǒng)等調(diào)整列車班次和發(fā)車時間,發(fā)揮價值。
1.3.2 解析運(yùn)營消耗情況
城市軌道交通屬于公共資源、公共服務(wù),其運(yùn)營消耗與運(yùn)營時間、通勤頻率、功能比例、乘客數(shù)量等有著密切關(guān)系。所以,依托數(shù)據(jù)挖掘技術(shù)中的分類解析、回歸解析,可以搭建城市軌道交通的運(yùn)營消耗情況預(yù)測模型。根據(jù)乘客通勤時間、乘客通勤數(shù)量、列車損耗情況等因素規(guī)律,以城市軌道交通整體運(yùn)營時間作為函數(shù),就可以通過數(shù)據(jù)挖掘技術(shù)和時間排序預(yù)測城市軌道交通系統(tǒng)的運(yùn)營消耗情況,為列車安全管理、軌道交通基建管理等提供數(shù)據(jù)支撐[6]。
1.3.3 檔案信息數(shù)據(jù)的管理
對于城市軌道交通信息系統(tǒng),檔案信息數(shù)據(jù)的管理是其智能化、數(shù)據(jù)化、自動化運(yùn)營的關(guān)鍵和核心,也是軌道交通安全運(yùn)維評價的基礎(chǔ)。所以,基于數(shù)據(jù)挖掘技術(shù)實(shí)施城市軌道交通信息系統(tǒng)的檔案信息數(shù)據(jù)管理具有重要價值。具體來說,數(shù)據(jù)挖掘技術(shù)可以根據(jù)城市軌道交通信息系統(tǒng)中的數(shù)據(jù)資料進(jìn)行數(shù)據(jù)分析、數(shù)據(jù)歸類、數(shù)據(jù)傳遞、數(shù)據(jù)甄別和數(shù)據(jù)管理,并以此建立數(shù)據(jù)管理模型。在數(shù)據(jù)搜集過程中,可以依托數(shù)據(jù)管理模型的邏輯架構(gòu)、管理語言、信息語言等整體解析城市軌道交通信息系統(tǒng)中出現(xiàn)的數(shù)據(jù),再根據(jù)數(shù)據(jù)特征進(jìn)行分類篩選和分類管理[7]。
2. 城市軌道交通信息系統(tǒng)的概念和發(fā)展結(jié)構(gòu)
城市軌道交通信息系統(tǒng)是基于控制技術(shù)、通信技術(shù)、網(wǎng)絡(luò)技術(shù)和計算機(jī)技術(shù)發(fā)展并成熟起來的,具備自動化、智能化和數(shù)據(jù)化的特征。具體來說,城市軌道交通系統(tǒng)主要由信號系統(tǒng)、通信系統(tǒng)、自動化檢票系統(tǒng)、乘客信息管理系統(tǒng)、綜合安全系統(tǒng)以及監(jiān)控系統(tǒng)組成。所以,城市軌道交通信息系統(tǒng)是交通信息的多角度全方位呈現(xiàn),也是交通綜合管理的數(shù)據(jù)信息平臺[8]。城市軌道交通信息系統(tǒng)的發(fā)展不是一蹴而就的,它是一個循序漸進(jìn)的過程,更是與軌道交通基礎(chǔ)建設(shè)、軌道交通綜合服務(wù)、軌道交通基礎(chǔ)業(yè)務(wù)相匹配的共同發(fā)展。所以,城市軌道交通信息系統(tǒng)的發(fā)展首先需要強(qiáng)化現(xiàn)有信息系統(tǒng)在運(yùn)維安全、物資保障等方面的推動,其次需要升級信息化管理、智能化管理、數(shù)據(jù)化管理水平,匹配新的軌道交通發(fā)展要求和網(wǎng)絡(luò)信息發(fā)展要求等。
3. 數(shù)據(jù)挖掘技術(shù)在城市軌道交通信息系統(tǒng)中的應(yīng)用基礎(chǔ)和應(yīng)用要求
3.1 數(shù)據(jù)挖掘技術(shù)在城市軌道交通信息系統(tǒng)中的應(yīng)用基礎(chǔ)
數(shù)據(jù)挖掘技術(shù)在城市軌道交通信息系統(tǒng)中的應(yīng)用主要是依托于“Hadoop”分布式架構(gòu)進(jìn)行系統(tǒng)更新和平臺設(shè)計。相比其他架構(gòu)和平臺,“Hadoop”平臺的計算能力更快、擴(kuò)展性更好、計算方式更便捷[9]。其中,“MapReduce”和“HDFS文件系統(tǒng)”是并行于計算機(jī)接口的核心部分架構(gòu),“MapReduce”主要提供數(shù)據(jù)錄入、數(shù)據(jù)搜集支持,“HDFS文件系統(tǒng)”提供底層數(shù)據(jù)的儲存支持。所以,針對城市軌道交通信息系統(tǒng)中信息量大、信息種類龐雜多樣的特點(diǎn),基于“Hadoop”框架構(gòu)建的城市軌道交通數(shù)據(jù)挖掘平臺是具有可行性的[10]。
3.2 數(shù)據(jù)挖掘技術(shù)在城市軌道交通信息系統(tǒng)中的應(yīng)用要求
3.2.1 可讀性和維護(hù)性要求
數(shù)據(jù)挖掘技術(shù)在城市軌道交通信息系統(tǒng)中的應(yīng)用,需要貼合城市軌道交通信息系統(tǒng)的實(shí)際情況,根據(jù)涉及列車運(yùn)行情況、運(yùn)力分布情況、乘客承載情況等,搭載相對應(yīng)匹配的數(shù)據(jù)挖掘技術(shù),進(jìn)而實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)應(yīng)用和城市軌道交通信息系統(tǒng)的有機(jī)融合,確保在城市軌道交通信息系統(tǒng)的運(yùn)行過程中數(shù)據(jù)使用和運(yùn)行方便,且數(shù)據(jù)具備可讀性和可維護(hù)性[11]。依托于數(shù)據(jù)庫應(yīng)用的可讀性和維護(hù)性,城市軌道交通信息系統(tǒng)還可以輔助實(shí)現(xiàn)系統(tǒng)管理的簡化,提升系統(tǒng)運(yùn)行的整體質(zhì)量。
3.2.2 穩(wěn)定性和安全性要求
現(xiàn)階段城市軌道交通信息系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用基本成熟,加之大部分城市軌道交通信息系統(tǒng)的數(shù)據(jù)構(gòu)造和信息庫設(shè)計相對簡單,運(yùn)行和操作也相對比較簡單,便于開展日常維護(hù)和拓展。為了確保城市軌道交通信息系統(tǒng)的順利運(yùn)行,數(shù)據(jù)挖掘技術(shù)在城市軌道交通信息系統(tǒng)中的應(yīng)用也要滿足自動化運(yùn)行和智能化運(yùn)營,且保證數(shù)據(jù)挖掘技術(shù)自身內(nèi)部具有一定的冗余設(shè)置和糾錯能力,進(jìn)而保證城市軌道交通信息系統(tǒng)的穩(wěn)定和安全。這樣,城市軌道交通信息系統(tǒng)的運(yùn)行過程才能符合要求,促進(jìn)各項(xiàng)信息數(shù)據(jù)能夠系統(tǒng)化管理,確保城市軌道交通順暢運(yùn)行[12]。
3.2.3 自動化和大容量要求
數(shù)據(jù)挖掘技術(shù)在城市軌道交通信息系統(tǒng)中的應(yīng)用是基于該系統(tǒng)工作流程的,且與系統(tǒng)的設(shè)置完全吻合,能適配系統(tǒng)中運(yùn)行評估、客流數(shù)據(jù)分析、運(yùn)維數(shù)據(jù)分析的具體要求。因此,城市軌道交通信息系統(tǒng)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用還需要滿足自動化和大容量要求。當(dāng)數(shù)據(jù)庫需要存儲和傳輸大量數(shù)據(jù)的情況下,如果提取部分?jǐn)?shù)據(jù)信息,那么最佳的解決方法是通過臨時數(shù)據(jù)挖掘技術(shù)進(jìn)行數(shù)據(jù)調(diào)度。此外,城市軌道交通信息系統(tǒng)涉及多臺服務(wù)器運(yùn)行,每個服務(wù)器都會產(chǎn)生許多臨時文件和工作日志,數(shù)據(jù)挖掘技術(shù)可以對服務(wù)器進(jìn)行分類,后續(xù)再進(jìn)行詳細(xì)分析。
4. 數(shù)據(jù)挖掘技術(shù)在城市軌道交通信息系統(tǒng)中的應(yīng)用策略
4.1 軌道交通運(yùn)行評價中的運(yùn)用
城市軌道交通中列車運(yùn)行的安全性、平穩(wěn)性、舒適性、時效性等構(gòu)建了城市軌道交通運(yùn)行評價的指標(biāo)體系。因此,構(gòu)建基于數(shù)據(jù)挖掘的軌道交通運(yùn)行評價平臺具有重要意義?;跀?shù)據(jù)挖掘技術(shù)的城市軌道交通信息系統(tǒng)所呈現(xiàn)出的數(shù)據(jù)內(nèi)容是城市軌道交通信息化管理和列車安全運(yùn)維的數(shù)據(jù)基礎(chǔ)體系和參考指標(biāo)。這樣,列車運(yùn)營過程中的安全性、時效性、舒適性有了數(shù)據(jù)支持,整個評價過程有了相對應(yīng)的標(biāo)準(zhǔn)。
4.2 客流信息數(shù)據(jù)處理中的運(yùn)用
城市軌道交通中的客流量往往伴隨著通勤時間、天氣狀況等條件進(jìn)行變化,這使得客流信息數(shù)據(jù)具有動態(tài)化的特征,這就給軌道交通客流信息數(shù)據(jù)處理帶來不穩(wěn)定和隨機(jī)性的難題。比如,某個城市在開展大型文藝活動或者體育賽事,極易造成客流變化,主要體現(xiàn)在早晚高峰、城市區(qū)域等客流差異上??土餍畔?shù)據(jù)處理難度的增加,給客流峰值預(yù)估造成偏差,影響城市軌道交通運(yùn)行的效率。城市軌道交通信息系統(tǒng)中的自動化檢票系統(tǒng)可以將不同乘客在不同時間、不同地點(diǎn)乘坐城市軌道交通列車的信息呈現(xiàn)出來,這是運(yùn)營人員進(jìn)行數(shù)據(jù)判斷的基礎(chǔ)。在客流信息數(shù)據(jù)處理中,“Hadoop”可以通過統(tǒng)計學(xué)分析、模擬識別等將乘客的出行偏好、出行情況模擬分析出來,并構(gòu)建乘客的出行習(xí)慣。這樣,依托于數(shù)據(jù)挖掘技術(shù),通過數(shù)據(jù)內(nèi)部規(guī)律分析,運(yùn)營人員就能獲取較為精準(zhǔn)的客流數(shù)據(jù)變化。
4.3 設(shè)備檢測維修中的運(yùn)用
城市軌道交通信息系統(tǒng)依靠的設(shè)施設(shè)備多,通過數(shù)據(jù)挖掘構(gòu)建的海量信息系統(tǒng)設(shè)備數(shù)據(jù)信息,可以將諸如網(wǎng)關(guān)設(shè)備、路由設(shè)備、數(shù)據(jù)存儲設(shè)備等的型號、故障數(shù)據(jù)、維修數(shù)據(jù)、預(yù)警數(shù)據(jù)等與軌道信息系統(tǒng)聯(lián)系起來。一旦某個設(shè)備即將出現(xiàn)問題時,數(shù)據(jù)挖掘技術(shù)將會通過故障代碼、故障原因、故障記錄時間、故障預(yù)警數(shù)據(jù)等反映出設(shè)備檢測維修的特點(diǎn),并開啟人工維修通知和設(shè)備關(guān)停預(yù)警。比如,通過“Hive數(shù)據(jù)倉庫”搭建城市軌道交通信息系統(tǒng)中的信號設(shè)備、網(wǎng)絡(luò)設(shè)備的維修指標(biāo)數(shù)據(jù)庫,通過數(shù)據(jù)庫將檢測信號設(shè)備、網(wǎng)絡(luò)設(shè)備等相關(guān)設(shè)備的工作時間、工作狀態(tài)、工作效率等反饋出來,一旦某個設(shè)備即將出現(xiàn)問題,數(shù)據(jù)挖掘技術(shù)將會按照“原始數(shù)據(jù)處理—數(shù)據(jù)庫篩選—數(shù)據(jù)值梳理—算法分析—預(yù)處理(維修)結(jié)果分析”的流程,引導(dǎo)工作人員進(jìn)行提前預(yù)防性處理,真正實(shí)現(xiàn)了設(shè)備的狀態(tài)維修。
結(jié)語
數(shù)據(jù)挖掘技術(shù)在城市軌道交通信息系統(tǒng)中的運(yùn)用,順應(yīng)了我國當(dāng)下城市軌道交通發(fā)展迅猛的趨勢,有效優(yōu)化了城市軌道交通信息系統(tǒng)運(yùn)維緩慢和運(yùn)維過程極易出現(xiàn)的問題。同時,數(shù)據(jù)挖掘也提升了城市軌道交通信息系統(tǒng)的數(shù)據(jù)管理水平、數(shù)據(jù)分析能力,推動了城市軌道交通信息系統(tǒng)的發(fā)展,提升了城市軌道交通的運(yùn)營維護(hù)水平和安全保障水平。因此,結(jié)合數(shù)據(jù)挖掘技術(shù)特點(diǎn),依托城市軌道交通網(wǎng)絡(luò)運(yùn)營的要求實(shí)現(xiàn)數(shù)據(jù)挖掘的應(yīng)用,是當(dāng)下城市軌道交通信息系統(tǒng)發(fā)展和軌道交通建設(shè)規(guī)劃的新方向。
參考文獻(xiàn):
[1]王瑋,龐婷婷.基于數(shù)據(jù)挖掘的城市軌道交通信息安全檢測[J].微型電腦應(yīng)用, 2022,38(2):113-115.
[2]宋大治,張浩,徐鐘全,等.基于MPP和Hadoop的城市軌道交通線網(wǎng)指揮平臺設(shè)計[J].鐵路通信信號工程技術(shù),2021, 18(8):47-53.
[3]魏萬旭,方勇,胡華,等.基于視頻數(shù)據(jù)挖掘的城市軌道交通車站行人交通行為特征提取系統(tǒng)研究[J].鐵道運(yùn)輸與經(jīng)濟(jì),2021,43(8):119-125.
[4]陶雨濛,王亮軍,衛(wèi)妍.城市軌道交通信號設(shè)備智能運(yùn)維系統(tǒng)設(shè)計[J].中國新技術(shù)新產(chǎn)品,2021,(15):25-27.
[5]李文鋒,閆濤.改進(jìn)的Apriori算法在集中告警系統(tǒng)中的應(yīng)用研究[J].金陵科技學(xué)院學(xué)報,2021,37(2):7-11,32.
[6]楊培盛,侯飛,李俊偉,等.軌道車輛空調(diào)智能運(yùn)維系統(tǒng)在濟(jì)南地鐵線路上的應(yīng)用研究[J].制冷與空調(diào),2021,21(8):54-58.
[7]楊愷鶴,丁小兵,劉志鋼,等.城市軌道交通客流時段OD對挖掘及快慢車停站方案確定算法研究[J].智能計算機(jī)與應(yīng)用,2021,11(4):39-43,48.
[8]高明亮,高珊,于闖,等.融合RCM、PHM和數(shù)據(jù)挖掘的城市軌道交通車輛維護(hù)決策技術(shù)研究[J].城市軌道交通研究,2021,24(2):64-68.
[9]向紅艷,袁發(fā)濤.基于自動售檢票數(shù)據(jù)的軌道車站客流識別模型[J].科學(xué)技術(shù)與工程,2021,21(4):1568-1573.
[10]馬旭,尹航.智慧城市軌道交通運(yùn)營管理信息化建設(shè)研究[J].交通世界,2020,(33):112-113.
[11]張婷曼,丁凰.依賴不確定性關(guān)聯(lián)規(guī)則的城市交通流大數(shù)據(jù)挖掘[J].國外電子測量技術(shù),2020,39(11):39-45.
[12]王亮軍,陳燕飛,陶雨濛,等.城市軌道交通列車司機(jī)駕駛狀態(tài)監(jiān)測系統(tǒng)設(shè)計[J].鐵道通信信號,2020,56(10):79-82.
作者簡介:趙俊,本科,副高級工程師,研究方向:云數(shù)據(jù)中心搭建、數(shù)據(jù)挖掘、軌道交通及運(yùn)營商行業(yè)信息化系統(tǒng)。