鐘 雁,馬海漫,張 春,趙懷昕
(1.北京交通大學(xué)城市交通復(fù)雜系統(tǒng)理論與技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,高速鐵路網(wǎng)絡(luò)管理教育部工程研究中心,北京 100044;2.天津鐵路職業(yè)技術(shù)學(xué)院,天津 300240)
列車故障檢測(cè)診斷系統(tǒng)作為保證高速鐵路運(yùn)行安全可靠的基礎(chǔ)之一,國(guó)外高速鐵路的安全監(jiān)控系統(tǒng)正向系統(tǒng)化、信息化和綜合化方向發(fā)展,日本新干線、法國(guó)TGV、德國(guó)ICE等都實(shí)現(xiàn)了故障檢測(cè)診斷的微機(jī)化[1].為實(shí)現(xiàn)高效的檢修作業(yè),提出了在維修基地遠(yuǎn)程指導(dǎo)維修工作人員進(jìn)行列車的維修工作或通過(guò)專家系統(tǒng)提供維修建議[2].國(guó)內(nèi)學(xué)者應(yīng)用新的理論、方法和技術(shù)對(duì)動(dòng)車組的故障進(jìn)行探索,如將專家系統(tǒng)、小波變換、神經(jīng)網(wǎng)絡(luò)、遺傳算法等應(yīng)用于動(dòng)車組故障診斷方法的研究中[3,4].
然而,在動(dòng)車組車載信息系統(tǒng)與地面信息系統(tǒng)的信息共享方面還存在很多不足.目前,對(duì)高速鐵路的運(yùn)行安全進(jìn)行針對(duì)性的研究還不多,利用動(dòng)車組狀態(tài)數(shù)據(jù)對(duì)其維修工作的指導(dǎo)作用也不夠.隨著鐵路信息技術(shù)深入應(yīng)用,現(xiàn)已積累了在線運(yùn)行動(dòng)車組的海量運(yùn)維狀態(tài)數(shù)據(jù),如何從中挖掘出有效的信息和知識(shí),為動(dòng)車組運(yùn)營(yíng)安全、故障診斷、維修等工作提供決策支持,是一個(gè)亟待解決的問(wèn)題.
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程[5].關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的一個(gè)重要的研究領(lǐng)域,所謂關(guān)聯(lián)是指兩種或兩種以上的事務(wù)內(nèi)在的聯(lián)系[6].動(dòng)車組檢修是保障列車運(yùn)行安全的重要手段[7],把動(dòng)車組工作狀態(tài)和故障之間的關(guān)聯(lián)關(guān)系作為故障診斷的知識(shí)和規(guī)則,用于判斷當(dāng)前動(dòng)車組是否處于故障狀態(tài).本文通過(guò)挖掘這些海量的動(dòng)車組狀態(tài)數(shù)據(jù),用于動(dòng)車組的故障診斷,并指導(dǎo)其維修工作,從而保障動(dòng)車組正常的運(yùn)營(yíng)管理和動(dòng)車組健康安全的運(yùn)行狀態(tài),具有十分重要的應(yīng)用價(jià)值.
動(dòng)車組故障診斷主要是指對(duì)現(xiàn)實(shí)情況與理想情況偏差的判定,即對(duì)當(dāng)前的狀態(tài)信息予以判定,確定其是否處于正常狀態(tài).基于規(guī)則的故障診斷具有知識(shí)表述直觀、形式統(tǒng)一、易理解和解釋方便等優(yōu)點(diǎn)[8].支持度和置信度是規(guī)則的兩個(gè)興趣度度量[9],其中,支持度反映了發(fā)現(xiàn)規(guī)則的有用性,是指模式為真的任務(wù)相關(guān)的元組(或事務(wù))所占的百分比;置信度表示的是每個(gè)發(fā)現(xiàn)模式的有效性或“值得信賴性”的確定性度量.頻繁模式增長(zhǎng)算法簡(jiǎn)稱FP-tree算法,是關(guān)聯(lián)規(guī)則挖掘的經(jīng)典算法之一.它將數(shù)據(jù)壓縮到一棵頻繁模式樹(FP-樹),但保留其數(shù)據(jù)項(xiàng)集關(guān)聯(lián)信息;然后,把這種壓縮后的數(shù)據(jù)組成一組條件數(shù)據(jù)庫(kù),每個(gè)條件關(guān)聯(lián)一個(gè)頻繁項(xiàng),并分別挖掘每個(gè)數(shù)據(jù)庫(kù)[10,11].
設(shè)有事務(wù)數(shù)據(jù)庫(kù)D,F(xiàn)P-tree算法的主要過(guò)程如下:
第1步 按照Apriori[12]算法第一次掃描數(shù)據(jù)庫(kù),生成頻繁項(xiàng)(1-項(xiàng)集)的集合,通過(guò)統(tǒng)計(jì)每一個(gè)項(xiàng)的個(gè)數(shù),得到它們的支持度計(jì)數(shù),然后把它們按支持度計(jì)數(shù)的降序排列,放入表中,記作排序表L.
第2步 構(gòu)造FP-樹.
(1)創(chuàng)建樹的根節(jié)點(diǎn),用“null”標(biāo)記.
(2)再次掃描數(shù)據(jù)庫(kù),每個(gè)事務(wù)當(dāng)中的項(xiàng)按L中的次序排列(即按遞減支持度計(jì)數(shù)排序),并對(duì)每個(gè)事務(wù)創(chuàng)建一個(gè)樹的分枝.當(dāng)為一個(gè)事務(wù)考慮增加分枝時(shí),沿共同前綴上的每個(gè)節(jié)點(diǎn)的計(jì)數(shù)增加1,為其跟隨在前綴之后的項(xiàng)創(chuàng)建節(jié)點(diǎn)并鏈接.為方便樹的遍歷,創(chuàng)建一個(gè)項(xiàng)頭表,記錄相應(yīng)頻繁項(xiàng)的名稱和支持度計(jì)數(shù)并按支持度計(jì)數(shù)遞減的順序排序.
第3步 按照項(xiàng)頭表中頻繁項(xiàng)的逆序,依次以每個(gè)頻繁項(xiàng)所在節(jié)點(diǎn)開始沿樹枝向上遍歷,找到它的所有前綴路徑,即得到它的條件模式基,并形成條件模式庫(kù).
第4步 對(duì)于條件模式庫(kù)中的每個(gè)條件模式基,計(jì)算其中每個(gè)項(xiàng)的支持度計(jì)數(shù),用條件模式庫(kù)中的頻繁項(xiàng)建立條件FP-樹.
第5步 挖掘條件FP-樹.即按照L中的項(xiàng)的逆序選擇后綴項(xiàng),尋找其前綴路徑,選擇支持度計(jì)數(shù)大于最小支持度計(jì)數(shù)的路徑和后綴項(xiàng)組合生成所有的頻繁項(xiàng)集,最后得到頻繁模式庫(kù).
通過(guò)上述FP-tree算法實(shí)現(xiàn)步驟的分析,可知該算法具有如下特點(diǎn):
(1)FP-tree算法采用壓縮的結(jié)構(gòu)存儲(chǔ)數(shù)據(jù)庫(kù)中的信息,且只進(jìn)行2次數(shù)據(jù)庫(kù)掃描.由于算法中某些項(xiàng)集前綴是一樣的,F(xiàn)P-樹可以通過(guò)共享這些重疊前綴來(lái)達(dá)到壓縮保存的目的.
(2)FP-tree算法既不生成候選集[13],也不對(duì)候選項(xiàng)目集進(jìn)行測(cè)試(即支持度計(jì)數(shù)).
(3)FP-tree算法良好的成長(zhǎng)性.在生成FP-樹的過(guò)程中,并未對(duì)數(shù)據(jù)信息進(jìn)行任何刪減,而是對(duì)其進(jìn)行重新的排列,且沒有對(duì)關(guān)聯(lián)規(guī)則造成破壞,如果挖掘完又加入新數(shù)據(jù),可在這棵樹上繼續(xù)加載新的數(shù)據(jù),得到一棵更大的樹,避免了前面挖掘的重復(fù)工作,節(jié)省了計(jì)算機(jī)的開銷.
基于以上分析,雖然FP-tree算法具有較好的性能,但由于故障診斷知識(shí)要求抽取的每條規(guī)則中都必須含有故障信息,所以在動(dòng)車組狀態(tài)數(shù)據(jù)挖掘時(shí)考慮對(duì)FP-tree算法進(jìn)行改進(jìn),以達(dá)到高效地得出故障診斷規(guī)則的目的.
在動(dòng)車組上采集到的狀態(tài)數(shù)據(jù)中包含了故障信息和相關(guān)的狀態(tài)信息,包括(故障)狀態(tài)信息名稱、列車編號(hào)、車廂號(hào)、車廂類型、運(yùn)行年月、速度、運(yùn)行公里等字段.找到這些狀態(tài)信息和故障信息之間的關(guān)聯(lián)關(guān)系是動(dòng)車組故障診斷的關(guān)鍵.頻繁項(xiàng)是指某幾個(gè)事務(wù)同時(shí)發(fā)生的次數(shù)大于最小支持計(jì)數(shù)的事務(wù)的集合.要把狀態(tài)信息應(yīng)用到故障診斷中,需要尋找一些“特殊的”頻繁項(xiàng),即其所包含的事務(wù)中,既有狀態(tài)信息,又有故障信息.因?yàn)檫@些項(xiàng)是頻繁的,那么某種狀態(tài)和某些故障會(huì)“經(jīng)常”一起發(fā)生,就表明在這種狀態(tài)下,某些故障發(fā)生的概率要大一些.動(dòng)車組在實(shí)際運(yùn)行過(guò)程中,某些狀態(tài)是連續(xù)的,此時(shí)狀態(tài)A發(fā)生的次數(shù)并不是A真正發(fā)生的次數(shù),只是數(shù)據(jù)庫(kù)中記錄的次數(shù),這時(shí)考慮挖掘結(jié)果的置信度,就失去了其應(yīng)有的意義,故在尋找動(dòng)車組狀態(tài)信息和故障信息之間的關(guān)聯(lián)規(guī)則時(shí),只需考慮支持度.支持度反映了動(dòng)車組故障A與狀態(tài)B同時(shí)發(fā)生的可能性大小,支持度越大,就表明在狀態(tài)B下,故障A發(fā)生的可能性越大.當(dāng)出現(xiàn)狀態(tài)B時(shí),就應(yīng)進(jìn)行相應(yīng)的維護(hù)或檢修工作,以免動(dòng)車組發(fā)生故障A.
設(shè)有事務(wù)數(shù)據(jù)庫(kù)D,D={d1,d2,…,dk},其中d代表動(dòng)車組歷史數(shù)據(jù)中的狀態(tài)數(shù)據(jù),包括故障信息和狀態(tài)信息.故障信息={制動(dòng)及供風(fēng)系統(tǒng),牽引傳動(dòng)系統(tǒng),…}為故障信息集合,狀態(tài)信息={車廂,運(yùn)行月份,…}為狀態(tài)信息集合,顯然故障信息集合∩狀態(tài)信息集合=?.改進(jìn)算法的生成樹流程如圖1所示.
圖1 改進(jìn)的FP-tree生成樹流程Fig.1 FP-tree’s generation of improved FP-tree
結(jié)合生成樹的流程,改進(jìn)算法的具體過(guò)程如下:
(1)掃描事務(wù)數(shù)據(jù)庫(kù)D.
(2)若沒有L,則產(chǎn)生頻繁1-項(xiàng)集,得到它們的支持度計(jì)數(shù).即先把故障信息項(xiàng)以支持度遞減順序排序,再將狀態(tài)信息項(xiàng)按支持度的遞減順序排序,最后按故障信息項(xiàng)在前.狀態(tài)信息項(xiàng)在后的順序組合成排序表L.返回(1).
(3)若有L,則判定是否有根節(jié)點(diǎn).
(4)若無(wú)根節(jié)點(diǎn),則產(chǎn)生根節(jié)點(diǎn),用“null”標(biāo)記,并把掃描到的新事務(wù)di中的項(xiàng)按照L中的頻繁項(xiàng)的順序插入到樹中,創(chuàng)建一個(gè)分枝,轉(zhuǎn)(6).
(5)有根節(jié)點(diǎn),則把掃描到的新事務(wù)di中的項(xiàng)按照L中的頻繁項(xiàng)的順序插入到樹中,創(chuàng)建一個(gè)分枝,轉(zhuǎn)(6).
(6)數(shù)據(jù)庫(kù)是否掃描完畢.
(7)否,返回(1).
(8)是,生成樹結(jié)束.
(9)搜索頻繁模式.按照排序表L中項(xiàng)的逆序,以每一個(gè)狀態(tài)信息項(xiàng)為后綴項(xiàng),分別把枝上的所有節(jié)點(diǎn)和后綴項(xiàng)連接起來(lái),得到頻繁模式.
(10)計(jì)算支持度.支持度的計(jì)算公式如下:
式中Num_FaultState——表示包含動(dòng)車組故障信息A和狀態(tài)信息B的元組數(shù);
TotalNum_Tuple——表示元組總數(shù).下面以動(dòng)車組歷史數(shù)據(jù)中的部分狀態(tài)數(shù)據(jù)為例,具體說(shuō)明該算法實(shí)現(xiàn)的詳細(xì)步驟.設(shè)最小支持度計(jì)數(shù)為2,有如下故障信息和狀態(tài)信息,如表1所示.其中,G1,G2表示故障信息,其余的I1-I5表示狀態(tài)信息.
表1 故障信息舉例Table 1 Examples of fault information
(1)掃描所有數(shù)據(jù),得到頻繁1-項(xiàng)集如表2.因?yàn)镮5支持度計(jì)數(shù)為1,小于最小支持度計(jì)數(shù)2,所以頻繁1-項(xiàng)集表中刪除I5.
(2)將故障信息G1-G2排在前,狀態(tài)信息I1-I4排在后,得出按照支持度降序的排序表L如表3所示.
(3)將每個(gè)事務(wù)中的項(xiàng)插入到樹中.為方便樹遍歷,創(chuàng)建一個(gè)項(xiàng)頭表,使得每個(gè)項(xiàng)通過(guò)一個(gè)節(jié)點(diǎn)鏈指向它在樹中的出現(xiàn),掃描所有的事務(wù)之后得到的樹如圖2所示,帶有相關(guān)的鏈節(jié)點(diǎn).
表2 頻繁1-項(xiàng)集Table 2 Frequent 1-set
表3 排序表LTable 3 Sort table L
圖2 存放壓縮的頻繁模式信息的FP-樹Fig.2 The FP-tree
(4)搜索頻繁模式.首先從L中支持度最少的I4開始,其包含兩個(gè)路徑 <(G1,I2,I4:1)>和<(G2,I2,I1,I4:1)>,由于G1和G2均小于最小支持計(jì)數(shù),因此I4并未找到頻繁模式.對(duì)于I3,其包含3 個(gè)路徑 <(G1,I2,I3:1)> ,< (G1,I1,I3:1)>和 <(G2,I2,I3:1)>,因?yàn)镚2的支持度計(jì)數(shù)為2,所以僅對(duì) <(G1,I2,I3:1)> 和 <(G1,I1,I3:1)> 尋找頻繁項(xiàng),形成它們的條件模式基<(G1,I2:1)>,從<(G1,I1:1)>可知,僅含有G1這一個(gè)路徑,因此有頻繁模式<(G1,I3:2)>.其余各項(xiàng)類似,得到頻繁模式如表4所示.
表4 通過(guò)創(chuàng)建條件(子)模式基挖掘FP-樹Table 4 Search the FP-tree
由于所有的故障信息都處于FP-樹的頂層(即再往上就是根節(jié)點(diǎn)),只需在FP-樹搜索頻繁項(xiàng)的過(guò)程中,令所有的搜索都搜索到樹的頂層,這樣搜索結(jié)果就必然含有故障信息.同時(shí),由于并不需要計(jì)算相應(yīng)的置信度,在遞歸地搜索頻繁項(xiàng)時(shí),也只需搜索到頂層,即搜索整個(gè)樹枝.因此,本文將這種改進(jìn)算法定義為整枝FP-tree算法.
整枝FP-tree算法與傳統(tǒng)FP-tree算法主要有兩點(diǎn)不同:
(1)整枝FP-tree算法不是直接按照其頻繁性來(lái)排序,而是將故障信息前置,保證搜索結(jié)果都含有故障信息;
(2)遞歸地搜索頻繁模式時(shí),僅需要搜索完整的枝,不會(huì)產(chǎn)生許多較短模式的頻繁項(xiàng)(這些頻繁項(xiàng)僅含有狀態(tài)信息),從而降低了搜索及產(chǎn)生頻繁模式的計(jì)算開銷.
下面以2010年10月到2011年8月實(shí)際數(shù)據(jù)為例來(lái)說(shuō)明改進(jìn)算法在動(dòng)車組故障診斷中的應(yīng)用.該數(shù)據(jù)來(lái)源于CRH2型動(dòng)車組車載信息地面應(yīng)用管理系統(tǒng)采集到的相關(guān)部分狀態(tài)數(shù)據(jù),總共20萬(wàn)余條.分別設(shè)置最小支持度為5%、10%、15%進(jìn)行挖掘?qū)嶒?yàn),經(jīng)過(guò)比較,當(dāng)最小支持度為15%時(shí),僅可得出一條規(guī)則,最小支持度取得越高,得出的規(guī)則也越少.因此,選擇10%作為最小支持度,設(shè)置其計(jì)數(shù)為20 000時(shí),即為10%左右,可以得出數(shù)量適中且有一定參考價(jià)值的規(guī)則,其中得到的部分規(guī)則及其支持度如表5所示.
表5中的規(guī)則可為動(dòng)車組的檢修提供參考建議,輔助人工判斷是否應(yīng)該安排檢修工作.例如:對(duì)于規(guī)則“故障信息(制動(dòng)及供風(fēng)系統(tǒng)),狀態(tài)信息(2011-04)[支持度 =21.6%]”,該關(guān)聯(lián)規(guī)則知識(shí)表示故障[制動(dòng)及供風(fēng)系統(tǒng)]在[4]月份頻發(fā),支持度為21.6%,建議在4月份安排制動(dòng)及供風(fēng)系統(tǒng)的專項(xiàng)檢修工作.對(duì)于規(guī)則“故障信息(制動(dòng)及供風(fēng)系統(tǒng)),狀態(tài)信息(T1)”[支持度=14.14%],該關(guān)聯(lián)規(guī)則的知識(shí)表示故障[制動(dòng)及供風(fēng)系統(tǒng)]在[T1]車型中頻發(fā),支持度為14.14%,建議對(duì)T1車型安排專項(xiàng)檢修工作.
表5 部分存儲(chǔ)的規(guī)則Table 5 Rules in KB(part)
下面基于同樣的運(yùn)行環(huán)境和硬件配置,在數(shù)據(jù)量分別為 2、4、6…18、20萬(wàn)條情況下,分別采用FP-tree算法和整枝FP-tree算法進(jìn)行測(cè)試,兩者的運(yùn)行時(shí)間對(duì)比如圖3所示.
圖3 兩種算法時(shí)間效果圖Fig.3 Time comparison of the two algorithms
從圖3中可以看出,在數(shù)據(jù)量較小時(shí)兩種算法性能相當(dāng),F(xiàn)P-tree略快于整枝FP-tree算法;當(dāng)數(shù)據(jù)量較大時(shí),本例中是17萬(wàn)條以上,整枝FP-tree算法的時(shí)間優(yōu)勢(shì)漸漸顯現(xiàn)出來(lái),從算法計(jì)算時(shí)間趨勢(shì)上來(lái)看,數(shù)據(jù)量越大,節(jié)省的時(shí)間越多.
下面就兩者的輸出做一下對(duì)比,兩種算法的輸出結(jié)果如表6所示.
表6中,T和M代表車型,01~08代表1~8號(hào)車廂.從表6中可以看出,在同樣的運(yùn)行環(huán)境和硬件配置下,采用整枝FP-tree算法,程序運(yùn)行時(shí)間比FP-tree算法減少了9 s,效率提高了約15%.對(duì)于輸出結(jié)果,F(xiàn)P-tree中有一些僅含有狀態(tài)信息的挖掘結(jié)果,但沒有故障信息和狀態(tài)信息之間的關(guān)聯(lián),例如:“"2011-04"61 463”等(輸出框中下劃線示出),這樣無(wú)意義的輸出結(jié)果造成了一定程度的空間浪費(fèi).
在采用整枝FP-tree算法后,不僅運(yùn)行效率有了一定程度的提升,存儲(chǔ)空間消耗也有所降低.CRH2型動(dòng)車組車載信息地面應(yīng)用管理系統(tǒng)每20 s就接收一次在線運(yùn)行動(dòng)車組的狀態(tài)數(shù)據(jù),每年都會(huì)產(chǎn)生海量運(yùn)維數(shù)據(jù).隨著動(dòng)車組狀態(tài)數(shù)據(jù)的不斷積累,使用整枝FP-tree算法進(jìn)行數(shù)據(jù)挖掘的效率比FP-tree算法更高,并可及時(shí)提示動(dòng)車組的故障狀態(tài)及預(yù)警信息,因此該改進(jìn)的算法有利于動(dòng)車組的維護(hù)檢修工作和運(yùn)營(yíng)調(diào)度的管理.
表6 兩種算法輸出結(jié)果Table 6 Output of the two algorithms
本文改進(jìn)了FP-tree算法,設(shè)計(jì)并實(shí)現(xiàn)了整枝FP-tree算法,挖掘結(jié)果符合挖掘目標(biāo)的要求,能夠?yàn)閯?dòng)車組實(shí)行狀態(tài)修提供參考和建議.從運(yùn)行時(shí)間上,當(dāng)數(shù)據(jù)信息量很大時(shí),本例是大于17萬(wàn)條以后,整枝FP-tree算法有較好的時(shí)間性能,而動(dòng)車組在實(shí)際運(yùn)營(yíng)中產(chǎn)生的狀態(tài)數(shù)據(jù)已超過(guò)17萬(wàn)條,所以改進(jìn)算法可以提升數(shù)據(jù)挖掘的性能,節(jié)約時(shí)間成本.在存儲(chǔ)空間上,改進(jìn)算法也滿足故障診斷的需求,不會(huì)產(chǎn)生無(wú)意義的關(guān)聯(lián)規(guī)則,節(jié)約了數(shù)據(jù)挖掘所需的空間成本.
[1]張家棟,田宏萍.關(guān)于列車安全狀態(tài)監(jiān)測(cè)和診斷系統(tǒng)的研究[J].內(nèi)燃機(jī)車,2000(11):22-24,28.[ZHANG J D,TIAN H P.Research on safe state monitoring and diagnosis system of train[J].Diesel Locomotives,2000(11):22-24,28.]
[2]Tim Smith,Alberto Diez Oliván,Nagore Barrena,et al.Remote maintenance support in the railway industry[C].Joint Virtual Reality Conference,2011:40-46.
[3]劉晶,季海鵬.基于神經(jīng)網(wǎng)絡(luò)的關(guān)聯(lián)規(guī)則在故障診斷中的應(yīng)用[J].工業(yè)工程,2011(02):118-121.[LIU J,JI H P.Neural network-based association rules for fault diagnosis[J].Industrial Engineering Journal,2011(02):118-121.]
[4]齊金平,宋薇,李宏亮,等.基于遺傳算法的二元決策樹方法在機(jī)車當(dāng)量公里數(shù)學(xué)模型中的應(yīng)用研究[J].內(nèi)燃機(jī)車,2010(02):13-15,19.[QI J P,SONG W,LI H L,et al.Application of genetic algorithmbased binary decision tree method to mathematical model for equivalent locomotive running kilometers[J].Diesel locomotives,2010(02):13-15,19.]
[5]陳燕.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘[M].大連:大連海事大 學(xué) 出 版 社,2006:120-121.[CHEN Y.Data warehouse and data mining[M].Dalian:Dalian Maritime University Press,2006:120-121.]
[6]王晶,趙志強(qiáng).關(guān)聯(lián)規(guī)則算法的實(shí)現(xiàn)與優(yōu)化[J].實(shí)驗(yàn)技術(shù)與管理,2012,29(8):111-112.[WANG J,ZHAO Z Q.Implementation and optimization of algorithm of data mining association rules of data mining[J]. Experimental Technology and Management,2012,29(8):111-112.]
[7]張才春,陳建華,花偉.基于不同檢修能力的動(dòng)車組運(yùn)用計(jì)劃研究[J].中國(guó)鐵道科學(xué),2010,31(5):130-133.[ZHANG C C,CHEN J H,HUA W.Research on the EMU operation plan based on different maintenance capacity[J].China Railway Science,2010,31(5):130-133.]
[8]吳明強(qiáng),史慧,朱曉華,等.故障診斷專家系統(tǒng)研究的現(xiàn)狀和展望[J].計(jì)算機(jī)測(cè)量與控制,2005,13(12):1301-1304.[WU M Q,SHI H,ZHU X H,et al.Research and prospect of fault diagnosis expert system[J].Computer Measure & Control,2005,13(12):1301-1304.]
[9]J Han,J Pei,B Mortazavi-Asl,et al.Freespan:Frequent pattern-projected sequential pattern mining[C]//Proceeding ofthe Sixth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2000:355-359.
[10]H Mannila,H Toivonen,A Verkamo.Efficient algorithm for discovering association rules[C].AAAI Workshop on Knowledge Discovery in Databases,1994:181-192.
[11]蔡曉霞.關(guān)聯(lián)規(guī)則中FP-tree算法的應(yīng)用[J].福建電腦,2012,28(1):92-93.[CAI X X.Application of FP-tree algorithm in association rules[J].Fujian Computer,2012,28(1):92-93.]
[12]尹士閃,馬增強(qiáng),毛晚堆.基于頻繁項(xiàng)目集鏈?zhǔn)酱鎯?chǔ)方法的關(guān)聯(lián)規(guī)則算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2012,33(03):1002-1007.[YIN S S,MA Z Q,MAO W D.Association rule algorithm based on chain storage method of frequent itemsets[J].Computer Engineering and Design,2012,33(03):1002-1007.]
[13]宋余慶,朱玉全,孫志揮,等.基于FP-tree的最大頻繁項(xiàng)目集挖掘及更新算法[J].軟件學(xué)報(bào),2003,14(9):1586-1592.[SONG Y Q,ZHU Y Q,SUN Z H,et al.Algorithm for mining and updating maximal frequent itemsets based on FP-tree[J].Journal of Software,2003,14(9):1586-1592.]