鄭曉峰 王曙
(華南理工大學(xué)土木與交通學(xué)院,廣東廣州510640)
我國的道路交通運輸發(fā)達(dá),占綜合運輸?shù)?5%以上.針對道路交通運輸管理復(fù)雜的特點,近年來各省級道路運輸管理機構(gòu)積極開發(fā)和實施道路運輸管理信息系統(tǒng),用科技的手段去規(guī)范管理、提供便民服務(wù).道路運輸企業(yè)的質(zhì)量信譽考核和道路運輸車輛準(zhǔn)入核查作為道路運輸管理的兩項主要措施,所遇到的數(shù)據(jù)挖掘問題在整個道路運輸管理信息數(shù)據(jù)挖掘研究中具有普適性與代表性.數(shù)據(jù)挖掘[1]過程又稱知識發(fā)現(xiàn)過程,1989年在國際會議IJCAI(International Joint Conference on Artificial Intelligence)上被首次提出,經(jīng)過20多年的發(fā)展,目前已成為數(shù)據(jù)庫領(lǐng)域的熱門學(xué)科,其理論研究和實際應(yīng)用均取得了豐碩的成果,在交通運輸領(lǐng)域的數(shù)據(jù)挖掘研究成果主要有:運用聚類分析方法研究車輛衛(wèi)星定位數(shù)據(jù)挖掘[2-3],運用關(guān)聯(lián)規(guī)則方法分析交通事故原因[4-5],運用時空數(shù)據(jù)挖掘、關(guān)聯(lián)規(guī)則等方法研究交通規(guī)劃[6-7],綜合運用分類、聚類和關(guān)聯(lián)規(guī)則等數(shù)據(jù)挖掘方法研究交通流控制[8-9].但截至目前,關(guān)于海量道路運輸管理信息數(shù)據(jù)挖掘方法的研究鮮見報道.
數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中一類可被發(fā)現(xiàn)的重要知識,若兩個或多個變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián).道路運輸管理所需的決策分析信息大部分涉及關(guān)聯(lián)問題.關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘自Agrawal等[10]提出后已被廣泛研究,其傳統(tǒng)算法Apriori也在原有基礎(chǔ)上不斷得到優(yōu)化[11],但是目前仍然存在許多用算法不能解決的問題,例如因數(shù)據(jù)庫的決策目標(biāo)和關(guān)聯(lián)屬性未規(guī)劃清楚而造成的龐大的關(guān)聯(lián)規(guī)則挖掘的運算量,由于支持度和置信度等參數(shù)設(shè)置不適當(dāng)而產(chǎn)生的大量無用規(guī)則等.因此,準(zhǔn)確地規(guī)劃挖掘目標(biāo),做好數(shù)據(jù)的約簡等預(yù)處理和合適地配置參數(shù)對關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘來說意義重大.近年來,關(guān)聯(lián)規(guī)則方法在交通運輸領(lǐng)域的最新應(yīng)用研究成果集中在對時空數(shù)據(jù)的挖掘上[[4-7,12].這些成果所應(yīng)用到的數(shù)據(jù)本身具備明顯的時間序列性質(zhì),而道路運輸管理信息多是無序的非結(jié)構(gòu)化數(shù)據(jù),挖掘其規(guī)律性規(guī)則難度更大,挖掘過程中會遇到更多的上述問題,因此探索關(guān)聯(lián)規(guī)則在道路運輸管理數(shù)據(jù)上的新的應(yīng)用思路和方法具有重要的現(xiàn)實意義.
粗糙集理論是Pawlak[13]于1982年提出的一種數(shù)據(jù)挖掘工具.它的基本思想是通過關(guān)系數(shù)據(jù)庫分類歸納形成概念和規(guī)則,通過等價關(guān)系的分類以及分類對于目標(biāo)的近似來發(fā)現(xiàn)知識.粗糙集能夠支持知識獲取的多個步驟(如數(shù)據(jù)預(yù)處理、數(shù)據(jù)約簡、規(guī)則生成和依賴關(guān)系獲取等),而無需提供所需處理的數(shù)據(jù)集合之外的任何先驗信息,所以對問題不確定性的描述或處理可以說是比較客觀的[14].道路運輸管理信息多為不一致、不精確和不完整的數(shù)據(jù),而且其數(shù)據(jù)挖掘的目的多為決策分析類型,因此粗糙集分析方法適用于此類信息的數(shù)據(jù)挖掘.粗糙集理論發(fā)展30多年來,在理論研究和應(yīng)用研究方面均取得了大量代表性成果[14-15],但有關(guān)粗糙集方法應(yīng)用于道路運輸管理信息數(shù)據(jù)挖掘的研究在國內(nèi)外卻鮮見報道.
針對道路運輸管理信息數(shù)據(jù)的特點,文中利用粗糙集屬性約簡方法,研究關(guān)聯(lián)規(guī)則傳統(tǒng)理論與粗糙集理論的結(jié)合問題,提出粗糙集分析與經(jīng)典關(guān)聯(lián)規(guī)則相結(jié)合的數(shù)據(jù)挖掘方法,利用粗糙集方法分析規(guī)則條數(shù)與支持度、置信度之間的關(guān)系,并針對質(zhì)量信譽考核問題驗證了粗糙集分析和關(guān)聯(lián)規(guī)則的綜合方法,研究了屬性約簡方法在道路運輸車輛準(zhǔn)入核查中的應(yīng)用.
設(shè)I={I1,I2,…,Im}是文字屬性,稱為項.給定一個事務(wù)數(shù)據(jù)庫D,D={t1,t2,…,tn}.其中每個事務(wù)ti(i=1,2,…,n)都對應(yīng)I的一個子集,滿足tn?I.每一個事務(wù)都有一個標(biāo)識符TID.如果項集α?I、β?I,并且α∩β=?,則形如式(1)的蘊涵式稱為關(guān)聯(lián)規(guī)則:
如果D中有s的事務(wù)包含α∪β(其中s=D中包含α∪β的事務(wù)個數(shù)/D中所有事務(wù)個數(shù) × 100%),那么規(guī)則α?β的支持度為s,其計算表達(dá)式為
如果包含α的事務(wù)有c也包含β(其中c=既包含α又包含β的事務(wù)個數(shù)/包含α的事務(wù)個數(shù)× 100%),那么規(guī)則α?β的置信度為c,其計算表達(dá)式為
設(shè)定最小支持度θ和最小置信度ω,如果s≥θ且c≥ω,則α?β為強關(guān)聯(lián)規(guī)則.
1.2.1 信息系統(tǒng)的抽象
粗糙集理論把客觀世界抽象為一個信息系統(tǒng)[13].一個信息系統(tǒng)S是一個四元組,記為
其中:U是對象(或事例)的有限集合,也稱為論域,U={u1,u2,…,um};A是對象屬性的有限集合,記為A={a1,a2,…,am};V是屬性的值域集,記為V=∪Vi,Vi是A中元素ai的值域;f是信息函數(shù),記為f:U×A V,f(ui,ai)∈Vi,他為每一個對象的每一個屬性賦予一個值.
1.2.2 不可分辨關(guān)系
設(shè)G={g1,g2,…,gn}?A,可以定義G上的一個不可分辨關(guān)系:
1.2.3 等價類和劃分
對于ui∈U,可用集合[ui]g來表示包含元素ui的等價類,.所有得到的等價類的并集構(gòu)成了論域U的劃分,記為U/ind(G),也稱為U的基本知識或概念.
1.2.4 約簡
如果屬性集合G?A滿足ind(G)=ind(A),且對于任意gk∈G均滿足式(5):
則G是A的一個約簡,記為G=RED(A).A的所有約簡的交集構(gòu)成A的屬性約簡的核,記為CORE(A)=∩RED(A).
傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘有4個重要的步驟[16]:
步驟1數(shù)據(jù)預(yù)處理;
步驟2 根據(jù)最小支持度找出數(shù)據(jù)集中的所有頻繁項集;
步驟3 根據(jù)頻繁項集和最小置信度產(chǎn)生關(guān)聯(lián)規(guī)則;
步驟4 評估規(guī)則.
傳統(tǒng)關(guān)聯(lián)規(guī)則挖掘的研究重點在產(chǎn)生關(guān)聯(lián)規(guī)則的算法求解和改善上.但事實上,關(guān)聯(lián)規(guī)則挖掘的數(shù)據(jù)預(yù)處理是非常關(guān)鍵的,粗糙集理論在描述數(shù)據(jù)系統(tǒng)和簡化待挖掘數(shù)據(jù)系統(tǒng)關(guān)聯(lián)項問題方面有獨到的作用.此外,如果最小支持度和最小置信度兩個關(guān)鍵閾值設(shè)置不當(dāng),會產(chǎn)生大量的頻繁項集和大量的冗余規(guī)則,影響用戶的決策,這是規(guī)則評估的關(guān)鍵問題.因此可嘗試運用粗糙集理論和方法,對規(guī)則條數(shù)與最小支持度和最小置信度之間的關(guān)系問題進(jìn)行求解.
2.2.1 歸納關(guān)聯(lián)規(guī)則
按照粗糙集方法的信息系統(tǒng)抽象方法,大多數(shù)關(guān)聯(lián)規(guī)則挖掘問題可歸納為求解實例中以決策目標(biāo)確定的關(guān)鍵數(shù)據(jù)項集和其余數(shù)據(jù)項集之間關(guān)聯(lián)規(guī)則的問題.
定義1 式(4)中的對象屬性A通??梢詣澐譃閮蓚€集合E和F,A=E∪F,E∩F=?.E稱為條件屬性集,F(xiàn)稱為決策屬性.將一個數(shù)據(jù)庫中待求解關(guān)聯(lián)規(guī)則的數(shù)據(jù)項集劃分為粗糙集表述的信息系統(tǒng)中A的條件屬性集和決策屬性,表達(dá)為求解S=〈U,A,V,f〉(A=E∪F,E∩F=?)中E?F的問題.這里的U指關(guān)聯(lián)數(shù)據(jù)庫所有記錄的集合(即為式(4)中所稱的論或),這時的S也稱為決策表.
通過定義1的歸納,待求解關(guān)聯(lián)規(guī)則的數(shù)據(jù)項集即可先根據(jù)粗糙集理論的約簡方法做預(yù)處理以減少冗余數(shù)據(jù)項.
2.2.2 約簡條件屬性集
粗糙集理論的約簡的典型算法是根據(jù)式(5)衍生得到的.文獻(xiàn)[17]介紹了通過構(gòu)造差別矩陣對條件屬性集E進(jìn)行約簡的方法.該方法的差別矩陣M是一個的矩陣,其中的每一個元素mij? E,做進(jìn)一步整理得到式(6):
M為主對角線為?的對稱矩陣,在實際應(yīng)用中只計算它的上三角陣.約簡的計算過程是對mij中每個元素進(jìn)行“或”運算,然后再對所有的mij進(jìn)行“與”運算,最后的結(jié)果就是M約簡的組合.
2.2.3 粗糙集方法與Apriori算法的結(jié)合
定義2 設(shè)集合L是條件屬性集E的子集,以L得到的等價類稱為特征集,記為[X],其中X是特征集[X]的描述.如果L有k個元素,那么稱[X]為k元特征集,記為[Xk].Xk稱為k元特征描述,用式(7)表述:
定義3 令θ是關(guān)聯(lián)規(guī)則的最小支持度,如果規(guī)則Xk?F的支持度大于θ,那么稱由Xk確定的k元特征集為頻繁k-項集.令Tk表示頻繁k-項集的集合,Rk是k元特征集的集合,稱為k元候選集.則有Rk?Tk,主要方法總結(jié)為算法1,描述如下:
待挖掘的數(shù)據(jù)庫用粗糙集方法處理后,歸納成決策表S,S=〈U,A,V,f〉(A=E∪F,E∩F=?).E1為條件屬性集E的約簡,F(xiàn)為決策屬性,設(shè)θ為最小支持度,ω為最小置信度.
結(jié)合Apriori-new算法[18],得到E1?F的關(guān)聯(lián)規(guī)則,如圖1所示.
圖1 粗糙集應(yīng)用于關(guān)聯(lián)規(guī)則挖掘的算法流程Fig.1 Algorithm process of association rule mining using rough set
2.2.4 關(guān)聯(lián)規(guī)則條數(shù)與參數(shù)配置的關(guān)系
上述方法中,最小支持度和最小置信度的設(shè)置對關(guān)聯(lián)規(guī)則的產(chǎn)生條數(shù)有重大的影響.通過設(shè)置一定范圍的最小支持度和最小置信度,得到一定范圍內(nèi)的規(guī)則條數(shù),它們之間的關(guān)系可能也存在一定的規(guī)律.文獻(xiàn)[19]用回歸分析的方法研究這一關(guān)系.但事實上這一個關(guān)系是不確定的,針對特定領(lǐng)域的應(yīng)用,可運用粗糙集的方法來求解它們的關(guān)系.
根據(jù)粗糙集理論,得到另一個決策表P,P=〈U2,A2,V2,f2〉(A2=E2∪F2,E2∩F2=?).U2是關(guān)聯(lián)規(guī)則運算記錄集,θ2是最小支持度,ω2是最小置信度.設(shè)θ2∪ω2=E2,F(xiàn)2是規(guī)則條數(shù).通過上述方法可求解形如E2?F2的關(guān)聯(lián)規(guī)則.
文中提出的粗糙集和關(guān)聯(lián)規(guī)則綜合應(yīng)用方法,已在廣東省道路運政管理信息系統(tǒng)中的客運企業(yè)質(zhì)量信譽考核數(shù)據(jù)庫得到驗證.
3.1.1 決策屬性與決策表
客運企業(yè)質(zhì)量信譽考核評分表中有4個要素:運輸安全、經(jīng)營行為、服務(wù)質(zhì)量和社會責(zé)任.每個要素對應(yīng)各自的得分檔次,道路運輸管理部門組織專家對每個企業(yè)按照評分表就各要素進(jìn)行打分,然后綜合各要素得分情況,再結(jié)合專家意見得到最后的評定結(jié)論.可以看出,管理部門需要知道的是評定結(jié)論與哪些要素的取值結(jié)合較為緊密,哪些要素在實際操作中可以忽略.因此,可設(shè)評定結(jié)論為決策屬性,評定要素為條件屬性,評定記錄為論域.為了說明問題,選擇9條記錄建立如表1所示的決策表,其中{運輸安全、經(jīng)營行為、服務(wù)質(zhì)量,社會責(zé)任}為條件屬性集,評定結(jié)果為決策屬性.
表1 道路運輸企業(yè)質(zhì)量信譽考核決策表Table 1 Decision table of quality credit assessment for road transport ation enterprise
3.1.2 數(shù)據(jù)預(yù)處理
為了構(gòu)造差別矩陣來對決策表進(jìn)行約簡,使用字母a、b、c、d、e來代替各屬性,其中a、b、c、d代表條件屬性,e代表決策屬性;同時為簡化文中的計算過程,各屬性值合并劃分為兩個檔次,好用“1”表示,中和差合并為一個檔次,用“0”表示,得到表2所示的概化表.
表2 概化后的決策表Table 2 Generalized decision table
3.1.3 條件屬性集的約簡
按照前文所提到的差別矩陣約簡方法得到差別矩陣M:
對矩陣中各元素進(jìn)行“或”運算,然后進(jìn)行“與”運算,最后得到a∧b∧c,則得到一個約簡{a,b,c},約簡后的決策表如表3所示.
表3 約簡后的決策表Table 3 Reduced decision table
3.1.4 關(guān)聯(lián)規(guī)則的獲取
設(shè)最小支持度θ=30%,最小置信度ω=80%,利用算法1得到以下4條關(guān)聯(lián)規(guī)則.
其現(xiàn)實意義是運輸安全性好且經(jīng)營行為好的則質(zhì)量信譽好,運輸安全性好且服務(wù)質(zhì)量中等的則質(zhì)量信譽好,經(jīng)營行為好且服務(wù)質(zhì)量好的則質(zhì)量信譽中等,經(jīng)營行為差且服務(wù)質(zhì)量差的則質(zhì)量信譽差.
3.1.5 規(guī)則條數(shù)與支持度、置信度的關(guān)系
在上述計算過程中,采用多個最小支持度θ2和最小置信度ω的組合,得到規(guī)則條數(shù)F2的對應(yīng)值,組成決策表P.再用決策表P及算法1可得到最小支持度θ、最小置信度ω和規(guī)則條數(shù)F2的關(guān)系如下:
即當(dāng)最小置信度ω在30%≤ω≤50%區(qū)間取值,且最小支持度θ在70%≤θ≤90%區(qū)間取值時,可使規(guī)則條數(shù)穩(wěn)定在3到5條.
3.2.1 燃料限值核查制度的主要問題
燃料限值核查制度是指各地交通主管部門根據(jù)國家頒布實施的達(dá)標(biāo)車型表去核查道路運輸車輛是否達(dá)標(biāo).表里的核查項目是需要核查的達(dá)標(biāo)車型表中公布車型的具體參數(shù).對照檢查公布車型的具體參數(shù)與實際車輛的具體參數(shù)是核查工作的主要內(nèi)容,因此核查項目的多少直接決定了實施部門的工作量.研究究竟真正需要核查多少具體參數(shù),既能保證數(shù)據(jù)能夠判斷實際車輛是否滿足達(dá)標(biāo)車型的要求,又能最大限度地減少核查內(nèi)容、減少地方道路運輸管理部門的工作量,是實施燃料限值核查工作遇到的主要問題.實際工作中遇到的是如表4所示的數(shù)據(jù)表.
表4 計算示例數(shù)據(jù)表Table 4 Data table of calculation example
3.2.2 核查項目約簡解決方法
目前燃料限值制度的核查項目有12項,設(shè)為核查項目的集合{車輛型號,載客人數(shù)(含駕駛員),外形尺寸,整備質(zhì)量,總質(zhì)量,發(fā)動機型號,底盤型號,驅(qū)動型式,輪胎規(guī)格,貨箱欄板內(nèi)尺寸或容積,牽引座最大允許承載質(zhì)量,準(zhǔn)拖掛車總質(zhì)量},用字母代替表示為{C,H,J,K,L,N,O,P,Q,R,T,W},Y代表結(jié)論.
廣東省自2010年3月1日全面實施燃料限值核查制度后,核查新增道路運輸營運車輛共12814輛,其中核查結(jié)論為通過的有12649輛,不通過的有165輛.
通過廣東省道路運輸管理信息系統(tǒng)后臺數(shù)據(jù)庫取得已具有12814條記錄的數(shù)據(jù)表,以表4的定義生成決策表,如表5所示.
表5 廣東省燃料限值工作決策表Table 5 Work decision table of fuel limits set by Guangdong Province
利用上述方法來求條件屬性的約簡,利用C++語言編程并在Windows 7平臺進(jìn)行“與”和“或”運算,最后得到該決策表的一個約簡{C,H,J,N,O,P,R,T},即車輛型號、載客人數(shù)、外形尺寸、發(fā)動機型號、底盤型號、驅(qū)動型式、貨箱欄板內(nèi)尺寸或容積、牽引座最大允許承載質(zhì)量為必須核查的項目,可將原12項的核查項目減少為8項,即決策表的條件屬性減少33%,對應(yīng)的工作量也減少了33%,有重要的實際應(yīng)用價值.
文中針對道路運輸管理信息數(shù)據(jù)的特點,將粗糙集理論方法運用到經(jīng)典關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘中,提出了粗糙集分析與經(jīng)典關(guān)聯(lián)規(guī)則相結(jié)合的數(shù)據(jù)挖掘方法,利用粗糙集方法分析了規(guī)則條數(shù)與支持度、置信度之間的關(guān)系;通過道路運輸管理的實際案例驗證了該方法的科學(xué)有效性,證明該方法對于解決道路運輸管理的實際問題切實可行.但由于關(guān)聯(lián)規(guī)則帶有一定的主觀判斷,因此在挖掘目標(biāo)不明顯的數(shù)據(jù)挖掘應(yīng)用中有一定局限性.該方法較為適用于推測評定結(jié)果和評定指標(biāo)之間關(guān)系的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘.
[1] 李思男,李寧,李戰(zhàn)懷.多標(biāo)簽數(shù)據(jù)挖掘技術(shù):研究綜述[J].計算機科學(xué),2013,40(4):14-15.Li Si-nan,Li Ning,Li Zhan-huai.Multi-label data mining:a survey[J].Compute Science,2013,40(4):14-15.
[2] 唐亮.信息化條件下營運車輛安全監(jiān)管關(guān)鍵技術(shù)研究[D].重慶:重慶大學(xué)自動化學(xué)院,2012.
[3] 劉衛(wèi)寧,曾嬋娟,孫棣華.基于DBSCAN算法的營運車輛超速點聚類分析[J].計算機工程,2009,35(5): 268-272.Liu Wei-ning,Zeng Chan-juan,Sun Di-hua.Clustering analysis of overspeed spots for commercial vehicles based on DBSCAN[J].Computer Engineering,2009,35(5): 268-272.
[4] Xiao Juan,Ye Feng,Xie Yafen,et al.Association rule mining and application in intelligent transportation system[C]∥Proceedings of the 27th Chinese Control Conference.Kunming:Beihang University Press,2008.
[5] Tian Rui,Zhao-sheng Yang,Zhang Mao-lei.Method of road traffic accidents causes analysis based on data mining[C]∥Proceedings of 2010 International Conference on Computational Intelligence and Software Engineering.Changchun:IEEE,2010.
[6] Lee Wei-Hsun,Tsenga Shian-Shyong,Tsaia Sheng-Han.A knowledge based real-time travel time prediction system for urban network[J].Expert Systems with Appli-cations,2009,36(3):4239-4247.
[7] Zhou Guo-qing,Wang Lin-bing,Wang Dong,et al.Integration of GIS and data mining technology to enhance the pavement management decision making[J].Journal of Transportation Engineering,2010,136(4):332-341.
[8] 夏英,張俊,王國胤.時空關(guān)聯(lián)規(guī)則挖掘算法及其在ITS中的應(yīng)用[J].計算機科學(xué),2011 38(9):173-176.Xia Ying,Zhang Jun,Wang Guo-yin.Spatio-temporal association rule mining algorithm and its application in intelligent transportation system[J].Compute Science,2011,38(9):173-176.
[9] Chen Shu-yan,Wang Wei,Zuylen van Henk.A comparison of outlier detection algorithms for ITS data[J].Expert Systems with Applications,2010,37(2):1169-1178.
[10] Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in Large databases[C]∥Proceeding of the ACMSIGMOD International Conference on Management of Data(ACMSIGMOD'93).Washington:IEEE,1993.
[11] 曾安平.多類關(guān)聯(lián)規(guī)則生成算法[J].計算機應(yīng)用,2012,32(8):2198-2201.Zeng An-ping,Muti-class association rule generation algorithm[J].Journal of computer applications,2012,32 (8):2198-2201.
[12] 夏英.智能交通系統(tǒng)中的時空數(shù)據(jù)分析關(guān)鍵技術(shù)研究[D].成都:西南交通大學(xué)計算機與通信工程學(xué)院,2012
[13] Pawlak Z.Rough sets[J].International Journal of Parallel Programming,1982,11(5):341-356.
[14] 王國胤,姚一豫,于洪.粗糙集理論與用研究綜述[J].計算機學(xué)報,2009,32(7):1229-1246.Wang Guo-yin,Yao Yi-yu,Yu Hong.A survey on rough set theory and applications[J].Chinese Journal of Computers,2009,32(7):1229-1246.
[15] 王學(xué)恩,韓崇昭,韓德強,等.粗糙集研究綜述[J].控制工程,2013,20(1):1-8.Wang Xue-en,Han Chong-zhao,Han De-qiang,et al.A survey of rough sets theory[J].Control Engineering of China,2013,20(1):1-8.
[16] Agrawal R,Srikant R.Fast algorithms for mining association rules[C]∥20th International Conference on Very Large Databases.San Francisco:IEEE,1994.
[17] 唐建國,譚明術(shù).粗糙集理論中的求核和約簡控制與決策[J].控制與決策,2003,18(4):449-452.Tang Jian-guo,Tan Ming-shu.On finding core and reduction in rough set theory[J].Control and Decision,2003,18(4):449-452.
[18] 程巖,黃梯云.信息系統(tǒng)中一種面向粗糙集的數(shù)據(jù)挖掘方法[J].情報學(xué)報,2001,20(1):90-99.Cheng Yan,Huang Ti-yun.A method of rough-set oriented data mining in information system[J].Journal of The China Society For Scientific and Technical Information,2001,20(1):90-99.
[19] 邸書靈,陳娜,馬新娜.回歸分析在關(guān)聯(lián)規(guī)則挖掘中的應(yīng)用研究[J].微計算機信息,2008,24(1/2/3): 171-172.Di Shu-ling,Chen Na,Ma Xin-na.Regression analysis and application in association rules mining[J].Microcomputer Information,2008,24(1/2/3):171-172.