梁海棟
摘 要:近年來,隨著科學技術的不斷進圖,數(shù)據(jù)挖掘技術的研究與應用越來越多的受到國內(nèi)外的企業(yè)界及學術界的關注。對計算機數(shù)據(jù)挖掘技術的概念、方法與任務進行了詳細的介紹,同時對數(shù)據(jù)挖掘技術在燃氣負荷以及燃氣客戶管理等系統(tǒng)中的應用進行分析與研究。
關鍵詞:數(shù)據(jù)挖掘技術 燃氣系統(tǒng) 燃氣負荷預測 燃氣客戶管理 應用分析
中圖分類號:TP3 文獻標識碼:A 文章編號:1672-3791(2013)03(c)-0032-01
1 數(shù)據(jù)挖掘技術概況
通過各種技術手段,從大量的數(shù)據(jù)庫中,對人們所需要的知識及信息進行數(shù)據(jù)的提取,所提取的數(shù)據(jù)有模糊、不完全以及隨機的可能性,這種提取的數(shù)據(jù)就被稱為數(shù)據(jù)挖掘。對計算機數(shù)據(jù)挖掘技術的概念、方法與任務進行了詳細的介紹,對數(shù)據(jù)挖掘技術在燃氣負荷以及燃氣客戶管理等系統(tǒng)中的應用進行分析與研究[1]。
從廣義方面來說,數(shù)據(jù)挖掘?qū)嶋H上就是觀察數(shù)據(jù)與實事的集合,對其模式?jīng)Q策尋找依據(jù)。
1.1 數(shù)據(jù)挖掘的任務
(1)數(shù)據(jù)挖掘的相關分析。
對數(shù)據(jù)庫中所存在的自變量與自變量的關系進行分析,從而得出自變量存在著依存的關系。
(2)數(shù)據(jù)的聚類。
把數(shù)據(jù)群體進行一個到多個的劃分,通常情況下,會用不規(guī)則的抽取計算方法,同時,為數(shù)據(jù)庫提供切實可行的信息。在對數(shù)據(jù)群體的分類中,原則上要求同類的個體要在最大程度上相似,而不同類的個體要在最大程度上相反,對數(shù)據(jù)的聚類技術主要包括:概念聚類法、模式識別法、神經(jīng)網(wǎng)絡法以及數(shù)學分類法等[2]。
(3)數(shù)據(jù)挖掘的概念。
描述數(shù)據(jù)庫中的某一個對象含義,對其主要的特性進行詳細的概括。對其內(nèi)涵的描述主要包括辨別性描述以及特性描述。在辨別性的描述中,其主要的描述方式分為:遺傳算法、決策樹法以及神經(jīng)網(wǎng)絡法。
(4)數(shù)據(jù)庫的偏差檢測。
檢測數(shù)據(jù)庫中不正常的數(shù)據(jù),其所檢測的模式偏差對象主要有拐點、極值點、邊界點以及斷點和零點等等。其數(shù)據(jù)偏差主要包括例外的模式、反常實力、觀察室的偏差預測、由于時間變化而出現(xiàn)的量值預測偏差等等[2]。
1.2 數(shù)據(jù)挖掘的方法
因為統(tǒng)計學分析法主要包括回歸、因子、相關、判別、差異以及聚類等方面的分析。而仿生物技術的方式主要包括遺傳算法與網(wǎng)絡算法等等。除此之外,對數(shù)據(jù)挖掘進行信息分析的方式還有IBLE算法以及ID3算法,而在集合論方式中,主要包括決策樹、粗集和覆蓋排斥反例等各種方法。此外,可視化技術及模糊論方法都有被運用[3]。
2 數(shù)據(jù)挖掘技術在燃氣系統(tǒng)中的應用
2.1 應用于在燃氣負荷預測中
從對事物本質(zhì)與規(guī)律的研究來看,在對燃氣負荷的預測規(guī)律中,其核心內(nèi)容就是對負荷本質(zhì)特點的研究。因為城市中的燃氣負荷有其固有的隨機性與復雜性,所以對其實質(zhì)性的研究很難有明顯的進展,在這種狀況下,更多的研究工作者投身于對燃氣預測模型以及預測算法的分析與研究中[5]。從而對某些研究負荷的性能造成了忽略,造成在后來的研究工作中,不得不人為的添加一些經(jīng)驗因素,這也在一定程度上造成了預測科學性的降低。這些因素體現(xiàn)在燃氣負荷樣本的分類上、預測參數(shù)的選取上以及對節(jié)假日的解決上。所以,通過科學的角度分析,運用數(shù)據(jù)挖掘方式,首先著手于負荷固有的性能,對其潛在的負荷數(shù)據(jù)及數(shù)據(jù)與數(shù)據(jù)之間存在的關系,特殊時期的負荷特征、以及不同的變量值對負荷所纏身的影響與作用進行挖掘,這樣,在負荷預測中所出現(xiàn)的問題就能有效的解決。
2.2 應用于燃氣客戶管理系統(tǒng)中
2.2.1 燃氣客戶關系管理與數(shù)據(jù)挖掘
燃氣的客戶關系管理系統(tǒng)中,對數(shù)據(jù)挖掘的應用,實際上就是定制化,這種定制化是企業(yè)營銷數(shù)據(jù)庫能力的集中體現(xiàn)。通過對數(shù)據(jù)庫的挖掘,一方面企業(yè)要獲得大量的數(shù)據(jù),使數(shù)據(jù)的條目更清晰。另一方面,還要有很強的對數(shù)據(jù)挖掘進行分析的能力,通過數(shù)據(jù)對客戶的信息進行更多的獲得,已達到客戶的滿意。燃氣客觀關系管理系統(tǒng)主要包括三個方面:銷售、市場以及客戶管理。通過數(shù)據(jù)挖掘技術與理論實現(xiàn)預測及描述客戶舉動模型的創(chuàng)建,使燃氣客戶關系系統(tǒng)的流程得到優(yōu)化,能有效的管理燃氣公司中客戶的關系。
2.2.2 數(shù)據(jù)的獲取
(1)客戶數(shù)據(jù)。
這種數(shù)據(jù)在通常情況下主要靠直接客戶或者天然氣的供應商進行獲取,傳統(tǒng)的客戶數(shù)據(jù)主要有三大類,即:交易性數(shù)據(jù)、描述性數(shù)據(jù)以及促銷性數(shù)據(jù)。
(2)交易數(shù)據(jù)。
燃氣公司與客戶有了交易關系后而出現(xiàn)的數(shù)據(jù),就是交易性數(shù)據(jù),這種數(shù)據(jù)主要包括以下幾個方面,即:消耗燃氣的地點、時間、產(chǎn)品規(guī)格、付款的方式以及金額等等。
(3)描述數(shù)據(jù)。
燃氣公司客戶處于靜止狀態(tài)的數(shù)據(jù),就是描述數(shù)據(jù),這種數(shù)據(jù)主要包括客戶的姓名、年齡、性別以及經(jīng)濟收入等各種最基本的信息,此外還含有客戶的興趣愛好以及消費習慣、客戶類型、燃氣消費情況以及信用等級等各方面的信息[5]。
3 結語
對燃氣各個系統(tǒng)的應用與研究是一項比較復雜的工作,數(shù)據(jù)挖掘技術在燃氣系統(tǒng)中的應用,大大提高了對燃氣數(shù)據(jù)的研究與管理,對分析傳統(tǒng)數(shù)據(jù)影響負荷因素及性能的定性與定性有很大的幫助,同時也受到了國內(nèi)企業(yè)界和學術界科研工作者的廣泛關注。
參考文獻
[1]Han JW,Kam berM,著.數(shù)據(jù)挖掘概念與技術[M].范明,孟小峰,譯.北京:機械工業(yè)出版社,2001.
[2]譚羽非,陳家新,焦文玲,等.基于人工神經(jīng)網(wǎng)絡的城市煤氣短期負荷預測[J].煤氣與熱力,2001,21(3):199-202.
[3]肖文暉,劉亞斌,王思存.燃氣小時負荷的模糊神經(jīng)網(wǎng)絡預測[J].煤氣與熱力,2002,22(1):16-18.
[4]張月欽.信息技術在大慶燃氣的開發(fā)與應用[A].第二屆中國城市燃氣論壇——燃氣青年工程師論壇資料匯編[C],2009.
[5]譚羽非.城市燃氣季節(jié)性負荷預測模型的建立及求解[J].煤氣與熱力,2003,23(3):131-133.