何宇雄 苑晉沛 聶宇 羅超
摘 要:電力調(diào)度自動(dòng)化系統(tǒng)對(duì)電力數(shù)據(jù)的收集和整理工作質(zhì)量有著較高要求,而為了滿足這一要求近年來數(shù)據(jù)挖掘技術(shù)日漸受到電力行業(yè)重視,基于此,文章就數(shù)據(jù)挖掘技術(shù)進(jìn)行了簡單介紹,并對(duì)數(shù)據(jù)挖掘在電力調(diào)度自動(dòng)化系統(tǒng)中的應(yīng)用進(jìn)行了深入論述,希望論述內(nèi)容能夠?yàn)橄嚓P(guān)業(yè)內(nèi)人士帶來一定啟發(fā)。
關(guān)鍵詞:數(shù)據(jù)挖掘;電力調(diào)度自動(dòng)化系統(tǒng);周期性關(guān)聯(lián)規(guī)則挖掘算法
中圖分類號(hào):TM734 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2018)04-0143-02
Abstract: Power dispatching automation system has higher requirements for the quality of power data collection and collation. In order to meet this requirement, data mining technology has been paid more and more attention in recent years. On the basis of this, this paper briefly introduces the technology of data mining, and discusses the application of data mining in power dispatching automation system in depth, hoping that the content of the discussion can bring some inspiration to the relevant industry.
Keywords: data mining; power dispatching automation system; periodic association rule mining algorithm
前言
電力數(shù)據(jù)收集、整理質(zhì)量直接影響電力調(diào)度自動(dòng)化系統(tǒng)的控制和管理水平,但由于很多價(jià)值較高的數(shù)據(jù)信息往往位于隱藏的數(shù)據(jù)之中,這就使得傳統(tǒng)方法不能較好滿足電力調(diào)度自動(dòng)化系統(tǒng)需要,而為了解決這一問題,正是本文就數(shù)據(jù)挖掘在電力調(diào)度自動(dòng)化系統(tǒng)中應(yīng)用展開具體研究的原因所在。
1 數(shù)據(jù)挖掘技術(shù)
在大數(shù)據(jù)時(shí)代到來的今天,數(shù)據(jù)挖掘技術(shù)能夠從海量數(shù)據(jù)信息中準(zhǔn)確找到所求信息,因此本文將數(shù)據(jù)挖掘技術(shù)視作“采用有效工具和措施從海量數(shù)據(jù)庫中提取數(shù)據(jù)和模型關(guān)系”的技術(shù),由此企業(yè)的決策能夠得到充足的判斷依據(jù)。為了更直觀了解數(shù)據(jù)挖掘技術(shù),本文將數(shù)據(jù)挖掘的過程和步驟概括為以下幾個(gè)方面:(1)確定業(yè)務(wù)對(duì)象。確定業(yè)務(wù)對(duì)象屬于數(shù)據(jù)挖掘過程的基礎(chǔ)工作,這一過程的實(shí)質(zhì)是了解業(yè)務(wù)問題。(2)準(zhǔn)備數(shù)據(jù)。通過選擇數(shù)據(jù)、數(shù)據(jù)預(yù)處理、轉(zhuǎn)換數(shù)據(jù)三個(gè)層面的工作,即可完成針對(duì)于挖掘算法的分析模型構(gòu)建,并最終完成一定領(lǐng)域的數(shù)據(jù)挖掘。
2 數(shù)據(jù)挖掘在電力調(diào)度自動(dòng)化系統(tǒng)中的應(yīng)用
2.1 應(yīng)用方式
神經(jīng)網(wǎng)絡(luò)、灰色分析法、關(guān)聯(lián)規(guī)則均能夠用于電力調(diào)度自動(dòng)化系統(tǒng)的數(shù)據(jù)挖掘,具體應(yīng)用如下所示。
(1)神經(jīng)網(wǎng)絡(luò)。作為應(yīng)用較為廣泛的一種人工智能研究方法,神經(jīng)網(wǎng)絡(luò)早已在我國實(shí)現(xiàn)了較為廣泛的應(yīng)用,電力調(diào)度自動(dòng)化系統(tǒng)的數(shù)據(jù)挖掘也是其應(yīng)用的重要領(lǐng)域,由于數(shù)據(jù)自行處理、數(shù)據(jù)分布存儲(chǔ)、高度容錯(cuò)性是神經(jīng)網(wǎng)絡(luò)的應(yīng)用優(yōu)勢(shì)所在,這就使得神經(jīng)網(wǎng)絡(luò)較為適用于模糊、不完整、不準(zhǔn)確數(shù)據(jù)的處理。在電力調(diào)度自動(dòng)化系統(tǒng)的數(shù)據(jù)挖掘中,神經(jīng)網(wǎng)絡(luò)主要通過關(guān)聯(lián)分析的方式實(shí)現(xiàn)數(shù)據(jù)邏輯處理,具體處理可以分為以下幾個(gè)方面:a.整合統(tǒng)一基礎(chǔ)數(shù)據(jù)。由于電力調(diào)度自動(dòng)化系統(tǒng)包含的數(shù)據(jù)具備龐大復(fù)雜、種類繁多的特點(diǎn),因此神經(jīng)網(wǎng)絡(luò)的應(yīng)用需要通過整合統(tǒng)一使相關(guān)數(shù)據(jù)形成結(jié)構(gòu)模型,通過神經(jīng)網(wǎng)絡(luò)系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)統(tǒng)一管理。b.實(shí)現(xiàn)不同環(huán)節(jié)電力調(diào)度的關(guān)聯(lián)。應(yīng)用數(shù)據(jù)挖掘神經(jīng)網(wǎng)絡(luò)方法整理不同環(huán)節(jié)的電流狀態(tài)和參數(shù),并保證相關(guān)數(shù)據(jù)信息的整合性,即可實(shí)現(xiàn)不同環(huán)節(jié)電力調(diào)度的關(guān)聯(lián)。c.分析與決策。結(jié)合神經(jīng)網(wǎng)絡(luò)整理的整合數(shù)據(jù),即可開展分析、決策以及數(shù)據(jù)共享。(2)灰色分析法?;疑治龇軌蜉^好分析電力調(diào)度過程出現(xiàn)的不完整數(shù)據(jù),但不適用于較為龐大的數(shù)據(jù)是該數(shù)據(jù)挖掘方法存在的不足。一般情況下,灰色分析法的應(yīng)用需要深入了解設(shè)備數(shù)據(jù)參數(shù),如用戶用電情況預(yù)測(cè)、母線負(fù)荷數(shù)據(jù)值、電力銷售情況預(yù)測(cè)等,結(jié)合分析確定電力調(diào)度邊界電量,即可提升數(shù)據(jù)收集的可靠性,電力調(diào)度自動(dòng)化系統(tǒng)的運(yùn)行也將由此獲得較為有力的支持。(3)關(guān)聯(lián)規(guī)則。作為數(shù)據(jù)挖掘的重要分支,關(guān)聯(lián)規(guī)則能夠通過發(fā)覺大量數(shù)據(jù)項(xiàng)集之間的有趣關(guān)聯(lián)和相互聯(lián)系實(shí)現(xiàn)信息的高質(zhì)量分析,剛剛提到的神經(jīng)網(wǎng)絡(luò)嚴(yán)格意義上也屬于關(guān)聯(lián)規(guī)則范疇,不過本文關(guān)于關(guān)聯(lián)規(guī)則的研究主要圍繞周期性關(guān)聯(lián)規(guī)則挖掘算法展開。周期性關(guān)聯(lián)規(guī)則挖掘算法具備掃描數(shù)據(jù)庫次數(shù)較少、避免掃描數(shù)據(jù)庫的時(shí)間開銷、連接程序中相同項(xiàng)目的比較次數(shù)較少、數(shù)據(jù)項(xiàng)集頻度統(tǒng)計(jì)速度較高等優(yōu)勢(shì),由此實(shí)現(xiàn)的周期性數(shù)據(jù)集挖掘、關(guān)聯(lián)規(guī)則挖掘便能夠大大降低電力調(diào)度自動(dòng)化系統(tǒng)的事故發(fā)生概率。
值得注意的是,本文研究的周期性關(guān)聯(lián)規(guī)則挖掘算法結(jié)合了蟻群算法,這是由于原算法使用了大量的搜索操作、分類檢索和路徑檢索,蟻群算法下走過的路上會(huì)留下信息素,這就使得較短路徑上的信息素濃度較高,結(jié)合負(fù)信息素理論,即可保證有信息素的地方螞蟻不能走過。如使用表1所示的事務(wù)數(shù)據(jù)庫D(部分),即可結(jié)合時(shí)態(tài)事務(wù)數(shù)據(jù)庫D分類數(shù)據(jù)集改進(jìn)、每一個(gè)分類數(shù)據(jù)集周期性數(shù)據(jù)集挖掘改進(jìn),以數(shù)據(jù)項(xiàng)A分類為例,即可求得表2所示的時(shí)態(tài)屬性差,由此開展更深入計(jì)算則能夠更深入了解周期性關(guān)聯(lián)規(guī)則挖掘算法的思想,也能夠認(rèn)識(shí)到蟻群算法的重要性。
2.2 應(yīng)用實(shí)踐
為提升研究實(shí)踐價(jià)值,本文圍繞周期性關(guān)聯(lián)規(guī)則挖掘算法建立了基于周期性關(guān)聯(lián)規(guī)則挖掘的數(shù)據(jù)分析系統(tǒng),這一系統(tǒng)的建立過程如下所示。(1)開發(fā)平臺(tái)選擇。結(jié)合系統(tǒng)功能需要,選擇了微軟的.net平臺(tái)作為主要系統(tǒng)開發(fā)平臺(tái),該平臺(tái)具備的強(qiáng)大數(shù)據(jù)庫訪問能力、擴(kuò)展豐富等特點(diǎn),能夠較好滿足系統(tǒng)開發(fā)需要。(2)基于數(shù)據(jù)橋的數(shù)據(jù)集成模塊設(shè)計(jì)??紤]到我國當(dāng)下電力事業(yè)的數(shù)據(jù)集成標(biāo)準(zhǔn)較為復(fù)雜、混亂,系統(tǒng)設(shè)計(jì)采用了自己的數(shù)據(jù)集成方法,同時(shí)應(yīng)用了清晰數(shù)據(jù)清洗策略,由此即可實(shí)現(xiàn)不完整數(shù)據(jù)、重復(fù)數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)三類臟數(shù)據(jù)的清洗,數(shù)字?jǐn)?shù)據(jù)不完整、日期數(shù)據(jù)不完整、錯(cuò)誤日期型數(shù)據(jù)、重復(fù)數(shù)據(jù)等僅屬于清洗內(nèi)容,其中除重復(fù)數(shù)據(jù)不予處理外,其他數(shù)據(jù)均采用修補(bǔ)空值和默認(rèn)值的方式,如數(shù)字?jǐn)?shù)據(jù)不完整采用“補(bǔ)0,補(bǔ)null,默認(rèn)值”的清洗策略。此外,無類型文件數(shù)據(jù)集成、數(shù)據(jù)庫數(shù)據(jù)集成、異構(gòu)數(shù)據(jù)庫數(shù)據(jù)集成也是這一環(huán)節(jié)設(shè)計(jì)的重要內(nèi)容[3]。(3)數(shù)據(jù)庫管理模塊設(shè)計(jì)。采用微軟公司的SQL Server數(shù)據(jù)庫系統(tǒng),由此數(shù)據(jù)庫管理被分為層次數(shù)建模、數(shù)據(jù)表管理、數(shù)據(jù)表導(dǎo)出三部分,其中數(shù)據(jù)表管理包含數(shù)據(jù)管理、結(jié)構(gòu)管理、刪除三方面功能,而數(shù)據(jù)表導(dǎo)出則包括文本文件、Excel文件、Access文件、Xml文件、其他數(shù)據(jù)庫五部分內(nèi)容。(4)數(shù)據(jù)分析功能模塊設(shè)計(jì)。數(shù)據(jù)分析功能模塊由同期數(shù)據(jù)分析、周期性數(shù)據(jù)分析、數(shù)據(jù)預(yù)警分析、數(shù)據(jù)關(guān)聯(lián)分析四部分組成,各部分設(shè)計(jì)如下所示:a.同期數(shù)據(jù)分析模塊設(shè)計(jì)。該模塊的運(yùn)行流程主要由負(fù)荷數(shù)據(jù)、網(wǎng)損數(shù)據(jù)、力率數(shù)據(jù)、有功總加數(shù)據(jù)對(duì)比組成,分析流程可以概括為:“輸入所有對(duì)比條件→合法→根據(jù)條件生成SQL語句→顯示查詢結(jié)果→打印對(duì)比圖像”。b.周期性數(shù)據(jù)分析模塊設(shè)計(jì)。圍繞報(bào)警周期性、負(fù)荷周期性、遙測(cè)周期性三方面開展數(shù)據(jù)挖掘,即可完成該模塊設(shè)計(jì)。c.數(shù)據(jù)預(yù)警分析模塊設(shè)計(jì)。分析流程為:“初始化數(shù)據(jù)集及參數(shù)→輸入預(yù)警分析參數(shù)→合法→分析預(yù)測(cè)→判斷預(yù)測(cè)類型→有無建議→輸出報(bào)警類型和建議→輸出報(bào)警類型”。d.數(shù)據(jù)關(guān)聯(lián)分析模型設(shè)計(jì)。采用默認(rèn)用戶手動(dòng)輸入數(shù)據(jù)集方法,程序流程為:“初始化已有周期性數(shù)據(jù)集→輸入?yún)?shù)→合法?→數(shù)據(jù)集交叉?→計(jì)算Conf、Sup→計(jì)算下一對(duì)數(shù)據(jù)集→完成”。
3 結(jié)束語
數(shù)據(jù)挖掘能夠較好地服務(wù)于電力調(diào)度自動(dòng)化系統(tǒng)。而在此基礎(chǔ)上,本文研究建立的基于周期性關(guān)聯(lián)規(guī)則挖掘的數(shù)據(jù)分析系統(tǒng),則證明了研究的實(shí)踐價(jià)值。因此,在相關(guān)領(lǐng)域的理論研究和實(shí)踐探索中,本文內(nèi)容能夠發(fā)揮一定參考作用。
參考文獻(xiàn):
[1]王謙,李烽.電力調(diào)度的自動(dòng)化網(wǎng)絡(luò)安全分析及實(shí)現(xiàn)[J].電子技術(shù)與軟件工程,2017(21):116.
[2]劉賓,朱亞奇,吳莎.數(shù)據(jù)挖掘在電力調(diào)度自動(dòng)化系統(tǒng)中的應(yīng)用[J].電子技術(shù)與軟件工程,2017(20):158.
[3]曹鐵生.電力調(diào)度自動(dòng)化系統(tǒng)應(yīng)用現(xiàn)狀與發(fā)展趨勢(shì)研究分析[J].硅谷,2014,7(23):74+76.
[4]周洋.數(shù)據(jù)挖掘在電力調(diào)度自動(dòng)化系統(tǒng)中的應(yīng)用解析[J].科技創(chuàng)新與應(yīng)用,2017(35):149-150.
[5]李夢(mèng)鳴.大數(shù)據(jù)挖掘平臺(tái)在電力運(yùn)營監(jiān)測(cè)工作的應(yīng)用[J].科技創(chuàng)新與應(yīng)用,2016(26):21-22.endprint