国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

淺析電力數(shù)據(jù)中的知識(shí)提取算法及應(yīng)用

2020-11-17 00:11:18郝景昌
裝備維修技術(shù) 2020年37期
關(guān)鍵詞:電力大數(shù)據(jù)知識(shí)圖譜

郝景昌

摘 ?要:隨著計(jì)算機(jī)技術(shù)及互聯(lián)網(wǎng)產(chǎn)業(yè)的發(fā)展,電力行業(yè)越來越多的數(shù)據(jù)進(jìn)入網(wǎng)絡(luò)。海量的數(shù)據(jù)給電力行業(yè)中的數(shù)據(jù)存儲(chǔ)、處理、分析帶來較大的開銷。知識(shí)圖譜、屬性約簡(jiǎn)、智能決策等技術(shù)為電力大數(shù)據(jù)的處理提供了較好的解決方案。然而在多維度、全方位的電力大數(shù)據(jù)中,針對(duì)知識(shí)本身的提取及表示的相關(guān)研究仍有所不足。電力大數(shù)據(jù)中的知識(shí)在多個(gè)維度的歸一化、知識(shí)表達(dá)的標(biāo)準(zhǔn)化方面仍有所不足?;谠颇P捅旧淼亩ㄐ远坎淮_定性轉(zhuǎn)換能力,對(duì)多維云模型增加歸一化改進(jìn),進(jìn)而提出一種面向電力大數(shù)據(jù)的知識(shí)提取算法。

關(guān)鍵詞:電力大數(shù)據(jù);知識(shí)圖譜;數(shù)據(jù)約簡(jiǎn);知識(shí)提取

1引言

隨著國家新電改方案的實(shí)施與推進(jìn),“互聯(lián)網(wǎng)+電力”思維逐漸開始引領(lǐng)電力企業(yè),成為一種主要的經(jīng)營(yíng)思路之一。隨著電力企業(yè)市場(chǎng)化的推進(jìn),電力企業(yè)逐漸告別壟斷,開始走向營(yíng)銷服務(wù)的時(shí)代。另一方面,隨著工業(yè)互聯(lián)網(wǎng),能源互聯(lián)網(wǎng)的發(fā)展,電力行業(yè)的各個(gè)環(huán)節(jié),從發(fā)電到電力公司的運(yùn)營(yíng),均開始向信息化、自動(dòng)化、智能化方向發(fā)展。

在“互聯(lián)網(wǎng)+電力”的發(fā)展過程中,越來越多的電力數(shù)據(jù)進(jìn)入互聯(lián)網(wǎng)。這些數(shù)據(jù)涵蓋電力行業(yè)的全過程,包含多個(gè)場(chǎng)景、多種環(huán)節(jié)。電力行業(yè)也在逐步邁入大數(shù)據(jù)時(shí)代。

當(dāng)前電力大數(shù)據(jù)領(lǐng)域的研究均在數(shù)據(jù)的處理與分析基礎(chǔ)上進(jìn)行。其中,電力知識(shí)的構(gòu)建是其核心過程。然而,當(dāng)前研究中,對(duì)于電力知識(shí)的構(gòu)建過程仍有進(jìn)一步提升的空間。在多維數(shù)據(jù)的處理中,如何有效挖掘不同維度數(shù)據(jù)中的信息,如何能夠既避免噪聲的干擾,又不忽略實(shí)際具有價(jià)值的信息,是當(dāng)前知識(shí)構(gòu)建中的主要難題。

本文圍繞電力大數(shù)據(jù)中的知識(shí)構(gòu)建展開研究,在云模型的基礎(chǔ)上,提出了一種改進(jìn)的多維云模型。該模型能夠?qū)Χ嗑S屬性進(jìn)行歸一化處理,處理后構(gòu)建多維云。在改進(jìn)的多維云模型基礎(chǔ)上,本文提出一種電力大數(shù)據(jù)中的知識(shí)提取算法,該算法能夠有效提取核心屬性信息,并基于核心屬性信息,構(gòu)建知識(shí)的抽象表示。所提取的知識(shí)還具備重構(gòu)數(shù)據(jù)的能力。仿真實(shí)驗(yàn)表明了本文所提出的算法在數(shù)據(jù)重構(gòu)以及知識(shí)準(zhǔn)確提取方面均具有較強(qiáng)的性能。

2改進(jìn)的多維云模型

2.1多維空間知識(shí)

物理世界中的現(xiàn)象映射至互聯(lián)網(wǎng)空間時(shí),數(shù)據(jù)往往包括多種維度的屬性。此時(shí)的知識(shí)包含多個(gè)維度下,數(shù)值接近的數(shù)據(jù)點(diǎn)。數(shù)據(jù)點(diǎn)的集合形成多維空間知識(shí)?,F(xiàn)給出多維空間知識(shí)的定義及表示方法。

定義1 多維空間知識(shí). 設(shè)U是N維空間中數(shù)值表示的定量論域,K是U上一類數(shù)據(jù)的集合,使用給定值 ,將X在論域上的分布稱為多維空間知識(shí),記作K(X),每個(gè)X稱為知識(shí)的一次實(shí)現(xiàn),其表示為N維空間中的一個(gè)數(shù)據(jù)點(diǎn): 。

多維空間中的知識(shí)提取,是將觀察到的知識(shí)的若干次實(shí)現(xiàn)提取為知識(shí)的抽象表示的過程。為此,我們引入改進(jìn)的多維云模型。

2.1改進(jìn)的多維云模型

李德毅院士在基于概論率、模糊數(shù)學(xué)的基礎(chǔ)上提出了云模型的概念,實(shí)現(xiàn)了包含不確定性的語言概念值與定量數(shù)值之間的相互轉(zhuǎn)換。云模型的數(shù)據(jù)特征用期望Ex ,熵En 和超熵He來表示,它們反映概念整體的定性特征。云模型既可以表示一維空間中的概念,也可以表示多維空間中的概念。當(dāng)使用云模型表示多維空間中的概念時(shí),三個(gè)特征值均為多維數(shù)據(jù)。然而,由于多維空間中的數(shù)據(jù)尺度變化較大,缺乏統(tǒng)一的度量,本文云模型基礎(chǔ)上引出了多維屬性的歸一化策略,提出一種改進(jìn)的多維云模型,用以表示多維空間中的知識(shí)。

定義2 多維空間云模型. 設(shè)U是N維空間中數(shù)值表示的定量論域,K是U上的知識(shí),其中包含M次實(shí)現(xiàn)。多維空間云模型MC用以對(duì)K進(jìn)行抽象表示,包含兩部分信息:核與多維尺度因子。其數(shù)學(xué)表示如下: ?。其中, 表示核,是N維云的中心點(diǎn), ;A表示云在N個(gè)維度下的不確定性, ;I表示多維尺度因子,為一個(gè)N維向量 。

在多維空間云模型中,核 是云的中心點(diǎn),是最能代表知識(shí)的點(diǎn),也是知識(shí)最典型的實(shí)現(xiàn),也可以表示知識(shí)的內(nèi)涵。不確定性A由知識(shí)的隨機(jī)性和模糊性共同決定,是多維屬性歸一化后的結(jié)果,表示與知識(shí)的內(nèi)涵、外延無關(guān)的,蘊(yùn)含在知識(shí)中的不確定性。多維尺度因子I表示知識(shí)在多個(gè)屬性下的標(biāo)尺,是多維屬性歸一化后提取出的結(jié)果,也可以用來表示知識(shí)在多個(gè)維度下的外延。

2.2多維屬性的歸一化方法

在知識(shí)的多維屬性中,不同維度的數(shù)值具有各自不同的量綱,不同維度下數(shù)值的分布會(huì)出現(xiàn)分布不均衡的現(xiàn)象。在提取知識(shí)時(shí),分布范圍較窄的屬性往往會(huì)被忽略,這將造成知識(shí)提取的不準(zhǔn)確。為此,本文提出一種多維屬性的歸一化方法。

多維屬性的歸一化主要目標(biāo)是將多個(gè)維度的屬性數(shù)值進(jìn)行處理,使各個(gè)維度的云模型表示中熵值均等于1。此時(shí)各維度下所去除的標(biāo)尺即為多維尺度因子,此時(shí)的超熵值即為不確定度。使用K表示N維空間上的某一知識(shí): 。其中, ,多維屬性的歸一化可以從數(shù)據(jù)中提取抽象特征,得到多維空間的云模型。

相比原始的逆向云模型算法,增加了歸一化處理的改進(jìn)的多維云模型能夠去除不同維度下屬性尺度的影響。在知識(shí)發(fā)現(xiàn)中,能夠有效防止忽略變化范圍小的數(shù)據(jù)。當(dāng)數(shù)據(jù)在多個(gè)維度分布時(shí),增加歸一化處理之后,一方面可以使多個(gè)維度下的尺度統(tǒng)一,另一方面在數(shù)據(jù)特征提取及數(shù)據(jù)生成時(shí),由于各個(gè)維度數(shù)據(jù)統(tǒng)一,可以通過特征的提取與疊加實(shí)現(xiàn)多維度下數(shù)據(jù)的統(tǒng)一快速處理。

3面向電力大數(shù)據(jù)的知識(shí)提取算法

在電力大數(shù)據(jù)中,數(shù)據(jù)涵蓋的范圍非常廣泛,主要包括電力行業(yè)基本信息數(shù)據(jù)、電力標(biāo)準(zhǔn)數(shù)據(jù)、電力基礎(chǔ)設(shè)施數(shù)據(jù)、電力業(yè)務(wù)數(shù)據(jù)、用電行為數(shù)據(jù)、運(yùn)維行為數(shù)據(jù)、商業(yè)運(yùn)營(yíng)數(shù)據(jù)等等。其中任何一個(gè)領(lǐng)域中的數(shù)據(jù)又包含多種維度,這些維度可能存在交叉,也可能具有高度的相關(guān)性。因此,在面對(duì)特定范圍內(nèi)電力數(shù)據(jù)的知識(shí)提取中,首先需要對(duì)多維數(shù)據(jù)進(jìn)行分析,去除噪聲,尋找屬性的相關(guān)性,獲取其核心屬性,進(jìn)而在核心屬性的基礎(chǔ)上,提取知識(shí)。

3.1電力大數(shù)據(jù)的核心屬性發(fā)現(xiàn)算法

針對(duì)某一范圍的電力數(shù)據(jù),其中往往含有多種屬性,在這些屬性中,有三類屬性在知識(shí)發(fā)現(xiàn)中無需參與運(yùn)算,本文定義為“非核心屬性”。非核心屬性主要包含如下三類:

(1)非數(shù)值型屬性。某些屬性的數(shù)據(jù)不具備數(shù)值特性,例如用戶ID,用戶手機(jī)號(hào)等。這些數(shù)據(jù)沒有數(shù)學(xué)意義,無法參與數(shù)學(xué)運(yùn)算,屬于離散的非數(shù)字屬性。這些屬性在知識(shí)發(fā)現(xiàn)中無法參與運(yùn)算,因而需要首先進(jìn)行排除。

(2)噪聲屬性。某些屬性的數(shù)據(jù)雖然具備數(shù)值特定,然而這些數(shù)值始終相同或極為接近,基本不會(huì)發(fā)生變化,這些數(shù)據(jù)在知識(shí)發(fā)現(xiàn)中將沖淡核心屬性的價(jià)值,屬于噪聲數(shù)據(jù),也應(yīng)在知識(shí)發(fā)現(xiàn)中進(jìn)行排除。

(3)從屬屬性。某些屬性的數(shù)據(jù)雖然具備數(shù)值特性也會(huì)變化,然而其變化受某種核心屬性的影響,隨某種核心屬性的變化而變化。這類數(shù)據(jù)稱之為核心數(shù)據(jù)的從屬數(shù)據(jù)。在知識(shí)發(fā)現(xiàn)中,基于核心屬性已經(jīng)足以進(jìn)行知識(shí)的發(fā)現(xiàn)。從屬數(shù)據(jù)將增大知識(shí)發(fā)現(xiàn)的計(jì)算量,對(duì)知識(shí)發(fā)現(xiàn)結(jié)果的影響較小,因而也需要進(jìn)行排除。

3.2電力大數(shù)據(jù)的知識(shí)提取過程

在電力大數(shù)據(jù)中,知識(shí)的提取是從多個(gè)定量數(shù)據(jù)轉(zhuǎn)化為抽象的數(shù)學(xué)表示的過程。假設(shè)當(dāng)前存在某種知識(shí)的多次實(shí)現(xiàn),使用多維數(shù)據(jù)集合K表示。電力大數(shù)據(jù)中的知識(shí)提取可表示為: 。具體步驟如下:

(1)知識(shí)數(shù)據(jù)集獲取。從已有數(shù)據(jù)全集中,根據(jù)先驗(yàn)知識(shí),得出其中表示某種知識(shí)的數(shù)據(jù)集合K。

(2)核心數(shù)據(jù)發(fā)現(xiàn)。基于算法2,從數(shù)據(jù)全集中去除非核心屬性,保留核心屬性,形成數(shù)據(jù)集合K。

(3)基于改進(jìn)云模型的知識(shí)提取。對(duì)現(xiàn)有數(shù)據(jù)集合K進(jìn)行歸一化處理,得出改進(jìn)的多維云模型 。

(4)此時(shí),改進(jìn)的多維云模型 即為該知識(shí)的抽象表示。

在改進(jìn)的多維云模型中,云模型的核 表示該知識(shí)的內(nèi)涵;表示多維尺度因子I表示該知識(shí)在多個(gè)屬性下的外延;云模型的不確定性A,代表該知識(shí)在多維維度下的不確定性。改進(jìn)的多維云模型一方面可以表示該知識(shí)的抽象特征,另一方面還可以根據(jù)該抽象特征生成該知識(shí)的實(shí)現(xiàn)。

3.3基于知識(shí)的數(shù)據(jù)生成算法

根據(jù)知識(shí)的抽象特性生成數(shù)據(jù),是多維云模型屬性歸一化的逆向過程。

對(duì)于已經(jīng)得到的某種知識(shí)抽象特性,可以基于知識(shí)生成近似的數(shù)據(jù)。為知識(shí)提取提供了一種抽象概念到具體數(shù)據(jù)的轉(zhuǎn)換方法。對(duì)于模擬電力領(lǐng)域中的業(yè)務(wù),構(gòu)建電力領(lǐng)域知識(shí)圖譜都具有一定的應(yīng)用價(jià)值。

4結(jié)論及未來工作展望

針對(duì)當(dāng)前電力大數(shù)據(jù)領(lǐng)域中的知識(shí)表達(dá)能力缺乏標(biāo)準(zhǔn)、知識(shí)提取能力相對(duì)較弱等問題展開研究,針對(duì)云模型進(jìn)行了改進(jìn),并提出了一種面向電力大數(shù)據(jù)的知識(shí)提取算法。仿真實(shí)驗(yàn)驗(yàn)證了該算法在數(shù)據(jù)重構(gòu)、知識(shí)提取等方面均有較好的性能。該算法電力行業(yè)大數(shù)據(jù)分析,知識(shí)圖譜構(gòu)建具有一定的參考價(jià)值。

參考文獻(xiàn)

[1]盛魁.混合數(shù)據(jù)的鄰域區(qū)分度增量式屬性約簡(jiǎn)算法[J].電子學(xué)報(bào),2020,48(04):682-696.

[2]周峰.泛在電力物聯(lián)網(wǎng)智能感知關(guān)鍵技術(shù)發(fā)展思路[J].中國電機(jī)工程學(xué)報(bào),2020,40(01):70-82+375.

猜你喜歡
電力大數(shù)據(jù)知識(shí)圖譜
分布式技術(shù)在電力大數(shù)據(jù)高性能處理中的應(yīng)用
電力大數(shù)據(jù)應(yīng)用研究與展望
基于云計(jì)算技術(shù)的電力大數(shù)據(jù)預(yù)處理屬性約簡(jiǎn)方法
面向電力大數(shù)據(jù)的數(shù)據(jù)管理工具對(duì)比
國內(nèi)圖書館嵌入式服務(wù)研究主題分析
國內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢(shì)
近十五年我國小學(xué)英語教學(xué)研究的熱點(diǎn)、問題及對(duì)策
基于知識(shí)圖譜的產(chǎn)業(yè)集群創(chuàng)新績(jī)效可視化分析
電力大數(shù)據(jù)可視化系統(tǒng)開發(fā)關(guān)鍵技術(shù)研究及趨勢(shì)
基于知識(shí)圖譜的智慧教育研究熱點(diǎn)與趨勢(shì)分析
杭锦旗| 莱阳市| 衡阳县| 阿合奇县| 富宁县| 顺昌县| 凤冈县| 台北市| 临江市| 潮安县| 霍城县| 当阳市| 巴青县| 饶阳县| 卢湾区| 武功县| 黄龙县| 自治县| 乐山市| 花垣县| 连云港市| 宣恩县| 仪征市| 手游| 仁化县| 天台县| 合作市| 勐海县| 岱山县| 彭山县| 乌兰察布市| 新平| 贵定县| 历史| 大安市| 明溪县| 龙陵县| 宕昌县| 尉犁县| 贡嘎县| 江门市|