王睿,李健,柳洪波,楊磊
山東泰開(kāi)隔離開(kāi)關(guān)有限公司,山東泰安,271000
電氣設(shè)備和系統(tǒng)在現(xiàn)代工業(yè)、交通和生活中扮演著關(guān)鍵角色。為了確保其可靠性和效率,對(duì)設(shè)備進(jìn)行持續(xù)監(jiān)測(cè)并從中收集數(shù)據(jù)已成為標(biāo)準(zhǔn)實(shí)踐。這些數(shù)據(jù)來(lái)源于各種傳感器、日志和控制系統(tǒng),其形式和結(jié)構(gòu)各異。對(duì)工程師和研究人員來(lái)說(shuō),如何從這些數(shù)據(jù)中提取有意義的信息,識(shí)別模式和趨勢(shì),以及進(jìn)行決策支持,是一個(gè)長(zhǎng)期且關(guān)鍵的任務(wù)。近年來(lái),深度學(xué)習(xí)技術(shù)在圖像識(shí)別、自然語(yǔ)言處理等領(lǐng)域取得了顯著的成果,這為其在電氣設(shè)備數(shù)據(jù)融合中的應(yīng)用提供了啟示。
深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的子領(lǐng)域,旨在通過(guò)模擬人腦的結(jié)構(gòu)和功能來(lái)學(xué)習(xí)數(shù)據(jù)的表示。其核心是使用多層神經(jīng)網(wǎng)絡(luò),常用的是前饋深度神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)。每一層都由多個(gè)神經(jīng)元組成,通過(guò)連接權(quán)重將信息從一個(gè)神經(jīng)元傳遞到另一個(gè)神經(jīng)元。隨著網(wǎng)絡(luò)的深入,這些表示變得更加復(fù)雜和抽象。深度學(xué)習(xí)已在圖像識(shí)別、語(yǔ)音識(shí)別和自然語(yǔ)言處理等多個(gè)領(lǐng)域顯示出卓越的性能。其成功的關(guān)鍵在于能夠自動(dòng)從原始數(shù)據(jù)中學(xué)習(xí)高級(jí)特征,避免了手動(dòng)特征工程的需要。當(dāng)處理大量數(shù)據(jù)時(shí),深度學(xué)習(xí)模型通常比其他機(jī)器學(xué)習(xí)算法更為優(yōu)越。
異構(gòu)性是電氣設(shè)備多源數(shù)據(jù)的顯著特點(diǎn)之一。在電氣系統(tǒng)的日常運(yùn)行中,各種傳感器、儀器和監(jiān)控設(shè)備會(huì)產(chǎn)生大量數(shù)據(jù),這些數(shù)據(jù)在來(lái)源、格式、質(zhì)量、時(shí)間尺度和空間尺度上可能都存在差異。例如,溫度傳感器可能提供每秒一次的讀數(shù),而電流測(cè)量設(shè)備可能每分鐘記錄一次。此外,數(shù)據(jù)可能來(lái)自不同的物理量,如電壓、電流、頻率和阻抗,這些物理量的單位和量綱也各不相同。因此,處理和分析這些數(shù)據(jù)時(shí)需要考慮其內(nèi)在的異構(gòu)性,確保正確地解釋和利用每項(xiàng)數(shù)據(jù)。數(shù)據(jù)的異構(gòu)性也為數(shù)據(jù)融合和分析帶來(lái)了挑戰(zhàn),簡(jiǎn)單地將不同來(lái)源的數(shù)據(jù)整合在一起可能會(huì)導(dǎo)致信息的丟失或誤解。為了充分利用這些數(shù)據(jù),并從中獲取有價(jià)值的信息,需要采用適當(dāng)?shù)臄?shù)據(jù)預(yù)處理、轉(zhuǎn)換和融合方法,確??紤]到每組數(shù)據(jù)的特性和價(jià)值。
電氣系統(tǒng)在運(yùn)行過(guò)程中會(huì)受到多種因素的影響,導(dǎo)致其狀態(tài)和性能發(fā)生持續(xù)變化。數(shù)據(jù)的動(dòng)態(tài)性反映了這些變化,包括周期性變化、突發(fā)事件和長(zhǎng)期趨勢(shì)。例如,電氣負(fù)荷可能會(huì)隨著日?;顒?dòng)的進(jìn)程、季節(jié)變化或特定事件而發(fā)生波動(dòng)。同時(shí),設(shè)備的老化、環(huán)境條件的變化或系統(tǒng)中的故障都可能導(dǎo)致數(shù)據(jù)的瞬時(shí)變化。這種動(dòng)態(tài)性要求在數(shù)據(jù)分析和決策過(guò)程中采用實(shí)時(shí)或近實(shí)時(shí)的方法,以捕獲和響應(yīng)這些變化。而且,數(shù)據(jù)的動(dòng)態(tài)性也意味著靜態(tài)模型或一次性的分析可能無(wú)法準(zhǔn)確地描述和預(yù)測(cè)系統(tǒng)的行為。因此,要有效地處理和利用這種動(dòng)態(tài)數(shù)據(jù),需要采用能夠適應(yīng)變化、學(xué)習(xí)新知識(shí)并及時(shí)更新的分析方法和工具。
電氣設(shè)備多源數(shù)據(jù)的相關(guān)性在不同數(shù)據(jù)之間呈現(xiàn)出明顯的內(nèi)在聯(lián)系和互動(dòng)模式。在電氣系統(tǒng)的各個(gè)組件和設(shè)備中,常??梢杂^察到相互依賴的關(guān)系。這種關(guān)系在數(shù)據(jù)中表現(xiàn)為統(tǒng)計(jì)相關(guān)性、因果聯(lián)系或共同的行為模式。電流與電壓之間可能存在固定的相位差關(guān)系,電氣設(shè)備的溫度上升與其工作負(fù)荷的增加具有直接聯(lián)系。對(duì)數(shù)據(jù)分析者而言,識(shí)別這些相關(guān)性可以揭示系統(tǒng)的內(nèi)在機(jī)制、預(yù)測(cè)未來(lái)的行為或檢測(cè)異常。同時(shí),基于單一數(shù)據(jù)源的分析可能會(huì)忽略其他數(shù)據(jù)的影響,導(dǎo)致分析結(jié)果的偏差。為充分利用數(shù)據(jù)的相關(guān)性,需要采用綜合的數(shù)據(jù)分析方法,確保所有相關(guān)數(shù)據(jù)的信息和價(jià)值都得到充分考慮[1]。
(1)單個(gè)自動(dòng)編碼器融合
單個(gè)自動(dòng)編碼器融合方法主要依賴自動(dòng)編碼器的能力來(lái)實(shí)現(xiàn)特征提取和融合。自動(dòng)編碼器是一種無(wú)監(jiān)督的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),設(shè)計(jì)用于學(xué)習(xí)數(shù)據(jù)的有效表示。其結(jié)構(gòu)包括編碼器部分和解碼器部分。編碼器將輸入數(shù)據(jù)壓縮到一個(gè)低維的潛在空間,而解碼器則試圖從這個(gè)潛在空間恢復(fù)原始數(shù)據(jù)。在電氣設(shè)備多源異構(gòu)數(shù)據(jù)融合的場(chǎng)景中,可以利用自動(dòng)編碼器的編碼部分從各個(gè)數(shù)據(jù)源中提取特征,并將這些特征融合為一個(gè)統(tǒng)一的表示。由于自動(dòng)編碼器能夠捕獲數(shù)據(jù)中的主要模式和結(jié)構(gòu),此方法能有效地整合來(lái)自不同源的信息,并為后續(xù)的分析和決策提供有用的輸入。當(dāng)處理大量的電氣設(shè)備數(shù)據(jù)時(shí),這種基于單個(gè)自動(dòng)編碼器的融合方法為確保數(shù)據(jù)的完整性和一致性提供了一個(gè)有效的策略。
(2)堆疊自動(dòng)編碼器融合
堆疊自動(dòng)編碼器融合方法通過(guò)多個(gè)自動(dòng)編碼器層次結(jié)構(gòu)實(shí)現(xiàn)更深層次的特征提取和融合。每一層的自動(dòng)編碼器都負(fù)責(zé)提取其輸入數(shù)據(jù)的某種特征,并將其輸出作為下一層自動(dòng)編碼器的輸入。通過(guò)這種層疊方式,模型能夠從原始輸入數(shù)據(jù)中學(xué)習(xí)到多層次、多尺度的表示。在電氣設(shè)備多源異構(gòu)數(shù)據(jù)的融合應(yīng)用中,堆疊自動(dòng)編碼器可以從各個(gè)數(shù)據(jù)源中分別提取淺層和深層特征,并將這些特征整合到一個(gè)統(tǒng)一的高維表示中。這種高維表示包含了輸入數(shù)據(jù)的豐富信息和結(jié)構(gòu),為后續(xù)的分析和應(yīng)用提供了堅(jiān)實(shí)的基礎(chǔ)[2]。
(1)軟注意力機(jī)制
軟注意力機(jī)制為數(shù)據(jù)融合提供了一種權(quán)重分配策略,使模型能夠在多個(gè)數(shù)據(jù)源之間分配不同的關(guān)注度。基于該機(jī)制,模型可以為每個(gè)數(shù)據(jù)源分配一個(gè)權(quán)重,這些權(quán)重是根據(jù)數(shù)據(jù)的內(nèi)容和上下文動(dòng)態(tài)計(jì)算的。在電氣設(shè)備多源異構(gòu)數(shù)據(jù)融合中,軟注意力機(jī)制可以根據(jù)每個(gè)數(shù)據(jù)源的貢獻(xiàn)和重要性為其分配權(quán)重,從而確保在融合過(guò)程中給予關(guān)鍵信息更高的優(yōu)先級(jí)。此外,軟注意力機(jī)制還提供了對(duì)模型決策的可解釋性,因?yàn)闄?quán)重可以直觀地展示模型對(duì)不同數(shù)據(jù)源的關(guān)注度。在實(shí)際應(yīng)用中,該機(jī)制可以有效地整合來(lái)自多個(gè)傳感器或設(shè)備的數(shù)據(jù),確保在整個(gè)融合過(guò)程中都能夠捕獲到關(guān)鍵的信息和模式。
(2)硬注意力機(jī)制
硬注意力機(jī)制為數(shù)據(jù)融合提供了一種明確的選擇策略,允許模型在多個(gè)數(shù)據(jù)源中選擇最重要的部分進(jìn)行處理。與軟注意力機(jī)制不同,硬注意力機(jī)制并不為每個(gè)數(shù)據(jù)源分配權(quán)重,而是直接選擇某些數(shù)據(jù)源進(jìn)行處理,忽略其他數(shù)據(jù)源。在電氣設(shè)備多源異構(gòu)數(shù)據(jù)融合中,硬注意力機(jī)制可以根據(jù)每個(gè)數(shù)據(jù)源的重要性或貢獻(xiàn)選擇性地進(jìn)行融合,從而確保關(guān)鍵信息得到有效處理。此融合方法的優(yōu)點(diǎn)在于其計(jì)算效率,因?yàn)槟P椭恍杼幚肀贿x中的數(shù)據(jù)源,而無(wú)需處理所有數(shù)據(jù)源。但此機(jī)制也需要精確的策略來(lái)決定何時(shí)和如何選擇數(shù)據(jù)源,以確保融合結(jié)果的準(zhǔn)確性和完整性。
(1)共享表示學(xué)習(xí)
共享表示學(xué)習(xí)是多任務(wù)學(xué)習(xí)中的一種策略,旨在通過(guò)共享模型的部分結(jié)構(gòu),如隱藏層,為多個(gè)任務(wù)提供一個(gè)共同的表示。這種表示形式可以捕獲不同任務(wù)之間的相似性和關(guān)聯(lián)性,從而增強(qiáng)模型的泛化能力。在數(shù)學(xué)上,假設(shè)有兩個(gè)任務(wù)1T1和2T2,其共享表示可以通過(guò)以下方式進(jìn)行建模:
f(x)=h(Wx+b)
其中,f(x)是輸入數(shù)據(jù)x的共享表示,h是激活函數(shù),W和b是共享權(quán)重和偏置。
對(duì)于每個(gè)特定的任務(wù),可以基于共享表示f(x)構(gòu)建特定的預(yù)測(cè)層:
y1=g1(f(x))
y2=g2(f(x))
其中,g1和g2是任務(wù)特定的函數(shù),y1和y2是兩個(gè)任務(wù)的輸出。
從上述公式可以看出,通過(guò)共享表示,不同的任務(wù)可以利用相同的底層特征f(x)。這不僅減少了模型的參數(shù)數(shù)量,還有助于在數(shù)據(jù)較少的任務(wù)中,通過(guò)其他任務(wù)的數(shù)據(jù)進(jìn)行正則化,從而提高模型的性能。
(2)相關(guān)性建模多任務(wù)學(xué)習(xí)
相關(guān)性建模多任務(wù)學(xué)習(xí)關(guān)注于明確捕捉和建模多個(gè)任務(wù)之間的相關(guān)性。該策略的核心思想是,通過(guò)學(xué)習(xí)任務(wù)間的依賴關(guān)系,可以更好地指導(dǎo)每個(gè)單獨(dú)任務(wù)的學(xué)習(xí)過(guò)程,從而提高整體性能。
設(shè)有任務(wù)集合{T1,T2,…,Tn},每個(gè)任務(wù)Ti對(duì)應(yīng)一個(gè)輸出函數(shù)fi。在相關(guān)性建模多任務(wù)學(xué)習(xí)中,任務(wù)間的關(guān)系可以用一個(gè)相關(guān)性矩陣R來(lái)描述,其中元素rij表示任務(wù)Ti和任務(wù)Tj之間的相關(guān)性。
其中,h是激活函數(shù),W和b是權(quán)重和偏置,rij是相關(guān)性矩陣的元素。
此公式表示,任務(wù)Ti的輸出不僅由其自身的輸入數(shù)據(jù)驅(qū)動(dòng),還受到其他任務(wù)的影響。相關(guān)性矩陣R的元素值決定了這種影響的強(qiáng)度。從上述公式可以觀察到,相關(guān)性建模多任務(wù)學(xué)習(xí)能夠明確地捕捉任務(wù)之間的依賴關(guān)系,使得在某個(gè)任務(wù)數(shù)據(jù)較少或存在噪聲時(shí),可以借助其他相關(guān)任務(wù)的信息進(jìn)行補(bǔ)充,從而增強(qiáng)模型的魯棒性和泛化能力[3]。
(1)基于LSTM的序列數(shù)據(jù)融合
基于LSTM的序列數(shù)據(jù)融合策略針對(duì)時(shí)序數(shù)據(jù)的特性,利用LSTM的長(zhǎng)期記憶能力來(lái)融合來(lái)自不同源的序列數(shù)據(jù)。LSTM全稱為長(zhǎng)短時(shí)記憶網(wǎng)絡(luò),是遞歸神經(jīng)網(wǎng)絡(luò)的一種變體,專為處理具有時(shí)間依賴性的序列數(shù)據(jù)而設(shè)計(jì)。在融合方法中,各個(gè)數(shù)據(jù)源的序列首先分別輸入到LSTM結(jié)構(gòu)中??紤]一個(gè)序列輸入xt,LSTM的更新可以表示為:
ft=σ(Wf[ht-1,xt]+bf)
it=σ(Wi[ht-1,xt]+bi)
Ct=ft⊙Ct-1+it⊙ˉCt
ot=σ(Wo[ht-1,xt]+bo)
ht=ot⊙tanh(Ct)
其中,ft、it、ot分別為遺忘、輸入和輸出門(mén);Ct和ht是當(dāng)前時(shí)刻的單元狀態(tài)和隱藏狀態(tài);W和b為權(quán)重和偏置;σ是Sigmoid激活函數(shù),⊙表示逐元素乘法。
當(dāng)各個(gè)數(shù)據(jù)源的序列通過(guò)LSTM處理后,其輸出隱藏狀態(tài)ht可以被視為該數(shù)據(jù)源在時(shí)刻t的特征表示。這些特征表示隨后可以通過(guò)各種方法進(jìn)行融合,如簡(jiǎn)單的加權(quán)平均或更復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),從而得到一個(gè)綜合的序列特征表示。這種基于LSTM的融合方法能夠充分捕捉序列數(shù)據(jù)的時(shí)間動(dòng)態(tài)和多源數(shù)據(jù)的互補(bǔ)信息。
(2)基于卷積網(wǎng)絡(luò)的序列數(shù)據(jù)融合
基于卷積網(wǎng)絡(luò)的序列數(shù)據(jù)融合方法利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)的局部感受野和權(quán)重共享特性,從時(shí)序數(shù)據(jù)中提取局部模式和特征。卷積操作可以捕捉數(shù)據(jù)中的短期依賴關(guān)系,而池化層則可以降低數(shù)據(jù)的維度并提取關(guān)鍵信息。
考慮一個(gè)輸入序列x的一段,卷積操作可以表示為:
ci=σ(W*x[i:i+k]+b)
其中,W是卷積核,k是其大小,*代表卷積操作,σ是激活函數(shù),b是偏置項(xiàng)。在融合過(guò)程中,各個(gè)數(shù)據(jù)源的序列首先經(jīng)過(guò)卷積層進(jìn)行特征提取,得到的特征圖可以通過(guò)池化操作進(jìn)一步處理:
pj=max(c[j:j+p])
其中,p是池化窗口的大小,上述操作是最大池化。
經(jīng)過(guò)卷積和池化操作后,各個(gè)數(shù)據(jù)源的序列被轉(zhuǎn)化為一組特征圖。這些特征圖可以進(jìn)一步通過(guò)全連接層或其他融合策略進(jìn)行整合,從而得到一個(gè)綜合的特征表示?;诰矸e網(wǎng)絡(luò)的序列數(shù)據(jù)融合方法利用了卷積網(wǎng)絡(luò)在處理格點(diǎn)數(shù)據(jù)(如圖像和時(shí)序數(shù)據(jù))上的優(yōu)勢(shì),能夠有效地捕捉多源數(shù)據(jù)的局部模式和全局結(jié)構(gòu)[4]。
綜上所述,電氣設(shè)備多源數(shù)據(jù)具有其獨(dú)特的特點(diǎn),如異構(gòu)性、動(dòng)態(tài)性和相關(guān)性。為了有效地處理和利用這些數(shù)據(jù),深度學(xué)習(xí)技術(shù)提供了一系列融合方法。自動(dòng)編碼器、注意力機(jī)制、多任務(wù)學(xué)習(xí)以及卷積神經(jīng)網(wǎng)絡(luò)等方法在多源數(shù)據(jù)融合中都展現(xiàn)了其出色的性能。這些方法能夠捕獲數(shù)據(jù)中的復(fù)雜模式和結(jié)構(gòu),確保數(shù)據(jù)的完整性和一致性。隨著技術(shù)的進(jìn)步和研究的不斷深化,預(yù)期未來(lái)會(huì)涌現(xiàn)更多的多源數(shù)據(jù)融合技術(shù),為電氣設(shè)備數(shù)據(jù)分析和應(yīng)用提供更多的可能性。