應(yīng)宜辰,吳命利,楊少兵,劉秋降
(北京交通大學(xué) 電氣工程學(xué)院, 北京 100044)
近年來(lái),我國(guó)電氣化鐵路的規(guī)模快速增長(zhǎng),牽引供電系統(tǒng)與電網(wǎng)的相互作用日益引起人們的重視,研究這類問題往往需要對(duì)包含牽引供電系統(tǒng)在內(nèi)的整個(gè)電力系統(tǒng)進(jìn)行更精細(xì)化的仿真分析,這對(duì)牽引負(fù)荷建模提出了更高要求。常用的牽引負(fù)荷模型主要包括3種:①恒定電流源或功率源模型,不考慮牽引負(fù)荷的波動(dòng)性,常用于電力系統(tǒng)確定性仿真[1-2];②基于列車牽引計(jì)算和運(yùn)行圖的動(dòng)態(tài)模型,考慮線路狀況、列車運(yùn)行特性及運(yùn)輸組織方式等因素,能較準(zhǔn)確地模擬牽引負(fù)荷過程[3];③基于大量實(shí)測(cè)數(shù)據(jù)的概率模型,從數(shù)據(jù)中挖掘規(guī)律并采用概率函數(shù)建模,能刻畫牽引負(fù)荷在復(fù)雜因素影響下的統(tǒng)計(jì)特征[4-7]。第一種方法忽略了牽引負(fù)荷的波動(dòng)特性,在精度要求較高或者需要獲得統(tǒng)計(jì)參數(shù)(如某些電能質(zhì)量指標(biāo))的電力系統(tǒng)仿真中,無(wú)法滿足要求;第二種方法復(fù)雜度很高,當(dāng)涉及系統(tǒng)規(guī)模較大時(shí)應(yīng)用不便;第三種方法基于數(shù)據(jù)驅(qū)動(dòng),比較容易與現(xiàn)在應(yīng)用較多的智能算法相結(jié)合,模型可以隨著數(shù)據(jù)及時(shí)更新。因此,目前第三種方法被廣泛應(yīng)用于分析牽引負(fù)荷對(duì)電力系統(tǒng)的影響。
在使用概率模型對(duì)于牽引負(fù)荷進(jìn)行描述的時(shí)候,首先需要根據(jù)得到的實(shí)測(cè)數(shù)據(jù)對(duì)概率模型進(jìn)行參數(shù)辨識(shí),然后使用辨識(shí)得到的參數(shù)對(duì)牽引負(fù)荷進(jìn)行描述。在實(shí)際應(yīng)用中,判定所擬合函數(shù)是否真正地收斂到了真實(shí)的概率分布往往需要一個(gè)評(píng)價(jià)標(biāo)準(zhǔn)對(duì)參數(shù)辨識(shí)結(jié)果進(jìn)行評(píng)價(jià),并且該評(píng)價(jià)標(biāo)準(zhǔn)還能對(duì)接下來(lái)的參數(shù)優(yōu)化方向提供指導(dǎo),這種思路與現(xiàn)在出現(xiàn)的一些新型智能算法有著相同的理念,如,邏輯回歸、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等算法,都采用損失函數(shù)作為評(píng)價(jià)標(biāo)準(zhǔn)確定尋優(yōu)方向。在負(fù)荷參數(shù)辨識(shí)中,由于多個(gè)參數(shù)往往具有一定的相關(guān)性,如牽引負(fù)荷的概率分布往往與列車通過數(shù)量以及列車自身功率的分布有關(guān)。因此,使用合適的評(píng)價(jià)標(biāo)準(zhǔn)對(duì)于這些參數(shù)的優(yōu)化方向選擇具有實(shí)際意義。目前一些文獻(xiàn)結(jié)合智能算法進(jìn)行負(fù)荷參數(shù)辨識(shí)取得一些進(jìn)展,例如,文獻(xiàn)[8]提出了一種基于負(fù)荷趨勢(shì)變化不同分段進(jìn)行負(fù)荷參數(shù)辨識(shí)的方法,結(jié)合了4種智能算法進(jìn)行參數(shù)辨識(shí),結(jié)果由4種方法加權(quán)產(chǎn)生,最后得到了精度較高的預(yù)測(cè)結(jié)果,但是該方法過于復(fù)雜;文獻(xiàn)[9]提出了一種非參數(shù)核密度估計(jì)方法來(lái)進(jìn)行牽引負(fù)荷的諧波電流分布預(yù)測(cè),該方法可以不假設(shè)數(shù)據(jù)服從某種分布而直接根據(jù)數(shù)據(jù)本身進(jìn)行擬合,省去了先驗(yàn)假設(shè)環(huán)節(jié),但是這種方法對(duì)于數(shù)據(jù)本身的要求較高,若存在一些異常數(shù)據(jù)點(diǎn),該方法可能導(dǎo)致擬合結(jié)果異常;文獻(xiàn)[10]提出了一種分段擬合電流曲線的方法,對(duì)曲線各個(gè)分段采用不同的擬合函數(shù)進(jìn)行擬合,該方法簡(jiǎn)單易行,但是需要手動(dòng)設(shè)置分段區(qū)間;文獻(xiàn)[11]提出了一種基于模擬退火算法的牽引饋線負(fù)荷參數(shù)辨識(shí)方法,該算法可以比較準(zhǔn)確地估計(jì)牽引饋線的有功和無(wú)功水平,但是該算法容易陷入一個(gè)局部范圍的搜索中,使得只可能得到一個(gè)局部最優(yōu)解;文獻(xiàn)[12]提出了一種基于改進(jìn)蟻群算法的客運(yùn)專線電力負(fù)荷參數(shù)辨識(shí)方法,該算法使用了輪盤賭法作為參數(shù)的選取方法,充分利用了輪盤賭法的隨機(jī)性使得尋優(yōu)算法不至于陷入局部最優(yōu),但是該算法并沒有充分利用之前的蟻群尋優(yōu)失敗的數(shù)據(jù),沒能更好地找出最優(yōu)參數(shù)所在的區(qū)間。本文提出了一種利用支持向量機(jī)指導(dǎo)的蟻群算法進(jìn)行牽引負(fù)荷的參數(shù)辨識(shí),該方法使用蟻群尋優(yōu)后所反饋數(shù)據(jù)對(duì)于支持向量機(jī)進(jìn)行訓(xùn)練,然后使用支持向量機(jī)反過來(lái)指導(dǎo)蟻群尋優(yōu)的方向,并且設(shè)置了閾值來(lái)調(diào)整尋優(yōu)方向的寬度,使得蟻群尋優(yōu)可以在一個(gè)可控的范圍內(nèi)逼近全局最優(yōu)解。
本文基于二項(xiàng)分布的行車密度公式,給出了描述牽引變電所有功功率的負(fù)荷模型;針對(duì)蟻群算法的隨機(jī)范圍不可控的問題,提出了一種利用蟻群尋優(yōu)反饋數(shù)據(jù)訓(xùn)練支持向量機(jī),然后使用支持向量機(jī)來(lái)指導(dǎo)蟻群算法隨機(jī)范圍的方法;給出了支持向量機(jī)指導(dǎo)蟻群算法的原理以及算法本身的適用性,提出了在實(shí)際應(yīng)用中應(yīng)如何根據(jù)實(shí)際的需求選定合適的閾值ε進(jìn)行尋優(yōu)范圍的優(yōu)化;闡述了改進(jìn)后的蟻群算法進(jìn)行牽引變電所牽引負(fù)荷數(shù)學(xué)模型的參數(shù)辨識(shí)流程,并進(jìn)行了實(shí)例仿真驗(yàn)證。
對(duì)于運(yùn)行的單臺(tái)列車而言,其功率除受自身參數(shù)影響外還主要受到以下外界因素影響:①線路限速;②線路坡度;③線路曲線半徑;④實(shí)際運(yùn)行過程中的一些隨機(jī)因素,如天氣情況、線路環(huán)境、受電弓的受流質(zhì)量、司機(jī)操作習(xí)慣等[13-14]??紤]列車運(yùn)行受到諸多確定性、不確定性因素的影響,根據(jù)大數(shù)定律和中心極限定律,列車的有功功率分布在大樣本空間上應(yīng)當(dāng)服從正態(tài)分布。某動(dòng)車組24 h功率實(shí)測(cè)值與擬合值對(duì)比見圖1。使用正態(tài)分布對(duì)其進(jìn)行擬合,決定系數(shù)達(dá)到了0.966。文獻(xiàn)[15-17]研究得出了無(wú)論是牽引計(jì)算的結(jié)果或是直接使用曲線擬合的結(jié)果,列車的有功功率都近似滿足正態(tài)分布的結(jié)論。因此,單臺(tái)列車的功率概率密度函數(shù)在測(cè)量數(shù)據(jù)范圍內(nèi)近似服從正態(tài)分布。
圖1 某列車功率實(shí)測(cè)值與擬合值對(duì)比
對(duì)于通過某供電區(qū)間列車數(shù)量的概率模型,文獻(xiàn)[12]將其考慮為一個(gè)正態(tài)分布模型,但是由于正態(tài)分布模型的值有可能取到負(fù)數(shù),而事實(shí)上列車的數(shù)量不可能為負(fù),因此實(shí)際使用時(shí)需要對(duì)該模型進(jìn)行一定的條件限制,而對(duì)于模型進(jìn)行修改又改變了模型本身特性,增加了模型的復(fù)雜性。
文獻(xiàn)[18]研究指出在測(cè)量時(shí)間足夠長(zhǎng)的情況下,可認(rèn)為列車的出現(xiàn)完全是一個(gè)獨(dú)立隨機(jī)事件,與其他區(qū)間上是否有列車無(wú)關(guān),這一結(jié)論說明列車通過供電區(qū)間的分布符合二項(xiàng)分布,見圖2。
圖2 二項(xiàng)分布擬合列車概率密度示意圖
考慮到實(shí)際使用中列車的數(shù)量不可能為負(fù)值,二項(xiàng)分布也具有相同的特性,故將列車通過某供電區(qū)間的概率模型考慮為一個(gè)二項(xiàng)分布模型更符合實(shí)際。
由上述分析可知,單臺(tái)列車的有功功率概率分布和通過某供電區(qū)段內(nèi)的列車數(shù)量概率分布,令隨機(jī)變量X、Y分別表示單臺(tái)列車的有功功率、供電區(qū)間內(nèi)的列車數(shù)量,則牽引變電所功率的表達(dá)式為[5]
(1)
式中:C為牽引變電所的空載功率。由于牽引變電所的空載功率一般較小可以忽略不計(jì),故由式(1)可知,牽引變電所的功率是由隨機(jī)變量X、Y決定的,由前面的分析可知,隨機(jī)變量X可描述為
X~N(μ,σ)
(2)
式中:N為正態(tài)分布函數(shù);μ、σ分別為單臺(tái)列車有功功率的均值、方差。
隨機(jī)變量Y可描述為
Y~B(n,p)
(3)
式中:B為二項(xiàng)分布函數(shù);n為同一時(shí)間通過供電區(qū)間列車數(shù)量的最大值;p為單臺(tái)列車通過供電區(qū)間的概率。
因此,牽引變電所的有功功率概率分布實(shí)際上是由μ、σ、n、p參數(shù)決定的,只需要辨識(shí)出這4個(gè)參數(shù),就可以描述出牽引變電所的概率分布情況。
由上述分析可知,辨識(shí)出μ、σ、n、p這4個(gè)參數(shù),就可以確定牽引變電所的有功功率概率分布。因此,目前的問題轉(zhuǎn)化為找到一組μ、σ、n、p,使得按照這組參數(shù)仿真得到的有功功率與實(shí)測(cè)牽引變電所有功功率之間的誤差最小。故這是一個(gè)最優(yōu)化問題,而針對(duì)最優(yōu)化問題,有很多的智能算法可供選擇,如遺傳算法、蟻群算法、模擬退火算法等。這些算法的本質(zhì)都是在設(shè)定一個(gè)目標(biāo)函數(shù)的情況下找到一個(gè)最優(yōu)解,實(shí)際上這些算法都可以對(duì)于牽引負(fù)荷進(jìn)行參數(shù)辨識(shí),但考慮到篇幅有限,本文采用蟻群算法作為例子進(jìn)行參數(shù)辨識(shí)的算法設(shè)計(jì)。
考慮到原始的蟻群算法是面向離散域設(shè)計(jì)與求解的,而本文所需要辨識(shí)的參數(shù)μ、σ、n、p是連續(xù)域的參數(shù),故采取網(wǎng)格化的劃分策略來(lái)進(jìn)行蟻群算法的解空間設(shè)計(jì)。
設(shè)x為待求變量,x∈(xmin,xmax)。根據(jù)變量x的范圍將x均勻地劃分為N格,每格的寬度Δx=(xmax-xmin)/N,將每格的中心作為節(jié)點(diǎn),其取值為
(4)
式中:i=1,2,3,…,N。
對(duì)于本文的問題,由于有4個(gè)待求參數(shù),故其解空間應(yīng)為4×N矩陣。
為了提高變量識(shí)別的速度和精度,根據(jù)文獻(xiàn)[12],對(duì)蟻群算法進(jìn)行了一定改進(jìn),每進(jìn)行一定的循環(huán)次數(shù),對(duì)于網(wǎng)格的寬度△x進(jìn)行一定的縮小,即
(5)
式中:xopt為當(dāng)前輪次迭代最優(yōu)值;α∈(0,1)為收縮系數(shù),收縮系數(shù)表示范圍收縮的快慢。
蟻群算法的原目標(biāo)函數(shù)是計(jì)算螞蟻?zhàn)哌^的總路徑長(zhǎng)度,因?yàn)槠湫枰业阶顑?yōu)的路徑[19-21],對(duì)于本文的問題來(lái)說,需要找到的是最優(yōu)的參數(shù)使得仿真數(shù)據(jù)與實(shí)測(cè)數(shù)據(jù)的誤差最小,故本文的目標(biāo)函數(shù)是計(jì)算仿真數(shù)據(jù)與實(shí)測(cè)數(shù)據(jù)之間的誤差。選擇M個(gè)實(shí)測(cè)數(shù)據(jù),其值為(xk,yk),xk、yk分別為第k個(gè)數(shù)據(jù)的有功功率值、概率密度值,k=1,2,3,…,M。設(shè)lΣ為蒙特卡羅仿真輸出的功率樣本總數(shù),lk為落入(xk-Δp,xk+Δp)區(qū)間的樣本數(shù),2Δp為功率概率密度函數(shù)的統(tǒng)計(jì)區(qū)間長(zhǎng)度,則目標(biāo)函數(shù)f為
(6)
得到目標(biāo)函數(shù)f值之后,就可以使用f值更新信息素矩陣的值,具體更新的公式為
(7)
(8)
(9)
每當(dāng)一只螞蟻?zhàn)咄?個(gè)節(jié)點(diǎn),即選定一組參數(shù)組,則根據(jù)該組參數(shù)組所確定的f值更新信息素矩陣與轉(zhuǎn)移概率。最終,當(dāng)所有螞蟻都走完4個(gè)節(jié)點(diǎn)的時(shí)候,選擇信息素矩陣每行的最大值所對(duì)應(yīng)的解作為最終尋優(yōu)得到的結(jié)果。
蟻群算法選擇下一組參數(shù)的方式是輪盤賭法,該方法存在的一個(gè)問題是對(duì)于下一組參數(shù)的選擇具有較大的隨機(jī)性。蟻群算法已經(jīng)通過信息素的方式來(lái)記錄歷史尋優(yōu)數(shù)據(jù),盡管它對(duì)接下來(lái)的參數(shù)選擇概率有一定的影響,但是由于進(jìn)行了式(5)的參數(shù)范圍收縮,使得一開始的初始參數(shù)對(duì)于之后的參數(shù)范圍有著極大的影響。由于輪盤賭法是根據(jù)轉(zhuǎn)移概率隨機(jī)地進(jìn)行參數(shù)選擇,在所有螞蟻都走完一遍路徑之后,根據(jù)信息素的最大值選擇最優(yōu)參數(shù)組。在這種情況下可能會(huì)出現(xiàn)所有選擇出的參數(shù)組都具有較大的誤差,而最終選擇出的最優(yōu)參數(shù)組只是這些具有較大誤差的參數(shù)組中的最小的一個(gè)。此時(shí),進(jìn)行式(5)的范圍收縮就會(huì)使得最終收縮得到的參數(shù)范圍并不是一個(gè)好的范圍。
事實(shí)上,有時(shí)候很難去確定什么樣的初始參數(shù)才是一個(gè)比較好的初始參數(shù),而增加一個(gè)基于誤差的指導(dǎo)函數(shù)就可以比較好的解決這一問題,因?yàn)榛谡`差的指導(dǎo)函數(shù)不依賴于初始參數(shù)的選擇。
對(duì)于本文的問題來(lái)說,需要辨識(shí)的參數(shù)為μ、σ、n、p,最終評(píng)價(jià)這些參數(shù)是否為一個(gè)好的參數(shù)的標(biāo)準(zhǔn)為仿真數(shù)據(jù)與實(shí)測(cè)數(shù)據(jù)之間的誤差。因此,可以設(shè)定一個(gè)基于誤差的指導(dǎo)函數(shù)對(duì)參數(shù)接下來(lái)的優(yōu)化方向進(jìn)行指導(dǎo)。由于牽引變電所功率的概率分布與列車的通過數(shù)量以及列車自身所需的功率的分布有關(guān),而列車數(shù)量的變化以及列車功率的變化對(duì)于牽引變電所功率的影響也是漸變的,并不是突變的。因此,實(shí)際上可以得到以參數(shù)組為自變量、誤差為因變量的連續(xù)函數(shù)。如果對(duì)于誤差值設(shè)定一個(gè)合適的閾值,認(rèn)為在這個(gè)閾值以下的誤差是可以接受的,而在這個(gè)閾值以上的誤差是不能接受的,那么上述問題就轉(zhuǎn)變?yōu)橐粋€(gè)分類問題。
在本文中,對(duì)于上面所述的分類問題,使用了支持向量機(jī)作為分類器。支持向量機(jī)是通過將原始空間經(jīng)內(nèi)積函數(shù)的定義轉(zhuǎn)換到一個(gè)新的更髙維的空間,在該髙維空間中對(duì)樣本進(jìn)行分類的方法,并且通過核函數(shù)的方式,可以將線性的分類邊界轉(zhuǎn)化為非線性的分類邊界,從而獲得更好的泛化性能。本文所使用的的支持向量機(jī)的核函數(shù)為高斯核函數(shù)。高斯核函數(shù)的形式為
(10)
式中:lj∈Rn為第j個(gè)標(biāo)記點(diǎn);xi為待分類數(shù)據(jù);fj為xi在高斯核函數(shù)下與標(biāo)記點(diǎn)lj相互作用的數(shù)值。實(shí)際上不難發(fā)現(xiàn),fj的值與xi與標(biāo)記點(diǎn)lj之間的距離有關(guān),當(dāng)xi與lj十分接近時(shí),f的值就會(huì)非常接近于1,當(dāng)xi與lj距離較遠(yuǎn)時(shí),f的值就會(huì)變得非常接近于0,這就說明f值實(shí)際上表征的是數(shù)據(jù)點(diǎn)xi到標(biāo)記點(diǎn)l的距離大小,而如果給f定一個(gè)閾值,選定小于f的值為與標(biāo)記點(diǎn)l相同的一類樣本,而大于f的值為另一類樣本,就可以完成分類的效果。
采用高斯核函數(shù)進(jìn)行分類的支持向量機(jī)需滿足以下約束
(11)
式中:w為權(quán)值向量;f(i)=(f1,f2,…,fn)表示數(shù)據(jù)點(diǎn)xi與各個(gè)標(biāo)記點(diǎn)fj之間的核函數(shù)值向量;n為總的標(biāo)記點(diǎn)個(gè)數(shù)[22-23]。
基于上述分析,本文提出了一種基于支持向量機(jī)的參數(shù)組選擇方法。具體步驟為:
Step1運(yùn)行不加收縮系數(shù)的蟻群算法,并記錄每輪蟻群算法的路徑值與相應(yīng)的參數(shù)組(μ、σ、n、p),對(duì)于本文的這個(gè)問題來(lái)講,蟻群算法的路徑值即為蒙特卡洛仿真數(shù)據(jù)與實(shí)測(cè)數(shù)據(jù)之間的誤差值。
Step2設(shè)計(jì)閾值ε,將誤差大于閾值ε的參數(shù)組標(biāo)記為0,將誤差小于閾值ε的參數(shù)組標(biāo)記為1,并將帶標(biāo)記的數(shù)據(jù)輸入支持向量機(jī)進(jìn)行訓(xùn)練,支持向量機(jī)的核函數(shù)選用高斯核函數(shù)。
Step3運(yùn)行加收縮系數(shù)的蟻群算法,但是在根據(jù)轉(zhuǎn)移概率輪盤賭法選擇參數(shù)的時(shí)候,將選擇好的參數(shù)組(μ、σ、n、p)輸入訓(xùn)練好的支持向量機(jī)模型進(jìn)行預(yù)測(cè),若預(yù)測(cè)結(jié)果為1,則選用該參數(shù)組作為下一組參數(shù)組,若預(yù)測(cè)結(jié)果為0,則重新輪盤賭法選擇參數(shù)。
由于增加了蟻群算法參數(shù)預(yù)辨識(shí)過程以及支持向量機(jī)的訓(xùn)練和判定環(huán)節(jié),算法的總體運(yùn)行時(shí)間是有所增加的。具體計(jì)算量分析為:蟻群算法的參數(shù)預(yù)辨識(shí)過程只運(yùn)行了一組蟻群循環(huán),而且并沒有加收縮系數(shù)環(huán)節(jié),所以其計(jì)算量只相當(dāng)于后面運(yùn)行20次蟻群循環(huán)的1/20不到,故總體的計(jì)算量增長(zhǎng)低于5%;對(duì)于支持向量機(jī)的訓(xùn)練環(huán)節(jié)來(lái)說,其訓(xùn)練時(shí)間還不足一個(gè)蟻群循環(huán)的運(yùn)行時(shí)間,故其計(jì)算量增長(zhǎng)低于0.5%;對(duì)于支持向量機(jī)的判定環(huán)節(jié),由于支持向量機(jī)已經(jīng)是訓(xùn)練好的網(wǎng)絡(luò),其判定速度非常快,其相對(duì)整個(gè)蟻群循環(huán)的運(yùn)算量增長(zhǎng)可以忽略不計(jì)。根據(jù)實(shí)測(cè)的運(yùn)行時(shí)間,實(shí)際運(yùn)算量的增長(zhǎng)在5%左右。
根據(jù)上面的分析可知,閾值ε的選擇是用來(lái)限定選擇出的最優(yōu)參數(shù)組的誤差上限的,從而避免輪盤賭法的隨機(jī)性過大而導(dǎo)致的參數(shù)收縮范圍不合理問題。但是對(duì)于閾值的選擇不當(dāng)也會(huì)造成以下問題:如果閾值ε過大,則會(huì)導(dǎo)致最優(yōu)參數(shù)組的誤差上限過高,那支持向量機(jī)對(duì)于參數(shù)選擇的指導(dǎo)作用就顯得很有限,如果將閾值選擇為1,那么整個(gè)算法就退化為不加支持向量機(jī)的蟻群尋優(yōu)算法;如果閾值ε選的過小,那么支持向量機(jī)的正樣本數(shù)量在總體樣本中的占比就會(huì)非常小,被排除掉的參數(shù)組就會(huì)占大多數(shù),此時(shí)支持向量機(jī)可能會(huì)進(jìn)入一個(gè)過擬合狀態(tài),使得其過于謹(jǐn)慎地進(jìn)行指導(dǎo),甚至可能排除掉一些可能具有更好結(jié)果的參數(shù)組序列。故對(duì)于閾值ε的選擇應(yīng)當(dāng)綜合考慮實(shí)際的算例情況,通過觀察支持向量機(jī)的正負(fù)樣本的數(shù)量在總體樣本中的占比,從而設(shè)置合理的閾值ε。
需要辨識(shí)μ、σ、n、p4個(gè)參數(shù)。對(duì)于μ、σ,若輸入數(shù)據(jù)的最大功率值為pmax,可設(shè)μ的初值為pmax/2,尋優(yōu)范圍為(0,pmax),設(shè)σ的初值為pmax/3,尋優(yōu)范圍為(0,pmax/6)。對(duì)于n、p,應(yīng)根據(jù)具體的運(yùn)行圖制定,假設(shè)同一時(shí)間最大運(yùn)行車輛為nmax輛,則n的取值范圍為(0,nmax),初始值選擇為nmax/2,對(duì)于p的初始值選擇,可取其范圍均值0.5,范圍為(0,1)。
支持向量機(jī)-蟻群優(yōu)化算法總體流程由三部分組成,分別為蟻群算法參數(shù)預(yù)辨識(shí)、支持向量機(jī)訓(xùn)練、支持向量機(jī)-蟻群算法參數(shù)辨識(shí),具體步驟為:
Step1初始化算法各個(gè)參數(shù),設(shè)定閾值ε,根據(jù)式(4)初始化解空間矩陣。
Step2執(zhí)行蟻群循環(huán),并記錄蟻群循環(huán)中的參數(shù)組與其對(duì)應(yīng)的誤差值f。
Step3判定是否達(dá)到最大迭代次數(shù),是則結(jié)束參數(shù)預(yù)辨識(shí)程序,若未達(dá)到,則返回Step2。
Step4使用記錄的f值與參數(shù)組,將f>ε的參數(shù)組標(biāo)記為0,將f<ε的參數(shù)組標(biāo)記為1,將帶標(biāo)記的數(shù)據(jù)輸入支持向量機(jī)進(jìn)行訓(xùn)練,得到訓(xùn)練完成的支持向量機(jī)模型。
Step5設(shè)置外循環(huán)迭代次數(shù)。
Step6重新初始化算法各個(gè)參數(shù),根據(jù)式(4)初始化解空間矩陣。
Step7執(zhí)行改進(jìn)蟻群循環(huán),在蟻群循環(huán)最后一步增加支持向量機(jī)判定環(huán)節(jié),將選擇好的參數(shù)組輸入訓(xùn)練完成的支持向量機(jī)模型進(jìn)行預(yù)測(cè),若輸出為1,則選擇該參數(shù)組作為下一組參數(shù)組,若輸出為0,則重新選擇參數(shù)組。
Step8根據(jù)信息素矩陣輸出最優(yōu)參數(shù)組,判定是否達(dá)到內(nèi)循環(huán)最大次數(shù),是則記錄最優(yōu)參數(shù)組,結(jié)束內(nèi)循環(huán),否則按式(5)更新解空間矩陣,返回Step7。
Step9判定是否達(dá)到外循環(huán)最大次數(shù),是則將記錄的最優(yōu)參數(shù)組依次進(jìn)行蒙特卡羅仿真,將其與真實(shí)數(shù)據(jù)進(jìn)行對(duì)比,計(jì)算誤差,選擇誤差最小的參數(shù)組作為最終的參數(shù)辨識(shí)結(jié)果,否則返回Step6。
其中,Step1~Step4為蟻群算法參數(shù)預(yù)辨識(shí)過程,Step5為支持向量機(jī)訓(xùn)練過程,Step6~Step9為支持向量機(jī)-蟻群算法參數(shù)辨識(shí)。
算法的流程框圖見圖3。
圖3 支持向量機(jī)-蟻群優(yōu)化算法流程圖
選擇京津城際南倉(cāng)變電所、京滬高鐵李營(yíng)變電所、大秦重載貨運(yùn)線木林變電所3個(gè)變電所的實(shí)測(cè)有功功率概率密度值進(jìn)行參數(shù)辨識(shí)驗(yàn)證,使用Matlab進(jìn)行仿真驗(yàn)證,下面以南倉(cāng)變電所為例,說明驗(yàn)證的具體過程。
(1)選取南倉(cāng)變電所功率概率密度值在最大概率值附近的6個(gè)點(diǎn)進(jìn)行曲線擬合,這6個(gè)點(diǎn)基本上是概率密度較為顯著的點(diǎn),而非一些可能是由隨機(jī)事件造成的小概率事件點(diǎn),分別為(1.5,0.85%)、(5.5,10.72%)、(9.5,8.5%)、(13.5,3.18%)、(17.5,0.76%)、(21.5,0.19%)。
(2)設(shè)置μ∈(0.1,6),初始值為3,σ∈(0.1,2),初始值為1,n∈(1,6),初始值為4,p∈(0,1),初始值為0.5,揮發(fā)系數(shù)ρ=0.5,閾值ε=0.4,信息素強(qiáng)度Q=100,收縮系數(shù)α=0.5,網(wǎng)格數(shù)量N=100,信息素矩陣初始化為全100的矩陣,蒙特卡羅仿真樣本數(shù)30 000個(gè),功率概率密度統(tǒng)計(jì)區(qū)間長(zhǎng)度的一半Δp=0.5 MW,用來(lái)參數(shù)預(yù)辨識(shí)的螞蟻數(shù)量為10只,迭代次數(shù)為100次,用來(lái)正式參數(shù)辨識(shí)的螞蟻數(shù)量為50只,內(nèi)循環(huán)迭代次數(shù)為5次,外循環(huán)迭代次數(shù)為100次。
(3)運(yùn)行支持向量機(jī)-蟻群優(yōu)化算法。
參數(shù)的最終辨識(shí)結(jié)果為:(μ,σ,n,p)=(2.025,0.660,6,0.643),將最終參數(shù)辨識(shí)結(jié)果輸入蒙特卡羅仿真進(jìn)行驗(yàn)證,輸出隨機(jī)樣本30 000個(gè)并統(tǒng)計(jì)其概率密度將其與實(shí)際值做對(duì)比。同理可以進(jìn)行京滬高鐵李營(yíng)變電所、大秦重載貨運(yùn)線木林變電所的負(fù)荷參數(shù)辨識(shí),3個(gè)變電所功率概率密度實(shí)測(cè)值與擬合值對(duì)比見圖4。圖4(c)中,由于木林變電所空載功率較大,故在空載功率處存在尖峰,將空載功率點(diǎn)忽略后,擬合效果也非常好。
圖4 3個(gè)變電所功率概率密度值實(shí)測(cè)值與擬合值對(duì)比
支持向量機(jī)優(yōu)化的蟻群算法與不進(jìn)行支持向量機(jī)優(yōu)化的蟻群算法參數(shù)辨識(shí)結(jié)果對(duì)比見表1。擬合誤差表示的是所擬合函數(shù)與擬合點(diǎn)之間的誤差,用來(lái)評(píng)估所擬合函數(shù)的擬合準(zhǔn)確度,而泛化誤差則表示的是所擬合函數(shù)與未擬合的實(shí)測(cè)數(shù)據(jù)點(diǎn)之間的誤差,用來(lái)評(píng)估擬合函數(shù)對(duì)于未知數(shù)據(jù)的預(yù)測(cè)能力,一個(gè)好的擬合函數(shù)應(yīng)該兼顧對(duì)于所擬合數(shù)據(jù)的擬合能力以及未知數(shù)據(jù)的預(yù)測(cè)能力[24]。由表1可知,由支持向量機(jī)改進(jìn)后的蟻群算法在擬合誤差同樣很小的情況下,其具有更小的泛化誤差,故其辨識(shí)出的參數(shù)組具有更強(qiáng)的泛化性能。
表1 蟻群算法直接參數(shù)辨識(shí)與使用支持向量機(jī)優(yōu)化的蟻群算法參數(shù)辨識(shí)結(jié)果對(duì)比
牽引負(fù)荷建模工作有助于揭示電氣化鐵路對(duì)于電網(wǎng)的影響機(jī)理,其中參數(shù)辨識(shí)的準(zhǔn)確性至關(guān)重要?;谏鲜龉ぷ?,本文主要得出以下結(jié)論:
(1)基于二項(xiàng)分布的列車行車密度描述方法,給出的牽引變電所電力負(fù)荷概率模型,能夠準(zhǔn)確地描述牽引負(fù)荷的隨機(jī)波動(dòng)性和統(tǒng)計(jì)特征。
(2)考慮到模型參數(shù)之間的關(guān)聯(lián)性,提出了通過機(jī)器學(xué)習(xí)算法改進(jìn)辨識(shí)精度的思路,并基于支持向量機(jī)給出了改進(jìn)方案和具體步驟,研究表明,支持向量機(jī)增強(qiáng)了參數(shù)辨識(shí)算法在領(lǐng)域選擇上的傾向性,提高了牽引負(fù)荷模型參數(shù)辨識(shí)的準(zhǔn)確性。
(3)分析閾值的選擇對(duì)于支持向量機(jī)最后分類效果的影響,得出在實(shí)際的操作中,不僅需要根據(jù)誤差要求動(dòng)態(tài)調(diào)整閾值,也需要考慮訓(xùn)練支持向量機(jī)的正負(fù)樣本的占比問題。
最后,本文所提方法的支持向量機(jī)的指導(dǎo)作用不僅能適用于蟻群算法,實(shí)際上還能適用于各種可以利用歷史誤差數(shù)據(jù)的尋優(yōu)算法,其本質(zhì)是挖掘模型參數(shù)之間存在的隱性聯(lián)系或者很難用簡(jiǎn)單的表達(dá)式來(lái)描述的顯性聯(lián)系,通過將各個(gè)參數(shù)映射至高維空間再進(jìn)行分類的方法,將這種聯(lián)系進(jìn)行數(shù)值化表述,進(jìn)而可以進(jìn)一步指導(dǎo)參數(shù)的優(yōu)化方向,實(shí)際上,只要模型參數(shù)之間存在內(nèi)在聯(lián)系,該方法就具有可行性。