国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于自適應(yīng)步長(zhǎng)的隨機(jī)遞歸梯度算法

2023-03-02 03:17:10李曉桐王福勝喬曉云
關(guān)鍵詞:集上步長(zhǎng)殘差

李曉桐,王福勝*,喬曉云

(1.太原師范學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,山西 晉中 030619;2.山西工程科技職業(yè)大學(xué) 基礎(chǔ)課教學(xué)部,山西 晉中 030619)

0 引言

在大規(guī)模機(jī)器學(xué)習(xí)中,如下優(yōu)化問(wèn)題常常出現(xiàn):

(1)

xt+1=xt-ηt?fit(xt),

(2)

其中下標(biāo)it是從{1,2,…,n}中隨機(jī)選取得到.

在機(jī)器學(xué)習(xí)中有許多改進(jìn)SGD的工作[3-4].近年來(lái),出現(xiàn)了大量被稱(chēng)為方差減少方法的隨機(jī)梯度算法的改進(jìn)變體,如:隨機(jī)方差縮減梯度算法(SVRG)[5],隨機(jī)遞歸梯度算法(SARAH,SARAH+)[6],隨機(jī)平均梯度算法(SAG)[7],隨機(jī)對(duì)偶坐標(biāo)上升算法(SDCA)[8],小批量半隨機(jī)梯度下降算法(mS2GD)[9],和SAGA[10]等.近年來(lái),對(duì)于隨機(jī)遞歸梯度算法有新的改進(jìn),如SARAH++[11].

1 算法

因此,文獻(xiàn)[11]中將SARAH+修改為SARAH++,算法如下:

算法1 SARAH++輸入: 0<γ≤1,步長(zhǎng)0<η≤γL,內(nèi)循環(huán)數(shù)m,最大迭代數(shù)T,樣本數(shù)n以及初始點(diǎn)x~0,G=0,s=0;1:while G

下面將上述自適應(yīng)步長(zhǎng)與SARAH++算法相結(jié)合構(gòu)造成新的算法,見(jiàn)算法2.

算法2 SARAH++AS輸入: 0<γ≤1,步長(zhǎng)0<η≤γL,內(nèi)循環(huán)數(shù)m,最大迭代數(shù)T,樣本數(shù)n以及初始點(diǎn)x~0,G=0,s=0;1:while G1 then4: 計(jì)算Ls= Fxs()- F(xs-1)xs-xs-15: 計(jì)算步長(zhǎng)ηs=γmLs6: end if7: while v(s)t2≥γv(s)02 and t≤m do8: x(s)t+1=x(s)t-ηv(s)t,t=t+19: if m≠0 do10: 隨機(jī)選取it∈{1,2,…,n},11: v(s)t= fit(x(s)t)- fit(x(s)t-1)+v(s)t-112: end if 13: end while14:KS=t,x~s=x(s)KS,G=G+KS15: end whileS=s,x^=x~s

2 收斂性分析

假設(shè)1假設(shè)每個(gè)函數(shù)fi(x)的梯度是L-Lipschitz連續(xù)的,即存在一個(gè)常數(shù)L,有

假設(shè)2假設(shè)每個(gè)fi都是凸的,且目標(biāo)函數(shù)F(x)是μ-強(qiáng)凸的,即

在假設(shè)2中,我們定義x*為最優(yōu)解,F(x)的強(qiáng)凸性等價(jià)為:

假設(shè)3假設(shè)每個(gè)函數(shù)fi(x)都是凸函數(shù),則有

fi(y)≥fi(x)+?fi(x)T(y-x),?x,y∈d.

其中x*是F(x)的最優(yōu)解.

在上述式子中,若假設(shè)Lη

證:根據(jù)F(x)的強(qiáng)凸的可知:

(1-μη)

3 數(shù)值實(shí)驗(yàn)

針對(duì)機(jī)器學(xué)習(xí)中二分類(lèi)的l2正則化邏輯回歸問(wèn)題:給定一組訓(xùn)練集(a1,b1),……,(an,bn),其中ai∈d,bi∈{+1,-1},通過(guò)求解下列問(wèn)題得到最優(yōu)預(yù)測(cè)值x∈d,

實(shí)驗(yàn)包括三個(gè)部分:首先,展示了SARAH++AS與SARAH++兩個(gè)算法的收斂速度,驗(yàn)證了SARAH++AS的有效性;其次,對(duì)比了兩個(gè)算法取不同步長(zhǎng)的變化趨勢(shì);最后,對(duì)比了SARAH++AS取不同γ之后對(duì)殘差的影響.所有的實(shí)驗(yàn)結(jié)果如圖1所示.

圖1 不同數(shù)據(jù)集上的SARAH++AS和SARAH++算法殘差對(duì)比

圖1對(duì)比了SARAH++AS與SARAH++兩個(gè)算法的收斂速度,其中x軸代表外循環(huán)數(shù),y軸表示殘差對(duì)比,即F(xs)-F(x*).圖中,藍(lán)色,紅色和綠色實(shí)線代表不同步長(zhǎng)的 SARAH++AS 算法,藍(lán)色,紅色和綠色虛線對(duì)應(yīng)著固定步長(zhǎng)的 SARAH++ 算法.四個(gè)子圖(a),(b),(c)和(d)分別對(duì)應(yīng)于phishing,ijcnn1,w8a和 splice 四個(gè)數(shù)據(jù)集.從圖中可以看出,SARAH++AS比固定步長(zhǎng)的SARAH++算法快,并且當(dāng)選擇不同的初始步長(zhǎng)η時(shí),SARAH++AS算法的收斂性能不受影響,對(duì)于步長(zhǎng)的選取更加容易.

圖2對(duì)比了兩個(gè)算法在不同數(shù)據(jù)集上的求解目標(biāo)函數(shù)時(shí)步長(zhǎng)的變化趨勢(shì),其中x軸代表外循環(huán)數(shù),y軸表示步長(zhǎng)變化.圖中藍(lán)色,紅色和綠色實(shí)線代表不同步長(zhǎng)的 SARAH++AS 算法,藍(lán)色,紅色和綠色虛線對(duì)應(yīng)著固定步長(zhǎng)的 SARAH++ 算法.從圖中可以看出,SARAH++AS比固定步長(zhǎng)的SARAH++算法快,并且當(dāng)選擇不同的初始步長(zhǎng)η時(shí),SARAH++AS算法的收斂性能不受影響,對(duì)于步長(zhǎng)的選取更加容易.

圖2 不同數(shù)據(jù)集上的SARAH++AS和SARAH++算法步長(zhǎng)對(duì)比

圖3 SARAH++AS算法中取不同γ對(duì)殘差的影響

4 結(jié)論

在本文中,將自適應(yīng)步長(zhǎng)與SARAH++算法結(jié)合,提出了一種改進(jìn)的算法SARAH++AS.從實(shí)驗(yàn)結(jié)果分析來(lái)看,相比于使用固定步長(zhǎng)的SARAH++算法,新算法的收斂速度更快,不受初始步長(zhǎng)選取的影響.新算法對(duì)初始步長(zhǎng)的選擇是有效的.

猜你喜歡
集上步長(zhǎng)殘差
基于雙向GRU與殘差擬合的車(chē)輛跟馳建模
基于Armijo搜索步長(zhǎng)的BFGS與DFP擬牛頓法的比較研究
基于殘差學(xué)習(xí)的自適應(yīng)無(wú)人機(jī)目標(biāo)跟蹤算法
Cookie-Cutter集上的Gibbs測(cè)度
鏈完備偏序集上廣義向量均衡問(wèn)題解映射的保序性
基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
復(fù)扇形指標(biāo)集上的分布混沌
平穩(wěn)自相關(guān)過(guò)程的殘差累積和控制圖
河南科技(2015年8期)2015-03-11 16:23:52
基于逐維改進(jìn)的自適應(yīng)步長(zhǎng)布谷鳥(niǎo)搜索算法
一種新型光伏系統(tǒng)MPPT變步長(zhǎng)滯環(huán)比較P&O法
石景山区| 安徽省| 攀枝花市| 北辰区| 临西县| 古交市| 绥中县| 资中县| 伊通| 盐池县| 彭山县| 图木舒克市| 廊坊市| 类乌齐县| 客服| 鹤壁市| 土默特左旗| 屯门区| 册亨县| 武汉市| 阳西县| 徐闻县| 莱芜市| 南通市| 图们市| 罗源县| 辽阳县| 富川| 犍为县| 新昌县| 肇庆市| 托克逊县| 会东县| 荆州市| 吉木乃县| 洪洞县| 信阳市| 南溪县| 鱼台县| 沂水县| 洞头县|