張碩+何發(fā)智+周毅+鄢小虎
摘 要:基于統(tǒng)一計(jì)算設(shè)備架構(gòu)(CUDA)對(duì)圖形處理器(GPU)下的并行粒子群優(yōu)化(PSO)算法作改進(jìn)研究。根據(jù)CUDA的硬件體系結(jié)構(gòu)特點(diǎn),可知Block是串行執(zhí)行的,線程束(Warp)才是流多處理器(SM)調(diào)度和執(zhí)行的基本單位。為了充分利用Block中線程的并行性,提出基于自適應(yīng)線程束的GPU并行PSO算法:將粒子的維度和線程相對(duì)應(yīng);利用GPU的Warp級(jí)并行,根據(jù)維度的不同自適應(yīng)地將每個(gè)粒子與一個(gè)或多個(gè)Warp相對(duì)應(yīng);自適應(yīng)地將一個(gè)或多個(gè)粒子與每個(gè)Block相對(duì)應(yīng)。與已有的粗粒度并行方法(將每個(gè)粒子和線程相對(duì)應(yīng))以及細(xì)粒度并行方法(將每個(gè)粒子和Block相對(duì)應(yīng))進(jìn)行了對(duì)比分析,實(shí)驗(yàn)結(jié)果表明,所提出的并行方法相對(duì)前兩種并行方法,CPU加速比最多提高了40。
關(guān)鍵詞:粒子群優(yōu)化算法;并行計(jì)算;圖形處理器;統(tǒng)一計(jì)算設(shè)備架構(gòu);自適應(yīng)線程束
中圖分類號(hào): TP301.6
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-9081(2016)12-3274-06