国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于自適應(yīng)線程束的GPU并行粒子群優(yōu)化算法

2017-01-13 20:06張碩何發(fā)智周毅鄢小虎
計(jì)算機(jī)應(yīng)用 2016年12期
關(guān)鍵詞:并行計(jì)算

張碩+何發(fā)智+周毅+鄢小虎

摘 要:基于統(tǒng)一計(jì)算設(shè)備架構(gòu)(CUDA)對(duì)圖形處理器(GPU)下的并行粒子群優(yōu)化(PSO)算法作改進(jìn)研究。根據(jù)CUDA的硬件體系結(jié)構(gòu)特點(diǎn),可知Block是串行執(zhí)行的,線程束(Warp)才是流多處理器(SM)調(diào)度和執(zhí)行的基本單位。為了充分利用Block中線程的并行性,提出基于自適應(yīng)線程束的GPU并行PSO算法:將粒子的維度和線程相對(duì)應(yīng);利用GPU的Warp級(jí)并行,根據(jù)維度的不同自適應(yīng)地將每個(gè)粒子與一個(gè)或多個(gè)Warp相對(duì)應(yīng);自適應(yīng)地將一個(gè)或多個(gè)粒子與每個(gè)Block相對(duì)應(yīng)。與已有的粗粒度并行方法(將每個(gè)粒子和線程相對(duì)應(yīng))以及細(xì)粒度并行方法(將每個(gè)粒子和Block相對(duì)應(yīng))進(jìn)行了對(duì)比分析,實(shí)驗(yàn)結(jié)果表明,所提出的并行方法相對(duì)前兩種并行方法,CPU加速比最多提高了40。

關(guān)鍵詞:粒子群優(yōu)化算法;并行計(jì)算;圖形處理器;統(tǒng)一計(jì)算設(shè)備架構(gòu);自適應(yīng)線程束

中圖分類號(hào): TP301.6

文獻(xiàn)標(biāo)志碼:A

文章編號(hào):1001-9081(2016)12-3274-06

猜你喜歡
并行計(jì)算
基于Hadoop的民航日志分析系統(tǒng)及應(yīng)用
云計(jì)算中MapReduce分布式并行處理框架的研究與搭建
矩陣向量相乘的并行算法分析
并行硬件簡(jiǎn)介
不可壓NS方程的高效并行直接求解
基于GPU的超聲場(chǎng)仿真成像平臺(tái)
基于Matlab的遙感圖像IHS小波融合算法的并行化設(shè)計(jì)
Spark計(jì)算引擎的數(shù)據(jù)對(duì)象緩存優(yōu)化研究
基于枚舉的并行排序與選擇算法設(shè)計(jì)
最大匹配問(wèn)題Tile自組裝模型