劉向紅,張時(shí)光,李隱峰
(鴻富錦精密電子 天津300462)
IBM POWER8核心處理器
劉向紅,張時(shí)光,李隱峰
(鴻富錦精密電子 天津300462)
隨著云運(yùn)算和大數(shù)據(jù)產(chǎn)業(yè)的迅猛發(fā)展,數(shù)據(jù)處理和存儲(chǔ)技術(shù)的發(fā)展如火如荼。IBM 作為服務(wù)器行業(yè)的先行者,不甘心Intel一枝獨(dú)大,在2015年3月對(duì)外部客戶推出開(kāi)放型平臺(tái)POWER8。為使服務(wù)器開(kāi)發(fā)者和用戶快速了解該系列處理器,整理了POWER8的技術(shù)特點(diǎn)和產(chǎn)品特性,以利于快速比較和選型。
大數(shù)據(jù) 服務(wù)器 核心處理器 IBM POWER8
2013年8月26日,在斯坦福大學(xué)舉行的第25屆HotChip半導(dǎo)體大會(huì)上,IBM發(fā)布了新一代服務(wù)器處理器POWER8。POWER8采用22,nm SOI工藝,芯片核心面積為650,mm2。性能方面,POWER8采用超標(biāo)量體系架構(gòu),對(duì)稱型超線程設(shè)計(jì) 8-WaySMT,最大支持同時(shí)執(zhí)行 96 個(gè)線程。該產(chǎn)品可聯(lián)系OpenPOWER基金會(huì)進(jìn)行許可注冊(cè)并開(kāi)發(fā)設(shè)計(jì),這是IBM第1次對(duì)外開(kāi)放如此高端處理器的開(kāi)發(fā)許可。
POWER8 最大支持12核心芯片多線程設(shè)計(jì),每個(gè)核心能同時(shí)處理 8個(gè)硬件線程,執(zhí)行高速運(yùn)算,總共可同時(shí)執(zhí)行 96個(gè)線程運(yùn)算任務(wù)。處理器使用了大量的開(kāi)關(guān)芯片 eDRAM 作為緩存,內(nèi)存控制器在eDRAM開(kāi)啟狀態(tài),可以為內(nèi)存和系統(tǒng)I/O打開(kāi)很大的帶寬。對(duì)于大多數(shù)工作負(fù)荷,據(jù)說(shuō)緩存芯片可達(dá)到POWER7兩到三倍的計(jì)算速度。
在 POWER7及以前的處理器系列,使用 GX+外部通信總線,POWER8 刪除了這一設(shè)計(jì)并取而代之以 CAPI端口。CAPI端口用于連接一些專業(yè)的輔助處理器,如GPU、ASIC和FPGA。這些通過(guò)CAPI總線外加的處理單元可以與CPU使用相同的內(nèi)存地址空間,從而減少了計(jì)算路徑長(zhǎng)度。在2013年ACM和IEEE超級(jí)計(jì)算大會(huì)上,IBM和Nvidia宣布了一項(xiàng)合作工程,在未來(lái)的 HPC系統(tǒng)中,Nvidia GPU將與POWER8系統(tǒng)高度集成且已明確應(yīng)用于第 1款POWER系統(tǒng)S824L。
POWER8還包含1個(gè)OCC,即所謂的集成于芯片上的控制器,也就是基于PowerPC 405處理器的電能和熱能管理單片機(jī)。它有兩個(gè)通用卸載引擎(GPE)和 512,KB的嵌入式靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),通過(guò)OCC可直接訪問(wèn)主存——運(yùn)行中的一個(gè)開(kāi)源固件。OCC管理 POWER8的運(yùn)行頻率、電壓、內(nèi)存帶寬、熱控制處理器和內(nèi)存,它可以通過(guò) 1,764個(gè)位于Fly之上的集成調(diào)節(jié)器調(diào)整電壓。OCC也可以被編程用于超頻POWER8處理器或降低其功耗降低工作頻率(類似于一些 Intel和 AMD處理器中的可配置的TDP)。
POWER8已有4、6、8、10和12核等不同版本,每個(gè)版本都采用 15層金屬處理的 22,nm的絕緣硅(SOI)單元制造。12核心版本由 42億個(gè)晶體管構(gòu)成,大小為650,mm2,6核版本大小僅為362,mm2。
POWER8芯片的存儲(chǔ)器控制器設(shè)計(jì)為可使用DDR3或 DDR4內(nèi)存。而作為一個(gè)存儲(chǔ)緩沖區(qū)、L4高速緩存芯片和實(shí)際存儲(chǔ)器,被配對(duì)至外部原件Centaur,設(shè)計(jì)為永不過(guò)時(shí)技術(shù)的內(nèi)存控制器。當(dāng)前,Centaur芯片采用 DDR3內(nèi)存,但未來(lái)版本可以使用DDR4或一些其他存儲(chǔ)器技術(shù),而不需要修改POWER8芯片本身的設(shè)計(jì)。
每一個(gè) Centaur由 3條高速連接方式連接到POWER8(2讀 1寫),運(yùn)行帶寬 9.6,GB/s,總運(yùn)行帶寬 28.8,GB/s,具有 40,ns的時(shí)間延遲。Centaur包含有 16,MB的 eDRAM,可用作 L4高速緩存。每個(gè)POWER8的每個(gè)Socket可以鏈接最多8個(gè)Centaur芯片,合計(jì)每 Socket最多允許鏈接高達(dá) 1,TB,帶有128,MB的L4高速緩存和230,GB/s的持續(xù)存儲(chǔ)器帶寬,32,GB DRAM的接口以及410,GB/s的峰值內(nèi)存帶寬。Centaur芯片最終被集成到 DRAM的 DIMM模塊中。存儲(chǔ)控制器 Centaur 芯片采用與 POWER8一樣的制程技術(shù)。
每個(gè) POWER8核心擁有 64,KB的 L1數(shù)據(jù)和32,KB的L1指令緩存。每個(gè)核心的每個(gè)循環(huán)可以向16個(gè)執(zhí)行通道發(fā)出10條指令并分派8條指令:2個(gè)固定點(diǎn)的通道,2個(gè)加載/存儲(chǔ)通道,2個(gè)加載通道,4個(gè)雙精度浮點(diǎn)通道,也可以充當(dāng)8個(gè)單精度浮點(diǎn)運(yùn)算通道,2條VMX通道,1個(gè)加密通道,1個(gè)十進(jìn)制浮點(diǎn)通道,1個(gè)條件寄存器通道和 1個(gè)分支執(zhí)行通道。
它有一個(gè)更大的4×16問(wèn)題處理隊(duì)列入口,能提高分支任務(wù)預(yù)測(cè),處理多達(dá)兩倍的高速緩存缺失。每個(gè)核包含8路硬件多線程,可被動(dòng)和自動(dòng)分配到具有1個(gè)、2個(gè)、4個(gè)或所有 8個(gè)線程的運(yùn)算。POWER8還增加了對(duì)硬件事務(wù)存儲(chǔ)器的支持。IBM估計(jì),其每個(gè)內(nèi)核是 POWER7 單線運(yùn)算速度的1.6倍。
POWER8 處理器由 12 顆芯片設(shè)計(jì)而成,可能由4、6、8、10或12 顆芯片集合構(gòu)成,其中1組芯片集包括1顆核芯,SRAM 512,KB 的L2 高速緩存總線(是上一代產(chǎn)品的兩倍)和eDRAM 8,MB的每顆芯片集的芯片之間的 L3共享緩存。因此,6核芯處理器將有48,MB L3的eDRAM緩存,而12 核芯處理器將總共有 96,MB 的 L3,eDRAM 緩存。該芯片還可以利用1個(gè)高達(dá)128,MB的 eDRAM 緩存 L4 采用Centaur 配套芯片。集成于芯片上的內(nèi)存控制器可以處理 1,TB RAM 和 230,GB/s 的持續(xù)內(nèi)存帶寬。這些內(nèi)核設(shè)計(jì)用來(lái)處理2.5~5,GHz的時(shí)鐘速率。
POWER8的6核版采用的是IBM安裝在雙芯片模塊(DCM)對(duì)向外擴(kuò)展的服務(wù)器。在大多數(shù)配置中,并不是全部的核心都可以被激活,因此出現(xiàn)了各種實(shí)際核心數(shù)量的不同配置。 12核心版本直到 2014年5月還沒(méi)有發(fā)布到任何系統(tǒng)。
IBM的單芯片POWER8模塊被稱為Turismo,雙芯片變種被稱為 Murano。PowerCore 的修改版本被稱為CP1。
2014年1月19日,蘇州Powercore技術(shù)公司宣布,他們將加入OpenPower基金會(huì)并注冊(cè)POWER8核心應(yīng)用,為客戶定制設(shè)計(jì)大數(shù)據(jù)和云計(jì)算。
IBM Murano——雙6核的12核處理器。擴(kuò)展型處理器在某些核心關(guān)閉的情況可以啟用。
IBM Turismo——單芯片的12核處理器。替換型處理器在市售和注冊(cè)時(shí)可以帶有被關(guān)閉內(nèi)核配置。
PowerCore CP1——POWER8是修訂安全特性后的一個(gè)變種,由于美國(guó)和中國(guó)之間的出口限制,將在紐約East Fishkil的Global Foundries(IBM之前的工廠)生產(chǎn)。該產(chǎn)品已在2015年發(fā)布。
針對(duì)該款功能強(qiáng)大的服務(wù)器平臺(tái),全球多家知名系統(tǒng)開(kāi)發(fā)商在解決方案發(fā)布之初就已經(jīng)開(kāi)始投入巨資開(kāi)發(fā)自己的 POWER8系列產(chǎn)品,在服務(wù)器市場(chǎng)搶占先機(jī)。其中啟動(dòng)比較早的有以下公司及其產(chǎn)品:
6.1 IBM開(kāi)發(fā)的3大系列產(chǎn)品線
6.1.1 擴(kuò)展型服務(wù)器
支持雙芯片模塊的1個(gè)或2個(gè)插座有2個(gè)6核處理器的 POWER8。“L”版本只運(yùn)行 Linux,而其他版本運(yùn)行AIX、IBM i和Linux。典型機(jī)型如:
①Power Systems S812L:1×POWER8,DCM(4、6或 8核心),2,U;Power Systems S814。②1× POWER8,DCM(6或8核心),4,U或tower。③Power Systems S822 和 S822L:1×(2×)POWER8 DCM (6、10、12或 20核心),2,U。④Power Systems S824和 S824L:1×(2×)POWER8 DCM(6、8、12、16或24核心),4,U。
6.1.2 企業(yè)級(jí)服務(wù)器
支持節(jié)點(diǎn)具有4套處理器插槽,各載8、10或12核心模塊,最多的16套處理器插槽,128個(gè)內(nèi)核和內(nèi)存 16,TB。這些機(jī)器能夠運(yùn)行 AIX、IBM i或 Linux操作系統(tǒng)。
①Power Systems E850,2×POWER8、3×DCM或 4×POWER8 DCM(8、10或 12核心),4,U;②Power Systems E870(見(jiàn)圖1),1×5,U或2×5,U節(jié)點(diǎn),4套處理器插槽,8~10 核心,POWER8一體化芯片設(shè)計(jì),最高支持到 80核心;③Power Systems E880,1×5,U、2×5,U、3×5,U或4×5,U節(jié)點(diǎn),每節(jié)點(diǎn)4套處理器插槽,8~12核心,POWER8一體化芯片設(shè)計(jì),最高支持到192核心。
圖1 IBM Power E870Fig.1 IBM Power E870
6.1.3 高性能計(jì)算機(jī)
典型機(jī)型如:① Power Systems S812LC(Open-Power),1×POWER8,SCM(8或 10核心),2,U;②PowerSystems S822LC“Firestone”(OpenPower),2×POWER8,SCM(8或 10核心),2,U,由制造商Wistron 為 IBM制造,兩顆 Nvidia K80,GPUs和達(dá)1,TB容量的自由選配DDR3,RAM。
6.2 泰安電腦
①SP010GM2NR,集成POWER8一體化芯片設(shè)計(jì),ATX 架構(gòu)的主板;② Palmetto GN70-BP010 (OpenPower參考設(shè)計(jì)用的主板),2,U,4核心POWER8 SCM,4,RAM插槽,基于泰安設(shè)計(jì)的主板;③Habanero TN-71-BP012.2,U,帶有8核心POWER8 SCM,32 支RAM插槽。
6.3 谷歌
谷歌曾展示過(guò)內(nèi)部使用的設(shè)計(jì)方案,帶有兩套處理器插槽。
6.4 浪潮電子信息
浪潮已經(jīng)與IBM達(dá)成協(xié)議,采用POWER8平臺(tái)和相關(guān)技術(shù),開(kāi)發(fā)服務(wù)器硬件。產(chǎn)品定型為:4,U服務(wù)器,兩套 POWER8處理器插槽。
6.5 Cirrascale
RM4950:4,U,4核心POWER8,SCM帶有4顆Nvidia Tesla K40加速器,基于泰安電腦的主板方案。
6.6 ,ZoomNetcom
①RedPOWER C210和C22,2,U和4,U,服務(wù)器帶有兩套POWER8處理器插槽和 64支RAM插槽;②RedPOWER C310和C320,2U和4U,服務(wù)器帶有兩套CP1插槽。
6.7 Rackspace
Barreleye:1,U,雙處理器插槽,32支 RAM 插槽,基于Rackspace的開(kāi)放平臺(tái)及其OnMetal服務(wù)。
另外還有創(chuàng)和 OP:1,X(1,U,單處理器插槽,32支RAM 插槽)等產(chǎn)品已經(jīng)開(kāi)發(fā)成功。
包括縱向擴(kuò)展型(Scale-up)和橫向擴(kuò)展型(Scaleout)兩種方案,如圖2所示。
圖2 縱向擴(kuò)展型和橫向擴(kuò)展型方案示意Fig.2 Schematic of Scale-up and Scale-out solutions
縱向擴(kuò)展型,就是當(dāng)舊方案已無(wú)法滿足應(yīng)用需求時(shí),重新采購(gòu)新方案,切換到新方案后,淘汰舊方案。橫向擴(kuò)展型,就是當(dāng)舊方案已無(wú)法滿足需求時(shí),在保留原有舊方案基礎(chǔ)上,增加新方案投資,新舊方案同時(shí)運(yùn)行。
關(guān)于系統(tǒng)架構(gòu)選型,用戶在采購(gòu)之初很難準(zhǔn)確預(yù)測(cè)未來(lái)數(shù)據(jù)增長(zhǎng)的速度和總量,因而往往不得不采購(gòu)比自己目前實(shí)際需求容量更大的存儲(chǔ),這就導(dǎo)致兩個(gè)問(wèn)題,一是預(yù)算的浪費(fèi),很多存儲(chǔ)空間都是為未來(lái)數(shù)據(jù)增長(zhǎng)采購(gòu)的,花了 10,TB的錢,但是可能只利用了5,TB,另外5,TB的資金白白閑置。另一個(gè)問(wèn)題是,隨著時(shí)間推移,數(shù)據(jù)增長(zhǎng),數(shù)據(jù)量超過(guò)了 10,TB。按照過(guò)去Scale-up的理念,解決方案就是購(gòu)買更大容量的存儲(chǔ),則難免面臨數(shù)據(jù)遷移的問(wèn)題,用戶必須停機(jī)遷移數(shù)據(jù),意味著服務(wù)的中斷。而Scale-out架構(gòu)解決了這個(gè)矛盾。用戶按需采購(gòu)存儲(chǔ),一旦容量不夠了,再購(gòu)置一臺(tái)接到原有存儲(chǔ)上即可,所以橫向擴(kuò)展型方案對(duì)于連續(xù)運(yùn)行型需求有絕對(duì)優(yōu)勢(shì)?!?/p>
[1] IBM Announces POWER8 with OpenPOWER Partners[EB/OL]. http://www.moorinsightsstrategy.com/wpcontent/uploads/2014/04/IBM-Announces-POWER8-with-OpenPOWER-Partners-by-Moor-Insights-and-Strategy. Pdf.
[2] IBM POWER8[EB/OL]. http://komplex-it.dk/media/ 128719/ibm_power8. pdf.
[3] POWER8[EB/OL]. https: //en.wikipedia.org/wiki/ POWER8.
[4] Life at the Intersection:OpenPOWER,Open Compute,and the Future of Cloud Software & Infrastructure[EB/OL]. http://openpowerfoundation.org/blogs/lifeat-the-intersection-openpower-open-compute-and-thefuture-of-cloud-software-infrastructure.
[5] IBM to help China's Inspur to design servers [EB/OL]. https://www.yahoo.com/news/ibm-help-chinas-inspurdesign-servers-123642000--finance.html?ref=gs.
A Brief Introduction of IBM POWER8
LIU Xianghong,ZHANG Shiguang,LI Yinfeng
(HongFuJin Electronic Precision,Tianjin 300462,China)
With the rapid development of cloud computing and big data industry,data processing and storage technology are also growing vigorously.IBM,as a pioneer of server industry,is not willing to let Intel occupy the data processing market,therefore it launched POWER8,an open platform,for external customers in March 2015.To give server developers and users a quick overview of the series processors,this paper analyzes technical features and product characteristics of POWER8 to offer reference for rapid comparison and selection.
big data;server;core processor;IBM;POWER8
TP368.5
A
1006-8945(2016)07-0012-04
2016-06-02