不論是AMD、Intel的CPU還是AMD、NVIDIA的GPU,F(xiàn)inFET工藝都會(huì)帶來(lái)20%以上的性能提升,30-40%的功耗降低,最終的CPU/GPU不僅性能更強(qiáng),功耗也會(huì)大幅降低。
在過(guò)去的幾年里,盡管PC產(chǎn)業(yè)一直面臨下滑的困境,但技術(shù)進(jìn)步是止不住的,越是在困難的情況下,技術(shù)發(fā)展就越重要,新技術(shù)不僅能為企業(yè)打開新的大門,也能給消費(fèi)者帶來(lái)全新的應(yīng)用體驗(yàn),創(chuàng)造全新的需求,從而推動(dòng)產(chǎn)品升級(jí)換代。作為PC核心技術(shù)的CPU、GPU等領(lǐng)域,會(huì)有哪些值得關(guān)注的技術(shù)進(jìn)步呢?
半導(dǎo)體技術(shù)是整個(gè)PC產(chǎn)業(yè)的根基,半導(dǎo)體工藝沒(méi)進(jìn)步,核心PC產(chǎn)品就無(wú)法繼續(xù)發(fā)展。在過(guò)去的50年中“摩爾定律”成了主導(dǎo)半導(dǎo)體工藝進(jìn)展的金科玉律,Intel不僅是摩爾定律的提出者,也是摩爾定律最堅(jiān)定的捍衛(wèi)者,Intel也靠著摩爾定律成就了一方霸業(yè)。
但是業(yè)界對(duì)摩爾定律的質(zhì)疑也從來(lái)沒(méi)斷過(guò),特別是最近幾年,很多人都認(rèn)為硅基半導(dǎo)體技術(shù)很快就要面臨極限了,Intel自己的“Tick-Tock”鐘擺戰(zhàn)略在Haswell架構(gòu)之后也失效了,14nm工藝延期了一年多,以致于到了2016年14nm依然會(huì)是主流。
按照目前的形勢(shì)來(lái)看,14/16nm FinFET工藝已經(jīng)成熟,除了Intel之外,TSMC、三星已經(jīng)在去年分別量產(chǎn)了14nm、16nm FinFET工藝,今年開始量產(chǎn)第二代高性能工藝了,GlobalFoundries今年也會(huì)量產(chǎn)14nm工藝。下一步是10nm節(jié)點(diǎn),雖然進(jìn)度比預(yù)期的晚,不過(guò)10nm工藝現(xiàn)在也渡過(guò)研發(fā)階段了,目前正在準(zhǔn)備量產(chǎn),Intel預(yù)計(jì)是在2017年下半年推出10nm CannonLake處理器,TSMC與三星在10nm工藝上更積極,對(duì)宣稱今年下半年就會(huì)量產(chǎn)10nm工藝。
10nm之后就是7nm節(jié)點(diǎn)了,但它離量產(chǎn)還有段距離,因?yàn)楣に囋较冗M(jìn),晶體管間距越小,漏電流也愈加嚴(yán)重,導(dǎo)致晶體管功耗過(guò)高。除此之外,先進(jìn)的生產(chǎn)工藝還要依賴半導(dǎo)體制造裝備的進(jìn)步,原本在10nm工藝就準(zhǔn)備啟用的EUV光刻機(jī)一直不夠成熟,ASML公司為了研發(fā)EUV設(shè)備投入了相當(dāng)多的資源,但EUV光刻機(jī)的產(chǎn)量及光照強(qiáng)度還是上不去,離規(guī)?;I(yè)生產(chǎn)還有很長(zhǎng)的距離,以致于Intel等公司并不看好7nm節(jié)點(diǎn)啟用EUV的前景,有可能要拖到5nm節(jié)點(diǎn)。硅基半導(dǎo)體受挫,科研人員很早就開始尋找新的半導(dǎo)體材料,包括砷化鎵、碳納米管甚至量子阱晶體管。2015年IBM及合作伙伴三星、GlobalFoundries率先展示了7nm工藝芯片,使用的就是硅鍺材料,使用這種材料的晶體管開關(guān)速度更快,功耗更低,而且密度更高,可以輕松實(shí)現(xiàn)200億晶體管,晶體管密度比目前的硅基半導(dǎo)體高出一個(gè)量級(jí)。
英特爾公司雖然沒(méi)有展示過(guò)7nm工藝,但他們對(duì)此一直很自信,此前表態(tài)稱即便沒(méi)有EUV工藝,他們也懂得如何制造7nm芯片,但愿這沒(méi)有在吹牛,因?yàn)镮ntel能否即時(shí)推出7nm工藝,關(guān)系著摩爾定律還能否再戰(zhàn)二十年。
半導(dǎo)體工藝發(fā)展雖然很重大,但并不急迫,AMD、Intel新一代處理器至少還有14nm、10nm兩代工藝可用。2016年這兩家都會(huì)推出新一代處理器,其中AMD推的是嘔心瀝血研發(fā)多年的改頭換面之作——Zen處理器,Intel今年則會(huì)有Broadwell-E及Kabylake處理器。
先說(shuō)領(lǐng)跑者Intel,今年的2代新品中,Broadwell-E是針對(duì)LGA2011平臺(tái)的HEPT發(fā)燒級(jí)處理器,Kabylake是針對(duì)主流市場(chǎng)的LGA1151處理器,前者最動(dòng)人的地方在于桌面處理器首次出現(xiàn)10核心設(shè)計(jì),旗艦型號(hào)Core i7-6950X將是10核20線程,頻率3.0GHz,L3緩存高達(dá)25MB。
至于跟跑者AMD,他們今年上半年會(huì)把第四代模塊化架構(gòu)Excavator核心帶到桌面市場(chǎng)上,推出AM4插槽的Bristol Ridge處理器,下半年的重點(diǎn)則是Zen架構(gòu)處理器,也是AM4插槽,但架構(gòu)、工藝全新升級(jí),放棄之前由推土機(jī)架構(gòu)引入的模塊多核理念,回歸傳統(tǒng)的SMT多線程。
Zen架構(gòu)曝光率非常高,隔三差五就要在媒體上亮相,雖然我們對(duì)Zen架構(gòu)的細(xì)節(jié)所知甚少,但從AMD及各方流傳出來(lái)的信息來(lái)看,Zen架構(gòu)性能值得期待,官方表示IPC性能提升40%還多,14nm FinFET工藝也會(huì)大幅降低處理器的功耗。
還有一點(diǎn)值得注意,不光Intel在推8核甚至10核處理器,AMD的Zen架構(gòu)多核并行能力也有提高,桌面版首發(fā)時(shí)至少是4核8線程起步,中高端會(huì)是8核16線程,而服務(wù)器/工作站出現(xiàn)16核32線程甚至32核64線程也不要驚訝。
不論是Intel的10核處理器還是AMD的16核處理器,桌面處理器在突破6核、8核之后會(huì)繼續(xù)進(jìn)入10核+時(shí)代,Intel Broadwell-E在前兩代突破8核之后已經(jīng)確定有10核20線程產(chǎn)品,AMD的Zen架構(gòu)更加激進(jìn),8核16線程不是問(wèn)題,是否會(huì)在桌面市場(chǎng)推出12核甚至16核的旗艦也令人期待。
伴隨著CPU、GPU計(jì)算性能的飛速增長(zhǎng),PCI-E總線也要有相應(yīng)的準(zhǔn)備,不過(guò)最新一代PCI-E 4.0總線技術(shù)已經(jīng)推遲了,原定于2015年上半年發(fā)布最終規(guī)范,但現(xiàn)在來(lái)看PCI-E 4.0總線可能要拖到2016年甚至2017年了。
新一代總線具備更高的性能,具體來(lái)說(shuō), 目前在用的PCI-E 3.0總線速率是8GT/s,Link帶寬8Tb/s,每一通道帶寬約為1GB/s,x16通道雙向帶寬32GB/s,而PCI-E 4.0在PCI-E 3.0基礎(chǔ)上保持架構(gòu)不變,速率翻倍到16GT/s,通道帶寬提升到2GB/s,x16雙向帶寬高達(dá)64GB/s。
不過(guò)PCI-E 4.0面臨的問(wèn)題也不少,除了銅介質(zhì)速率繼續(xù)提升的技術(shù)難題之外,PCI-E 4.0最大的尷尬之處在于——桌面顯卡用不到這么高的帶寬,高性能計(jì)算領(lǐng)域PCI-E 4.0帶寬又不給力。前者很好說(shuō),因?yàn)閺腜CI-E 2.0到PCI-E 3.0時(shí)代,顯卡性能也沒(méi)有因此受益,PCI-E 3.0 x16帶寬已經(jīng)達(dá)到了32GB/s,目前的高端顯卡并不需要這么高的帶寬,而升級(jí)到PCI-E 4.0,64GB/s的帶寬對(duì)桌面顯卡來(lái)說(shuō)也是浪費(fèi)。
如果用到HPC領(lǐng)域,PCI-E 4.0帶寬的64GB/s又有點(diǎn)捉襟見(jiàn)肘了,等不及的廠商早已經(jīng)在暗地里開發(fā)新的總線技術(shù),其中NVIDIA跟IBM聯(lián)合開發(fā)了NVLink總線,號(hào)稱帶寬是PCI-E總線的5-12倍,AMD也在開發(fā)自家的架構(gòu)互聯(lián)技術(shù),帶寬超過(guò)100GB/s。
無(wú)論AMD還是NVIDIA,他們開發(fā)的新總線技術(shù)帶寬可以輕松超過(guò)100GB/s,這對(duì)服務(wù)器產(chǎn)品很有用,但對(duì)桌面市場(chǎng)有什么意義呢?值得發(fā)燒友關(guān)注的就是多卡互聯(lián)技術(shù),目前AMD、NVIDIA最多能做到的也就是4卡SLI/CF交火,有了NVLink這樣的技術(shù),8卡SLI或者CF都是有可能的。
說(shuō)完了CPU處理器,我們也不能忽視GPU處理器。作為當(dāng)前PC中功耗最高的一部分,顯卡對(duì)游戲性能影響至關(guān)重要,但在性能越高=功耗越高這條路上,顯卡也面臨一個(gè)選擇——NVIDIA的Maxwell架構(gòu)證明了顯卡性能增長(zhǎng)的同時(shí),能耗也可以很低。2016年的GPU不僅要性能,更重要的是效能,我們要看到還是每瓦性能比。
在Maxwell架構(gòu)之后,NVIDIA將推出新一代的Pascal架構(gòu)。根據(jù)官方公布的資料,Pascal顯卡將支持3D Memory顯存,容量、帶寬可達(dá)普通顯存的2-4倍,而顯卡只有標(biāo)準(zhǔn)PCI-E顯卡的1/3大小,如今基于Pascal架構(gòu)的新一代顯示芯片已經(jīng)有兩款高端產(chǎn)品——GeForce GTX 1080、GTX 1070相繼問(wèn)世了。
至于AMD,由于目前的R200、R300系列顯卡大都還在使用GCN架構(gòu)改款,制程工藝還是28nm工藝,能效方面已經(jīng)落后NVIDIA的Maxwell架構(gòu)了,所以2016年AMD也會(huì)在GPU領(lǐng)域有大動(dòng)作——推出了GCN 4.0架構(gòu)Polaris,制程工藝升級(jí)到14/16nm FinFET,同時(shí)會(huì)搭配HBM 2顯存,號(hào)稱每瓦性能比提升一倍。
AMD還實(shí)際演示了Polaris顯卡的能效優(yōu)勢(shì),之前使用用Polaris架構(gòu)的一款中端顯卡跟NVIDIA的GTX 950做了對(duì)比,同樣是在1920x1080 60fps的性能上,Polaris顯卡的整機(jī)功耗是86W,而GTX 950整機(jī)功耗是140W,可見(jiàn)功耗優(yōu)勢(shì)非常非常大。2016年GPU要想提高性能、降低功耗,除了架構(gòu)改進(jìn)之外,新一代內(nèi)存技術(shù)也功不可沒(méi),其中AMD在去年的Fury顯卡上首次使用的HBM內(nèi)存就是代表,NVIDIA所說(shuō)的3D顯存其實(shí)也是HBM技術(shù),不過(guò)是HBM 2代技術(shù)。與HBM競(jìng)爭(zhēng)的則是美光主導(dǎo)的HMC內(nèi)存技術(shù)。對(duì)于HBM技術(shù),簡(jiǎn)單來(lái)說(shuō),HBM就是在GDDR5顯存無(wú)法繼續(xù)大幅提升頻率的情況下?lián)Q了一種思路,通過(guò)提高總線位寬來(lái)提高帶寬,第一代HBM顯存的頻率只有500MHz,等效1GHz,遠(yuǎn)低于目前的GDDR5顯存,但帶寬高達(dá)128GB/s,4顆芯片總計(jì)可以帶來(lái)512GB/s的帶寬,遠(yuǎn)高于主流GDDR5顯存。(圖8)
2016年HBM 2代也來(lái)了,JEDEC已經(jīng)正式批準(zhǔn)了HBM 2顯存規(guī)范,相比第一代HBM,HBM 2可堆棧的層數(shù)更多,單顆容量最高可達(dá)8GB,頻率也翻倍到2Gbps,帶寬從128GB/s提高到256GB/s,這樣一來(lái)布置4組HBM 2顯存就可以實(shí)現(xiàn)32GB容量、1TB/s的帶寬了,次之也有16GB容量,1TB/s帶寬,這正好與NVIDIA之前宣稱的數(shù)據(jù)相符。
HBM內(nèi)存技術(shù)已經(jīng)得到了SK Hynix、三星等廠商的支持,另一個(gè)內(nèi)存技術(shù)大腕美光的選擇不同——顯存市場(chǎng)他們繼續(xù)推改良版的GDDR5X,3D堆棧內(nèi)存上則選擇了HMC(Hybrid Memory Cube),它跟HBM一樣都需要使用TSV工藝連接多層DRAM芯片。
性能方面,HMC閃存相比DDR內(nèi)存依然有足夠多的優(yōu)勢(shì),普通DDR3-1600內(nèi)存雙通道帶寬不過(guò)12.8GB/s,美光之前宣稱HMC的性能是DDR3內(nèi)存的20倍,單通道帶寬就有128GB/s(跟HBM 1代相同),同時(shí)功耗比DDR3減少70%,占用面積比DDR3減少95%。
HMC陣營(yíng)實(shí)際上也有Intel、三星等其他公司參與,但目前力推HMC的基本上只有美光公司,他們現(xiàn)在推出了2/4GB容量的HMC內(nèi)存,有兩種封裝,896-Ball BGA封裝的帶寬為160GB/s,666-Ball BGA封裝的帶寬是120GB/s。
具體應(yīng)用方面,HMC在Intel的新一代Xeon Phi加速卡上露過(guò)面了,代號(hào)Knights Landing的Xeon Phi加速卡配備了16GB板載緩存,號(hào)稱5倍帶寬、5倍能效于DDR4內(nèi)存,它就是美光提供的HMC內(nèi)存。
不過(guò)總體來(lái)看,HMC相對(duì)HBM來(lái)說(shuō)還有點(diǎn)滯后,HBM在新一代顯卡上站穩(wěn)腳跟沒(méi)問(wèn)題,未來(lái)也會(huì)進(jìn)入服務(wù)器等市場(chǎng),HMC受到的支持力度不如HBM,不過(guò)3D內(nèi)存技術(shù)現(xiàn)在還是新興事物,現(xiàn)在給HBM、HMC作出最終判決還有點(diǎn)為時(shí)過(guò)早。2016年半導(dǎo)體/處理器技術(shù)的進(jìn)步首先要依賴工藝升級(jí),雖然10nm及7nm工藝還有點(diǎn)遠(yuǎn),但2016年我們可以預(yù)期新一代處理器全面升級(jí)14/16nm FinFET工藝,這比去年的28nm、20nm工藝已經(jīng)有很大進(jìn)步了。不論是AMD、Intel的CPU還是AMD、NVIDIA的GPU,F(xiàn)inFET工藝都會(huì)帶來(lái)20%以上的性能提升,30-40%的功耗降低,最終的CPU/GPU不僅性能更強(qiáng),功耗也會(huì)大幅降低。