一直以來,英偉達和AMD旗艦級顯示卡的龍爭虎斗都會成為消費者討論的焦點,本期CHIP就為大家?guī)韮杉易钚碌钠炫灱夛@示卡產(chǎn)品的對比測試,為追求極致的發(fā)燒級玩家們提供參考。
去年,英偉達采用GK104核心的GeForce GTX 680和單卡雙芯產(chǎn)品GeForce GTX 690凸顯了其小核心戰(zhàn)略的成功,原以為英偉達GeForce GTX 690順利拿下單卡卡皇的寶座之后,下一代旗艦產(chǎn)品應(yīng)該是GPU架構(gòu)更新?lián)Q代的小核心產(chǎn)品。但是考慮到這一代產(chǎn)品在性能尚不能完全甩開對手,因此英偉達在公司成立20周年之際,高調(diào)推出了由超級計算機領(lǐng)域直接“搬運”到桌面領(lǐng)域的GeForce GTX Titan這一超大核心的產(chǎn)品。這款產(chǎn)品一經(jīng)推出便顛覆了高端顯示卡市場Radeon HD 7970與GeForce GTX 680相對平衡的現(xiàn)狀,一躍成為了目前性能最強的單芯旗艦產(chǎn)品,再加上之前就已存在的GeForce GTX 690,一時之間,骨灰級玩家在談及旗艦級顯示卡時廠商似乎只有N卡可選擇。面對如此的狀況,AMD自然不會坐以待斃,在Radeon HD 7970發(fā)布了一年多之后,AMD終于在4月下旬正式推出了官方版的單卡雙芯產(chǎn)品Radeon HD 7990,它的誕生意味著AMD將停止目前在頂級顯示卡市場碌碌無為的現(xiàn)狀,重新披掛上陣征戰(zhàn)旗艦級顯示卡市場。
硬件規(guī)格:再創(chuàng)新高
英偉達GeForce GTX Titan采用的GK110核心架構(gòu)與目前的GeForce GTX 680所采用的GK104核心很相似,如SMX單元包含192個CUDA核心和16個紋理單元,但是執(zhí)行DP雙精度的運算單元增加到了64個(GK104只有8個)。GK104具有35億個晶體管、8組SMX單元、4組ROP管線及4組GDDR5控制器,而GK110完整版具有驚人的15組SMX單元、6組ROP管線以及6組GDDR5顯存控制器,于是晶體管數(shù)量達到了71億個,規(guī)模相比GK104幾乎翻了一番。GeForce GTX Titan只使用了GK110核心15組SMX中的14組,不過保留了完整的6組GDDR5顯存控制器和ROPs管線,于是它總計有2 688個CUDA核心、896個DP CUDA核心、224個紋理單元、384bit顯存位寬、6GB顯存容量和48組ROPs單元。頻率方面,由于GeForce GTX Titan有如此巨大的核心規(guī)模,所以它的核心頻率顯然不可能像GeForce GTX 680那樣輕松突破1GHz,其基礎(chǔ)頻率只有837MHz,Turbo頻率為876MHz,比GeForce GTX 680的1 006MHz/1 058MHz(Turbo頻率)低了不少,不過顯存頻率依然保留了GeForce GTX 680的水準(zhǔn)為6 008MHz,顯存帶寬高達288.33GB/s。
AMD的Radeon HD 7990采用的兩顆核心與Radeon HD 7970所采用的Tahiti XT相同,單顆Tahiti XT核心具有2048個流處理單元、128個紋理單元及32個光柵單元,晶體管數(shù)量達到了43.1億個,并配備了3GB/384bit規(guī)格的GDDR5顯存。于是Radeon HD 7990具有4 096個流處理器、256個紋理單元和64個光柵單元,晶體管數(shù)量也達到了86.2億個。物理顯存容量雖然翻倍,但是由于雙卡同時渲染工作的原因,實際使用時等效顯存容量不變,依然為3GB。頻率方面,Radeon HD7990的默認核心/顯存頻率為1000MHz/6000MHz,顯存帶寬為288GB/s,與對手基本持平。
架構(gòu)設(shè)計:各有特色
英偉達的GeForce GTX Titan之所以被命名為Titan,多半是因為英偉達對于目前世界上最快的超級計算機“Titan”的紀(jì)念。超級計算機“Titan”所采用的是目前世界上最快的專業(yè)級顯示卡Tesla K20X,兩者采用的都是同為2 688個CUDA核心的NVIDIA Kepler GK110核心,不同的只是兩者的細節(jié)之處與面向的領(lǐng)域。
GeForce GTX Titan采用的GK110核心仍舊基于Kepler架構(gòu),從某種意義上來說,它并不能算是一款“革新”的產(chǎn)品。不過,雖然GK110核心與GTX680所采用的GK104核心同屬Kepler架構(gòu)范疇,但其相對后者GK110依然擁有不少的改變。從GK110核心SMX邏輯結(jié)構(gòu)圖中我們可以得知,雖然它與GK104的SMX具有相同的結(jié)構(gòu)、相同的192個CUDA Core和相同的16個紋理單元,但是在CUDA Core的旁邊,我們可以看到新加入了許多DP Unit單元,即Double Precision Float Unit,意為雙精度浮點單元。一組SMX中就包含64個DP Unit,14組共包含896個。英偉達在GK110核心中加入如此之多的雙精度浮點單元,目的就是為大幅增強GK110的雙精度浮點運算能力以滿足和對手競爭的需求。
雖然AMD的Radeon HD 7990使用的依然是AMD在一年多以前發(fā)布的Tahiti核心,但是現(xiàn)在看來它所使用的GCN架構(gòu)依然非常先進。在GCN陣列微觀結(jié)構(gòu)中,每個GCN陣列里有4組SIMD單元,每組SIMD單元里面包括16個流處理器,我們可以發(fā)現(xiàn)GCN架構(gòu)已經(jīng)完全拋棄了此前4D+1D流處理器VLIW的超長指令架構(gòu)限制,不存在原有架構(gòu)指令打包-派發(fā)-解包的問題,所有流處理器以16個為一組的SIMD陣列完成指令調(diào)度。雖然每次只能執(zhí)行1個ALU操作,但是4組SIMD能保證執(zhí)行4條線程,利用率接近100%。整個架構(gòu)從最基層開始就為更靈活地運算優(yōu)化,架構(gòu)中層的運算單元在并行效率上也有針對性地改進,整個GCN架構(gòu)更加面向“通用計算就是圖形計算”的未來趨勢。
技術(shù)比拼
英偉達在GeForce GTX 680發(fā)布時引入了一種新的GPU動態(tài)超頻技術(shù)——GPU Boost,與CPU處理器中的Turbo Boost動態(tài)加速類似,都是在處理器允許的范圍內(nèi)動態(tài)調(diào)節(jié)核心頻率。在GeForce GTX Titan顯示卡中,GPU Boost加速技術(shù)也升級到了第二代。GPU Boost 2.0放寬了電壓的限制,在GPU溫度控制上考慮了更多,因為相比高電壓帶來的危害,日常應(yīng)用中GPU長時間處于高溫狀態(tài)更可能會損壞芯片。本次測試中GeForce GTX Titan公版顯示卡的Boost頻率能達到995MHz,相比默認的837MHz提升了18.6%,比上一代公版GeForce GTX 680常見的10%要高一些,可以帶來更多的性能提升。
除此之外,GeForce GTX Titan還具有英偉達獨有的TXAA技術(shù),這是一大殺手锏。該技術(shù)類似在動畫、電影、游戲CG中所采用的復(fù)雜高畫質(zhì)過濾器,可以減少因為鋸齒導(dǎo)致畫面出現(xiàn)撕裂和閃動等問題,畫質(zhì)比MSAA、FXAA以及CSAA更高,而且消耗資源較少。
AMD方面,在畫面渲染也有獨到的優(yōu)勢。一直以來,人類頭發(fā)在游戲中的實時精確渲染是游戲里最為復(fù)雜、最具挑戰(zhàn)性的項目,成千上萬、各自獨立的微小細絲都是半透明的,而且都有復(fù)雜的陰影,這對GPU來說是非常巨大的負擔(dān)。而Radeon HD 7990采用的TressFX Hair渲染技術(shù),使用了DirectCompute編程語言,結(jié)合AMD GCN架構(gòu)的強大并行計算能力,將頭發(fā)渲染的工作部分轉(zhuǎn)到了后期處理中。這不僅大大提高了運算效率,還讓重力、風(fēng)雨、頭部運動等因素都被列入考慮的范圍智能,因此能以更真實的方式描繪頭發(fā),讓頭發(fā)更加自然和逼真。
除此之外,Radeon HD 7990集成了兩個Tahiti XT核心,通過重新設(shè)計的4個Mini Display Port+1個DVI的輸出接口,它原生即可支持5連屏的EYEFINITY應(yīng)用。此外,Radeon HD 7990也繼承了Radeon HD 7970的智能核心休眠技術(shù)ZeroCorePower,顯示卡在空閑時可讓一顆核心處于休眠狀態(tài),最大限度地降低顯示卡功耗、發(fā)熱和噪音。
性能、功耗互有勝負
無論兩款產(chǎn)品的設(shè)計和采用的技術(shù)如何,對于游戲玩家來說顯示卡的性能表現(xiàn)才是最重要的。在分別測試顯示卡理論DirectX 11圖形性能和曲面細分性能的3DMark 11和Unigine Heaven Benchmark 4.0測試中,Radeon HD 7990均取得了不錯的成績,以較明顯的優(yōu)勢取得領(lǐng)先。在隨后的多款不同分辨率設(shè)置的熱門游戲測試中,Radeon HD 7990單卡雙芯的劣勢逐漸顯露出來,在《刺客的信條3》、《上古卷軸5》中的成績明顯反常,想要在性能方面完勝對手,AMD在驅(qū)動方面還需要下不少功夫。不過整體看來,在游戲性能這一環(huán)節(jié),Radeon HD 7990還是略勝一籌。
在顯示卡高負載功耗測試中,由于如今的高端顯示卡均具備了功耗保護功能,在使用Furmark等嚴(yán)酷的烤機軟件進行測試時,顯示卡會自動降低頻率來保護自己不會損壞。這導(dǎo)致我們無法通過常用烤機軟件來得到其準(zhǔn)確的最大功耗,所以我們選擇了用3DMark 11測試程序來測試整個平臺的整體功耗(不含顯示器)。在待機功耗方面,GeForce GTX Titan所在的平臺整體待機功耗僅為68W,Radeon HD 7990的平臺整機功耗略高,為91W。高負載狀態(tài)下GeForce GTX Titan平臺的最高功耗為380W,相比之下雙芯的Radeon HD 7990平臺最高功耗為460W。因此在功耗表現(xiàn)方面,GeForce GTX Titan完勝。
總結(jié):
通過此次旗艦級產(chǎn)品的碰撞,AMD又一次通過“1+1>2”的方式取得了勝利,重新奪回了單卡旗艦的寶座。雖然兩者在零售價格方面都是7 999元,不過采用單芯設(shè)計的GeForce GTX Titan在成本方面有著明顯的優(yōu)勢,AMD為了奪回這個寶座可謂殺敵一千自損八百。
作為兩家顯示卡廠商在旗艦級產(chǎn)品上的扛鼎之作,在性能方面,兩款產(chǎn)品可謂誠意十足,幾乎所有的游戲在2560×1440分辨率的高畫質(zhì)設(shè)置下都可以流暢運行。雖然兩者在性能方面有些差距,但是并不十分明顯,不過AMD向來在后續(xù)驅(qū)動優(yōu)化方面表現(xiàn)非常不錯,因此Radeon HD 7990在性能方面還有不少優(yōu)化的余地。從目前的信息看來,英偉達的下一代旗艦GeForce GTX 780的性能并不如目前的GeForce GTX Titan,AMD自家的Radeon HD 8000系列顯示卡上市也仍需時日,因此Radeon HD 7990自然是當(dāng)今追求極致性能玩家的不二之選。