《微型計(jì)算機(jī)》評(píng)測(cè)室
從電影的角度來看,觀眾往往更鐘情于主角從弱到強(qiáng)、逆風(fēng)翻盤的劇情,不論是經(jīng)典的《美國隊(duì)長》《蜘蛛俠》還是《毒液》等各類超級(jí)英雄電影無不如此。盡管在現(xiàn)實(shí)生活中,普通人無論如何努力也沒有成為超級(jí)英雄的可能,但在競(jìng)爭的市場(chǎng)中,這樣的劇情卻經(jīng)??梢?。
比如芯片廠商AMD,雖然它以同時(shí)擁有CPU、GPU兩條高技術(shù)產(chǎn)品線為傲,但從經(jīng)濟(jì)體量上來看,不論面對(duì)哪一條產(chǎn)品線上的主要競(jìng)爭對(duì)手,它都是弱勢(shì)的一方。不過在產(chǎn)品的研發(fā)成果上,AMD卻在不斷給我們帶來驚喜——2017年Zen架構(gòu)、銳龍?zhí)幚砥靼l(fā)布;2018年采用12nm工藝、Zen+架構(gòu)的第二代銳龍?zhí)幚砥鲉柺?今天AMD更帶來了市場(chǎng)上首款支持PCIe 4.0,采用7nm工藝打造的第三代銳龍?zhí)幚砥?,而?jìng)爭對(duì)手的同類產(chǎn)品還是14nm++工藝、PCIe 3.0時(shí)代的產(chǎn)品。
顯卡方面同樣如此,當(dāng)競(jìng)爭對(duì)手還在使用12nm工藝、PCIe3.0的技術(shù)時(shí),AMD現(xiàn)在帶來了首款采用7nm工藝、PCIe 4.0技術(shù)的NAVI RX 5700系列顯卡。在顯卡正式上市之前,NAVI顯示核心已經(jīng)確認(rèn)得到索尼、微軟下一代游戲主機(jī)的采用。
相對(duì)于競(jìng)爭產(chǎn)品,AMD最新的第三代銳龍?zhí)幚砥?、NAVIRX 5700系列顯卡在技術(shù)規(guī)格上已經(jīng)顯示出優(yōu)勢(shì)。那么在實(shí)際測(cè)試、應(yīng)用中這些AMD新產(chǎn)品能否發(fā)揮出各自的威力?是否能像美國隊(duì)長、蜘蛛俠一樣同時(shí)擊敗兩位強(qiáng)大的對(duì)手呢?
Zen 2架構(gòu)+7nm AMD第三代銳龍?zhí)幚砥鳒y(cè)試
在最終確定了以TSMC臺(tái)積電作為合作伙伴之后,AMD迅速推進(jìn)了全線產(chǎn)品的7nm制程計(jì)劃,AMD面向桌面PC市場(chǎng)的第三代銳龍?zhí)幚砥饕舱搅料唷5谌J龍?zhí)幚砥鲗?huì)延續(xù)到3000系的命名,除了大家比較熟悉的3800X、3700X之外,AMD還首次在銳龍7、5、3之外增添了一條面向頂級(jí)市場(chǎng)的產(chǎn)品線——銳龍9,而銳龍9 3900X、3950X作為兩款首發(fā)的銳龍9系列先鋒,自然也是備受關(guān)注。
基于7nm生產(chǎn)工藝的第三代銳龍3000系處理器采用了全面升級(jí)的Zen 2架構(gòu),基于TSMC臺(tái)積電7nm工藝打造,接口方面仍然使用了具有傳承與經(jīng)典繼承意義的Socket AM4??傮w來看,第三代銳龍?zhí)幚砥髦饕幸韵铝筮M(jìn)步:
1.首先是TSMC臺(tái)積電7nm生產(chǎn)工藝的使用,未來AMD桌面CPU、APU都會(huì)交由臺(tái)積電以7nm甚至更先進(jìn)的工藝制造。從一些工藝參數(shù)上來看,臺(tái)積電的7nm工藝全稱是7nm HK-MGFinFET,針對(duì)不同的用途分為兩種:一種為移動(dòng)設(shè)備設(shè)計(jì),被稱為“7FF”,以低功耗和較高性能功耗比為特點(diǎn);另一種為高性能處理器設(shè)計(jì),名為“7HPC”。根據(jù)AMD的官方數(shù)據(jù),7nm工藝的采用最終將第三代銳龍?zhí)幚砥鞯木A密度提高了2倍,在相同性能下,功耗可以降低一半,在相同功耗下,性能較前代產(chǎn)品可以提升25%。
2.IPC(Instruction Per Clock,CPU每時(shí)鐘周期指令執(zhí)行數(shù))提升了15%,這主要得益于第三代銳龍?zhí)幚砥髟趦?nèi)部進(jìn)行了大幅改良。其包括使用新的前端架構(gòu),如加入TAGE分支預(yù)測(cè)器,更精準(zhǔn)的指令預(yù)取功能,優(yōu)化了指令緩存,同時(shí)將微操作緩存從2KB提升到4KB;在整數(shù)運(yùn)算單元上,第三代銳龍?zhí)幚砥魈嵘藬?shù)據(jù)載入和存儲(chǔ)帶寬,對(duì)數(shù)據(jù)載入和存儲(chǔ)指令進(jìn)行管理的AGU單元從兩個(gè)提升到了三個(gè),并提升了指令的每周期發(fā)射數(shù)。在浮點(diǎn)運(yùn)算單元上,它的快速內(nèi)容創(chuàng)建性能提升了兩倍,兩個(gè)浮點(diǎn)運(yùn)算單元采用256bit設(shè)計(jì),不僅具有更大的吞吐量,同時(shí)也實(shí)現(xiàn)了對(duì)AVX-256指令的支持。此外,浮點(diǎn)運(yùn)算單元的數(shù)據(jù)載入和存儲(chǔ)帶寬提升了兩倍,將使得數(shù)據(jù)的傳輸更具效率,并減少了與整數(shù)單元出現(xiàn)沖突的概率。
3.更為驚人的是第三代銳龍?zhí)幚砥骷尤肓诵碌木彺嬷噶?,使用了較前代處理器翻倍容量的三級(jí)緩存。如銳龍9 3950X擁有多達(dá)64MB三級(jí)緩存,總共72MB緩存。銳龍7 3700X的二級(jí)與三級(jí)緩存容量分別達(dá)到4MB、32MB,而上代銳龍7 2700X相應(yīng)的緩存容量分別只有4MB、16MB,三級(jí)緩存容量只有銳龍7 3700X的一半。這不僅大幅提高了處理器數(shù)據(jù)的命中概率,還有效提升了游戲性能,減少了內(nèi)存訪問延遲。
4.除了在架構(gòu)設(shè)計(jì)上的進(jìn)步外,Zen 2在整個(gè)處理器的宏觀布局上也提出了全新的模式。相比Zen架構(gòu)的每個(gè)處理器核心自帶相關(guān)輸入輸出接口和I/O模塊不同的是,Zen 2架構(gòu)徹底將處理器的計(jì)算核心部分和I/O部分剝離。計(jì)算核心通過INFINITYFABRIC總線和I/O模塊部分連接,本身不再提供額外的I/O接口。換句話來說,AMD在Zen 2上的處理器模塊是無法單獨(dú)工作的,需要搭配專用的I/O芯片才能正常使用,這和Zen架構(gòu)存在很大的差異。另外,Zen 2的計(jì)算核心采用的是7nm工藝,有助于縮小面積、提高頻率、降低功耗。而I/O部分由于模擬電路更多,即使采用7nm工藝也不會(huì)帶來面積、功耗等方面的明顯改善,因此采用了12nm工藝制造。采用分離式設(shè)計(jì)的優(yōu)勢(shì)在于可以靈活配比不同數(shù)量的計(jì)算核心和I/O模塊,以實(shí)現(xiàn)不同的規(guī)格。目前Zen 2單個(gè)計(jì)算核心單元的規(guī)格是8核心、16線程,一個(gè)I/O模塊最多可以搭配8個(gè)計(jì)算核心(擁有8個(gè)IF總線接口),這樣就能夠?qū)崿F(xiàn)最多64核心、128線程的規(guī)格。要知道,目前單路CPU核心最多的紀(jì)錄也只有32個(gè)。
5.值得一提的是,第三代銳龍?zhí)幚砥髌脚_(tái)的規(guī)格大幅提升,最高可擁有12個(gè)帶寬達(dá)10Gbps的USB 3.1接口,44條PCIe 4.0通道,徹底告別以前的PCIe 2.0接口。原因就是我們前面提到的處理器內(nèi)部采用了由12nm工藝打造,集成內(nèi)存控制器與PCIe4.0控制器的IO芯片,在外搭配了規(guī)格同樣強(qiáng)大,支持PCIe 4.0的X570芯片組。包括AMD NAVI 5700系列顯卡,以及Microsemi、群聯(lián)電子、慧榮在內(nèi)的諸多新款SSD主控芯片也開始提供對(duì)PCIe 4.0的支持。相對(duì)于目前主流的PCIe 3.0平臺(tái),PCIe 4.0最大的好處就是帶寬翻倍,從PCIe 3.0每通道1GB/S帶寬提升到每通道2GB/S。對(duì)于顯卡來說,更高的傳輸帶寬可以讓GPU在每周期內(nèi)接收到更多的數(shù)據(jù),提升每周期的運(yùn)算效率,并帶來性能的提升。對(duì)SSD來說,意味著在X4通道配置下,PCIe 4.0 X4 SSD的理論最高傳輸速度就可提升到8GB/S,而PCIe 3.0 X4 SSD的最高速度則不可能突破4GB/S。
6.同時(shí)PCIe 4.0總線的使用也將處理器內(nèi)部INFINITYFABRICN聯(lián)總線的帶寬翻倍,能帶來更高的多核心運(yùn)算性能。此外,第三代銳龍?zhí)幚砥鲀?nèi)部的INFINITY FABRICN聯(lián)總線還具有與內(nèi)存頻率異步工作的能力。在異步模式下(在此模式下內(nèi)存頻率更容易得到提升),第三代銳龍?zhí)幚砥鞯淖罡邇?nèi)存超頻頻率目前達(dá)到了DDR4 5133,而在同步工作模式下(此模式下具有更低的內(nèi)存延遲、更好的內(nèi)存性能),第三代銳龍?zhí)幚砥鞯膬?nèi)存工作頻率也可達(dá)到DDR4 3733。相對(duì)于前代銳龍?zhí)幚砥鞴俜綐?biāo)稱的DDR4 2933來說,其內(nèi)存性能提升了很多。
目前AM口已經(jīng)為第三代銳龍?zhí)幚砥骷尤肓硕辔弧懊蛯ⅰ保核鼈兪菍?duì)標(biāo)酷睿i9-9900K(F)系列的12核心、24線程設(shè)計(jì)的銳龍9 3900X、對(duì)標(biāo)酷睿i7-9700K(F)系列的8核心、16線程銳龍7 3800X、銳龍7 3700X以及首次曝光,對(duì)標(biāo)酷睿i5-9600K(F)的兩款第三代銳龍5系列處理器。當(dāng)然最令人期待的是銳龍93950X。這款處理器擁有非常驚人的規(guī)格,它不僅采用16核心、32線程設(shè)計(jì),還擁有很高的工作頻率,基準(zhǔn)頻率達(dá)到3.5GHz,最大加速頻率為4.7GHz,更擁有72MB緩存。值得稱贊的是,其熱設(shè)計(jì)功耗卻只有105W TDP,僅與8核心、16線程設(shè)計(jì)的銳龍73800X相當(dāng),7nm的能耗比優(yōu)勢(shì)可見一斑。
第三代銳龍?zhí)幚砥鲗?shí)際產(chǎn)品賞析
兩款處理器均采用AM4封裝,處理器封裝面積僅40mmx40mm。而之前AMD的消費(fèi)級(jí)12核心處理器是采用sTR4封裝的銳龍Threadripper 1920X與Threadripper 2920X,它們的封裝面積達(dá)到了58.5mmx75.4mm,但其處理器核心數(shù)量不僅只有12顆,緩存容量還比銳龍9 3900X少得多,只有32MB,最高加速頻率也比后者低。采用12nm工藝的銳龍Threadripper 2920X最高加速頻率也就4.3GHz,其TDP功耗卻達(dá)到了180W。當(dāng)然更值得一提的是,在今年9月才會(huì)發(fā)布的銳龍9 3950X更在與銳龍9 3900X、銳龍7 3700X完全相同的“容器”中,放入了多達(dá)16顆核心、64MB三級(jí)緩存。相信從這些參數(shù)的對(duì)比上,大家已經(jīng)可以非常清晰地看到7nm生產(chǎn)工藝帶來了什么——那就是更高的晶圓密度、更高的工作頻率、更高的能耗比。同時(shí),AMD還為銳龍9 3900X、銳龍7 3700X配備了WraithPrism RGB即幽靈Prism RGB四熱管風(fēng)冷散熱器。
而為了讓第三代銳龍?zhí)幚砥靼l(fā)揮出最大的性能,此次我們還搭配了芝奇皇家戟DDR4 3600內(nèi)存。它的導(dǎo)光條內(nèi)部擁有多達(dá)幾十面的切割面,清澈的材質(zhì),極高的折射率,再結(jié)合那經(jīng)過多重電鍍加工的“皇族金”或“鎧甲銀”色彩,具有鏡面效果的鋁合金散熱片,整條內(nèi)存看起來更像是一件價(jià)值不菲的珠寶。同時(shí)這款內(nèi)存不僅可以在DDR4 3600高頻下穩(wěn)定工作,其默認(rèn)延遲也較低,僅為16-16-16-36,使得它能為處理器提供強(qiáng)勁的內(nèi)存性能。
我們?nèi)绾螠y(cè)試
處理器:銳龍9 3900X、銳龍7 3700X
銳龍7 2700X、酷睿i9-9900K、酷睿i7-9700K
主板:ROG CROSSHAIRⅦFORMULA
英特爾Z390主板
內(nèi)存:芝奇皇家戟DDR4 3600 8GB x 2
硬盤:閃迪EXTREMEⅡ240GB
顯卡:Radeon RX 5700XT
電源:ROG THOR 1200W
在本次測(cè)試中,我們將主要測(cè)試第三代銳龍?zhí)幚砥飨鄬?duì)于第二代產(chǎn)品有多大的進(jìn)步,因此我們特別加入銳龍7 2700×與其同級(jí)產(chǎn)品進(jìn)行對(duì)比。而銳龍9 3900X雖然沒有與其類似的前代產(chǎn)品,但從對(duì)它的測(cè)試中,我們也可以看出它相對(duì)于銳龍7級(jí)別的產(chǎn)品有哪些性能優(yōu)勢(shì)。同時(shí)我們還將加入酷睿i9-9900K、酷睿i7-9700K兩款處理器進(jìn)行對(duì)比,因?yàn)樗鼈兎謩e是銳龍9 3900X、銳龍7 3700X在市場(chǎng)上所瞄準(zhǔn)的主要競(jìng)爭對(duì)手。通過對(duì)比測(cè)試,我們將能了解這兩款第三代銳龍?zhí)幚砥髂芊駪?zhàn)勝對(duì)手,是否更值得購買。
此外,鑒于第三代銳龍?zhí)幚砥髦С諴CIe 4.0技術(shù),因此我們將搭配同樣支持PCIe 4.0的Radeon RX 5700XT顯卡進(jìn)行測(cè)試,初步了解PCIe 4.0技術(shù)到底有多大的威力。
專為三代銳龍打造的多相供電猛獸ROG CROSSHAIR Ⅷ FORMULA主板
新一代CROSSHAIR ⅧFORMULA在設(shè)計(jì)風(fēng)格上與以往的CROSSHAIR產(chǎn)品有一些區(qū)別,沒有采用全黑配色,在主板中搭配了一些亮銀色設(shè)計(jì)。特別是主板IO裝甲處有一大塊透明銀色設(shè)計(jì),原因很簡單,這部分區(qū)域內(nèi)部配備了LiveDash OLED屏幕,可顯示系統(tǒng)信息如處理器、主板溫度、風(fēng)扇轉(zhuǎn)速,以及各種定制Logo等。同時(shí)在主要熱源主板處理器供電部分的MOSFET部分,主板則配備了由鋁合金打造,具有大量鰭片、設(shè)計(jì)精良的CROSSCHILL EK Ⅲ混合水冷模塊。這款散熱器采用G1/4螺紋管、防水橡膠墊、銅質(zhì)水道設(shè)計(jì),擁有更大的流量,可高效地對(duì)主板處理器供電部分進(jìn)行降溫。
當(dāng)然,更值得關(guān)注的還是工程師為CROSSHAIR ⅦFORMULA主板打造的多相供電系統(tǒng)。這款CROSSHAIRⅦFORMULA主板采用了龐大的14+2相供電設(shè)計(jì)。其中專為處理器核心供電的14相供電是由兩顆電感、兩顆PowlRstage一體式封裝的MOSFET通過兩兩并聯(lián)來實(shí)現(xiàn)。相比通過倍相芯片來實(shí)現(xiàn)多相供電的方案,兩顆并聯(lián)的PowlRstage MOSFET可以直接將電流一分為二,無需經(jīng)過第三方倍相芯片,擁有更短的響應(yīng)時(shí)間,而基于倍相芯片的供電電路則會(huì)增加約20nS的延遲。更糟糕的是,倍相芯片的加入會(huì)使供電電路的設(shè)計(jì)更加復(fù)雜,因此在相同供電相數(shù)、相同負(fù)載下,倍相解決方案的發(fā)熱更大,電壓衰減幅度也更高,所以最終工程師還是通過兩兩并聯(lián)的方式為CROSSHAIRⅦFORMULA帶來了14+2相供電系統(tǒng)。
同時(shí)在ROG CROSSHAlRⅦFORMULA主板上,工程師還為我們帶來了最新的OptimemⅢ技術(shù)。該技術(shù)還是通過布線優(yōu)化、減少干擾來提升主板對(duì)高頻內(nèi)存的支持能力。根據(jù)華碩的官方資料來看,該主板已經(jīng)可以支持DDR4 4800內(nèi)存穩(wěn)定工作。鑒于第三代銳龍?zhí)幚砥鲀?nèi)存性能最佳的頻率在DDR4 3733以內(nèi)。OptimemⅢ技術(shù)也可以帶來更多的好處。如芝奇皇家戟DDR4 3600內(nèi)存的標(biāo)準(zhǔn)工作電壓為1.35V,在ROGCROSSHAIR Ⅶ FORMULA主板上,如按默認(rèn)延遲設(shè)置工作,則只需要1.25V的電壓即可。同時(shí)Optimem Ⅲ技術(shù)還具備降低延遲的能力,只需將內(nèi)存電壓提升到1.4V,它即可將芝奇皇家戟DDR4 3600的延遲降低到14-15-15-35,帶來更強(qiáng)的內(nèi)存性能。
值得一提的是,在網(wǎng)絡(luò)方面ROG CROSSHAIRⅦFORMULA主板也采用了非常極致的設(shè)計(jì)。首先在無線方面,它搭配了支持最新WiFi 6技術(shù)(802.11ax)的英特爾AX200無線模塊。其不僅支持5GHz/2.4GHz雙頻和多用戶2x2 MIMO(MU-MIMO),峰值傳輸帶寬更達(dá)到了2.4Gbps,比現(xiàn)有802.11ac標(biāo)準(zhǔn)的速度提升了至少37%。用戶如選用ROG RaptUre GT-AX11000、華碩RT-AX88U、RT-AX58U等AX系列路由器搭配,就能發(fā)揮出這款無線網(wǎng)卡的最大威力。有線部分,這款主板則配備了Aquantia AQC-111C 5G網(wǎng)絡(luò)芯片,理論傳輸速度可達(dá)5GbpS,當(dāng)然要實(shí)現(xiàn)這一速度需要用戶搭配相應(yīng)的網(wǎng)線、路由器等配套設(shè)備。
音頻方面,這款主板也配備了SUPREMEFX電競(jìng)信仰音效系統(tǒng)。其核心是一顆由瑞昱特供、輸出信噪比為120dB、輸入信噪比為113dB的S1220 7.1聲道Codec,并搭配一顆可推動(dòng)600Ω高阻抗設(shè)備,具有偵測(cè)播放設(shè)備阻抗,提供合適放大等級(jí)的耳放芯片。值得一提的是,為了讓電競(jìng)耳機(jī)擁有更好的播放效果,ROG CROSSHAIR Ⅶ FORMULA主板的前置音頻輸出則交由諧波失真僅一94dB的ESS SABRE 9023 HyperstreamDAC芯片負(fù)責(zé),可以為玩家?guī)砀珳?zhǔn)的定位、更震撼的動(dòng)態(tài)效果。當(dāng)然像尼吉康音頻電容、專為防爆音設(shè)計(jì)的DE-POP MOSFET,以及鍍金音頻插孔等多種高品質(zhì)元件在這款主板上也得到了——應(yīng)用。此外,可以在游戲中以圖形化指示聲音方位的Sonic Radar Ⅲ聲波雷達(dá)也是主板必不可少的元素,它可以讓玩家發(fā)現(xiàn)敵人變得更加輕松。
大幅提升CPU性能測(cè)試
測(cè)試點(diǎn)評(píng):從測(cè)試結(jié)果來看,第三代銳龍?zhí)幚砥鞯男阅鼙憩F(xiàn)顯然不負(fù)眾望,不論是在多線程還是單線程性能上相對(duì)第二代產(chǎn)品都取得了很大的提升。最明顯的就是銳龍7 3700X與銳龍7 2700X的對(duì)比,雖然兩款處理器同為8核心16線程設(shè)計(jì),但在S!S。ftware Sandra處理器算術(shù)性能上銳龍7 3700X領(lǐng)先了多達(dá)23.5%,在CPU-Z處理器單線程性能上,銳龍7 3700X也領(lǐng)先了近13.8%。顯然這是與第三代銳龍?zhí)幚砥黝l率提升、采用新一代Zen 2架構(gòu)密不不可的。舉例來說,首先在頻率上,銳龍7 3700X的最高加速頻率比銳龍7 2700X高了100MHz,在全核心滿載工作頻率下,銳龍7 3700X更高了200MHz,再加上大幅提升IPC性能的Zen 2架構(gòu),銳龍7 3700X能取得如此成績并不讓人意外。而多74顆核心、8條計(jì)算線程的銳龍9 3900X在多線程性能上,更對(duì)其他幾款產(chǎn)品形成了碾壓。即便是酷睿i9-9900K,在CPU-Z處理器多線程性能測(cè)試上,也只有前者的68%。
總體來看,兩款第三代銳龍?zhí)幚砥髋c對(duì)手的同類處理器相比,在多線程性能上它們繼續(xù)保持著明顯優(yōu)勢(shì)。在單線程性能上則大幅縮小了差距,如銳龍7 2700X的CPU-Z單線程性能與酷睿i9-9900K相比落后了近20%,但銳龍7 3700X則將這一差距縮小到了不到8%,效果還是相當(dāng)顯著的。內(nèi)存上由于AIDA64暫時(shí)還沒有對(duì)銳龍7 3700X處理器提供很好的支持,因此我們?cè)趯?duì)比測(cè)試中只用《魯大師》進(jìn)行了簡單的內(nèi)存性能測(cè)試。初步來看兩款第三代銳龍?zhí)幚砥鞯膬?nèi)存性能相比第二代產(chǎn)品也有改善,與兩款對(duì)手的產(chǎn)品相比還要略好一些。
多核心性能占盡優(yōu)勢(shì)CPU應(yīng)用性能測(cè)試
測(cè)試點(diǎn)評(píng):由于現(xiàn)在的應(yīng)用軟件廣泛對(duì)多核心、多線程運(yùn)算提供了很好的支持,因此在各類應(yīng)用中,第三代銳龍?zhí)幚砥鞫加胁诲e(cuò)的表現(xiàn)。如在實(shí)際使用V-RAY渲染工具進(jìn)行渲染時(shí),銳龍73700X的渲染速度比酷睿i7-9700K快了近30%,只略低于酷睿i9-9900K,而多了4顆核心的銳龍9 3900X又比銳龍7 3700X快了多達(dá)41.5%。顯然想組建低成本渲染機(jī)器的話,第三代銳龍?zhí)幚砥骶褪且粋€(gè)不錯(cuò)的選擇。同時(shí)在壓縮與解壓縮應(yīng)用、視頻轉(zhuǎn)碼應(yīng)用、金融運(yùn)算中,第三代銳龍?zhí)幚砥鞯囊舱急M優(yōu)勢(shì)——單是銳龍7 3700X的壓縮與解壓縮性能就能輕松擊敗酷睿i9-9900K,領(lǐng)先后者達(dá)17%;在HandBrake視頻轉(zhuǎn)碼中,銳龍7 3700X的轉(zhuǎn)碼時(shí)間比酷睿i7-9700K少了10%,與酷睿i9-9900K相同。而銳龍93900X的消耗時(shí)間則比銳龍7 3700X又少了近18%。顯然在大量的視頻處理任務(wù)中,第三代銳龍能夠?yàn)橛脩艄?jié)約不少工作時(shí)間。
唯一的例外是在Foobar FLAC無損音頻轉(zhuǎn)MP3中,可能得益于軟件對(duì)英特爾處理器支持更好,酷睿i9-9900K的轉(zhuǎn)碼時(shí)間比銳龍9 3900)(少了1秒,但銳龍7 3700X還是在測(cè)試中戰(zhàn)勝了酷睿i7-9700K。
PCIe 4.0初顯優(yōu)勢(shì)幀速最高領(lǐng)先多達(dá)61fpS!游戲性能測(cè)試
測(cè)試點(diǎn)評(píng):首先從3DMark最新版本的PCIe 4.0測(cè)試來看,在支持PCIe 4.0技術(shù)后,的確可以給第三代銳龍平臺(tái)帶來很大的帶寬優(yōu)勢(shì)——它們搭配Radeon RX 5700XT后的顯卡帶寬在24.5GB/S以上,而其他只支持PCIe 3.0技術(shù)的處理器與Radeon RX 5700XT之間的帶寬則難以超過14GB/S。顯然PCIe 4.0技術(shù)令顯卡帶寬獲得了質(zhì)的提升,將有助于GPU以更高的效率工作。性能測(cè)試方面,在對(duì)多核處理器支持較好的3D Mark、《僵尸世界大戰(zhàn)》中,第三代銳龍?zhí)幚砥骶鶓?zhàn)勝了各自的對(duì)手。特別是在支持Vulkan API的《僵尸世界大戰(zhàn)》中,銳龍93900X、銳龍7 3700X分別領(lǐng)先酷睿19-9900K、酷睿i7-9700K達(dá)61fpS、59fpS,完全是不同級(jí)別產(chǎn)品的表現(xiàn)。究其原因就在于Vulkan API大幅降低了繪制命令開銷,改善了多線程性能,使得銳龍這類多核心、多線程處理器的性能可以得到充分發(fā)揮。
而在其他三款游戲中,酷睿處理器憑借單核心性能優(yōu)勢(shì)相對(duì)第三代銳龍?zhí)幚砥鞯拇_還能獲得小幅領(lǐng)先,但由于第三代銳龍?zhí)幚砥鞔蠓s小了單線程性能差距,因此在這些游戲中的運(yùn)行幀速差異也很小——各游戲幀速差異不超過2fpS,在游戲中用戶完全無法感覺到有任何不同。
7nm有優(yōu)勢(shì)嗎?功耗與溫度測(cè)試
測(cè)試點(diǎn)評(píng):接下來我們還測(cè)試了在采用7nm生產(chǎn)工藝后,第三代銳龍?zhí)幚砥鞯墓呐c溫度會(huì)有怎樣的變化。而從結(jié)果來看,7nm工藝對(duì)降低處理器的功耗顯然大有裨益。雖然同為8核心16線程處理器,滿載頻率還高了200MHz,銳龍7 3700X在AIDA64烤機(jī)時(shí)的系統(tǒng)滿載功耗居然比銳龍7 2700X系統(tǒng)低了44W。而銳龍9 3900X雖然同樣滿載頻率比銳龍7 2700X高了125M Hz,核心數(shù)多74顆,但最終滿載功耗卻只比銳龍7 2700X多了3W,7nm工藝帶來的優(yōu)勢(shì)非常明顯。
不過在溫度測(cè)試上,總體來看第三代銳龍?zhí)幚砥鞯臏囟榷急鹊诙a(chǎn)品要高,特別是在滿載測(cè)試下。原因無外乎有兩點(diǎn):1.它們的工作頻率更高,即便在長時(shí)間滿載測(cè)試下,像銳龍9 3900X這樣的12核心處理器滿載頻率都達(dá)到了4.0GHz以上;2.7nm生產(chǎn)工藝提高了晶體管密度,在有限的空間里需要容納更多的晶體管,而在面積不變的情況下,第三代銳龍?zhí)幚砥髟黾恿薎/O芯片,PCIe 4.0控制器,高端產(chǎn)品更增加了多顆核心,所以在滿載情況下,它們的工作溫度的確有可能更高。
最高全核心4.4GHz內(nèi)存輕松實(shí)現(xiàn)DDR4 4600
最后,我們還簡單測(cè)試了第三代銳龍?zhí)幚砥鞯某l能力。由于第三代銳龍?zhí)幚砥鞯墓ぷ鳒囟容^高,因此它們的超頻潛力不是太高。在采用360mm三排水冷散熱器的情況,兩款處理器全核心超頻能達(dá)到的最高頻率均為4.4GHz左右。在此頻率下,它們可以運(yùn)行CPU-Z或《魯大師》一些負(fù)載不太大的測(cè)試。如果將頻率降低到4.3-4.35GHz,銳龍9 3900X、銳龍7 3700X則能運(yùn)行像CONEBENCH R20、GeekBench這些重載超頻測(cè)試。
更值得一提的是,借助第三代銳龍?zhí)幚砥麂J龍9 3900X對(duì)內(nèi)存更好的支持能力,以及CROSSHAIRⅦFORMULA主板的Optimem Ⅲ技術(shù),芝奇皇家戟DDR4 3600內(nèi)存優(yōu)秀的體質(zhì),我們?cè)?8-18-18-39延遲設(shè)置、1.45V內(nèi)存電壓下,最高可將內(nèi)存頻率超頻到DDR4 4600。不過由于內(nèi)存頻率超過了DDR43733,工作在異步模式下,內(nèi)存延遲有所增加。總體來看,第三代銳龍?zhí)幚砥鲗?duì)內(nèi)存的支持能力要比第二代產(chǎn)品好很多。
完全達(dá)到預(yù)期目標(biāo)暑期裝機(jī)值得推薦
綜合來看,第三代銳龍?zhí)幚砥飨鄬?duì)于第二代產(chǎn)品的確有非常大的進(jìn)步,借助Zen 2架構(gòu)、7nm工藝,它從單核心性能、多線程性能、功耗,以及內(nèi)存超頻能力、技術(shù)規(guī)格上,都獲得了全面升級(jí)。而與競(jìng)爭對(duì)手的產(chǎn)品相比,第三代銳龍?zhí)幚砥髟趩魏诵男阅苌洗蠓s小了差距,在游戲中的幀速差異幾乎可以忽略不計(jì),在多核心性能與相關(guān)應(yīng)用上則繼續(xù)保持著“碾壓”的態(tài)勢(shì),包括像《僵尸世界大戰(zhàn)》這類對(duì)多核心技術(shù)支持較好的游戲,再加上支持PCIe 4.0技術(shù),讓第三代銳龍?zhí)幚砥鞯谋憩F(xiàn)更加全面。畢竟PCIe4.0相對(duì)于PCIe 3.0產(chǎn)品的帶寬優(yōu)勢(shì)非常明顯,只有采用第三代銳龍?zhí)幚砥鞑拍艹浞职l(fā)揮出新一代SSD、游戲顯卡的性能。所以只要第三代銳龍?zhí)幚砥鞯淖罱K上市價(jià)格與同類競(jìng)爭產(chǎn)品相比差不多甚至更便宜,那么第三代銳龍?zhí)幚砥鞯男詢r(jià)比優(yōu)勢(shì)就將非常突出,在這個(gè)暑期有望成為市場(chǎng)上的裝機(jī)熱點(diǎn)。
最后需要提到的是,第三代銳龍?zhí)幚砥鞯牡絹碇皇求@喜的開始——根據(jù)AMD官方消息,采用7nm+工藝的Zen 3架構(gòu)已經(jīng)基本完成研發(fā)工作,更加神秘的Zen 4架構(gòu)已經(jīng)進(jìn)入設(shè)計(jì)階段,好戲還在后頭。
突破束縛!首套第三代銳龍全PCIe 4.0系統(tǒng)體驗(yàn)
我們知道,第三代銳龍?zhí)幚砥鞒颂幚砥髯陨淼男阅堋⒓夹g(shù)提升外,其他方面最大的改進(jìn)就是增加了對(duì)PCIe 4.0技術(shù)的支持。相對(duì)于目前主流的PCIe 3.0平臺(tái),PCIe 4.0最大的好處就是帶寬翻倍,從PCIe 3.0每通道1GB/S帶寬提升到每通道2GB/S。對(duì)于顯卡來說,更高的傳輸帶寬可以讓GPU在每周期內(nèi)接收到更多的數(shù)據(jù),提升每周期的運(yùn)算效率,并帶來性能的提升。對(duì)SSD來說,意味著在X4通道配置下,PCIe 4.0 X4 SSD的理論最高傳輸速度就可提升到8GB/S,而PCIe 3.0 X4 SSD的最高速度則不可能突破4GB/S。目前包括Microsemi、群聯(lián)電子、慧榮在內(nèi)的諸多新款SSD主控芯片也開始提供對(duì)PCIe 4.0的支持,而板卡廠商技嘉科技也在第一時(shí)間推出了支持PCIe 4.0技術(shù)的X570主板,以及AORUS PCIe 4.0 SSD,將為用戶帶來更加暢快的體驗(yàn)。
打造甜點(diǎn)級(jí)第三代銳龍平臺(tái) X570AORUS PRO WIFI主板
在技嘉的AORUS系列主板中,AORUS PRO WIFI系列一直是兼顧性能、功能與價(jià)格的產(chǎn)品,在各方面比較均衡。這款采用X570芯片組的X570 AORUS PROWIFI主板也不例外。首先它采用了基于IR數(shù)字PWM控制器的豪華12+2相供電設(shè)計(jì),每相供電搭配可承載40A電流的IR 3553 Powl Rstage一體式MOSFET。因此主板對(duì)處理器核心的供電能力總計(jì)可以達(dá)到480A,完全能滿足第三代銳龍?zhí)幚砥鞯某l需要,畢竟即便16核心的銳龍9 3950X對(duì)電流的要求也就200A。這款主板不僅可以完全滿足要求,還留有大量的冗余量,供用戶超頻。同時(shí)主板供電部分還搭配服務(wù)器級(jí)電感,5K固態(tài)電容,并采用了8+4Pin供電接口。供電接口的內(nèi)部由實(shí)心結(jié)構(gòu)的CPU供電插針組成,相對(duì)普通供電接口內(nèi)部的空心插針,它能有效降低阻抗與發(fā)熱量。
當(dāng)然,對(duì)于X570主板來說,另一重大升級(jí)就是支持PCIe 4.0技術(shù),該主板除了提供相應(yīng)的PCIe 4.0顯卡與擴(kuò)展插槽外,還為主板提供了兩個(gè)帶寬為PCIe 4.0X4即8GB/S的M.2 SSD接口。此外每個(gè)接口還提供了技嘉特制的合金M.2散熱裝甲,以及幫助SSD與散熱片緊密接觸的導(dǎo)熱墊,可以有效降低SSD工作溫度,避免溫度過高降速。
網(wǎng)絡(luò)部分,除了配備穩(wěn)定的英特爾千兆有線網(wǎng)卡外,該主板也搭載了支持最新WiFi 6技術(shù)(802.11ax)的英特爾WiFi6 802.11ax+BT5.0無線模塊。其不僅支持5GHZ/2.4GHZ雙頻和多用戶2x2 MIMO(MU-MIMO)技術(shù),峰值傳輸帶寬更達(dá)到2.4GbpS,比現(xiàn)有802.11ac標(biāo)準(zhǔn)的速度提升了至少37%。
為了給玩家提供更真實(shí)的音效,這款主板特別采用了高配版的魔音音效系統(tǒng)。其核心是瑞昱提供的ALC1220-VB音頻芯片,負(fù)責(zé)接收來自主板芯片組的HD AUDIO音頻數(shù)據(jù),并在連接多聲道音頻系統(tǒng)時(shí)提供環(huán)繞聲音頻。音頻部分還搭配了日系高品質(zhì)音頻專用電容、WIMA FKP2發(fā)燒級(jí)音頻電容。
接下來,我們采用12核心24線程設(shè)計(jì)的銳龍9 3900X、支持PCIe 4.0技術(shù)的Radeon RX 5700XT對(duì)這款主板進(jìn)行了測(cè)試。首先從基準(zhǔn)性能測(cè)試來看,X570 AORUS PROW,WIFI主板正常地發(fā)揮出了銳龍9 3900X的性能——如CPU-Z多線程性能突破8100分、CINEBENCH R20的處理器多線程性能達(dá)到7000Cb以上,7-Zip的壓縮與解壓縮性能突破了100000MIPS,《僵尸世界大戰(zhàn)》在2K分辨率、最高畫質(zhì)下的平均幀速也能達(dá)到180fDS以上,可以在2K分辨率、最高畫質(zhì)下流暢運(yùn)行各類游戲大作。同時(shí)PCIe 4.0的威力也初步顯現(xiàn)出來。從3DMark PCIe帶寬測(cè)試來看,X570 AORUS PRO WIFI主板搭配RadeonRX 5700XT的顯卡帶寬達(dá)到23.58GB/S。而該顯卡在其他PCIe3.0主板上使用時(shí)的顯卡實(shí)測(cè)帶寬只有13.6GB/S左右。
得益于12+2相供電設(shè)計(jì),在同時(shí)開啟CPU、FPU、CACHE的AIDA64烤機(jī)測(cè)試中,X570 AORUS PRO WIFI主板的發(fā)熱量也不是太大。在銳龍9 3900X連續(xù)烤機(jī)半小時(shí)后,處理器供電部分的最高溫度為75.3℃,供電區(qū)域的平均溫度為69.1℃。更值得一提的是主板擁有優(yōu)秀的超頻能力,首先在內(nèi)存超頻上,主板除了可以輕松支持DDR4 3600內(nèi)存外,還可以在1.45V內(nèi)存電壓,18-18-18-39@1T延遲設(shè)置下,將內(nèi)存超頻到DDR4 4333,帶來突破62000MB/S的內(nèi)存復(fù)制帶寬。
此外,在1.428V處理器核心電壓下,我們也可通過X570 AORUS PRO WIFI主板將銳龍9 3900X超頻到4.35-4.4GHZ,令其CPU-Z處理器單線程性能從521.8提升到543.2,多線程性能逼近8900分。而它的《魯大師》處理器性能則突破了28萬4000分,在性能排行榜中位居第23位。
技嘉AORUSNVMe Gen4 SSD
在支持PCIe 4.0技術(shù)的第三代銳龍平臺(tái)發(fā)布之際,技嘉搶在傳統(tǒng)存儲(chǔ)廠商之前,在業(yè)內(nèi)推出了首款PCIe 4.0 SSD即AORUSNVMe Gen4 SSD。首先從這款SSD的外觀來看,它就非常有型。這款采用M.2 2280規(guī)格設(shè)計(jì)的AORUS NVMe Gen4 SSD在正反兩面都配備了厚重的純銅散熱模塊。而為主控那面服務(wù)的散熱模塊更設(shè)計(jì)了多達(dá)27塊鰭片,可以有效擴(kuò)大散熱面積,其散熱模塊的總重量達(dá)到77克。由于散熱模塊采用銅打造,其導(dǎo)熱系數(shù)達(dá)到401W/mK,比普通的鋁(導(dǎo)熱系數(shù):237W/mK)制散熱模塊要高出69%,再加上內(nèi)部配備了專業(yè)的LAIRD導(dǎo)熱墊,因此其散熱模塊能對(duì)PCIe 4.0主控進(jìn)行有效降溫。
當(dāng)然,有所不足的就是這款散熱模塊過大,厚度達(dá)到了11.4mm,在一些主板或幾乎所有筆記本電腦上都會(huì)遭遇安裝兼容問題。好在技嘉工程師早已考慮到這一問題,這個(gè)散熱模塊是可拆卸的,只要擰下散熱器左右兩側(cè)的六顆螺絲,就能取出這款SSD的“真身”??梢钥吹竭@款SSD內(nèi)部由多顆芯片組成,最重要的當(dāng)然是群聯(lián)電子的PS5016-E16 PCIe 4.0主控。這款主控采用28nm工藝制造,支持八個(gè)閃存通道讀寫,最多可支持32顆DIE并行讀寫。其對(duì)PCIe 4.0 X4系統(tǒng)總線的支持,使得它的接口帶寬可達(dá)8GB/S,相對(duì)于接口帶寬僅4GB/s的PCIe 3.0產(chǎn)品有大幅提升。同時(shí)這款SSD還支持NVMe 1.3,以及第四代LDPC糾錯(cuò)引擎、RAOD ECC、損耗均衡等技術(shù)。
AORUS NVMe Gen4 SSD目前總共規(guī)劃有1TB、2TB兩款產(chǎn)品,此次我們收到的是2TB這一旗艦產(chǎn)品??梢钥吹剿鋫淞藘深w型號(hào)為“H5AN8G8NCJ”的SK海力士DDR4 26661GB內(nèi)存顆粒作緩存,用來存放FTL分區(qū)映射表,其緩存總?cè)萘烤瓦_(dá)到了2GB。而SSD的核心存儲(chǔ)部件采用的則是東芝的BiSC4 96層堆疊3D NANDD TLC閃存。目前TLC閃存的壽命已經(jīng)得到了很大提升,技嘉將為AORUS NVMe Gen4 SSD2TB產(chǎn)品提供5年或3600TB可寫容量的質(zhì)保政策(注:類似汽車?yán)锍膛c時(shí)間結(jié)合的售后政策,以先到為準(zhǔn)則),對(duì)于普通用戶來說完全夠用了。接下來我們還是在基于銳龍9 3900X、X570A。RUS PR。WI F!主板、Radeon RX 5700X了顯卡的PCIe4.0平臺(tái)上,對(duì)A。RUS NVMe Gen4 SSD進(jìn)行了測(cè)試。
基準(zhǔn)性能測(cè)試
測(cè)試點(diǎn)評(píng):
首先從CrystalDsikMark測(cè)試來看,其連續(xù)讀取速度達(dá)到4998.7MB/s,已經(jīng)非常接近5000MB/s,其連續(xù)寫入速度則達(dá)到4200MB/s以上,成功突破了原有PCIe 3.0 x4 SSD的4GB/s限制。在AS SSD Benchmark中,它的連續(xù)讀寫速度則要稍低一些,但其成績也實(shí)現(xiàn)了超越4200MB/S的目標(biāo)。其他方面,這款SSD也有不錯(cuò)的表現(xiàn),如其隨機(jī)4K讀取性能達(dá)到66.98MB/S,這意味著其iops達(dá)到了17146iops,能幫助系統(tǒng)快速啟動(dòng)游戲。而其高隊(duì)列深度下的隨機(jī)4K讀寫性能就更加驚人,均突破1900MB/S,也就是說其iops最低都在50萬之上,用于服務(wù)器也完全能夠勝任。這些表現(xiàn)也幫助AORUS NVMeGen4 SSD 2TB的ASSSD Benchmark總分達(dá)到了6458分,遠(yuǎn)遠(yuǎn)高于普通產(chǎn)品的表現(xiàn)。
應(yīng)用性能測(cè)試
測(cè)試點(diǎn)評(píng):在模擬實(shí)際應(yīng)用的PCMark 8存儲(chǔ)性能測(cè)試中,技嘉AORUS NVMe Gen4 SSD也取得了非常好的成績,其總成績達(dá)到5089分,可以說是我們現(xiàn)在測(cè)得分?jǐn)?shù)最高的一款固態(tài)硬盤,其傳輸帶寬更突破了620MB/s。而我們?cè)?019年上半年測(cè)試的一款旗艦級(jí)NVMe PCIe 3.0 SSD的分?jǐn)?shù)不到5080,傳輸帶寬也只有583MB/s左右。在實(shí)際的游戲載入體驗(yàn)中,技嘉AORUS NVMe Gen4 SSD不僅能在15秒以內(nèi)快速地啟動(dòng)各類游戲大作,更相對(duì)于NVMe PCIe 3.0旗艦級(jí)SSD表現(xiàn)出明顯的優(yōu)勢(shì)。如其《奇點(diǎn)灰燼:擴(kuò)展版》的啟動(dòng)時(shí)間只需14.8秒,而后者需要18.5秒,同時(shí)AORUS NVMe Gen4 SSD在《坦克世界》上的啟動(dòng)時(shí)間也少用了0.3秒。
是否會(huì)掉速?HD TUNES全盤讀寫測(cè)試
測(cè)試點(diǎn)評(píng):前面我們已經(jīng)提到,這款SSD采用的是3DNAND TLC顆粒,因此還需要使用全盤讀寫測(cè)試,來檢測(cè)當(dāng)用戶寫入大容量文件時(shí),是否會(huì)出現(xiàn)嚴(yán)重的掉速。首先從全盤連續(xù)讀取測(cè)試來看,這款SSD的表現(xiàn)非常穩(wěn)健,全盤平均讀取速度也保持在4133.2MB/S,符合其作為PCIe 4.0 SSD的表現(xiàn)。而在全盤寫入測(cè)試時(shí),可以看到這款SSD擁有一個(gè)非常大的SLC緩存空間,當(dāng)寫入容量達(dá)到接近1.3TB時(shí)才開始逐漸掉速。但寫入速度的降幅不是太大,最低也有2122MB/s,就這個(gè)速度也達(dá)到了很多旗艦級(jí)NVMe PCIe 3.0 SSD的空盤寫入性能,其整體平均寫入速度更達(dá)到了3427.5MB/S。
此外,雖然PCIe 4.0主控的發(fā)熱量較大,但通過FLIR熱像儀觀察,借助做工優(yōu)秀的純銅散熱器,技嘉AORUS NVMeGen4 SSD的最高工作溫度還是控制在了75℃以內(nèi)。當(dāng)然如果你的主板容納不下原廠散熱片,那么也很有必要為它安裝其他類型的散熱片。
PCIe 4.0將成為頂級(jí)平臺(tái)新標(biāo)準(zhǔn)
綜合以上評(píng)測(cè),可以看到PCIe 4.0技術(shù)顯然能為消費(fèi)者帶來明顯的改變——X570 AORUS PRO WIFI主板不僅擁有優(yōu)秀的做工、強(qiáng)悍的超頻能力,更能完美發(fā)揮出PCIe 4.0顯卡、SSD的最高性能。而采用PCIe 4.0主控的技嘉AORUS NVMe Gen4 SSD在性能上相對(duì)于PCIe 3.0產(chǎn)品擁有明顯的優(yōu)勢(shì),再加上它擁有做工優(yōu)秀的散熱片,長達(dá)5年的售后服務(wù),高達(dá)3600TB的寫入壽命,可以說我們此次測(cè)試的這套第三代銳龍全PCIe 4.0 SSD平臺(tái)的表現(xiàn)是讓人非常滿意的,PCIe 4.0將成為頂級(jí)平臺(tái)的新標(biāo)準(zhǔn)。
性價(jià)比就是殺手锏A(chǔ)MD Radeon RX 5700XT&5700顯卡首發(fā)評(píng)測(cè)
在今年初,MC為大家分享了全球首款基于7nm生產(chǎn)工藝的游戲顯卡AMD Radeon 的首發(fā)評(píng)測(cè)。從測(cè)試結(jié)果我們發(fā)現(xiàn),雖然在架構(gòu)上沒有太大改變,但得益于7nm生產(chǎn)工藝的加持,AMD Radeon V Ⅱ的游戲性能和NVIDIA GeForce RTX 2080FE相比互有勝互。此外在評(píng)測(cè)文章中我們也提到,基于VEGA架構(gòu)的AMD Radeon Ⅷ顯卡其實(shí)可以看作AMD在7nm生產(chǎn)工藝上的“試水”之作,而基于7nm生產(chǎn)工藝的戰(zhàn)略性產(chǎn)品應(yīng)該是下一代采用NAVI架構(gòu)的消費(fèi)級(jí)顯卡。果然,在“AMD NEXTHORIZON GAMING TECH DAY”游戲技術(shù)大會(huì)上,基于7nm生產(chǎn)工藝的AMD NAVI顯卡終于揭開了它神秘的面紗。AMD在此次游戲技術(shù)大會(huì)上一共發(fā)布了兩款NAVI顯卡,它們分別是AMD Radeon RX 5700XT和AMD Radeon RX 5700,同時(shí)這兩款顯卡也于不久前抵達(dá)MC評(píng)測(cè)室。懷揣激動(dòng)和期待的心情,我們對(duì)這兩款顯卡進(jìn)行了一番詳細(xì)評(píng)測(cè),而測(cè)試結(jié)果也給我們帶來了不小的驚喜。
從GCN到RDNA,AMD NAVI系列顯卡技術(shù)解析
在游戲技術(shù)大會(huì)上,AMD全球副總裁Radeon游戲產(chǎn)品部總經(jīng)理Scott Herkelman、AMD技術(shù)事業(yè)部工程研發(fā)高級(jí)副總裁David Wang,以及AMD企業(yè)院士兼首席GPU架構(gòu)師MikeMantor等專業(yè)人士為我們對(duì)AMD新一代NAVI顯卡進(jìn)行了詳細(xì)介紹。他們提到,與上一代產(chǎn)品相比,NAVI顯卡的不同之處主要有以下幾點(diǎn):
1.采用來源于GCN,但做出大幅改進(jìn)、增強(qiáng)的RDNA架構(gòu);
2.采用更快、更小、擁有更多晶體管,但能耗比更高的7nm生產(chǎn)工藝;
3.采用GDDR6顯存,相比GDDR5顯存,帶寬提升2倍;
4.采用PCIe 4.0接口,相對(duì)于PCIe 3.0顯卡,接口帶寬也提升了2倍;
5.采用具有更高解碼與編碼碼率的Radeon媒體引擎;
6可以實(shí)現(xiàn)3倍無損壓縮的Radeon顯示引擎
RDNA架構(gòu):更高的運(yùn)算效率
首先在計(jì)算單元組成上,RDNA架構(gòu)與GCN架構(gòu)有明顯不同。在GCN架構(gòu)上是一個(gè)CU里含有4組16個(gè)流處理器(也就是SIMD16),共計(jì)64個(gè)流處理器,并搭配相應(yīng)的標(biāo)量、向量單元、調(diào)度器與寄存器;而在RDNA架構(gòu)中,這64個(gè)流處理器被分為了兩組,每組32個(gè)也就是實(shí)現(xiàn)了SIMD32,并配備兩倍數(shù)量的標(biāo)量單元,兩倍數(shù)量的調(diào)度器與向量單元。
這有什么好處呢?簡單來說在執(zhí)行已經(jīng)在很多游戲中應(yīng)用的Wave64指令時(shí),GCN架構(gòu)需將這個(gè)Wave64指令拆分為4個(gè)SIMD16。由于只有一個(gè)調(diào)度器,所以需要等待前面一個(gè)SIMD16單元完成運(yùn)算時(shí)才能進(jìn)行下一個(gè),所以完成這條指令需要4個(gè)時(shí)鐘周期,各流處理器在整個(gè)運(yùn)算周期里的利用率只有25%。如果由RDNA架構(gòu)來執(zhí)行該指令,它則可以將該指令拆分為兩個(gè)Waver32(即兩個(gè)SIMD32),并通過兩個(gè)調(diào)度器將運(yùn)算同時(shí)分配給這兩組流處理器單元,這使得這一條Wave64指令只需要一個(gè)時(shí)鐘周期就可完成,流處理器單元在運(yùn)算中的利用率達(dá)到了100%。同理在執(zhí)行Wave32指令時(shí),RDNA架構(gòu)也只需要一個(gè)時(shí)鐘周期,GCN架構(gòu)同樣需要等待一個(gè)時(shí)鐘周期。因此簡單地說,RDNA架構(gòu)具備更高的運(yùn)算效率。