夏松
先說個題外話。前段時間,M C評測室拿到了號稱目前“最強”的兩張專業(yè)應用級顯卡—NVIDIA RTXA6000和NVIDIA Quadro RTX8000。我們也在UG、Pro-E等工業(yè)級專業(yè)應用中對其進行了測試,確實有著非常亮眼的表現(xiàn)。但問題是,不管是A6000還是RT X8000,其價格都是高達數(shù)萬元的云端產(chǎn)品。對目前絕大多數(shù)從事C G、動漫、影視后期處理等設計創(chuàng)作工作的用戶來說,Quadro系顯卡始終有些“性價比不高”。自然而然地,他們的目光更多地會投向游戲顯卡市場。
對當前的市售主流游戲顯卡來說,它們在專業(yè)應用層面是否有足夠能力應付?在設計創(chuàng)業(yè)行業(yè)使用非常廣泛的一些軟件應用是否能輕松駕馭?面對價格從2000元到上萬元的各檔次主流顯卡,你又該如何選擇?帶著這些疑問,我們決定搜羅目前市面上的在售主流顯卡,并讓他們來一次橫向評測式的同臺競技。
設計創(chuàng)作,最需要的是什么?
對3D建模、渲染的設計創(chuàng)作者、視頻剪輯創(chuàng)作者和進行各類直播的電腦用戶來說,他們對電腦性能的需求主要在哪兒?如果帶著這個問題去走訪各個設計創(chuàng)作行業(yè)的用戶,得到的第一答案肯定是—效率!
筆者曾采訪過很多從事設計創(chuàng)作行業(yè)的大咖、工作室乃至愛好者,但無一例外地,在被問及“你最想要的電腦性能應該是怎樣的?”這個問題時,回答幾乎都是“渲染效率高”。的確,無論是從3DSMax、MAYA、Blender Cycles等軟件內(nèi)渲染輸出CG,還是從DaVinci Resolve、Premere Pro等軟件中渲染剪輯輸出視頻,等待渲染結(jié)果的時間才是最讓人煎熬及倍感無聊的。甚至在電腦性能低下的時候,渲染一幀高分辨率CG都需要幾個甚至十幾個小時,有時候為了看一個制作效果都不得不額外付費交由專業(yè)的渲染公司渲染出結(jié)果再返回查看,這期間自然會損耗大量的時間,而這些都是成本!
因此,拋開自身的設計功底基礎(chǔ)不談,效率的提升無疑是設計師們最為迫切的需求。對當前已經(jīng)與電腦密不可分的設計創(chuàng)作行業(yè)來說,又該如何提升效率?
從CPU渲染到GPU渲染,跨越式的效率提升
在以往,從事創(chuàng)作行業(yè)的電腦在考慮效率的問題上幾乎呈現(xiàn)明顯的兩極分化。對工業(yè)應用,像U G、Pro-E或醫(yī)學、地質(zhì)學研究等領(lǐng)域來說,清一色的Quadro或Radeon Pro專業(yè)卡,對于CG動漫制作、視頻剪輯創(chuàng)作等應用領(lǐng)域來說,如果不舍得購買價格高昂的專業(yè)顯卡,那么就提升CPU性能,采用傳統(tǒng)的CPU渲染輸出方式。而在應用層面,OPCL這種傳統(tǒng)的CPU渲染方式也是根深蒂固了許多年,封閉的API加速也使得創(chuàng)作者們對此苦惱不已。
不過在近些年來,尤其是隨著NVIDIA GeForce RTX顯卡的發(fā)布與擴張,G P U并行計算的加速性能逐漸走向了臺前。對經(jīng)常使用M AYA、3DSMax、Blender Cycles、Resolve、Premiere Pro等CG、視頻創(chuàng)作軟件的用戶來說,G PU加速已經(jīng)成為比CPU加速更為優(yōu)秀的渲染解決方案。
在這方面,NV IDI A無疑是走在前列的。早在2019年,NVIDIA就已經(jīng)在CES 2019展會上完整地公布了RTXStudio的新概念,從軟件與硬件兩方面為設計師的內(nèi)容創(chuàng)作工作進行加速。如今的RTX Stduio生態(tài),涉及RTXStudi o硬件、支持RT X加速的創(chuàng)作應用、Studio驅(qū)動程序三個重要的部分。RTX Studio硬件是通過了NVIDIA認證標準的筆記本電腦、臺式機電腦,支持RTX加速的創(chuàng)作應用,為第三方軟件利用RTX GPU的特性,來加強創(chuàng)作功能。Studio驅(qū)動,則是NVIDIA區(qū)別于為游戲優(yōu)化的Game Ready驅(qū)動,而針對創(chuàng)作應用的工作流有性能加成的GPU驅(qū)動,并跟隨創(chuàng)作應用的更新,提供穩(wěn)定性的全面持續(xù)優(yōu)化支持。
另一方面,隨著GPU加速渲染的逐漸鋪開,越來越多的專業(yè)應用軟件廠商都逐漸在應用中開放了對G PU硬件加速的支持,各種針對G PU硬件加速的第三方渲染軟件更是層出不窮地更新,V-Ray、Arnol d、A RT……在NVIDIA Studio生態(tài)系統(tǒng)中,如今已有超過50款專業(yè)應用針對R T XGPU進行了優(yōu)化加速,這些G PU加速應用程序使超過4500萬的專業(yè)內(nèi)容設計生產(chǎn)者創(chuàng)造出了無數(shù)的C G、視頻等藝術(shù)品。尤其是對新進推出的第二代光追顯卡GeForce RTX 30系列而言,更是為基于3D渲染、AI人工智能加速的設計、渲染工作流和視頻創(chuàng)作提供了巨大的加速編輯和快速流傳輸?shù)墓δ堋?/p>
當然,AMD最新發(fā)布的RadeonRX6000系列顯卡也采用了全新的RDNA 2架構(gòu),帶來了三個方面的技術(shù)優(yōu)勢,一是較其上一代產(chǎn)品更為出色的功率效率和更高的頻率,二是全新設計的無限緩存,三是大量高級技術(shù)包括硬件光線追蹤技術(shù)的支持。同時,在不少的設計應用軟件中也提供了對AMD Radeon GPU的硬件加速支持(大多仍基于傳統(tǒng)的OPENCL加速)。
因此,很多用戶就會深度糾結(jié),到底是購買強力的CPU進行渲染工作,還是選擇顯卡進行GPU加速渲染?選N卡好,還是選A卡好呢?前后兩代NVIDIA GeForce RTX顯卡在性能上又有多大差異呢?既然如此,“是騾子是馬,拉出來遛遛吧!”
橫測:RTX遙遙領(lǐng)先,CPU渲染落車尾
在測試的顯卡選擇上,我們選擇了目前市售的主流NV IDI A和AM D顯卡,以及目前號稱“最強”處理器的AMD 銳龍 95950X。通過這些對比測試,我相信大家就能清晰地看到它們之間的性能差異。
在測試工具軟件上,我們選擇的是目前在設計創(chuàng)作行業(yè)應用非常廣泛的3DSMax 2021+V-Ray 5插件,以及Blender Cycles。在測試模型上,3DSMax方面我們選擇的是大中小三個渲染模型,其中模型1為裝修行業(yè)中常見的混搭客廳裝修效果三維圖,模型2為哈雷摩托車的CG渲染圖(光線效果比較復雜)、模型3為商業(yè)街推廣營銷效果圖。在Blender Cycles的渲染模型選擇上,我們分別使用的是512采樣率的NVIDIA形象LogoC G圖與256采樣率的金毛吼雕刻C G效果圖。
ROUND1:3DSMa x2021渲染競速賽
首先來看3DSMax 2021+V-Ray 5渲染器的超級競速。由于V-Ray 5渲染器不支持AMD顯卡的GPU加速相關(guān)設置,因此在3DS M a x的測試中我們主要考察前后兩代RTX顯卡在GPU加速渲染下的性能差異,以及它們相對于CPU的性能差異。
首先進行的3D S M a x渲染競速可以看作是前后兩代RTX顯卡的“內(nèi)斗”。我們從測試結(jié)果也可以清楚地看到,RT X 30系顯卡相對于RT X 20系顯卡在渲染效率上的提升是非常明顯的,對位產(chǎn)品的提升幅度基本都達到了翻倍或接近翻倍。而相對于目前“最強”處理器AMD 銳龍 95950X而言,即使前一代的入門產(chǎn)品RTX 2060在所有渲染模型中的效率都是銳龍 9 5950X的一倍以上。而RTX 3080、RTX 3090在“哈雷摩托”模型中的渲染效率更是達到了10倍的提升。
需要說明的是,為了盡可能節(jié)省測試時間,我們選擇的渲染模型在渲染輸出時設置的分辨率都相對較小,比如A模型(客廳)和C模型(商圈)都是采用了800×600的分辨率輸出,如果在更高分辨率渲染輸出的設置下,這個差距還將進一步拉大。事實上,我們也單獨測試了RT X3080、RTX 3090和銳龍 9 5950X在2K分辨率下輸出客廳裝修效果圖的渲染效率,結(jié)果發(fā)現(xiàn)銳龍 9 5950X的渲染用時已經(jīng)達到了RT X 3080的10倍左右。在以4K分辨率渲染輸出哈雷摩托模型時,RT X 3090的效率更是高達銳龍 9 5950X的15倍左右。
ROUD2:BlenderCycles渲染競速
再來看Blender Cycles。在BlenderCycles軟件中,支持CUDA和OPTIX兩種適用于NVIDIA GPU的硬件加速方式,而針對AMD GPU則提供了OPENCL加速渲染。在測試中我們選擇的是NVIDIA宣傳LOGO效果圖和金毛吼雕刻兩個CG模型。測試中NV IDI A選擇OPTIX渲染模式,AMD Radeon RX顯卡及銳龍 9 5950X處理器選擇的是OPENCL渲染模式。
從測試結(jié)果來看,NVIDIA RT X30系GPU仍然是獨占鰲頭,領(lǐng)先優(yōu)勢十分明顯。不但相對于前一代R T X20系GPU的對位領(lǐng)先性能近100%,在與AMD最新一代Radeon RX 6000系顯卡相比時,渲染效率的領(lǐng)先程度也在100%以上。即使對目前已經(jīng)發(fā)布的GeForce RTX 30系GPU的入門級代表RTX 3060來說,在Blender Cycles中的渲染效率也已經(jīng)超過了AMD的旗艦產(chǎn)品Radeon RX 6900XT,加速性能的優(yōu)越可見一斑。
同樣,AMD目前桌面級處理器的頂級旗艦銳龍95950X再次在橫評中墊底,不但相較于RTX 30系GPU相差3 ~ 8倍性能,即使相對于RTX2060,在渲染性能上也落后100%甚至更多。
設計創(chuàng)作,RTX 30是優(yōu)選
NVIDIAAmpere核心的第二代RTXGPU在本次橫向測試中沒有辜負我們的期望,其渲染性能表現(xiàn)讓人眼前為之一亮。多CUDA核心配置、第二代光線追蹤性能、進化的DLSS功能,再搭配上特別適配的Studio驅(qū)動程序,以及越來越多針對RTX顯卡適配的創(chuàng)作軟件,NVIDIA Studio生態(tài)圈已經(jīng)日益龐大,這對于創(chuàng)作者們來說無疑是一個福音,同時也將把整個設計創(chuàng)作行業(yè)推向一個新的高度。而GeForce RTX 30系GPU也必然會給設計創(chuàng)作行業(yè)帶來再一次的創(chuàng)新,走向一個全新、自由、高效的創(chuàng)作時代是完全可以期待的。
坦白講,或許不用我們再多說什么話語,大家應該能夠通過這次的大型“橫評”得到結(jié)論了。確實,在NV IDI A大力推進RT X Studio生態(tài)建設之后,已經(jīng)有越來越多的設計應用軟件加入了RTX GPU加速的“朋友圈”。從測試結(jié)果也能夠看出,NVIDIA RTX GPU的創(chuàng)作應用加速性能已經(jīng)遠遠地將傳統(tǒng)的CPU渲染甩在了身后。而作為競爭對手的AM DRadeon RX 5000、RX 6000系顯卡,由于軟件及各第三方渲染插件對其支持力度不夠,加上本身在渲染性能上的落后,也已經(jīng)被NVIDIA RTX GPU甩開了一代以上的性能差距。
所以,對于設計創(chuàng)作行業(yè)的從業(yè)者來說,在高昂的專業(yè)顯卡之外,或許RTX30系顯卡是一個更具性價比也更優(yōu)的選擇。甚至從我們的測試來看,如果不是進行UG或Pro-E等工業(yè)級建模渲染應用,目前GeForceRT X 30系顯卡就應該是設計創(chuàng)作非常棒的選擇,它也絕對值得創(chuàng)意創(chuàng)作工作者信賴!