国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

軟硬兼施 了解新一代顯卡的“隱藏實力”

2021-05-23 15:08:34
電腦愛好者 2021年10期
關鍵詞:處理器容量細節(jié)

顯存訪問革命

在AMD推出RX 6000系列顯卡的時候,同時宣布了一個“新技術”——Smart Access Memory,簡稱SAM。它其實就是一種讓處理器可以訪問全部顯存,即擁有全部權(quán)限(Full Access)的技術(圖1)。

在十幾年前,當顯卡接口轉(zhuǎn)向PCIe插槽時,顯卡與處理器的通信能力就是PCIe總線的重要“賣點”。當然,處理器和顯卡的通信并不是直接訪問處理器或者GPU,那樣會擾亂數(shù)據(jù)處理的,GPU通過PCIe通道訪問的主要是內(nèi)存數(shù)據(jù),而處理器訪問的當然就是顯存里的數(shù)據(jù)了。只不過由于當初設計的問題,處理器訪問顯存的范圍被定在了256MB,也就是最初幾代PCIe高端顯卡(圖2)的顯存容量。

不過之后隨著顯卡顯存容量的提升,這個能力似乎被遺忘了,于是處理器訪問顯存時需要的BAR(基礎地址寄存器)就沒有升級過,訪問權(quán)限一直保持在256MB,顯卡和處理器只能交流少量的數(shù)據(jù)。但PCIe規(guī)范本身其實并沒有這種限制,反而有ResizabIe BAR Capabilitv(可調(diào)節(jié)大小的BAR容量)這個功能(圖3)。Smart Access Memory實際上就是終于“想起”并用上了這個功能,只要按照PCIe規(guī)范調(diào)節(jié)BAR,就可以讓處理器獲得訪問全部顯存的權(quán)限了。

英特爾和英偉達也隨后推出了類似功能,大部分主板直接以PCIe規(guī)范的Resizable BAR Capability技術為名(圖4),一般直接簡稱為BAR。也有部分主板比較個性,例如華擎將這一功能命名為CAM(Clever Access Mempry)(圖5)。

至于為什么現(xiàn)在處理器和GPU廠商都突然想起來了這個功能,其實很簡單,相對于目前的顯卡,PCIe4.0×16插槽擁有了“太大”的帶寬,比如我們測試支持PCIe 4.0的RTX 30系列、RX 5000/6000系列顯卡時,使用PCIe 3.0×16(或PCIe 4.0×8)還是PCIe 4.0×16插槽,表現(xiàn)并沒什么區(qū)別,說明有很大的接口帶寬根本處于閑置狀態(tài)。

另一方面,要想讓處理器順暢地訪問高速、大容量緩存,對通道帶寬的要求也非常高,在PCIe 3.0時代,大家根本不敢放開處理器訪問顯存的范圍,以免影響最緊要的通信數(shù)據(jù),也只有如今PCIe 4.0時代的帶寬,才能讓廠商放心開啟這一功能。順便說一下,現(xiàn)在動輒8GB甚至10多GB、20多GB的顯存,也為處理器與GPU協(xié)作留下了一定的容量基礎,否則被GPU自身緊急需求的數(shù)據(jù)塞滿的區(qū)區(qū)幾GB顯存,也根本沒有處理器插手的空間。也許正是出于這種考慮,英偉達第一款“出生”就為BAR進行優(yōu)化的GPU,恰好是自身性能有限,但顯存容量很大的RTX 3060(圖6)。

至于性能方面,很遺憾的是,目前只有少數(shù)幾款游戲可以從這一功能中明顯受益,例如《戰(zhàn)爭機器5》在開啟BAR之后幀速提升就比較大(圖7),但其他3A游戲的幀速提升幅度大都很小,有些甚至還會有幀速下降的情況。

當然,這一功能的潛力還是非常明顯的,處理器與GPU的良好協(xié)作,對未來場景越來越復雜、NPC越來越智能、物理效果越來越真實的游戲或3D應用,都是意義非凡的。只是想要充分感受它帶來的益處,恐怕還得等待為其優(yōu)化的全新3D應用/游戲引擎。

分辨率優(yōu)化技術

使用低分辨率或低細節(jié)的畫面,通過優(yōu)化來模擬更高分辨率、畫質(zhì)的畫面,是顯卡的一種常見的幀速“優(yōu)化”模式。不過在近期,軟硬件結(jié)合,并且有了光線追蹤畫面的更緊迫需求,才使得兩大GPU廠商的相關技術——英偉達的DLSS和AMD的FidelityFX技術更加引人矚目。

火速連接

DLSS是英偉達在RTX 20時代就提出的技術,在本刊2020年第15期《低成本“升級”提升電腦性能的小手段》一文中已經(jīng)有詳細介紹,這里就不贅述了,

其中AMD的FidelityFX技術,實際上是為RX 6000系列顯卡和以及AMD支持的新一代游戲主機推出的一整套圖形品質(zhì)優(yōu)化工具(圖8),可為游戲加入環(huán)境光遮蔽、可變陰影著色以及自定義銳化技術等,分辨率優(yōu)化技術是其中的FidelityFX Contrast AdaptiveSharpening(對比度自銳化,簡稱CAS)部分,目前仍在開發(fā)和優(yōu)化中。

從目前的情報看,F(xiàn)idelityFX CAS更偏向于游戲本身的支持和優(yōu)化,與DLSS的實現(xiàn)途徑有明顯區(qū)別。DLSS是在英偉達自家的服務器上對游戲進行針對性的智能學習和優(yōu)化,之后通過驅(qū)動放出相應的優(yōu)化設置,這樣可以獲得最適合GPU的效果,但優(yōu)化時間較長,如果游戲引擎有變化可能需要重新學習。而AMD可以利用自家在游戲主機平臺上的絕對優(yōu)勢,要求開發(fā)商的游戲引擎直接為FidelityFX優(yōu)化,以便在主機上發(fā)揮最好效果。由于目前大量的中高端游戲都是跨平臺開發(fā)和發(fā)售的,PC平臺上的這些游戲當然也會支持FidelityFX。這種方式雖然傳統(tǒng),但同樣有效,而且不會出現(xiàn)游戲升級或發(fā)布后,需要推出新驅(qū)動才能對其優(yōu)化的情況。

可變速率渲染

如果說DLSS和FidelityFX CAS的幀速優(yōu)化主要是依靠低分辨模擬高分辨率,那么通過降低細節(jié)來提升幀速的新技術應該就是可變幀率渲染(VariabIe Rate Shading,簡稱VRS)了。

用最簡單的方法解釋VRS,它其實就是自動判別玩家不關注的景物、角度,比如遠處的樹皮,快速轉(zhuǎn)身時候“途經(jīng)”角度上的景物。然后盡量減少這些地方的細節(jié)渲染,使用更粗糙的材質(zhì)等等(圖9),這樣可以降低顯卡對每一幀畫面的處理負擔,就可以提升整體幀速了。當然在幀速已經(jīng)足夠的情況下,也可以將這些節(jié)省下來的資源放在更重要的景物、視角里,甚至還可能增加這些地方的細節(jié)表現(xiàn),提升畫質(zhì)體驗。

我們很難通過實際游戲的靜態(tài)畫面看到VRS的表現(xiàn),因為一旦靜止,沒有所謂可以忽略的景物和角度了,顯卡常常會去彌補畫面細節(jié),所以我們只能從3DMark的相應測試中截取圖片來看一看效果。

3DMark的VRS測試分為兩級,一級只能針對某個圖形,比如遠處的石頭與樹木與近處使用不同的渲染細節(jié)(圖10、圖11);而二級則可以針對圖形的某個區(qū)域,比如同一所房子中,位于玩家側(cè)面的墻壁和正對的墻壁都可以表現(xiàn)出不同的細節(jié)(圖12、圖13)。

在一級VIRS測試中,我們可以比較明顯地看出遠處的樹皮變得更模糊了,雖然對重要景物的影響不大,但仔細觀察會看到明顯的不同。至于二級VRS,因為區(qū)域設定更靈活,畫面損失也更小,靜態(tài)圖片就幾乎看不出來變化了。

VRS對幀速的影響很大,以畫質(zhì)損失較小的二級VRS為例,使用同為圖靈核心的GTX 1660和RTX 2070顯卡進行測試,兩者開啟VRS后的幀速提升都更明顯。

這里要注意的是,VRS雖然不是RTX 30和RX6000這樣的最新一代顯卡才開始提供的技術,但對于核心還是有一定要求的。特別是畫面效果與幀速更加平衡的二級VRS,最好使用圖靈或更新核心的顯卡。

英偉達專屬 快速響應與新G-Sync

英偉達發(fā)布RTX 3060的同時,還推出了一個有助于游戲整體速度體驗的技術——Reflex。它除了通過英偉達自身的GPU研發(fā)能力,降低游戲畫面的生成、傳輸、顯示延遲之外,還盡量降低處理器壓力、并讓鼠標、顯示器廠商針對操控延遲、顯示延遲進行優(yōu)化,以加快游戲從操控輸入到畫面最終顯示的整體速度(圖14),降低延遲,提升體驗。

火速連接

關于英偉達快速響應技術的介紹,可參考本刊2021年第4期的《感受未來走近CES 2021》一文。

而在RTX 3060的發(fā)布會前后,英偉達還悄悄地做了另一件事,那就是將G-Sync的認證標準降低了(圖15)。首先是衍生出了所謂的G-Sync Compatible(G-Sync兼容)標準。從對比表中可以看出,顯示器只需要支持可變刷新率,不用經(jīng)過之前G-Sync認證的300+種檢測,當然也不用內(nèi)置芯片,價格也就便宜得多,這使得很多入門、主流游戲顯示器可以開始支持G-Sync技術。

其次,英偉達將原本最高規(guī)格的G-Sync Ultimate標準降低了。原先的Ultimate HDR實際就是DisplayHDR 1000標準,包括峰值亮度達到1000nits,且要有多個背光分區(qū)等要求,現(xiàn)在變成了比較模糊的Lifelike HDR,這樣HDR 600甚至400的顯示器也可以宣傳自己是G-Sync Ultimate標準了。

這兩個舉措的意義非常明顯,Reflex可以從整體上改變畫面延遲問題,讓玩家更充分感受到升級顯卡帶來的實際好處,避免其他方面的延遲掩蓋幀速提升的體驗。而降低和擴展G-Sync認證,則可以讓更多玩家體驗到無撕裂的畫面,同樣有利于顯卡展示其高幀速的優(yōu)勢。不過這兩個技術,或者說戰(zhàn)略也存在一些缺陷,例如Reflex陣營中沒有網(wǎng)絡相關廠商加入,而網(wǎng)絡延遲在游戲整體延遲中已經(jīng)是無法忽視的問題了,而且G-Sync認證向下擴展和降低標準會不會影響高端玩家的體驗,也是未知之數(shù)。

AMD專屬 內(nèi)置緩存與Rage模式

AMD的新一代GPU當然也有自己的專屬特色技術,首先就是RX 6000全系都具有的特殊配置——Infinity Cache。如果說RX 6000系列采用的架構(gòu)更像是處理器的話,那么Infinity Cache就有點像是處理器中常見的、所有核心共享的三級緩存(L3 Cache)。其實RDNA2架構(gòu)圖上確實和處理器一樣明確標有一級、二級(L1、L2)緩存及Infinity Cache的位置(圖16),也說明其使用方式和三級緩存真的非常類似。

Infinity Cache的存在大幅提升了RX 6000系列的數(shù)據(jù)響應速度(圖17),在這方面將RTX 30系列遠遠甩在了身后。不過這一配置也存在一些問題,比如占用了GPU核心的外部帶寬,也因此影響到了顯存容量配置,造成RX 6000系列的高端型號在這兩點上都弱于對手。

至于AMD的Rage模式,其實就是自動超頻,或者說高頻率狀態(tài)(圖18)。在發(fā)布會的時候我們甚至可以看到,RX 6900 XT能夠與對手抗衡,實際上就使用了超過標準頻率的Rage模式(圖19)。而AMD之所以會有這種設計,應該也與RX 6000比對手更低的TG P(Total Graphics Power,全卡功耗)有關,這使其可以適當放松功耗管理來獲得更高性能。

在新一代的顯卡和其配套軟件中,可能還隱藏著一些尚不為人熟知的技術,也有一些是我們特別熟知,因此算不上“隱藏實力”的技術,比如光線追蹤等。它們的目的與實現(xiàn)途徑各不相同,或?qū)嵱?、或超前、或強力、或有趣,但相同的是,它們都在努力推進著3D技術不斷發(fā)展、完善。也許在下一代顯卡露面后,我們可以回頭更好、更全面地重新梳理這些技術及其帶來的變化。

猜你喜歡
處理器容量細節(jié)
以細節(jié)取勝 Cambridge Audio AXR100/ FOCAL ARIA 906
留心細節(jié)處處美——《收集東·收集西》
細節(jié)取勝
Coco薇(2016年10期)2016-11-29 19:59:58
SnO2納米片容量異常行為的新解釋
電源技術(2015年12期)2015-08-21 08:58:20
Imagination的ClearCallTM VoIP應用現(xiàn)可支持Cavium的OCTEON? Ⅲ多核處理器
2015年上半年我國風電新增并網(wǎng)容量916萬千瓦
風能(2015年8期)2015-02-27 10:15:12
2015年一季度我國風電新增并網(wǎng)容量470萬千瓦
風能(2015年5期)2015-02-27 10:14:46
ADI推出新一代SigmaDSP處理器
汽車零部件(2014年1期)2014-09-21 11:41:11
呼嚕處理器
小青蛙報(2014年1期)2014-03-21 21:29:39
焊管(2013年11期)2013-04-09 07:16:58
洮南市| 桑植县| 阿拉善右旗| 舞阳县| 庄河市| 西吉县| 宣城市| 青铜峡市| 绥芬河市| 滦平县| 丹江口市| 甘孜| 商河县| 鲁甸县| 秦安县| 社会| 亳州市| 德清县| 开封市| 扶绥县| 分宜县| 娄底市| 锡林郭勒盟| 山丹县| 永胜县| 郓城县| 兰西县| 金川县| 保德县| 惠东县| 齐河县| 榆林市| 高唐县| 清镇市| 沁源县| 三亚市| 当雄县| 温宿县| 屏山县| 蕉岭县| 柘城县|