1998年,英特爾曾經(jīng)推出過自主品牌的獨立顯卡——Intel i740(圖1),這顆芯片是英特爾以購買Real3D公司20%股權(quán)為代價,與其攜手合作定制的產(chǎn)品,從而以較小的代價迅速進入了3D圖形市場,與同期的3dfx、ATI、NVIDIA、S3、Trident和Matrox競爭。隨后,i740還被英特爾整合進了810/815芯片組(改名為i752),構(gòu)筑了其一統(tǒng)“集顯江湖”的基石??上В琑eal3D公司在1999年時倒閉,英特爾的獨顯品牌之路也戛然而止。
繼i740之后,英特爾其實并沒有放棄獨顯產(chǎn)品的規(guī)劃,曾計劃在2010年推出代號為““Larrabee”的獨顯品牌(圖2)。Larrabee號稱是第一款實用級萬億次運算圖形處理器,其最大特色是在GPU內(nèi)引入X86指令,從而使得編程更加簡單,同CPU之間的數(shù)據(jù)交換可以保持一致性,大大降低圖形應(yīng)用程序的開發(fā)周期和難度。可惜,Larrabee“出師未捷身先死”,由于其性能以及驅(qū)動的開發(fā)遠遠落后于原先的計劃,最終淪落成為Xeon Phi加速器的項目。
在過去的20余年中,英特爾核顯品牌歷經(jīng)了多次迭代,比如去年第10代酷睿IceLake集成的核顯就隸屬于Gen11,而今年第11代酷睿TigerLake集成的核顯則是Gen12。只是,英特爾對Gen12寄予厚望,后者改用了全新可擴展的向量-矩陣架構(gòu),高度可擴展性讓它能夠針對不同市場推出不同分支的架構(gòu)和產(chǎn)品,從面向高性能計算市場Xe-HPC,面向數(shù)據(jù)中心/AI計算的Xe-HP,再到面向游戲玩家的Xe-HPG以及面向移動端的Xe-LP(圖3)。
沒錯,第11代酷睿處理器集成的銳炬Xe(Iris Xe)就是基于Xe LP超低功耗架構(gòu)打造,而我們今天文章的主角,銳炬Xe Max同樣是源于Xe LP定制。從本質(zhì)上來看,它們其實就是同一顆芯片,可以簡單理解為擁有獨立顯存的銳炬Xe核顯超頻版。
根據(jù)英特爾的規(guī)劃,銳炬XeMax將細分為移動版和桌面版,它們的品牌名稱和Logo相同(圖4),第一批上市的則是用于輕薄本市場的移動版。我們不妨先將英特爾常見的Gen11/Gen12核顯與銳炬XeMax獨顯進行一下對比,尋找它們的共性與差異(表1)。
雖然銳炬Xe和銳炬XeMax都是基于Xe-LP架構(gòu)設(shè)計,但它們核顯和獨顯身份,注定了二者在存在形式上有著本質(zhì)上的差異。其中,銳炬Xe核顯被直接整合進了第11代酷睿處理器基板上的芯片中(圖5),通過Ringbus總線與CPU內(nèi)核連接,并將部分內(nèi)存虛擬為顯存,無需占用PCB主板額外的空間。
作為獨顯,銳炬XeMax自然是以獨立的芯片形態(tài)存在(圖6),需要搭配獨立的LPDDR4X顯存顆粒,通過PCIe4.0總線與CPU相連。但也正是因為獨立形態(tài)存在,它需要占用更多PCB主板的空間(圖7),從而影響輕薄本的集成度。
正如前文所述,銳炬XeMax獨顯在本質(zhì)上就是第11代酷睿i7集成的銳炬Xe核顯的超頻版,它們都采用了10nmSuperFin制程工藝打造,內(nèi)置96個EU執(zhí)行單元,共計768個流處理器(圖8),集成48個紋理單元和24個光柵單元,支持DX12.1、OpenGL4.6和OpenCL2.0API接口以及VRS可變刷新率、適應(yīng)性同步、同步計算、DLBoostDP4AAI加速指令、AV1視頻編碼、12位端到端數(shù)據(jù),以及eDP1.4b、DP1.4、HDMI2.0b、最多四屏顯示等功能。
唯一不同的是,銳炬XeMax獨顯的核心頻率從1.35GHz提升到了1.65GHz(約22%),并可搭配4GB128bit的LPDDR4X-4266MHz顯存,不用擔(dān)心OEM廠商給第11代酷睿處理器搭配DDR4-2666/3200等低頻率內(nèi)存而影響帶寬。
此外,銳炬XeMax可以獨享25W功耗,在性能上發(fā)揮穩(wěn)定。要知道,很多第11代酷睿輕薄本在拷機測試時功耗只能穩(wěn)定運行在15W~25W,這還是CPU+GPU的整體功耗。換句話說,銳炬XeMax才能100%發(fā)揮出XeLP架構(gòu)的真正實力。
接下來,我們通過3DMark軟件對當(dāng)前熱門的核顯和主流級別獨顯進行對比(表2),以96個執(zhí)行單元的銳炬Xe核顯在搭配雙通道LPDDR4X-4266內(nèi)存時的跑分為基準(100%)。作為它的獨顯版,銳炬XeMax有著大約18.8%的性能提升,可以進一步拉開與GeForceMX350獨顯之間的差距,已經(jīng)無限接近18WTDP版本的GeForceMX450了。但是,3DMark畢竟只是理論測試軟件,在實際的游戲中,銳炬XeMax獨顯只能達到GeForceMX350的水平,可以在1080P+最低畫質(zhì)下流暢運行早期的3A游戲大作。
需要注意的是,銳炬XeMax獨顯的表現(xiàn)還會受到來自英特爾的顯卡驅(qū)動,以及OEM廠商為筆記本設(shè)定的功耗墻和溫度墻的影響。宏碁非凡S3X是首發(fā)銳炬XeMax獨顯的輕薄本,但是從網(wǎng)友的實測反饋來看,它在部分游戲和圖像渲染工具中會出現(xiàn)貼圖錯誤,而且在以《絕地求生》為代表的游戲中,銳炬XeMax獨顯運行的流暢度還不如屏蔽獨顯,直接使用銳炬Xe核顯運行的狀態(tài)。
究其原因,是因為以非凡S3X為代表的輕薄本受制于65W電源適配器,可供CPU+GPU使用的最大功耗只有42W左右。在高負載的環(huán)境下,系統(tǒng)會優(yōu)先確保GPU的功耗輸出,留給CPU的功耗則會被壓制到10W出頭(圖9),導(dǎo)致CPU頻率驟減,遇到《絕地求生》這種比較吃CPU頻率的游戲自然會頻頻卡頓了。至于為什么核顯狀態(tài)玩這個游戲會更流暢,是因為第11代酷睿在協(xié)調(diào)CPU和核顯功耗分配時更靈活,在確保核顯穩(wěn)定輸出時還能避免CPU“拉胯”。
從現(xiàn)有的數(shù)據(jù)來看,想讓銳炬XeMax獨顯真正以1.65GHz的頻率滿血輸出,需要30W左右的實時功耗,想在玩大型3D游戲時讓CPU保持在較高的頻率,也需要分配20W或更高的功耗,這需要英特爾和OEM廠商兩方面共同協(xié)調(diào)優(yōu)化,以升級驅(qū)動和BIOS的形式不斷改進。
在英特爾發(fā)布銳炬X eMax獨顯之前,很多玩家都盼望它能與處理器內(nèi)集成的銳炬Xe核顯組成交叉火力,在玩游戲時能實現(xiàn)1+1≧2的增益效果。
遺憾的是,銳炬獨顯與核顯之間無法“交火”,只能借助DeepLink技術(shù),讓銳炬XeMax獨顯與銳炬Xe核顯并行處理推理和渲染項目,提升內(nèi)容創(chuàng)作工作效率(圖10)。根據(jù)官方數(shù)據(jù),第11代酷睿i7-1165G+銳炬XeMax獨顯的AI性能較之第10代酷睿i7-1065G7+MX350提升了7倍;在執(zhí)行超級視頻編碼項目時,較之第九代酷睿i9-10980HK+RTX2080SuperMax-Q獨顯的組合還要快1.78倍。
此外,由于是通用軟硬件架構(gòu),銳炬核顯與獨顯間還支持動態(tài)功率共享(DynamicPowerShare),一方空閑時可將功耗空間智能地分配給另一方。但正如前文提到的,非凡S3X在“吃雞”時對CPU功耗的壓制太過激進,顯然這一功能還有不小的優(yōu)化空間。
就性能而言,采用獨立封裝和獨立顯存,獨享更高功耗的銳炬XeMax獨顯的確領(lǐng)先銳炬Xe核顯不少,但也談不上質(zhì)變,換成實際游戲就是個位數(shù)的幀數(shù)提升而已。因此,當(dāng)?shù)?1代酷睿筆記本已標(biāo)配LPDDR4-4266內(nèi)存的情況下,額外增加一個銳炬XeMax獨顯的意義真心不大,還會讓消費者付出不必要成本。除非你從事AI或圖像渲染方面的工作,還需要一款盡可能輕薄的筆記本,第11代酷睿+銳炬XeMax獨顯的組合才有用武之地。
從另一個角度來看,如果英特爾獨顯可以受到市場認可,未來推出了取消核顯的移動處理器,將更多的晶體管用于強化CPU部分性能,此時再搭配自家的獨立顯卡,說不定可以在英偉達和AMD的獨顯市場中分一杯羹(圖11)。此外,如果英特爾將來可以實現(xiàn)核顯與獨顯在游戲中的交火能力,也是一種差異化競爭的思路。