在6月4日的Computex上,英特爾終于將Haswell處理器的型號、規(guī)格公諸于世。首批發(fā)售的型號一共有22款,包括12款桌面產品、10款移動產品。整體和之前Sandy Bridge、Ivy Bridge發(fā)布的情況類似,本次Haswell也采用了高端產品先行發(fā)售,中低端產品后續(xù)補充的方式。本期CHIP將通過對其最高端的Core i7-4770K處理器和與之搭配的Z87主板進行詳細的分析與測試,為大家剖析新一代Haswell平臺帶來的變革。
革新的架構
從宏觀方面來講,Haswell的整體構造與Sandy Bridge較為相似,如使用環(huán)形總線與各個CPU核心連接,同時用總線連接的還有LLC、GPU核心以及系統(tǒng)邏輯單元等。英特爾之所以會采用這個構造是因為環(huán)形總線可以更容易地實現各個模塊的連接,并且可以推出大量衍生產品。
不過新的Haswell架構在指令下行back-end緩存周圍與以往產品有很大的不同,其指令發(fā)出/執(zhí)行管線與之前的數代產品(從Nehalem到Sandy Bridge)的架構相比都擁有了極大的變化。首先前幾代的產品一直都采用6指令(uOPs)方式運行,而現在則提升為8指令。而且在指令發(fā)出端口方面,Haswell指令的發(fā)出端口由之前的2個提升為8個,并將整數運算單位和載入/存儲管線各增加了1個。因此Haswell可同時執(zhí)行4個整數運算以及2個載入和1個存儲的操作,這可以讓Vector單元的峰值運算性能相比之前最高提升兩倍。在使用FMA命令時,Haswell的CPU核心浮點運算和SIMD運算性能也將獲得兩倍的提升。
Haswell還有一些其他的改進,包括內存訪問帶寬的大幅度提升,如L1緩存的載入帶寬由原先的32B/循環(huán)提升為64B/循環(huán)。而L2和L1緩存的帶寬也由之前的256bit提升為512bit,并且L2 TLB(Translation Look-aside Buffer,翻譯后援緩沖器)也獲得了大幅提升,可以大大提升高工作負載時的性能表現。
新的指令集
經過多年的發(fā)展,如今的主流處理器已經達到了4核心4線程、4核心8線程甚至更高的規(guī)格,即便是入門的產品也達到了雙核心4線程的規(guī)格,多線程技術早已融入到普通辦公和家庭娛樂環(huán)境中,但是在日常應用中,許多時候擁有更多線程的處理器并不能完全體現出其速度的優(yōu)勢,有部分原因是因為軟件、游戲開發(fā)商對多核優(yōu)化不足,而且CPU自身也存在著一定的限制導致多線程運行效率的降低。
英特爾在Haswell架構加入了新的TSX擴展功能,簡單來說,TSX就是允許程序員指定事務型同步代碼空間,使得目前使用粗粒度線程鎖定(Coarse-grained thread lock)的程序能更自由地使用細粒度線程鎖定(Fine-grained thread lock),進而提高多線程執(zhí)行的效率和性能。
舉個簡單的例子,如果用戶在編輯Excel表格時,打算同時編輯兩份拷貝,Excel就會提示該文件正在編輯,只能以只讀方式打開但不能編輯,這種情況就類似粗粒度線程鎖定,這種鎖定比較簡單,很容易實現,但是效率不高,細粒度線程鎖定則可以實現自由度更高的數據同步。如果在上個例子中使用細粒度線程鎖定的規(guī)則,那么每個線程都可以操作不同縱列的數據,這樣就可以明顯提高CPU的處理效率,讓運算速度更快。不過這樣做也有更大的風險,特別是多個線程同時向一個區(qū)域寫入數據時,數據出錯的幾率更大。在使用了事務性內存和TSX擴展后,部分鎖定操作的運算性能可提升1~3倍。如在軟件仿真中,傳統(tǒng)內存需要10.6s的處理時間,事務性內存僅需要4.6s,性能提升明顯。除了TSX擴展之外,在Sandy Bridge架構上首次開始使用的AVX指令集也升級到了AVX 2.0版本,與現在Ivy Bridge處理器所使用的128bit的AVX指令集相比,AVX 2.0采用了256bit的SIMD浮點指令集和SIMD陣列,在理想狀況下浮點和整數性能均可以達到上一代產品的兩倍。
暴增的GPU規(guī)格
在CPU架構穩(wěn)步升級的同時,Haswell整合的GPU核心自然也不會落后,雖然從Haswell的GPU核心架構上來看,它在一定程度上沿續(xù)了Ivy Bridge的設計,但是在規(guī)格方面進行了大幅升級。
在規(guī)格方面,Haswell擁有3種不同級別的圖形核心,與之前Sandy Bridge的HD2000/HD3000和Ivy Bridge的HD2500/HD4000分別各只有兩種規(guī)格不同,Haswell的GPU核心有3種規(guī)格,在命名方面也有了較大變化。按照運算單元的不同,Haswell的GPU核心分為GT1、GT2和GT3共3種,其中GT1定位最低,只有6個EU單元、24個ALU單元、1個曲面細分單元,與目前Ivy Bridge的HD 2500核芯顯示卡規(guī)格基本相同。GT2核心的EU單元則大幅提高到20個,并且擁有80個ALU單元,2個曲面細分單元,與目前Ivy Bridge最高級別的HD 4000核芯顯示卡的16個EU單元相比多了四分之一。而Haswell的GT3核心的EU單元大幅提升至40個,是GT2的兩倍,是HD4000的2.5倍。它還擁有160個ALU單元和4個曲面細分單元,如此規(guī)模的硬件提升已經讓Haswell集成顯示核心超越了入門級顯示卡的水平,甚至具備叫板中端顯示卡的能力,在性能方面已經向AMD的APU產品看齊,這對AMD來說可不是個好消息。不過擁有GT3核心最高規(guī)格的處理器只會出現在頂級移動平臺上,主流桌面版處理器最高僅配備GT2顯示核心,如本次測試中的Core i7-4770K的核芯顯示卡即為GT2顯示核芯。
更低的功耗
在設備移動趨勢越來越明顯的情況下,英特爾已經悄然改變了處理器的研發(fā)策略,將重點從提升性能轉向降低功耗、提高效能方面。新的Haswell雖然不會升級制造工藝,但會從架構和技術上作出努力,特別是會整合穩(wěn)壓器模塊(VRM),改進處理器供電的精細度,并在不影響性能的前提下降低功耗。
目前,穩(wěn)壓器和各種供電IC都安置在主板上,而為了加強處理器供電并且增加賣點,主板供電電路相數在不斷猛增,制造成本和占用空間也水漲船高,但仍舊都達不到英特爾想要的理想供電水平。為此,英特爾特別在Haswell處理器電路中設計了一個功耗單元(Power Cell),這個內置的供電系統(tǒng)可以獨立調節(jié)每個內核、顯示卡核心、SA系統(tǒng)助手以及內部的I/O總線等各個部分電路的供電,這可以實現高精度的電壓調節(jié),并且非常有助于降低處理器的功耗。
作為節(jié)能的另一個舉措,Haswell還將支持微軟在Windows 8中引入的Connected standby(連接狀態(tài))節(jié)能技術,英特爾定義了不同的節(jié)能狀態(tài),稱為S0ix。相比上一代的處理器,Haswell從S0切換到S3狀態(tài)只需要毫秒級的時間,而且可以在短時間內頻繁切換,這將大大減少處理器在低負載下的功耗。除此之外,Haswell具有新的C節(jié)能狀態(tài)(C7至C10),它可以有效降低待機狀態(tài)的功耗。這個技術可以將平臺功耗降低至0.1W級別的水平,這對于在智能設備領域野心勃勃的英特爾來說是個好消息。
測試平臺介紹
本次測試平臺中的處理器是Haswell處理器桌面版中最高端的產品,型號是Core i7-4770K.,主板方面我們使用了技嘉GA-Z87X-UD3H主板作為測試平臺,該主板采用了8相IR數字供電設計,可以提供更高的供電電流,并能更好地保證供電電壓的平穩(wěn)性,同時具有不俗的超頻性能。除了測試處理器集成顯示核芯的圖形性能外,我們還將對處理器搭配獨立顯示卡時的游戲性能進行測試。為此在處理器游戲性能測試環(huán)節(jié),我們選擇了AMD頂級的Radeon HD 7990顯示卡作為測試平臺。為了保證平臺的穩(wěn)定性,我們使用了海韻SS-850KM 80PLUS金牌電源。
測試結果與總結:
在常規(guī)處理器性能測試中我們可以發(fā)現,Core i7-4770K在多個項目中都與上代的Core i7-3770K不分伯仲,除了CineBench R11.5的OpenGL項目和MediaCoder轉碼項目性能提升明顯外,其余測試成績兩者之間的差距均在10%以內。綜合看來,憑借架構上的優(yōu)化,Core i7-4770K在多線程應用中比Corei7-3770K平均提升了大約7%,對于追求更高性能處理器的用戶來說,Core i7-4770K平臺并沒有足夠的理由來打動我們去升級他們手中的Core i7-3770K+Z77的平臺。
在使用獨立顯示卡的處理器游戲性能測試項目中,Core i7-4770K相對于上代Ivy Bridge核心的 Corei7-3770K的提升也是微乎其微,甚至有數款游戲還敗給了Core i7-3770K平臺,總體平均下來Core i7-4770K的領先幅度僅為0.5%左右,這對于想要升級新平臺的高端游戲玩家來說無疑是一個巨大的打擊。
在核芯顯示卡性能測試項目中,Core i7-4770K終于憑借更高的硬件規(guī)格和更高的核心頻率進行了一次蛻變,雖然它只配備了集成20個EU的HD4600顯示核心,但是在性能方面的提升立竿見影,綜合性能提升約為30%。這種級別的性能提升可以讓在上一代核芯顯示卡的性能下許多不具備可玩幀數的游戲變得可玩甚至流暢,不過對于這次核芯顯示卡性能提升的真正意義主要還是在于移動平臺方面,因為如此的性能可以讓低端獨立顯示卡徹底失去活路,而對于使用一顆頂級桌面處理器搭配高端游戲顯示卡組建游戲專用平臺的用戶來說,這種游戲性能的提升卻如同隔靴搔癢。
功耗方面,我們分別測試了Core i7-4770K+Z87主板平臺和上一代Core i7-3770K+Z77平臺的待機、典型游戲狀態(tài)和處理器滿載下的平臺功耗,待機狀態(tài)下Core i7-4770K平臺的功耗僅為52W,比上一代的Core i7-3770K平臺低了近10W。在典型游戲情況下,兩者的功耗幾乎相同。而在處理器滿載的情況下,Core i7-4770K平臺的功耗則反超上一代Ivy Bridge平臺,約高出了10W。
如今Core i7-4770K已經在市場上銷售,價格在2 350元左右,相比Core i7-3770K貴了200元有余,加上新的8系列主板,一套Core i7-4770K+Z87主板平臺的成本至少要比Core i7-3770K+Z77主板的平臺多出400~500元左右,由于這一代處理器對于高端獨立顯示卡平臺下的游戲性能提升有限,因此對于游戲用戶來說,上一代的Core i7-3770K平臺明顯要實惠得多。而對于主要工作是3D渲染、視頻制作的用戶來說,升級Core i7-4770K平臺則是非常不錯的選擇。
聲音
Haswell平臺為英特爾帶來了有史以來最大幅的改善,其搭載的Iris顯示卡較此前的產品性能提升2倍,并大幅降低了待機功耗,而這種功耗的降低并不是以犧牲性能為代價的。
—— 施浩德
英特爾公司高級副總裁、PC客戶端事業(yè)部總經理