可樂
AMD Kaveri APU開創(chuàng)了AMD全新的異構(gòu)計算時代,為AMD未來的發(fā)展鋪平了道路。在硬件上,Kaveri APU在GPU和CPU部分都做出了重大改進,全新的壓路機CPU架構(gòu)和強大的GCN GPU架構(gòu)使得APU在性能上達到了一個巔峰。在軟件方面,借助于統(tǒng)一內(nèi)存尋址技術(shù)和HSA異構(gòu)加速的強大魅力,APU能夠以前所未有的態(tài)勢展現(xiàn)出其在應(yīng)用程序加速、并行計算等方面的獨特優(yōu)勢。
1 全新的CPU和GPU架構(gòu)
Kaveri APU在硬件上的優(yōu)勢在于全新的硬件架構(gòu)。它的CPU部分采用了AMD在推土機架構(gòu)上大幅度加強、重新調(diào)整設(shè)計的壓路機架構(gòu)。而GPU部分,桌面顯卡上流行的GCN架構(gòu)的加入,使得Kaveri APU成為史上圖形性能最強大的處理器產(chǎn)品。
壓路機架構(gòu):IPC大幅度提升
AMD之前的的推土機架構(gòu)設(shè)計存在些許遺憾。而在Kaveri APU上,AMD經(jīng)過全新調(diào)整推出了壓路機架構(gòu),總的來看,Kaveri APU的壓路機構(gòu)相比同檔次的推土機和打樁機架構(gòu),綜合性能提升大約15%~20%。
根據(jù)AMD官方資料,壓路機架構(gòu)指令部分大幅度加強,指令緩存追蹤失敗幾率降低30%,分支預(yù)測失敗幾率降低20%,每個線程增加了25%的數(shù)據(jù)調(diào)度寬度,為每個整數(shù)單元配備了獨立的解碼單元。在執(zhí)行部分,壓路機增加了5%~10%的調(diào)度效能,提升了L1數(shù)據(jù)緩存的存儲性能。此外,壓路機還引入了動態(tài)調(diào)整大小的L2緩存、增加了微解碼操作隊列,提升了L1和L2緩存的接口,上述改進使得壓路機的性能相比之前的推土機有了明顯的提升,尤其是額外增加的整數(shù)解碼單元,使得壓路機的整數(shù)性能明顯提升,在執(zhí)行日常操作時性能表現(xiàn)更為出色。
GCN架構(gòu):史上最強的融合GPU
AMD官方數(shù)據(jù)顯示,新的GCN架構(gòu)融合獨顯核心帶來了最多30%的GPU性能增加。Kaveri APU完美支持DirectX 11.2、Open GL 4.3等一些新技術(shù),也支持AMD諸多特色技術(shù),如Mantle、TureAudio、UVD等,堪稱史上規(guī)格最全面、性能最強悍。
Kaveri APU最多可以集成8個CU單元,每個CU單元有64個流處理單元, 最多擁有512個流處理單元,規(guī)格堪比目前桌面獨立顯卡。AMD宣稱Kaveri APU的頂級型號A10-7850K可以在1080P分辨率下以中等畫質(zhì)以每秒30~40幀的速度比較流暢地運行《戰(zhàn)地4》。此外,AMD還額外強調(diào)了兩個數(shù)據(jù),856GFLOPS和47%的GPU面積。Kaveri APU的計算能力目前最高可達到856GFLOPS,與此相對應(yīng)的是上一代Richland APU的最高浮點計算能力為779GFLOPS。從數(shù)據(jù)來看,雖然Kaveri APU只想對Richland的絕對值提升了約10%,但是由于CPU和GPU架構(gòu)的改進以及統(tǒng)一內(nèi)存尋址、HSA等技術(shù)的引入,Kaveri APU在實際的計算能力上相比前代的Richland還是有更大幅度的進步的。此外,Kaveri APU中GPU部分的面積越來越大,目前已經(jīng)達到了47%(浮點計算貢獻能力約86%)。更大的GPU面積可以提供更強大的浮點計算能力,也能夠使得APU在運行圖形應(yīng)用以及有關(guān)并行計算時效能表現(xiàn)更為出色。
2 新工藝提升能耗比
在這一代新的Kaveri APU上,AMD采用了全新的28nmSHP工藝。全新的工藝擁有超高的晶體管密度。之前的Richland APU的晶體管數(shù)量有13億個,核心面積為246平方毫米,但是在Kaveri APU上使用了GlobalFoundries新的“半代工藝”后,擁有高達24.1億晶體管,但是核心面積卻只有245平方毫米,晶體管密度幾乎提升一倍。
更小的核心面積有助于降低產(chǎn)品的成本。不僅如此,Kaveri APU借助于全新的28nm SHP工藝,功耗表現(xiàn)也非常令人滿意,最高功耗僅有95W,最低功耗甚至只有15W。更低的功耗加上更強悍的性能,大幅度提升了APU的性能功耗比,擴展了APU的市場范圍。現(xiàn)在AMD可以提供高性能、低功耗以及超低功耗等多個版本的APU產(chǎn)品,各個類型的用戶都可以得到自己想要的選擇。
3 異構(gòu)計算魔力初現(xiàn)
對Kaveri APU而言,硬件架構(gòu)的進步只能說是常規(guī)性的。而Kaveri APU對統(tǒng)一內(nèi)存尋址(Heterogeneous Uniform Memory Access,簡稱為hUMA)的支持,則完全可以堪稱對整個業(yè)界尤其是異構(gòu)計算發(fā)展的革命性推動。Kaveri APU是目前全球首款能夠支持CPU和GPU統(tǒng)一尋址的處理器,也是AMD未來發(fā)展HSA(Heterogeneous System Architecture,異構(gòu)系統(tǒng)架構(gòu))的核心產(chǎn)品。
在傳統(tǒng)的理念中,由于巨大的結(jié)構(gòu)差異,CPU和GPU各有所長,將它們?nèi)诤显谝黄疬M行智能調(diào)度并發(fā)揮各自的優(yōu)勢,一直都極為困難。傳統(tǒng)的CPU+GPU的分離式架構(gòu)通過PCI-E總線調(diào)配CPU和GPU中的數(shù)據(jù),并且CPU和GPU各自有擁有本地存儲,這樣就造成了兩者之間數(shù)據(jù)的共享和傳輸存在瓶頸,還給編程人員和程序編譯帶來了巨大的困難。
為了解決這樣的問題,AMD在Kaveri APU上支持hUMA,使得CPU和GPU能夠使用統(tǒng)一的內(nèi)存空間,數(shù)據(jù)存放于CPU和GPU公共的空間中,可以被CPU和GPU同時調(diào)用和讀取,完全沒有任何帶寬和數(shù)據(jù)存儲上的阻隔,效率相比傳統(tǒng)的CPU+GPU分離式設(shè)計有了翻天覆地般的提升,同時為異構(gòu)計算本身的發(fā)展打開了大門。為了更進一步發(fā)展Kaveri APU統(tǒng)一內(nèi)存尋址的強大潛力,AMD還專門組建了HSA聯(lián)盟,并從軟件開發(fā)和硬件底層兩方面下手支持HSA異構(gòu)計算的發(fā)展。根據(jù)AMD展示的一些例子,在HSA的支持下,Kaveri APU相比傳統(tǒng)CPU,在JPEG解碼速度上的提升高達87.3%。此外還有諸如人臉識別、圖形加速等強大的功能,在HSA和Kaveri APU的加持下都能獲得極為明顯的性能提升。
4 奏響APU最強音
從硬件、軟件以及架構(gòu)設(shè)計和規(guī)格來看,Kaveri APU不愧是目前AMD最強的APU產(chǎn)品。借助于全新的打樁機架構(gòu)、GCN融合顯卡,Kaveri APU實現(xiàn)了性能的飛躍。在軟件方面,HSA架構(gòu)以及相關(guān)軟件的配合,使得Kaveri APU開啟了一扇通向未來異構(gòu)計算的大門。這也是AMD布局多年后希望得到的結(jié)果??偟膩碚f,Kaveri APU是AMD未來發(fā)展的核心,也是AMD未來進化的基礎(chǔ)。