在今天的中國,數字化轉型已經在各種場合下多次被提及。在數字化轉型推動經濟增長的大背景下,科研、產業(yè)、醫(yī)療、教育、經濟等產業(yè)結構發(fā)生了巨大的變化。甚至可以說數字化推進各個行業(yè)重塑的同時,正在與經濟模式和社會生活的結構相融合,推動數字經濟發(fā)展的核心技術,正成為社會的發(fā)展的核心動力。
正因如此英特爾眾多產品線中,“至強”的地位也越來越重要,它不僅意味著全新的數據中心平臺,還是英特爾計算力從云端下沉到邊緣,深入到各行各業(yè)的算力引擎。
其實熟悉閃迪產品的朋友都應該了解,閃迪這一系列的移動固態(tài)硬盤其實已經是第二代產品,早在2019年,閃迪便啟用了這個設計,而當時我們也就這個耐用、耐看的產品設計給予了很高的評價:IP55 等級的防水防塵、出得野外、入得殿堂的外觀,以及出色的兼容性,這些都是當時整個市場中非常創(chuàng)新意識的點。正是受益于這項極受歡迎的設計,閃迪也將這個產品線延展開來,豐富的產品線也使得我們偶爾會有辨識上的盲區(qū),在評測這款閃迪移動固態(tài)硬盤之前,我們不妨展開聊聊閃迪近幾年的變化。
AI、算力、安全同時提升的第三代至強
我們看到,全新發(fā)布的第三代英特爾至強可擴展處理器(代號“Ice Lake”)采用了10nm制程工藝設計生產,這是繼Tiger Lake之后,英特爾又一個進入10nm時代的產品線。每顆第三代英特爾至強可擴展處理器芯片可提供最多40個核心,性能相比已部署五年的系統(tǒng)提高2.65倍。該平臺每插槽最多可支持6TB系統(tǒng)內存,提供高達8個DDR4-3200內存通道和64個PCIe 4.0通道。
在至強處理器周邊,英特爾集中了傲騰持久內存與存儲產品、以太網適配器、FPGA和經過優(yōu)化的軟件解決方案等強大產品線組合,使至強平臺在數據中心、云、5G和智能邊緣等領域提供強大的性能和工作負載優(yōu)化,以應對在人工智能、數據分析、高性能計算等多種復雜需求的開發(fā)和部署。
以往我們看處理器的升級,主要看它的算力成長指標,而第三代英特爾至強可擴展處理器不僅在算力上有著重大的提升,更是在人工智能和安全性上提供了更為強大的支持,這對于在分布式智能時代以強大、靈活、可靠的算力,來應對復雜多樣的工作負載有著巨大價值。
算力上,第三代英特爾至強可擴展處理器(以下簡稱“第三代至強”)在主流數據中心工作負載上性能平均提升46%。另外,它還是唯一內置人工智能加速,并提供廣泛軟件優(yōu)化和整體解決方案的數據中心CPU,其全新的硬件和軟件優(yōu)化可以提供高達74%的人工智能加速,在20種主流人工智能工作負載上,第三代至強的性能優(yōu)勢最高超出AMD EPYC7763的1.5倍,最高超出英偉達A100 GPU的1.3倍。
通過英特爾深度學習加速技術集成人工智能加速技術,英特爾專門為第三代至強提供了多項安全法寶,包含英特爾軟件防護擴展(Intel SGX)和英特爾密碼操作硬件加速,以及用于人工智能加速的英特爾深度學習加速技術(DL Boost),這些新功能和新軟件都會加入英特爾精選解決方案和英特爾市場就緒解決方案內,組成滿足廣泛行業(yè)需求的產品組合。
看懂至強及其周邊軟硬件方案組合,才能明白英特爾真正的強大之處在于豐富的產品線和生態(tài)系統(tǒng):比如為了解決傳輸更快問題的Si Photonics硅光子通信芯、Ethernet以太網產品線、Tofino可編程以太網交換機產品線;為了存儲更多的Optane內存、SSD產品線和在算力上形成包圍優(yōu)勢的XEON至強、Atom凌動、Agilex FPGA、結構化eASIC、StratixFPGA、Movidius 神經網絡計算、Habana AI、Xe顯示等芯片陣營。正是憑借軟硬結合的優(yōu)勢、規(guī)?;哪芰屯晟频纳鷳B(tài)支持,英特爾能夠提供最為靈活創(chuàng)新的產品解決方案,并贏得最多的合作伙伴支持。
作為一款數據中心產品,第三代至強緊抓住未來的數據中心的變化趨勢,英特爾將之歸納為“應萬變 塑非凡”六字——也是第三代至強的發(fā)布主題。細講下來便是針對云計算在公有云、私有云、混合云,甚至行業(yè)云在實施地點、部署規(guī)模上的不同,需要數據中心適應AI和新興業(yè)務的需求。
從基礎架構的角度來看,計算、存儲、內存會逐漸解耦,透過更多的軟件虛擬化,以實現計算資源池的互聯,使之資源利用最大化。如今的至強處理器多達40個核心,強大的算力包圍出的計算資源池,為充分利用處理器的高算力,英特爾引入了負載整合的技術,具體來說便是運用虛擬化的技術,在不同核心上跑不同的應用,充分利用現在處理器的多核能力。同樣,英特爾在邊緣上利用云原生技術將相關軟件模塊放在一個容器中便于服務商管理和升級,也需要利用虛擬化技術將前端平臺虛擬化成若干個不同的計算設備、網絡設備、存儲設備,用戶便可從相互連通的計算池中調用計算資源,實現復雜的應用。在聯通算力池的基礎上,英特爾也根據客戶需要的復雜應用場景,將軟件分解為更小的模塊,成為微服務,方便調用。
另外,CPU如今并不能單獨滿足日益復雜的用戶需求,前文中也提到,至強處理器周邊有很多給力的“小伙伴”。不過英特爾的XPU大戰(zhàn)略則是通過異構計算打通不同構架芯片的圍欄,從而實現覆蓋更寬的產品組合。這其中既包含了x86構架的CPU,也包含了FPGA架構的Agilex,也有Xe顯示芯片,還有人工智能加速芯片VPU架構……一句話,便是將CPU融入XPU大戰(zhàn)略協同工作中去,以應對復雜數據處理需求。
海量數據涌向邊緣
細看英特爾在近兩年的產品線布局,產品重心越來越從云、到網絡,向邊緣上遷移,這是由于數據的產生將大量產生于數據中心之外,有報告指出,2025年數據中心之外產生的數據將占據總數據量的75%,而企業(yè)也非常重視分析這類數據產生的價值。對于面向企業(yè)的解決方案來說,將算力放在更靠近數據的地方,不僅能夠降低延時,加快分析效率,而且能夠直接帶來AI、機器視覺的大量應用。所以我們看到,第三代至強特別為智能邊緣側提供了強大的人工智能、復雜的圖片或視頻分析以及整合工作負載的性能、安全性與運營控制。相較于前一代產品,該平臺可為圖像分類提供的人工智能推理性能提升最多可達1.56倍。
另外,第三代至強易于管理的特性,也有利于在新零售、制造、醫(yī)療等行業(yè)中部署智能邊緣計算。比如英特爾Speed Select技術,便能將一臺服務器針對不同工作負載的需求動態(tài)的靈活配置,以提升其利用率。加上剛才提及的安全功能,能夠讓這些分散于數據中心之外的數據更加安全,更加有效地得到利用。特別是應智能邊緣開發(fā)的至強D系列產品,采用了SoC架構,擁有上述易管理、安全和AI等計算特性,能夠更加靈活地部署在邊緣之上。
關于智能邊緣話題的高端專訪
英特爾公司物聯網事業(yè)部中國區(qū)首席技術官及高級首席工程師張宇博士
數據中心、云端、網絡、邊緣,到存儲,英特爾在以上領域均推出了基于第三代至強平臺的產品組合。但近年來,應行業(yè)需求,發(fā)展得最快的莫過于邊緣,所以我們就“智能邊緣的發(fā)展”話題,邀請到英特爾公司物聯網事業(yè)部中國區(qū)首席技術官及高級首席工程師張宇博士與我們進行一場深入的交流。
1.第三代至強能夠在哪些邊緣之上
相對第三代至強的性能提升,我們更關心它能夠在哪些具體的智能邊緣應用場景上部署。雖然算力提升給平臺的部署提高了更大的寬容度,但硬件還是需要于基于英特爾各種軟件解決方案才能在各行各業(yè)生根開花。
在第三代至強發(fā)布之前,我們已經看到前序產品已經有在邊緣上應用的案例,比如將云基礎設施和云服務部署到企業(yè)現場的智能邊緣小站;比如基于5G網絡,在接近智能手機或者移動終端的地方(智能化基站)提供云計算能力的MEC(移動邊緣計算);以及在醫(yī)療、工業(yè)上大量用于監(jiān)視控制和數據采集的邊緣視覺套件……但實現上,這些應用在訴求點和部署方式各不相同,目前英特爾可以在哪些場景下部署第三代至強平臺?帶著這樣的話題,我們開始了今天的交流。
首先,張宇博士介紹了邊緣的大概念。邊緣的概念最早來自網絡邊緣,因業(yè)務下沉將一些算力由中心推到邊緣,如今物聯網場景的需求越來越旺盛,所以我們從應用場景角度將其分為網絡邊緣和物聯網邊緣。邊緣小站、5G的MEC平臺都屬于網絡邊緣的應用;物聯網的應用場景更加具體一些,除了工業(yè)、醫(yī)療,智能交通、智慧社區(qū)準確來說都包含其中。
第三代至強對兩類邊緣場景都能提供很好支持,比如利用至強處理器在通信領域可以搭建MEC平臺,能夠實現高效的信號處理和數據轉發(fā)。這次發(fā)布的很多新特性,特別適于數據的高效傳輸,比如英特爾DDIO(數據直接 I/O)便可將傳統(tǒng)從網卡接入,經過內存再進入CPU處理的數據,直接從網卡進入到CPU,省去內存的轉發(fā)環(huán)節(jié),無形中提高了數據接收和處理速度。
物聯網的邊緣計算應用場景很多,不同場景對于算力要求不一樣,對用戶來說,總希望獲得性價比最大化的方案。我們可以看到,第三代至強此次推出了不同硬件配置、不同核心數量、不同性能的產品,用戶可以根據自己對于負載的要求選擇不同的配置。對應用戶在邊緣上部署的效益最大化的需求,第三代至強還含有一個全新的特征——英特爾SST技術(Speed Select Technology)。這是一個可提供更精細化的CPU性能控制技術,它可以根據負載或虛擬機要求,調節(jié)每個核上的性能,針對工作負載的變化。SST技術還可以提供遠程訪問解決方案實現自動重新配置。這樣靈活的配置能力,非常適于在邊緣上的部署。
2.為邊緣計算而生的至強D有哪些能力
在邊緣之上,第三代至強D系列處理器是當仁不讓的主角。早期,D系列處理器曾應用在SOC嵌入式場景,新一代的至強D處理器則專門應用于vRAN、安全設備、uCPE/SD-WAN、交換機和路由器等室內外使用場景中密度更高、尺寸受限且堅固耐用的邊緣設備上。
在張宇博士看來,至強D處理器的設計與邊緣計算是相輔相成的,由于邊緣底層更多的是PCIe帶寬,強調I/O吞吐能力,所以至強D處理器從硬件、工藝方面都充分考慮到性能功耗比、應用性、易部署。而且不同于數據中心等領域所需的一個處理器平臺將兩塊CPU的雙路服務器,至強D處理器采用的是單路服務器方案。
我們還在英特爾官網留意到,至強D處理器提供從25W到125W的廣泛功率選擇包含的系統(tǒng)芯片包括集成CPU、面向英特爾QuickAssist技術的硬件加速、IO和NIC,加上SP產品線的補充,能夠涵蓋用戶對算力從低到高的不同要求。此外,該處理器還內置原生人工智能(VNNI和英特爾深度學習加速)、直連加密功能和精準定時,進一步促進邊緣服務的部署。
3.第三代至強平臺應對不同邊緣應用場景的靈活部署有何優(yōu)勢?
與傳統(tǒng)數據中心不同,算力在邊緣上的部署需要及時響應和靈活性,以應對不同場景下的部署。與競爭對手相比,英特爾的優(yōu)勢在何處呢?張宇肯定了我們的問題方向,雖然不能對競爭對手進行評測,他還是從英特爾已經具有明顯優(yōu)勢做了解答。
在他看來,英特爾在邊緣部署上充分了解用戶對于半導體行業(yè)、對于芯片的要求,盡管根據不同應用場景需要完成的工作是多樣化的,但總體可以將處理的類型分成三個大類:第一,要完成計算;第二,要做存儲;第三,滿足通信。如今很難把所有工作都在一個節(jié)點上完成(單一節(jié)點系統(tǒng)),需要的是云邊協同的分布式系統(tǒng),將工作在云端和邊緣分布式地進行處理。所以系統(tǒng)角度去看一塊半導體處理器,是基本的要求。
英特爾XPU企業(yè)戰(zhàn)略擁有強大的產品陣列支持,產品涵蓋了通信、計算、存儲的各個方面,不同處理器有各自分工,在具體處理器設計方面充分考慮用戶需求,我們把這幾個方面都考量進去了。第三代至強可擴展處理器我們一方面提升核心數量和算力,人工智能、AI推理能力在不斷增強;存儲方面,它的內存在傲騰的支撐下能達到6TB,訪問內存的容量提升了2.6倍,訪問速度也提升了1.6倍左右。通信相關的技術方面,DDIO這樣的技術使得至強處理器更快的接收到數據、處理數據以及更快發(fā)送數據。這些都是單一處理器設計時著重考慮的方面。
放在英特爾全產品系列上來看,剛才提到的小站、5G的MEC平臺,其中都包含了英特爾的處理器技術和與之相關的軟件技術在通訊里,我們提供的OpenNESS軟件工具可以方便地幫助用戶實現5G的RAN功能、5G核心網絡功能、5G的MEC功能,利用這樣的軟件能夠更好地發(fā)揮處理器平臺能提供的功能。在人工智能方面還提供了比如OpenVINO、OneAPI等這樣的軟件工具,能夠幫助開發(fā)者快速把他在開放的人工智能框架,像Caffe、TensorFlow等開放框架上設計、訓練好的人工智能網絡模型,通過這樣一些工具快速的部署到英特爾提供的不同硬件平臺上實現人工智能的推理操作。所以英特爾產品最大的特點便是在軟件和硬件的產品均涵蓋了用戶在計算、通訊和存儲多方面的需求。
在應對不同邊緣應用場景的部署上,英特爾也一直和合作伙伴一起為最終用戶提供解決方案。包含剛才提及的,英特爾在軟件方面非常完整,在此基礎上還有應用參考級的框架,這是英特爾非常自豪的。軟件和解決方案上投入的力度越大,最終用戶用起來就越方便。
4.第三代至強平臺在AI方面的進展
其實不僅是至強,英特爾其他產品線上最新一代的產品都強調AI能力的成長。而AI,更是邊緣上用于視覺采集、計算等應用非??粗氐哪芰?。我們已經看到,第三代至強號稱業(yè)內唯一內置人工智能加速的處理器,相對競品在測試項目中取得了明顯的優(yōu)勢,希望通過張宇博士了解到第三代至強AI性能大幅提升的原因。
關于AI方面,第三代至強多核心帶來了強大的人工智能算力。除了 AVX512指令集對于加速 AI 模型的推斷非常有效之外,還集成了DL Boost Int8的指令集,人工智能推理方面的速度與第二代至強相比有1.8倍左右的提升;同時,VNI的指令集也做了進一步增強,可顯著提高基于硬件的性能。另外,英特爾建有機器學習庫,還可能過OpenVINO推動人工智能和機器學習的融合,特別是在人工智能邊緣計算上,大大簡化了實際部署環(huán)境的難度,尤其是在最新版本在邊緣端的軟硬結合帶來了性能的極大提升。
由于采用了11代Graphic顯示芯片(內部稱為12代Graphic),第三代至強相比前一代使用的9代Graphic,可用于AI計算的單元數EU從最高32擴到了96個,3倍擴展的情況下,視覺方面的AI運算能力上也有巨大提高。在某些場景對AI算力需求巨大的情況下,還可以通過FPGA或者其他加速卡進行擴展,這也是平臺開放性所具備的天生優(yōu)勢。在與合作伙伴深入的合作下,英特爾擁有完備的參考樣本,能幫助合作伙伴快速部署產品。
寫在最后:
完備的參考樣本建立在英特爾非常重視的解決方案建設上。從2010年起致力于加速數據中心解決方案的質量以及數量后,至強在各個方面擁有相當深厚的基礎和技術解決能力。尤其是2017年開始英特爾推出精選解決方案之后、英特爾可以提供了超過500個數據中心解決方案和30個從云到邊緣的不同工作負載的方案。從寬廣的軟硬件產品組合、豐富的解決方案,到廣泛的生態(tài)系統(tǒng)和數十年客戶實例實施經驗,這些都是英特爾足以自傲的。當然,我們今天的話題還是落在智能邊緣之上,英特爾專門建設了邊緣軟件中心(ESH),英特爾提供的軟件工具和針對不同行業(yè)的解決方案均是通過其更新和共享。對于邊緣的重視還是因其高速的成長性,有理由相信,未來邊緣上產生的數據將體現出更多價值。