徐遠志
●個人電腦,PC,這個大家都熟,辦公、影音娛樂、玩游戲,做些簡單的創(chuàng)意性工作(比如視頻編輯、簡單的三維建模、簡單的產品設計),完全OK !而PC 的特點,從英特爾這邊來說,主要就是搭載(Core)酷睿處理器的平臺。
●再往上一級是工作站。負載更重的專業(yè)設計任務,比如,設計一臺摩托車發(fā)動機,常規(guī)的PC 可就有些吃力了,就得上工作站了!從工作站這一級開始,就開始使用(Xeon)至強處理器了,核心數量比PC 多,用的主板也不同了,且能使用ECC 錯誤校驗內存避免工作過程中宕機,而且,開始搭載專業(yè)顯卡了。
●那么再往上呢?那就是服務器,以及服務器集群了。采用的是數個或是海量的至強處理器,用Win Server 或Linux 系統(tǒng),然后根據不同的應用需求,會插滿內存(比如幾千GB)或硬盤(比如10PB、100PB,1PB=1024TB),當然,也可以插滿深度學習用的加速卡??傊?,復雜的任務,比如電影、動畫長片的渲染,比如大型的機械設計,比如游戲服務器,比如數據中心,又比如深度學習訓練等,就要用到服務器或服務器集群了!
但實際上,從工作站到服務器(集群),中間還是有比較大的跨度。實際應用中,往往會有這樣的情況:某些應用類型的算力需求遠高于工作站,但如果上服務器(集群),成本又太高了——畢竟至強處理器,以及其專屬的主板、內存等周邊都相對更貴,且WindowsServer 系統(tǒng)還是收費的,Server 上很多應用也往往是付費的(甚至是按照節(jié)點數量收費的)——這,可就相當具體了??!
為了解決上述這些實際問題,在2018年,英特爾創(chuàng)造了一種新技術、新事物:把個人電腦(PC),通過機架進行組合堆疊來集合算力(并進行分配),大家可以理解為“用PC搭建的服務器”。而英特爾也給它取了一個特別貼切的名字,叫作“PC Farm”,也即是“PC農場”。
這是PC Farm的“官方定義”。
PC Farm也歷經多次進化和迭代,但其統(tǒng)一的特征就是:它是由完整的“PC系統(tǒng)”即個人電腦系統(tǒng)組合而成的!上圖里可以非常清晰地看到三套完整的個人電腦系統(tǒng):三塊主板,每塊上都有兩根內存、一根M.2 接口的SSD,并安裝了一顆處理器,而且,每塊主板上也都有一套完整的接口。
而后,PC Farm 進化為縱向拔插形態(tài)方便隨時擴充和更多地堆疊(往機架上堆,堆成一個一個的機柜),但依然可看出是由單個PC單元組合而成的。
較新的PC Farm 產品已經非常方便插拔了,但單個組成單元依然是一套完整的PC,當然,也借助了一些服務器技術,比如服務器的散熱技術。
●首先是總算力可以很高!因為它也可以若干個機柜進行堆疊, 內部通過IPMI( 智能平臺管理接口,Intelligent PlatformManagement Interface)或是基于IPMI 的第三方管理軟件來進行管理和調配,實現硬件性能的組合(和分配),所以它的“總體性能”可以非常高(一個機柜貌似就可部署144 個算力節(jié)點),能勝任大量的專業(yè)應用。
●其次就是成本相對服務器系統(tǒng)要低不少。這個“成本相對低”是多方面的,首先PC 硬件系統(tǒng)相對便宜,系統(tǒng)和軟件費用也低。另外,這些用于組合堆疊的PC是“完整的個體”,它們是可以輕松替換的,如今甚至能“跨代堆疊”(比如之前大部分是第12代酷睿平臺,如今可部分升級到第13 代酷睿平臺,不同代可混用)。最夸張的是,被替換下來(淘汰下來)的個體,是可以作為獨立的PC 折價銷售的——因為它的配件、功能是完備的。也就是說,PCFarm 的擴容、升級,既簡單,成本也要低得多!
● 部署和管理靈活快捷。由于PC Farm引入了服務器的插拔擴容概念和遠程管理概念,所以,其部署和管理是比較靈活快捷的。經過培訓后,其實是很容易上手的。
而基于以上特性,PC Farm其實可以實現很多應用。目前主要活躍在電競網吧、電競酒店、云游戲、云渲染、VR 娛樂等領域。
大家不要被“云”字給唬著了,其實沒那么復雜,下面牛大叔給大家舉幾個不同類型的例子,相信大家都能看得明白:
●電競酒店。我們假設一家電競酒店,分布在5 層樓共計100個房間。最傳統(tǒng)的做法是:在每個房間放一臺高性能PC,比如第12 代酷睿i7+RTX 3070/4060。總量是100 臺,投資巨大不說,還面臨配件被盜被破壞的風險。
而采用PC Farm 方案,我們只要在一個房間部署機架式的PCFarm“服務器”,或許只用30個節(jié)點(30 顆i7 處理器+30 塊RTX 獨顯系統(tǒng)),進行統(tǒng)一管理和性能動態(tài)分配,就能滿足100個房間的需求(畢竟絕大部分用戶就玩玩網游,無需太多性能)。和該情況類似的還有網吧。
●又比如小型的影視工作室。這個很好理解,這些小型的影視工作室主要做特效視頻,并完成海量視頻的剪輯工作,對處理器性能和顯卡性能要求高,單個PC 肯定是不夠的。以往,這類工作室往往購買二手服務器用處理器來渲染(上全新的至強系統(tǒng),不管是工作站還是服務器,成本都很高)。
● PC Farm 與服務器集群混搭搞定“云游戲”。
這個例子稍專業(yè)一點,但也容易理解:假設某游戲廠商開發(fā)了一個畫面特漂亮的游戲(通常是網游),但問題是,如果把所有運算都在客戶端完成(如手機、筆記本電腦),對客戶端硬件的要求就很高,而客戶端的程序也會非常大,就好像如今的大型3A 游戲,動輒上百GB 容量——這對于手機來說就是噩夢了!
那么咋解決呢?比較好的方式就是在云端完成游戲的渲染工作,把客戶端的運算和存儲壓力大幅降低。但,渲染這活兒,并不適合于傳統(tǒng)意義上的服務器——服務器可以用一顆處理器延展出TB 級的內存+ 海量的硬盤,但渲染這活兒是吃處理器核心數量、GPU數量和性能的——這要靠服務器系統(tǒng)來堆,可就貴上天了!那么合理的方案就是:傳統(tǒng)的服務器完成數據部分,渲染部分就交給PCFarm完成!
這就是“云游戲模型”,實際上,最傳統(tǒng)的“網頁游戲”也是典型的云游戲。不過如今的云游戲,畫質提升很大——考驗的就是PC Farm的算力。
西山居的《劍網3》和《劍網3緣起》,就與英特爾和阿里邊緣云ENS 合作,靠PC Farm 集群完成畫面渲染,從而大幅降低客戶端硬件的需求。
邊緣算力,如測繪建模等。
不要被“邊緣”這個“標準行業(yè)詞匯”嚇著啦,待牛大叔給你清楚解讀:
2020年以前,大家都知道一個有意思的事情,叫作“演唱會抓逃”。好多逃犯耐不住寂寞,去看歌星的演唱會,誰知道被現場逮??!還別說,演唱會上真的抓了不少逃犯。
具體咋做的呢?其實機制很簡單:會場每個進出口架上攝像頭,攝像頭抓取進場觀眾的人臉和公安部的逃犯數據庫進行比對。而在這個系統(tǒng)中,攝像頭就是“終端”,而公安部的逃犯系統(tǒng)在公安部服務器上,就是“云端”。
但這個方式有個現實的問題:如果所有人臉都要通過互聯網“跨越千山萬水”上傳到公安部的服務器上進行比對,然后再反饋下來,那么速度就太慢了,無法及時出結果。于是,這個系統(tǒng)就引入了“邊緣算力”——每個攝像頭或者每幾個攝像頭,搭配一臺電腦,這臺電腦不僅錄制攝像頭拍攝的畫面方便后續(xù)到公安部數據庫中比對,而且它自己就帶有幾十萬個逃犯的面部特征數據,然后它就可以完成快速的對比篩查,這就比全部通過云端進行要快得多,高效得多了。而在這個模型中,攝像頭就是“終端設備”;這臺靠近攝像頭的電腦就是“邊緣算力”(“邊緣”指它物理位置上更靠近終端而不是云端);而公安部的數據庫就是“云端”。
不過上述例子中,人臉識別只抓關鍵特征,所以對“邊緣算力”的要求并不高,一臺高性能PC 即可。但如果采集的、需要在邊緣端預處理的信息比較復雜,算力要求比較高咋辦呢?比如測繪數據,不僅是復雜的高精度圖像,而且包含了坐標、海拔等一大堆位置信息,還要做識別分析,這時,邊緣端就得靠高PC 來堆疊性能了——PCFarm 在這里就正好可以派上用場了——用一臺多節(jié)點的PC Farm集群系統(tǒng)覆蓋一片范圍的測繪信息進行預處理,最后再上傳到云端。
看到這里,相信大家對PC Farm這種產品有了全面的認識和了解,而我想說的是:這種神奇的產品,其實應用前景非常廣闊。之前有人說它是“介于工作站和服務器之間的產品”,對,但也不對——畢竟它具備了不少連傳統(tǒng)服務器都不具備的特質,且其算力理論上也可以相當強悍,而總體擁有成本相對服務器系統(tǒng)又明顯低得多,在不少應用上的確能大展拳腳——最終,就看大家如何發(fā)揮想象了!