近年來,不少科技公司開始自主研發(fā)計算機芯片,旨在節(jié)省服務(wù)器成本,并提高機器學(xué)習(xí)模型的處理和訓(xùn)練效率。
據(jù)悉,臉書也加入了這一行列,并正在為其數(shù)據(jù)中心自主開發(fā)一套定制芯片。
其中,一個芯片處理器用于優(yōu)化視頻轉(zhuǎn)碼,或進一步提升其用戶觀看視頻的體驗;而另一個芯片處理器將用于內(nèi)容推薦等機器學(xué)習(xí)任務(wù)。
這樣一來,臉書將逐漸減少對外部芯片制造商的依賴,比如英特爾、高通和博通等;另一方面,由于臉書數(shù)據(jù)中心的碳足跡處于不斷增長的趨勢,轉(zhuǎn)向定制芯片可以有效幫助其減少碳足跡。
此外,臉書并不打算讓自研芯片完全取代原本的芯片處理器,新芯片將與其目前正在使用的第三方處理器一起運行。
定制芯片并不是一個新命題,比如,自2016年以來,谷歌一直擁有用于機器學(xué)習(xí)的TPU(Tensor Processing Unit)定制芯片。該芯片正在為Google的許多應(yīng)用程序提供支持,包括用于提高搜索結(jié)果和街景相關(guān)性的人工智能系統(tǒng)RankBrain,進一步提高了谷歌地圖導(dǎo)航的準確性和質(zhì)量。
值得一提的是,在與圍棋世界冠軍李世石的對弈中,由TPU提供支持的谷歌DeepMind AI程序以4:1的總比分獲勝。
2020年12月,據(jù)外媒報道,微軟也在為其Surface設(shè)備和云基礎(chǔ)設(shè)施開發(fā)內(nèi)部的ARM芯片處理器,并開始自研用于數(shù)據(jù)中心的芯片。
一直以來,微軟的Azure云服務(wù)都是使用英特爾的處理器來驅(qū)動。雖然Surface設(shè)備在PC市場中所占的份額相對較小,但微軟開始自研芯片的這一舉動仍對英特爾造成一定打擊,致使其股價在該日收盤前下跌約6.3%。
臉書表示,他們一直在與芯片合作伙伴共同探索提高計算性能和能效水平的方法。關(guān)于未來的計劃,目前尚未有更多可公布的新訊息。
事實上,對臉書來說,涉足定制芯片并不是一件容易的事,不過此前該公司已經(jīng)進入半定制芯片領(lǐng)域。
2019年,臉書宣布正在開發(fā)一種用于視頻轉(zhuǎn)碼和推理工作的專用集成電路(ASIC)。
據(jù)了解,臉書每月需為超過27億用戶提供應(yīng)用和服務(wù)。為支持如此龐大的用戶量,該公司設(shè)計并構(gòu)建了先進且高效的系統(tǒng)來擴展其基礎(chǔ)設(shè)施。
然而,隨著工作負載的增長,僅由傳統(tǒng)的通用處理器為用戶提供服務(wù)已遠遠不夠。在臉書看來,或許只有開發(fā)新的專用加速器和整體系統(tǒng)級解決方案,才能進一步提高系統(tǒng)的性能、功率和效率。
因此,臉書與其他公司合作開發(fā)了分別面向人工智能推理優(yōu)化、人工智能模型培訓(xùn)和視頻轉(zhuǎn)碼的解決方案。
2019年3月14日,臉書宣布推出用于AI模型培訓(xùn)的“Zion”平臺、用于AI推理優(yōu)化的專用集成電路“Kings Canyon”以及用于視頻轉(zhuǎn)碼的“Mount Shasta”。
臉書用于人工智能推理解決方案的構(gòu)建塊
其中,作為臉書的下一代訓(xùn)練硬件平臺,“Zion”平臺具有強大的計算能力。在進行AI模型培訓(xùn)的過程中,不僅能夠有效處理CNN、LSTM和SparseNN等一系列神經(jīng)網(wǎng)絡(luò),而且可提供高內(nèi)存容量、高帶寬以及靈活的高速互連,以支持臉書的關(guān)鍵工作負載。
需要注意的是,在臉書訓(xùn)練工作負載增加的同時,其推理工作負載也在不斷增加。而臉書當前使用的標準CPU服務(wù)器由于很難繼續(xù)擴展,因此并不能跟上人工智能推理優(yōu)化的進程?;诖耍槙c多個合作伙伴合作開發(fā)了可在其基礎(chǔ)設(shè)施中部署和擴展的推理ASIC。
據(jù)了解,該推ASIC擁有四個主要組成部分,分別為國王峽谷推理M.2模塊、雙湖單路服務(wù)器、Glacier Point v2載卡、優(yōu)勝美地v2機箱。這些組成部分利用已經(jīng)發(fā)布到OCP(Open Compute Project,開放計算項目)
的現(xiàn)有構(gòu)建塊,加快了開發(fā)時間且依靠其通用性降低了風(fēng)險。
據(jù)統(tǒng)計,臉書的平均直播數(shù)量每年都在翻倍增長。尤其自2018年8月在全球推出以來,F(xiàn)acebook Watch服務(wù)的月觀眾人數(shù)已超過4億,每天約有7500萬人使用。
針對觀眾不同的可用互聯(lián)網(wǎng)連接,臉書生成了多種輸出質(zhì)量和分辨率(或比特率)來優(yōu)化視頻觀看,這一過程稱為轉(zhuǎn)碼。要完成此轉(zhuǎn)碼過程需要大量密集型的計算,而通用CPU的效率遠遠不及臉書視頻擴展基礎(chǔ)設(shè)施的增長速率。
因此,臉書與其芯片供應(yīng)商Broadcom和Verisilicon合作設(shè)計了針對轉(zhuǎn)碼工作負載進行優(yōu)化的定制ASIC。這其中包含用于轉(zhuǎn)碼工作流程每個階段的專用芯片,能夠支持分布在不同數(shù)據(jù)中心位置的異構(gòu)硬件設(shè)備,平衡視頻轉(zhuǎn)碼的工作負載。
自研芯片的勢頭正逐漸擴大,整個科技行業(yè)的芯片布局是否會因此發(fā)生變化?目前仍需繼續(xù)觀望。(摘自美《深科技》) (編輯/克珂)