Peter Sayer
開放計算項目(OCP)在2011年啟動,F(xiàn)acebook在當(dāng)時公布了一些其自制服務(wù)器的設(shè)計,這些服務(wù)器旨在讓Facebook的數(shù)據(jù)中心更為高效地運(yùn)行。
Facebook希望其他的公司能夠采用和修改他們的最初設(shè)計,在降低成本的同時提升質(zhì)量。他們確實做到了:針對開放計算項目設(shè)計的硬件銷售額在2017年達(dá)到了12億美元,這一銷售額是上一年度的兩倍,預(yù)計到2021年有望達(dá)到60億美元。
在IHS Markit的評估中,這些數(shù)字排除了OCP委員會成員Facebook、英特爾、Rackspace、微軟和高盛在硬件方面的開支。上述這些公司均在一定程度上使用OCP。這部分的開支仍然只占數(shù)據(jù)中心系統(tǒng)總體市場的一小部分。據(jù)Gartner預(yù)測,整個市場在2017年達(dá)到1780億美元。雖然Gartner預(yù)測整個市場到2019年將進(jìn)入停滯期,但HIS預(yù)測OCP部分將以每年59%的速度增長。
部署OCP的原因
當(dāng)Facebook為他們位于俄勒岡州普賴恩維爾的首個專用數(shù)據(jù)中心設(shè)計硬件時,他們希望能夠在能源、材料和資金這三個方面實現(xiàn)節(jié)約。
通過降低能源供應(yīng)損耗和將服務(wù)器設(shè)計的更高,F(xiàn)acebook有效地提升了能源效率。服務(wù)器設(shè)計的更高可以為更大且更為高效的散熱片留出空間,這也意味著可以使用直徑更大的風(fēng)扇,從而只需要很少的電力就可以讓更多的空氣流動起來。
通過取消無用的面板、涂裝、標(biāo)志、不需要的擴(kuò)展插槽和組件(如視頻卡,甚至是安裝螺釘),每臺服務(wù)器節(jié)省了超過6磅重的材料。
由于不用為未消耗的電力或未使用的部件付錢,這勢必會降低成本。另外,它們還節(jié)約了勞動力:沒有了安裝螺釘,拆裝服務(wù)器都非常便捷;標(biāo)準(zhǔn)化節(jié)約了處理備件的時間,整個系統(tǒng)可以更為迅速地部署。
部署OCP面臨的障礙
在2018年的開支研究中,IHS Markit認(rèn)為OCP硬件部署主要面臨三大障礙,分別為:安全、貨源和整合。
向所有人公布OCP硬件制造規(guī)范的一個風(fēng)險是任何人都可以制造。這導(dǎo)致別有用心的人在交付前會篡改它們,并且誰也不會知道。換句話說,供應(yīng)鏈的安全是一個很大的問題。
安全
在2018年3月于美國圣何塞召開的OCP峰會上,OCP領(lǐng)袖們表示,他們正在通過創(chuàng)建新的安全項目(Security Project)來解決供應(yīng)鏈安全問題。新的安全項目重點是制定一個標(biāo)準(zhǔn)的硬件接口和協(xié)議,以確保啟動代碼的完整性。
微軟已經(jīng)貢獻(xiàn)了他們的Project Cerberus。Project Cerberus為符合《NIST 800-192平臺固件防災(zāi)指南》的主板固件的硬件信任根。
他們以此為基礎(chǔ)還計劃開發(fā)安全固件API、針對專用安全硬件的開源固件、安全的固件配置方法,以及能夠核實所有易變存儲(包括BIOS、微控制器和復(fù)雜可編程邏輯器件CPLD的閃存)和確保安全的工具。在這方面,正在接收OCP硬件的企業(yè)能夠確保收到的硬件只能運(yùn)行他們希望運(yùn)行的固件。
該項目的主管并不擔(dān)心新的硬件,相反他們正在考慮的是二手設(shè)備。為了確保轉(zhuǎn)售市場的安全,他們將考慮提供可以將硬件從不安全或不受信狀態(tài)恢復(fù)過來工具和能夠追蹤和修改硬件所有權(quán)的工具。
軟硬件整合
將硬件和軟件整合起來比較容易,自從微軟加入到OCP委員會并貢獻(xiàn)出了用于向客戶交付Azure服務(wù)的機(jī)架和服務(wù)器設(shè)計后,在操作系統(tǒng)層面的整合變得尤為容易。目前在其他層面的整合工作還在繼續(xù),包括能夠讓OCP服務(wù)器啟動的最底層固件。
另一個新的OCP方案——開放系統(tǒng)固件項目(Open System Firmware Project)也希望解決這一問題。該項目致力于將初始化服務(wù)器芯片組的代碼實現(xiàn)開源,以讓其能夠被用于不同平臺和不同類型的處理器上。此外,該項目還打算以UEFI和Linux Boot項目為基礎(chǔ)為所有的云操作系統(tǒng)和數(shù)據(jù)中心的處理器架構(gòu)提供支持,包括GPU、FPGA和針對機(jī)器學(xué)習(xí)等應(yīng)用進(jìn)行專門優(yōu)化過的硬件。
隨著開放計算硬件逐步在網(wǎng)絡(luò)虛擬化中占據(jù)一席之地,OCP還在著手將開放軟件和硬件整合在一起。思科系統(tǒng)和瞻博網(wǎng)絡(luò)等傳統(tǒng)網(wǎng)絡(luò)設(shè)備廠商也在緊張地將兩者整合起來,向用戶交付為專利軟件量身打造的專利硬件。
如今,OCP正在與Linux基金會合作將他們的硬件與后者網(wǎng)絡(luò)功能虛擬化開放平臺(OPNFV)軟件整合在一起。近期,這兩個組織承諾將聯(lián)合測試硬件和軟件產(chǎn)品以確保產(chǎn)品符合各自的規(guī)范。
到哪里購買OCP設(shè)備
尋找開放計算項目硬件的貨源已經(jīng)變得非常容易了。該項目的網(wǎng)站上有一個市場頁面,我們可以在這里研究設(shè)備規(guī)范和聯(lián)系開放計算項目廠商。
目前已經(jīng)有100多款產(chǎn)品獲得了OCP授權(quán)或認(rèn)證。OCP授權(quán)標(biāo)簽僅供那些完全符合當(dāng)前OCP規(guī)范且由OCP銀牌、金牌或鉑金成員制造的產(chǎn)品使用。OCP認(rèn)證產(chǎn)品可由任意廠商制造,但是必須要完全符合當(dāng)前OCP規(guī)范同時必須要提供開源設(shè)計文件。
開放計算項目硬件的類型
雖然項目的早期重點是OCP服務(wù)器和電力供應(yīng),不過如今該項目已經(jīng)逐漸將機(jī)架、存儲和開放計算項目網(wǎng)絡(luò)也納入其中。該組織目前已經(jīng)接受了開放的Wi-Fi硬件規(guī)范。
OCP服務(wù)器盡管是以簡單的商用設(shè)備為出發(fā)點,但是它們正在逐漸發(fā)生變化,因為針對不同工作負(fù)載的專用服務(wù)器和機(jī)器學(xué)習(xí)應(yīng)用對計算的需求正在影響著設(shè)計。
Facebook正在持續(xù)推動OCP服務(wù)器的發(fā)展。在2018年美國圣何塞OCP峰會上,F(xiàn)acebook展示了他們的第三代機(jī)器學(xué)習(xí)平臺Big Basin v2。該平臺使用的是Nvidia Tesla V100 GPU,與之前Big Basin v1使用的P100相比,這是一個很大提升。新處理器在性能方面提升了大約三分之二。對此,F(xiàn)acebook稱得益于對Big Basin設(shè)計上的一些調(diào)整,除了處理器數(shù)量有所增加,平臺保持了幾乎全部的優(yōu)點。
Facebook還展示了一個名為Fabric Aggregator的新系統(tǒng)。該系統(tǒng)被設(shè)計用于連接同一區(qū)域內(nèi)的相鄰數(shù)據(jù)中心,以及將數(shù)據(jù)中心區(qū)域與其他數(shù)據(jù)中心區(qū)域相互連接。通過使用Facebook自己的OPC 100G交換機(jī)、Wedge 100和FBOSS(Facebook開放交換系統(tǒng))軟件,F(xiàn)abric Aggregator允許類似Facebook的網(wǎng)絡(luò)公司獨立地擴(kuò)展區(qū)域內(nèi)和區(qū)域間流量。
微軟也希望能夠分享開放交換市場。其容器化的SONiC(云端開放網(wǎng)絡(luò)軟件)已經(jīng)進(jìn)入到了邁勒羅斯科技(Mellanox Technologies)公司的新設(shè)備當(dāng)中,允許企業(yè)將本地的架頂交換機(jī)遷移至Azure云上。這使得微軟能夠?qū)⒂布S商的銷售額為自己的云服務(wù)所用。
通過另一個OCP方案,微軟不再修改存儲市場的架構(gòu)。閃存設(shè)備和存儲子系統(tǒng)制造商對于處理地址映射、垃圾收集和損耗均衡的信息應(yīng)當(dāng)駐留在何處并沒有達(dá)成一致意見。將這些信息放在存儲子系統(tǒng)中對于工作站或消費級設(shè)備具有意義,但是在云服務(wù)功能中,例如垃圾收集,如果控制器不知道數(shù)據(jù)來自何處,那么處理將會變慢并出現(xiàn)浪費。這也是為什么存儲系統(tǒng)緩存通常會混雜著來自不同應(yīng)用和虛擬機(jī)的數(shù)據(jù)——在不同時間將被釋放出來的數(shù)據(jù)。借助于Denali項目,微軟希望讓OCP存儲設(shè)備制造商將這一信息轉(zhuǎn)移至更高層的堆棧上,從SSD驅(qū)動器轉(zhuǎn)移至主機(jī)上,從而允許其為特定的工作負(fù)載修改驅(qū)動器行為方式。