開(kāi)源硬件從超大規(guī)模數(shù)據(jù)中心向傳統(tǒng)企業(yè)擴(kuò)展
自2011年Facebook成立OCP以來(lái),包括惠普、戴爾、微軟在內(nèi)的近200家企業(yè)成為了OCP(Open Compute Project)的成員,該組織已經(jīng)發(fā)布了數(shù)十款服務(wù)器、交換機(jī)以及其他系統(tǒng)和主板的開(kāi)源設(shè)計(jì)。
目前,4家規(guī)模最大的超大互聯(lián)網(wǎng)公司提供商中已有3家(Google、Facebook和Microsoft)加入OCP 。此外,OCP也正逐漸滲透到傳統(tǒng)企業(yè)中,他們不僅積極探索OCP,而且已經(jīng)實(shí)施了一些重要的OCP部署并致力于實(shí)現(xiàn)這些部署的持續(xù)發(fā)展。
今年有超過(guò)3500名工程師注冊(cè)參加了OCP大會(huì),其中有約178受訪者稱(chēng),他們每年在數(shù)據(jù)中心設(shè)備上的花費(fèi)為25.6億美元,預(yù)計(jì)到2022年將增加至近110億美元。在本次大會(huì)上,眾多創(chuàng)新設(shè)計(jì)亮相,推動(dòng)超大規(guī)模數(shù)據(jù)中心向深度和廣度發(fā)展。成員企業(yè)代表們表示,他們希望這些新項(xiàng)目只是芯片開(kāi)源的一個(gè)開(kāi)始。
微軟和合作伙伴發(fā)布了開(kāi)源RTL,用于一種新的數(shù)據(jù)壓縮機(jī)制,而英特爾公布了另一個(gè)實(shí)現(xiàn)安全塊的類(lèi)似項(xiàng)目。這些舉措表明,參與開(kāi)放計(jì)算項(xiàng)目(Open Compute Project,OCP)的數(shù)據(jù)中心巨頭們,正在朝著芯片開(kāi)源邁出第一步。
當(dāng)下,摩爾定律正在放緩,深度學(xué)習(xí)等工作負(fù)載不斷增加,這迫使工程師們?nèi)σ愿白非笮阅芴嵘。OCP大會(huì)參展廠商高管表示,由于目前有十幾款熱門(mén)處理器和加速器正在研發(fā)中,因此希望OCP委員會(huì)能夠在明年之前起草相關(guān)的標(biāo)準(zhǔn)。
微軟服務(wù)器設(shè)計(jì)總經(jīng)理Kushagra Vaid表示:“在云服務(wù)提供商中,我們開(kāi)創(chuàng)了貢獻(xiàn)RTL的先例。對(duì)于一項(xiàng)新的壓縮標(biāo)準(zhǔn)來(lái)說(shuō),你需要為整個(gè)行業(yè)做出貢獻(xiàn),你需要大量的芯片。”
Project Zipline是對(duì)所謂“數(shù)據(jù)洪流”的一種響應(yīng)措施,根據(jù)最近的一項(xiàng)研究顯示,預(yù)計(jì)到2025年每年產(chǎn)生的數(shù)據(jù)量將達(dá)到175ZB。Project Zipline定義了優(yōu)化數(shù)據(jù)中心的霍夫曼編碼的一種變體,在模式匹配的IP塊中實(shí)現(xiàn)的。Project Zipline將微軟測(cè)試文件大小減少了了92%-96%,同時(shí)可以在微秒級(jí)處理吞吐量達(dá)每秒數(shù)十GB。
Vaid坦言,推出新的壓縮技術(shù)需要一定的時(shí)間。到目前為止,Project Zipline得到了AMD、Arm,Broadcom、Cadence、Intel、Marvell、Mellanox和Synopsys等廠商的支持。
在另一個(gè)項(xiàng)目Project Cerberus中,OCP的目標(biāo)是將使用Project Cerberus創(chuàng)建的處理器信任根擴(kuò)展到服務(wù)器的所有組件中,這就需要Facebook、Intel和微軟等廠商定義一個(gè)新的協(xié)議和IP塊。這種方法讓目前Cerberus主板上使用的NXP控制器成為主控制器,與每個(gè)外圍芯片中的從屬塊進(jìn)行通信。英特爾發(fā)言人表示,這幾家廠商將開(kāi)放這些外圍塊的源代碼。
重新思考服務(wù)器主板
在會(huì)上,微軟工程師Siamak Tavallaei描述了一種針對(duì)模塊化主板的新概念:將服務(wù)器主板分解為多個(gè)模塊,以降低成本并縮短設(shè)計(jì)時(shí)間。該項(xiàng)目負(fù)責(zé)人Siamak Tavallaei已經(jīng)公布了這一概念的高級(jí)描述內(nèi)容,并且已經(jīng)有十幾家企業(yè)有興趣在今年夏天設(shè)計(jì)出原型。
這種方法讓處理器和內(nèi)存變成了一個(gè)模塊,可以在定義好芯片后立即開(kāi)始設(shè)計(jì)。各種CPU模塊都可以采用一種安全控制器模塊,這種模塊運(yùn)行固件、監(jiān)控溫度、控制風(fēng)扇和其他基本事務(wù)。
采用基于PCIe Gen 4的I/O線纜,可以有助于減少電路板空間并縮短處理器與I/O之間的距離。距離縮短可以節(jié)省高達(dá)60%的PCB材料,并在機(jī)箱中騰出更多空間,用于容納更多端口、PCIe插槽、甚至是GPU等加速器。
各種服務(wù)器機(jī)架創(chuàng)新液冷方案亮相大會(huì)
隨著處理器和加速器變得體積更大,散熱更多,各種替代性的冷卻系統(tǒng)也開(kāi)始風(fēng)靡。在今年的大會(huì)上,參會(huì)者看到了各種各樣的熱管、泵和更奇特的冷卻技術(shù)。
臺(tái)灣的WiWynn公司展示了一種兩相(液體到蒸汽)浸沒(méi)系統(tǒng),可以冷卻48-V Facebook Diablo Pass服務(wù)器的100個(gè)節(jié)點(diǎn)。
除了一些網(wǎng)絡(luò)巨頭正在自主研發(fā)的解決方案之外,市場(chǎng)中現(xiàn)有多達(dá)十幾種液冷產(chǎn)品,甚至是浸入式系統(tǒng),現(xiàn)在也有多達(dá)八個(gè)競(jìng)爭(zhēng)公司展示了他們的單相或者雙相系統(tǒng)。
浸入式系統(tǒng)廠商Submer表示,他們目前在測(cè)試4兆瓦的系統(tǒng),預(yù)計(jì)將在幾天內(nèi)公布10兆瓦的首個(gè)部署案例。
在LinkedIn的展位上,Zutacore展示了多個(gè)解決方案,從用于1U服務(wù)器的管道,到用于機(jī)架和熱交換裝置(看起來(lái)就像是有著金屬外殼的汽車(chē)散熱器)的液冷系統(tǒng)。
Emerald Pool:一臺(tái)服務(wù)器可容納8個(gè)加速器
Facebook的Emerald Pool是一種針對(duì)可容納8個(gè)加速器的機(jī)械和電氣參考服務(wù)器設(shè)計(jì),目前采用的是PCIe Gen 3總線。Facebook正在醞釀明年推出大量的加速器。
例如,F(xiàn)acebook正在與Broadcom和Verisilicon合作開(kāi)發(fā)一款用于視頻轉(zhuǎn)碼器的ASIC,它可以處理各種任務(wù),包括處理來(lái)自手機(jī)的不穩(wěn)定上傳,到Facebook Watch的下一個(gè)系列。Facebook技術(shù)戰(zhàn)略總監(jiān)Vijay Rao表示,它兼容H.264、VP9和AV1等多種編碼器。芯片方面需要在10W的60幀/秒的速度下處理兩個(gè)4K流,并且并行編碼多個(gè)流,此外還需要支持ffmpeg和VAPI標(biāo)準(zhǔn)。
對(duì)于AI推理任務(wù)來(lái)說(shuō),F(xiàn)acebook希望芯片能夠達(dá)到至少5 TOPS/W的性能。目前Facebook正在與Esperanto、Habana、Intel、Marvell和Qualcomm圍繞用于推理任務(wù)的開(kāi)源Glow編譯器展開(kāi)合作。
Arm仍在試圖切入數(shù)據(jù)中心服務(wù)器市場(chǎng)
微軟正在將AMD Naples服務(wù)器添加到自己的數(shù)據(jù)中心x86陣容中,但到目前為止,微軟還無(wú)法將Arm服務(wù)器投入生產(chǎn)環(huán)境。如何讓復(fù)雜云軟件堆棧中的依存關(guān)系變得易管理,Vaid希望可以在一年時(shí)間內(nèi)解決這個(gè)問(wèn)題。
Marvell的ThunderX2是高通取消Centriq之后唯一的候選芯片。但是,微軟有望在新的Ampere芯片上市之后對(duì)其進(jìn)行測(cè)試。
華為展示了自己1月份推出的雙路Arm服務(wù)器,現(xiàn)在華為提供了每個(gè)插槽有64個(gè)定制Arm核心的樣品。
微軟致力于簡(jiǎn)化SSD控制器
在存儲(chǔ)方面,F(xiàn)acebook和微軟正在測(cè)試英特爾Optane存儲(chǔ),但是并沒(méi)有披露測(cè)試結(jié)果。微軟展示了一款功耗為400W的256TB 1U閃存陣列,計(jì)劃在下個(gè)月投入生產(chǎn)時(shí)采用32個(gè)英特爾代號(hào)Ruler的16TB 3D NAND卡。
Vaid展示了一個(gè)Project Denali主板,它將大多數(shù)固件作業(yè)推送到服務(wù)器,將SSD控制器縮小到僅管理NAND介質(zhì)的簡(jiǎn)單芯片,從而節(jié)省資金并簡(jiǎn)化管理。
Facebook的12.8T交換機(jī)采用Broadcom芯片
在網(wǎng)絡(luò)方面,Mediatek的Nephos部門(mén)公布了自己的6.4Tbits/s交換芯片所贏得的10個(gè)設(shè)計(jì)獎(jiǎng)項(xiàng),其中一些設(shè)計(jì)已經(jīng)在位于中國(guó)和美國(guó)的數(shù)據(jù)中心運(yùn)行。Nephos已經(jīng)生產(chǎn)出了一款12.8Tbits/s多芯片器件,采用TSMC的7納米工藝及InFO封裝。
Innovium公司表示,他們正在生產(chǎn)自己的12.8T芯片,今年該芯片設(shè)計(jì)被思科兩款交換機(jī)采用。Broadcom公司也在發(fā)售自己的12.8T Tomhawk-3,但還沒(méi)有采用7納米芯片。與此同時(shí),諾基亞也在參與一個(gè)面向用于電信邊緣網(wǎng)絡(luò)的標(biāo)準(zhǔn)機(jī)箱OCP項(xiàng)目,目前主板和機(jī)械設(shè)計(jì)已經(jīng)開(kāi)源貢獻(xiàn)給Open Edge。
Facebook則展示了最新的交換機(jī)設(shè)計(jì)——Minipack,該涉及采用了Broadcom的Tomahawk-3芯片和設(shè)備,為25G光纖端口提供服務(wù)。此外,F(xiàn)acebook還公布了一個(gè)新的數(shù)據(jù)中心拓?fù)浣Y(jié)構(gòu),將四層折疊改為三層堆疊,以節(jié)省成本并減少跳數(shù),提升數(shù)據(jù)中心的運(yùn)行效率。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼
