
Gaudi2中國市場發(fā)布,英特爾與伙伴要抄GPU的后路

大模型驅(qū)動的AIGC對于算力需求是巨大的,這直接帶動了AI基礎(chǔ)設(shè)施的發(fā)展,而AI服務(wù)器更是成為搶手貨。這次Gaudi2在國內(nèi)發(fā)布,并由浪潮信息進(jìn)行相關(guān)服務(wù)器的銷售,無疑為當(dāng)前火爆的AI服務(wù)器市場帶來新的變化。
新聞事件
2023年7月11日,英特爾正式于中國市場推出第二代Gaudi深度學(xué)習(xí)加速器——Habana Gaudi2。 同時,英特爾正與浪潮信息合作,打造并發(fā)售基于Gaudi2深度學(xué)習(xí)加速器的浪潮信息AI服務(wù)器NF5698G7。
新聞分析
在筆者看來,這一新聞看點著實多,我們不妨從中挑選出幾個看點,與大家分享。
01 新選擇,AI服務(wù)器的新變量
眾所周知,現(xiàn)在AIGC如此火爆,直接帶動了算力需求的激增,進(jìn)而推動了AI服務(wù)器的發(fā)展。
根據(jù)IDC統(tǒng)計,2022年預(yù)計全球生成式人工智能對AI服務(wù)器的新增需求規(guī)模為8.2億美元,預(yù)計到2026年其新增需求規(guī)模將達(dá)到109.9億美元,2022年至2026年的年復(fù)合增速高達(dá)91.34%。
AI服務(wù)器通常擁有一個或多個協(xié)處理器,比如GPU、FPGA或ASIC協(xié)處理器,而CPU與GPU的組合是最為主流的組合,例如英特爾或者AMD的處理器加上英偉達(dá)的GPU。
現(xiàn)在隨著Gaudi2的推出,AI服務(wù)器迎來新的組合模式。Gaudi2深度學(xué)習(xí)加速器暨Gaudi2夾層卡HL-225B,以第一代Gaudi高性能架構(gòu)為基礎(chǔ),以多方位性能與能效比提升,加速高性能大語言模型運行。該加速器具備:
- 24個可編程Tensor處理器核心(TPCs)
- 21個100 Gbps(RoCEv2)以太網(wǎng)接口
- 96GB HBM2E內(nèi)存容量
- 2.4TB/秒的總內(nèi)存帶寬
- 48MB片上SRAM
- 集成多媒體處理引擎
Gaudi2加速器的出色性能在6月公布的MLCommons MLPerf基準(zhǔn)測試中得到了充分認(rèn)證,其在GPT-3模型、計算機(jī)視覺模型ResNet-50(使用8個加速器)、Unet3D(使用8個加速器),以及自然語言處理模型BERT(使用8個和64個加速器)上均取得了優(yōu)異的訓(xùn)練結(jié)果。與市場上其他面向大規(guī)模生成式AI和大語言模型的產(chǎn)品相比,Gaudi2擁有卓越的性能與領(lǐng)先的性價比優(yōu)勢,能夠幫助用戶提升運營效率的同時,降低運營成本。
此外,Gaudi2可為大規(guī)模的多模態(tài)和語言模型提供出色的推理性能。在最近的Hugging Face評估中,其在大規(guī)模推理方面的表現(xiàn),包括在運行Stable Diffusion(另一個用于從文本生成圖像的最先進(jìn)生成式AI模型之一)、70億以及1760億參數(shù)BLOOMz模型時,在行業(yè)內(nèi)保持領(lǐng)先。
在Stable Diffusion訓(xùn)練上,Gaudi2展示了從1張卡至64張卡近線性99%的擴(kuò)展性。此外,MLCommons剛剛公布的MLPerf訓(xùn)練3.0結(jié)果,亦驗證了Gaudi2處理器在1750億參數(shù)的GPT-3模型上,從256個加速器到384個加速器可實現(xiàn)令人印象深刻的接近線性的95%擴(kuò)展效果。
英偉達(dá)的GPU現(xiàn)在不光卡的價格暴漲,關(guān)鍵是一卡難求。從Gaudi2的表現(xiàn)看,我們有理由相信Gaudi2會成為AI服務(wù)器的新選擇,而GPU不再是唯一首選。
而具體到中國市場,由于不管是NVIDIA還是AMD都是為中國客戶提供“特供”版本的芯片,所以不縮水的Gaudi2有望成為中國企業(yè)的新選擇,這無疑為市場增加了新的變數(shù)。
02 堅冰松動,中美的算力博弈
眾所周知,中美之間在半導(dǎo)體領(lǐng)域展開博弈。NVIDIA與AMD的芯片在中國出貨受限,但是這次Gaudi2卻可以在國內(nèi)發(fā)布上市。而且浪潮集團(tuán)被美國列入實體名單,而出乎意外的是浪潮信息居然可以發(fā)布基于Gaudi2的服務(wù)器產(chǎn)品。
這些說明了什么?我們只能說這背后英特爾是做足了工作的,我覺得話只能說到這里。我這樣的猜想與英特爾的相關(guān)人員溝通后也得到了確認(rèn)。
Gaudi2作為AI加速器在中國銷售是符合監(jiān)管規(guī)定,特別是美國。除了商業(yè)考慮,這次Gaudi2能夠在中國市場發(fā)布,應(yīng)該是得到了高層的默認(rèn),這是不是預(yù)示著中美在科技領(lǐng)域的堅冰有松動的跡象了?這不好說。但是至少說,Gaudi2在中國上市是利好消息。
03 敏感時刻為什么選擇浪潮信息?
英特爾選擇浪潮信息首發(fā)相關(guān)的服務(wù)器產(chǎn)品,也肯定是經(jīng)過深思熟慮的,就像前面說的,浪潮信息的母公司浪潮集團(tuán)處于敏感時刻,而英特爾在AI服務(wù)器方面還是一如既往選擇浪潮信息,肯定是看到了浪潮信息的過人之處。
這里要重點說的是浪潮信息,據(jù)IDC數(shù)據(jù)報告顯示,浪潮信息在中國AI服務(wù)器市場份額連續(xù)六年保持第一。
我想這也是英特爾選擇與浪潮信息推出Gaudi2服務(wù)器產(chǎn)品的重要選擇,要知道浪潮信息在服務(wù)器市場的產(chǎn)品工程能力和市場拓展能力那是業(yè)界有目共睹的。浪潮信息在服務(wù)器市場的表現(xiàn)那可是可圈可點,所以Gaudi2選擇浪潮的這樣合作伙伴進(jìn)行國內(nèi)市場的拓展,還是非常值得期待的。
比如浪潮信息這次推出的NF5698G7服務(wù)器在6U空間支持8顆基于開放加速模組OAM高速互聯(lián)的Gaudi2 AI加速器,每顆Gaudi2芯片配置96GB HBM高速內(nèi)存,共提供2.1Tbps的P2P互聯(lián)帶寬,支持全互聯(lián)拓?fù),滿足大模型訓(xùn)練張量并行的通信需求;搭載2顆第四代至強處理器,支持AMX/DSA等AI加速引擎。
NF5698G7基于全球開放計算OCP開放加速器規(guī)范OAM/UBB進(jìn)行產(chǎn)品設(shè)計,支持PyTorch、TensorFlow等主流AI框架和Megatron/DeepSpeed等流行開發(fā)工具,為生成式AI提供成熟、高性價比的開放生態(tài)產(chǎn)品方案。
除了Gaudi2,浪潮信息與眾多芯片廠商有廣泛的合作,比如英特爾、AMD、Arm、Ampere、NVIDIA、國內(nèi)的AI創(chuàng)新公司等。這其實也是浪潮信息在AI服務(wù)器方面的能力體現(xiàn)。
04 依靠伙伴,英特爾打個AI翻身仗
Gaudi2是英特爾布局AI的重要棋子;蛟S借助Gaudi2,英特爾可以在AI領(lǐng)域打個翻身仗。至于這樣的論斷是否成立,這要看Gaudi2后面的市場表現(xiàn)。
在AI市場,英特爾并沒有占據(jù)太大的優(yōu)勢。雖然英特爾一直在為至強處理器打“AI補丁”,但是相比GPU的強勢地位,效果并不明顯。比如第四代英特爾至強可擴(kuò)展處理器繼承了英特爾AMX加速引擎,可以更好地運行AI工作負(fù)載。
創(chuàng)新的硬件必不可少,軟件的生態(tài)建設(shè)同樣重要。就像NVIDIA在AI市場,除了GPU,CUDA是其構(gòu)建護(hù)城河的重要因素。
對于英特爾也是如此,英特爾構(gòu)建了從云到端產(chǎn)品組合,同時提供Geti商用軟件平臺和OpenVINO開源深度學(xué)習(xí)平臺等。
此外,英特爾的一大優(yōu)勢是開放生態(tài),秉持賦能全棧軟件的開放生態(tài)戰(zhàn)略,幾十年來持續(xù)投入從硬件到軟件各個層面的開源開放,建立了充滿活力的生態(tài)系統(tǒng),其傳承自x86架構(gòu)的龐大合作伙伴體系可以為英特爾帶來巨大的能力。英特爾在Gaudi2推出后,新華三、超聚變等英特爾的鐵桿伙伴也講推出相應(yīng)的服務(wù)器產(chǎn)品。
在NVIDIA和AMD芯片無法供應(yīng)中國市場的情況下,英特爾聯(lián)合合作伙伴推動Gaudi2 AI加速器的AI服務(wù)器,無疑是具有想象空間的。
結(jié)論
大模型驅(qū)動的AIGC對于算力需求是巨大的,這直接帶動了AI基礎(chǔ)設(shè)施的發(fā)展,而AI服務(wù)器更是成為搶手貨。這次Gaudi2在國內(nèi)發(fā)布,并由浪潮信息進(jìn)行相關(guān)服務(wù)器的銷售,無疑為當(dāng)前火爆的AI服務(wù)器市場帶來新的變化。
如今是一個多元化的時代,不光AI芯片,還有大模型乃至AI框架,呈現(xiàn)出百花齊放的態(tài)勢。Gaudi2在中國市場如果表現(xiàn)出色,無疑會給整個市場帶來變革,這是中國市場對于AI算力的強大需求所決定的。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
