這次”料“更多 NVIDIA黃仁勛的GTC 2021”廚房“發(fā)布會(huì)再度上演
如果大家有印象的話,去年NVIDIA GTC大會(huì),NVIDIA首席執(zhí)行官黃仁勛在自家廚房進(jìn)行大會(huì)演講應(yīng)該是無出其右了。轉(zhuǎn)眼今年的GTC大會(huì)再次來臨,黃仁勛的”廚房“發(fā)布會(huì)再度上演。雖然場景沒有變,但是發(fā)布的內(nèi)容確實(shí)”料“更多,涉及了AI、汽車、機(jī)器人、5G、實(shí)時(shí)圖形、協(xié)作和數(shù)據(jù)中心等。
黃仁勛說,NVIDIA會(huì)一如既往在CPU、DPU和GPU方面大力投入,并使其能夠用于研究人員和企業(yè)的全新數(shù)據(jù)中心級(jí)計(jì)算解決方案。硬件只是NVIDIA的一方面,作為一家軟件公司,NVIDIA提供一系列基于NVIDIA AI,以及用于仿真、協(xié)作和自主機(jī)器訓(xùn)練的軟件。
組合拳——CPU、DPU和GPU
我們知道GPU是NVIDIA的”主業(yè)“,但是憑借一系列的收購,NVIDIA也在向其他XPU拓展,在本次大會(huì)上,NVIDIA推出了CPU、DPU和GPU的”組合拳“,幫助用戶打造完全可編程的單一AI計(jì)算單元。
CPU與GPU一直是好朋友,NVIDIA GPU作為加速計(jì)算組件,其實(shí)扮演了與CPU一起工作的角色。如今NVIDIA也推出了自己的首款數(shù)據(jù)中心CPU——Grace,Grace是一款高度專用型處理器,主要面向大型數(shù)據(jù)密集型HPC和AI應(yīng)用。
Grace是高度專業(yè)化的處理器,工作負(fù)載面向例如訓(xùn)練具有超過1萬億個(gè)參數(shù)的新一代NLP模型等。當(dāng)與NVIDIA GPU緊密耦合時(shí),搭載Grace CPU的系統(tǒng)速度比如今基于NVIDIA DGX 打造的最先進(jìn)的系統(tǒng)(在x86 CPU上運(yùn)行)快10倍。從這樣的成績可以看出,NVIDIA推出自有CPU芯片意在更好地實(shí)現(xiàn)與GPU的協(xié)同處理,讓性能表現(xiàn)更優(yōu)秀。
Grace基于第四代 NVIDIA NVLink互聯(lián)技術(shù),支持LPDDR5x內(nèi)存子系統(tǒng),并可以得到NVIDIA HPC軟件開發(fā)套件以及全套CUDA和CUDA-X庫的支持。據(jù)悉,瑞士國家超級(jí)計(jì)算中心將構(gòu)建一臺(tái)名為Alps的超級(jí)計(jì)算機(jī)。這臺(tái)計(jì)算機(jī)將使用Grace和NVIDIA下一代GPU。美國能源部下屬的洛斯阿拉莫斯國家實(shí)驗(yàn)室也將在2023年推出一臺(tái)基于Grace的超級(jí)計(jì)算機(jī)。
除了自研的CPU,憑借收購而來的Arm,也讓NVIDIA在CPU方面有了更多的話語權(quán)。在云計(jì)算、企業(yè)和邊緣數(shù)據(jù)中心、超級(jí)計(jì)算、PC等其他市場中,Arm也開始嶄露頭角。黃仁勛也宣布與多家重要的Arm合作伙伴展開合作,包括云計(jì)算領(lǐng)域的AWS、科學(xué)和云計(jì)算領(lǐng)域的Ampere Computing、超融合邊緣服務(wù)器領(lǐng)域的Marvel、以及將打造Chrome OS和Linux PC SDK與參考系統(tǒng)的聯(lián)發(fā)科。
DPU(Data Processing Unit,數(shù)據(jù)處理單元)是NVIDIA在收購Mellanox推出的創(chuàng)新產(chǎn)品,其可實(shí)現(xiàn)具有突破性的網(wǎng)絡(luò)、存儲(chǔ)和安全性能。作為業(yè)內(nèi)首款400G以太網(wǎng)和NDR InfiniBand DPU,BlueField-3具有出色的網(wǎng)絡(luò)性能。相比上一代產(chǎn)品,它具有10倍加速計(jì)算能力、16個(gè)Arm A78 CPU核,和4倍的加密速度。BlueField-3也是首款支持第五代PCIe總線并提供數(shù)據(jù)中心時(shí)間同步加速的DPU。
此外,BlueField-3利用NVIDIA DOCA(集數(shù)據(jù)中心于芯片的架構(gòu))軟件開發(fā)包的優(yōu)勢(shì),為開發(fā)者提供一個(gè)完整、開放的軟件平臺(tái),開發(fā)在BlueField DPU上開發(fā)軟件定義和硬件加速的網(wǎng)絡(luò)、存儲(chǔ)、安全和管理等應(yīng)用。目前服務(wù)器制造商戴爾、浪潮、聯(lián)想和超微正在將BlueField DPU集成到他們的系統(tǒng)中,云服務(wù)供應(yīng)商也在使用BlueField DPU來加速他們的業(yè)務(wù),如百度、京東和UCloud。
黃仁勛還提到了NVIDIA的AI-on-5G計(jì)算平臺(tái),該平臺(tái)充分利用 NVIDIA Aerial軟件開發(fā)套件與NVIDIA BlueField-2 A100——一種包含NVIDIA “5T for 5G”解決方案的、集成GPU和DPU的融合型卡,創(chuàng)建高性能5G RAN和AI應(yīng)用。富士通、Google Cloud、Mavenir、Radisys和Wind River等合作伙伴都在開發(fā)適用于NVIDIA AI-on-5G平臺(tái)的解決方案。
不管是CPU還是DPU、GPU,很明顯,NVIDIA正在將自己業(yè)務(wù)邊界不斷延展,也就是不再局限于以GPU為中心,而是以計(jì)算為核心,覆蓋多樣化的計(jì)算工作負(fù)載。隨之而來的就是客戶選擇的靈活性,同時(shí)整個(gè)計(jì)算芯片市場也將迎來新的格局。
NVIDIA是軟件平臺(tái)公司
除了更富的硬件產(chǎn)品,NVIDIA在軟件方面的布局也業(yè)界有目共睹的,比如CUDA。所以,我們通常會(huì)在GTC大會(huì)上看到一系列的軟件更新。
在本屆大會(huì)上,NVIDIA發(fā)布了用于訓(xùn)練Transformers的框架—— NVIDIA Megatron。Transformers在自然語言處理領(lǐng)域具有至關(guān)重要的位置,其在生成文檔摘要、將電子郵件中的短語補(bǔ)充完整、對(duì)測驗(yàn)進(jìn)行評(píng)分、生成體育賽事現(xiàn)場評(píng)論、甚至生成代碼等領(lǐng)域有著廣泛的應(yīng)用。
此外,NVIDIA還發(fā)布了用于計(jì)算藥物研發(fā)加速庫Clara Discovery的一些新模型,以及與Schrodinger的合作;用于對(duì)話式AI的NVIDIA Jarvis已經(jīng)可用,其能夠?qū)崿F(xiàn)語音識(shí)別、語言理解、翻譯和表達(dá)性語音;加快推薦系統(tǒng)的NVIDIA Merlin現(xiàn)可通過NGC(NVIDIA的深度學(xué)習(xí)框架容器目錄)獲取。
為幫助客戶將自身專業(yè)知識(shí)應(yīng)用于AI領(lǐng)域,黃仁勛發(fā)布了NVIDIA TAO,其可以運(yùn)用客戶和合作伙伴的數(shù)據(jù),對(duì)NVIDIA預(yù)訓(xùn)練模型進(jìn)行微調(diào)和適配,同時(shí)保護(hù)數(shù)據(jù)隱私。
量子計(jì)算也是當(dāng)下的熱點(diǎn),NVIDIA cuQuantum能夠?yàn)榱孔与娐纺M器提供加速,以助力研究人員設(shè)計(jì)出更完善的量子計(jì)算機(jī)。
為了保障現(xiàn)代化數(shù)據(jù)中心的安全,黃仁勛發(fā)布了NVIDIA Morpheus數(shù)據(jù)中心安全平臺(tái),其基于NVIDIA AI、NVIDIA BlueField、Net-Q網(wǎng)絡(luò)遙測軟件和EGX而構(gòu)建,能夠?qū)ν暾臄?shù)據(jù)包進(jìn)行實(shí)時(shí)檢測。
開箱即用的產(chǎn)品
有了硬件又有了軟件,NVIDIA為用戶打造更加開箱即用的解決方案,其中包括專為工作組打造的“便攜式AI數(shù)據(jù)中心”——NVIDIA DGX Station,以及NVIDIA專為密集型AI研發(fā)打造的AI數(shù)據(jù)中心產(chǎn)品——NVIDIA DGX SuperPod。
全新DGX Station 320G借助320GB超快速HBM2e連接至4個(gè)NVIDIA A100 GPU,內(nèi)存帶寬達(dá)到每秒8TB。然而,僅需將其插入普通的壁裝電源插座即可使用,耗電量只有1500瓦。此外,NVIDIA還發(fā)布了一種適用于NVIDIA DGX Station A100的訂閱服務(wù)。DGX Station A100是世界上唯一支持 NVIDIA多實(shí)例GPU技術(shù)的適用于辦公室場景的工作組服務(wù)器設(shè)備。
DGX SuperPOD是配備20套或以上NVIDIA DGX A100系統(tǒng)和NVIDIA InfiniBand HDR網(wǎng)絡(luò)的AI超級(jí)計(jì)算機(jī)。DGX SuperPOD使用全新80GB NVIDIA A100,將其HBM2e內(nèi)存提升至90TB。目前它已經(jīng)升級(jí)至采用NVIDIA BlueField-2,且NVIDIA如今還為該產(chǎn)品提供配套的NVIDIA Base Command DGX管理和編排工具。
為進(jìn)一步實(shí)現(xiàn)AI民主化,黃仁勛發(fā)布了來自頂尖制造商的新系列NVIDIA認(rèn)證系統(tǒng),即大容量企業(yè)級(jí)服務(wù)器。它們現(xiàn)在已通過認(rèn)證,可運(yùn)行NVIDIA AI Enterprise軟件套件,該套件得到了全球應(yīng)用最廣泛的計(jì)算虛擬化平臺(tái)——VMware vSphere 7的獨(dú)家認(rèn)證。
NVIDIA于今日發(fā)布多款新系統(tǒng),以擴(kuò)大NVIDIA認(rèn)證服務(wù)器生態(tài)系統(tǒng)。這些新系統(tǒng)配備用于主流AI和數(shù)據(jù)分析的NVIDIA A30 GPU,以及用于AI圖形、虛擬工作站以及混合計(jì)算和圖形工作負(fù)載的NVIDIA A10 GPU。
最后,NVIDIA推出推理服務(wù)器NVIDIA Triton,它可以從進(jìn)入客戶EGX服務(wù)器或云實(shí)例的連續(xù)數(shù)據(jù)流中獲取洞察。這包括任何在cuDNN上運(yùn)行的AI模型,也就是幾乎所有的AI ,包括來自TensorFlow、Pytorch、ONNX、OpenVINO、TensorRT等的任何框架。
其他——仿真協(xié)作與自動(dòng)駕駛
在大會(huì)上,NVIDIA還公布了其他產(chǎn)品更新,比如NVIDIA Omniverse,其旨在創(chuàng)建共享虛擬3D世界,特點(diǎn)包括:可以擴(kuò)展至多個(gè)GPU、具有高物理精度、能夠充分運(yùn)用RTX實(shí)時(shí)路徑追蹤和DLSS、可以使用NVIDIA MDL模擬材料、可以使用NVIDIA PhysX模擬物理學(xué)并且與NVIDIA AI完全集成。
3D制作團(tuán)隊(duì)通常規(guī)模龐大、應(yīng)用技術(shù)繁多且所在地點(diǎn)分散,NVIDIA Omniverse Enterprise使其能夠在復(fù)雜的項(xiàng)目中開展無縫協(xié)作。設(shè)計(jì)師、藝術(shù)家和審核人員可以在任何地點(diǎn)、任何設(shè)備上進(jìn)行線上實(shí)時(shí)協(xié)作,而不需要召開面對(duì)面會(huì)議或就大量文件進(jìn)行交流和迭代。
Omniverse Enterprise是一個(gè)全新的平臺(tái),它包含NVIDIA Omniverse Nucleus服務(wù)器(管理客戶端之間的共享數(shù)據(jù)庫)和NVIDIA Omniverse Connectors(業(yè)內(nèi)領(lǐng)先的設(shè)計(jì)應(yīng)用程序插件)。
它還包含兩個(gè)終端用戶應(yīng)用:NVIDIA Omniverse Create,可加速場景構(gòu)成,用戶可通過實(shí)時(shí)互動(dòng)來裝配、點(diǎn)亮、模擬和渲染場景;NVIDIA Omniverse View,支持無縫設(shè)計(jì)協(xié)作,并能通過逼真的渲染技術(shù)實(shí)現(xiàn)建筑和工程項(xiàng)目的可視化。該平臺(tái)還包含NVIDIA RTX Virtual Workstation(vWS)軟件,它能讓協(xié)作者在任何地方自由地運(yùn)行各類圖形密集型3D應(yīng)用。
Omniverse Enterprise經(jīng)測試和優(yōu)化后,適合專業(yè)人員在NVIDIA RTX筆記本電腦及臺(tái)式電腦上運(yùn)行,或在NVIDIA EGX平臺(tái)上的NVIDIA認(rèn)證系統(tǒng)上運(yùn)行。因此,從使用本地臺(tái)式電腦、筆記本電腦的小型工作組,到使用各種設(shè)備訪問數(shù)據(jù)中心的全球分布式團(tuán)隊(duì),任何規(guī)模的組織都可以部署該工具。
自動(dòng)駕駛汽車領(lǐng)域是“機(jī)器學(xué)習(xí)和機(jī)器人技術(shù)所面對(duì)的最嚴(yán)峻的挑戰(zhàn)之一,NVIDIA構(gòu)建模塊化的端到端解決方案,其自動(dòng)駕駛汽車計(jì)算系統(tǒng)級(jí)芯片——NVIDIA DRIVE Orin將于2022年投產(chǎn)。與此同時(shí),NVIDIA新一代車載系統(tǒng)級(jí)芯片NVIDIA DRIVE Atlan正式發(fā)布,其集NVIDIA在AI、汽車、機(jī)器人、安全和BlueField安全數(shù)據(jù)中心領(lǐng)域的所有技術(shù)之大成,為汽車帶來真正的數(shù)據(jù)中心。Atlan可以達(dá)到每秒超過1000萬億次(TOPS)運(yùn)算次數(shù),致力于應(yīng)用到2025年的車型。
NVIDIA第八代Hyperion汽車平臺(tái)也同期發(fā)布,包括參考傳感器、自動(dòng)駕駛汽車和中央計(jì)算機(jī)、3D地面真實(shí)數(shù)據(jù)記錄儀、網(wǎng)絡(luò)以及所有必要的軟件。在軟件方面,正如Omniverse能夠構(gòu)建汽車生產(chǎn)工廠的數(shù)字孿生一樣,DRIVE Sim也可用于創(chuàng)建自動(dòng)駕駛汽車的數(shù)字孿生,并將其用于自動(dòng)駕駛汽車的開發(fā)。
總結(jié)劃重點(diǎn)
”廚房“發(fā)布會(huì)全程看下來,應(yīng)該說看點(diǎn)頗多。但是總結(jié)一下,無外乎以下幾點(diǎn):
如今是一家能夠提供GPU、CPU和DPU三種芯片的公司。
NVIDIA是一家軟件平臺(tái)公司。
NVIDIA是一家AI公司,提供Megatron、Jarvis、Merlin、Maxine、Isaac、Metropolis、Clara和DRIVE、以及各種可使用TAO進(jìn)行定制化的預(yù)訓(xùn)練模型。
NVIDIA正在通過用于研究的DGX、用于云的HGX、用于企業(yè)級(jí)和5G邊緣的EGX以及用于機(jī)器人技術(shù)的AGX來擴(kuò)展AI。
總之,NVIDIA正在變得越來越”重“,基于已有產(chǎn)品,其業(yè)務(wù)領(lǐng)域不斷擴(kuò)展。我們對(duì)于NVIDIA的定位和認(rèn)知也正在刷新。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼