
從黃仁勛CES全程高能演講,看英偉達龐大AI棋局:物理AI、AI PC、通用機器人

黃仁勛在會后接受包括至頂科技在內(nèi)的媒體采訪時所說:“英偉達只做兩類事情:要么是別人沒在做的,要么是我們能做得獨特且更好的。”
NVIDIA創(chuàng)始人黃仁勛在CES 2025的全程高能演講,淺看是一場新品發(fā)布會,實則是英偉達下了一步巨大的棋,這步棋關(guān)乎從云端到終端、從數(shù)據(jù)中心到普通用戶、從虛擬世界到物理世界的“全方位”AI發(fā)展路線,不過這個“全”帶了引號,因為英偉達試圖在每一個方向都去突破既有玩法的極限。
就像黃仁勛在會后接受包括至頂科技在內(nèi)的媒體采訪時所說:“英偉達只做兩類事情:要么是別人沒在做的,要么是我們能做得獨特且更好的。”
所以從這個角度,再回看那場發(fā)布會,似乎是另外的基調(diào),所以這篇文章特此梳理黃仁勛這次演講背后的8個核心要點。
圖:出現(xiàn)在CES 2025舞臺上的黃仁勛,這次穿了件閃亮亮的皮衣,他開玩笑地對觀眾說道:“畢竟我在拉斯維加斯”。
要點一:“AI改變了游戲規(guī)則,更改變了計算的本質(zhì)”,所以用BlackWell重新定義AI計算的邊界。
黃仁勛開篇回顧了英偉達的發(fā)展歷程。
從1993年NV1開始,英偉達就立志,構(gòu)建能完成普通計算機無法完成任務的計算機,當時英偉達的編程架構(gòu)被稱為UDA(Unified Device Architecture,統(tǒng)一設備架構(gòu)),跑在UDA的第一個應用程序,是世嘉的《虛擬戰(zhàn)士》。
六年后的1999年,NVIDIA發(fā)明了可編程GPU;又過了六年后的2006年,英偉達發(fā)明了通用并行計算架構(gòu)CUDA(Compute Unified Device Architecture);再過了六年后的2012年,隨著“師生三人組”Alex Krzyzewski、Ilya Suskevor和Jeffery Hinton利用GPU訓練AlexNet,并贏得2012年ImageNet挑戰(zhàn)賽,震驚了計算機視覺界,AI由此進入新階段。(這幾個6年歷程,老鐵見了都得直呼666)
黃仁勛認為,AI發(fā)展有四個階段:
1、感知AI(Perception AI),理解圖像、文字和聲音,場景包括語音識別、推薦系統(tǒng)、醫(yī)學成像;
2、生成式AI(Generative AI),生成圖像、文本和聲音,場景包括數(shù)字營銷、內(nèi)容生成;
3、現(xiàn)階段的Agenic AI,能夠感知、推理、規(guī)劃和行動,場景包括代碼助理、客戶服務、患者護理;
4、未來的物理AI(Physical AI),場景包括自動駕駛汽車、通用機器人。
2018年是一個關(guān)鍵的節(jié)點,谷歌發(fā)布Transformer模型BERT,徹底改變了AI的格局。這里溫馨插入一段解釋,之所以說Transformer具有變革性,是因為它引入的注意力機制,解決了長序列數(shù)據(jù)處理的難題,且允許并行計算,打破了傳統(tǒng)RNN和LSTM的串行限制,它讓機器第一次真正學會了“看全局”。
如果說以前的AI是只能一個個字往下讀,但會看了后邊忘了前邊的兒童,而Transformer就是一目十行,心有全篇的專家。這個突破不僅讓AI更聰明,處理信息的速度也賊快。而且它厲害的地方是,不光能處理文字,連圖片、聲音這些都能應對。所以說,Transformer就像是AI世界的“基本法”,徹底改變了AI的發(fā)展方向。
黃仁勛現(xiàn)場說:“Transformer驅(qū)動的機器學習將從根本上改變每一個應用程序的構(gòu)建方式、計算方式、以及超越這些的可能性。”
順著這句話,黃仁勛舉了個“AI革新傳統(tǒng)圖形渲染”的例子。傳統(tǒng)光線追蹤,要對每個像素進行復雜計算,計算量巨大,但AI變革了這個過程——英偉達在游戲圖形領域完成了兩次根本性的革新:
第一次革新是引入可編程著色器和光線追蹤技術(shù),這讓顯卡能夠通過定制化的程序來處理像素,并模擬真實世界中的光線行為,從而生成極具真實感的畫面;第二次革新是DLSS(AI超分辨率技術(shù),Deep Learning Super Sampling),它的核心理念是讓AI來輔助甚至部分取代傳統(tǒng)的像素渲染,通過在英偉達超級計算機上進行大規(guī)模訓練,AI系統(tǒng)學會了理解和預測像素的顏色值,使得GPU上的神經(jīng)網(wǎng)絡能夠“腦補”出未經(jīng)實際渲染的像素內(nèi)容。
最新一代DLSS 4的突破,被黃仁勛稱之為“奇跡”,它不僅能在空間維度上補全像素,還能在時間維度上工作——通過預測未來畫面,為每一幀額外生成三幀畫面,就好比有3300萬像素,而實際只需計算200萬像素,并讓AI預測其余的3100萬像素,既保證了渲染質(zhì)量,又提升了渲染效率。在現(xiàn)場演示中,DLSS 4 以每秒247幀的速度渲染場景,比不使用AI快8倍以上,同時將延遲保持在僅34毫秒。
順著上述知識點,黃仁勛發(fā)布了這次的第一款GPU新品——RTX Blackwell系列。
RTX Blackwell 系列擁有920億個晶體管,AI算力最高達4000 TOPS(比上一代高出三倍),美光G7內(nèi)存,帶寬可達每秒 1.8 TB(是上一代性能的2倍)。現(xiàn)有的 RTX GPU 也將支持 DLSS 4。
該系列包括四種型號:
-
RTX 5070——售價549 美元,提供 RTX 4090 的性能。
-
RTX 5070 Ti——售價749 美元,提供與 4090 相當?shù)男阅,配?1406 AI TOPS 和 16GB G7 內(nèi)存。
-
RTX 5080——售價999 美元,配備 1800 AI TOPS 和 16GB G7 內(nèi)存。
-
RTX 5090——售價1999 美元,配備 3404 AI TOPS 和 32GB G7 內(nèi)存。
搭載 RTX Blackwell GPU 的筆記本電腦,電池壽命延長 40%,性能提高一倍,功耗降低一半,價格從1299 美元到 2899 美元不等。其中,搭載RTX 5090、RTX 5080、RTX 5070 Ti的筆電將于3月上市,搭載RTX 5070筆電將于4月由OEM發(fā)售。
要點二:“Scaling Law依然奏效,正推動AI計算需求的指數(shù)級增長”,所以用NVLink滿足全球數(shù)據(jù)中心需求。
接著講到AI發(fā)展,黃仁勛認為Scaling Law(規(guī)模定律)還沒結(jié)束——即數(shù)據(jù)越多、模型越大、計算能力越強、模型就越有效。之所以還沒結(jié)束,是因為互聯(lián)網(wǎng)每年產(chǎn)生的數(shù)據(jù)量都在翻倍,未來幾年人類產(chǎn)生的數(shù)據(jù)量將超過之前的總和,而且這些數(shù)據(jù)正變得多模態(tài)。
黃仁勛認為,規(guī)模定律非但沒結(jié)束,而且還發(fā)展出三種狀態(tài):預訓練規(guī)模定律(Pre-Training Scaling)、后訓練規(guī)模定律(Post-Training Scaling)、測試時間規(guī)模定律(Test-Time Scaling)。
其中:
-
「預訓練規(guī)模定律」利用強化學習和人工反饋等技術(shù),AI借助人類反饋進行學習提升,它可以針對特定領域微調(diào),類似學生根據(jù)老師指導改進作業(yè),適合解決數(shù)學、推理問題。
-
「后訓練規(guī)模定律」則類似于自我練習,AI通過持續(xù)自主練習提升能力,過程中雖耗費大量算力,但能產(chǎn)生突破性模型。
-
「測試時間規(guī)模定律」是指AI運行時,不再僅僅改進參數(shù),而是能動態(tài)掉配計算資源,通過“分步推理”和“深入思考”找出最優(yōu)解決方案。該定律已被證明極其有效。
黃仁勛說,“規(guī)模定律推動了對英偉達的計算,特別是Blackwell芯片的巨大需求。”
圖:Blackwell全系產(chǎn)品圖
話音落下,黃仁勛搬出了一個由72塊Blackwell GPU組成的NVLink72巨型“盾牌”模型,還擺了個pose,被網(wǎng)友調(diào)侃“美國隊長”。
不過黃仁勛手里的“盾牌”,只是NVLink72的縮小模型,真正的NVLink72重達1.5噸,擁有60萬個零件,相當于20輛汽車的復雜程度,系統(tǒng)內(nèi)部有個類似“脊椎”的結(jié)構(gòu),通過2英里的銅線與5000根電纜把所有的Blackwell連接在一起。
黃仁勛介紹了性能參數(shù)。一個NVLink72芯片的AI浮點運算性能是1.4 ExaFLOPS,比世界上最大、最快的超級計算機還要大。其內(nèi)存帶寬達到 1.2 PB/s,相當于全球所有互聯(lián)網(wǎng)流量的總和。這種超級計算能力,使得 AI 能夠處理更復雜的推理任務,同時顯著降低成本,為更高效的計算奠定了基礎。
NVLink72的生產(chǎn)和部署過程十分復雜。它在全球45個工廠進行生產(chǎn),采用液冷技術(shù)散熱,經(jīng)過嚴格測試后會被拆解成小部件,運送到全球的數(shù)據(jù)中心,之后再重新組裝起來——這種特殊的運輸方式是因為整機太重太大。
黃仁勛解釋了“為什么要建造這塊龐然大物”,是因為Scaling Law要求越來越強大的計算能力。新一代Blackwell芯片與上一代相比,每瓦性能提升了4倍,每美元性能提高了3倍。這個提升帶來兩個重要影響:
第一,從成本角度看,訓練同樣規(guī)模的AI模型,成本可以降低到原來的1/3;或者用相同成本,可以訓練規(guī)模大3倍的模型。
第二,從數(shù)據(jù)中心運營角度看,由于數(shù)據(jù)中心受限于供電能力,新芯片的能效提升意味著,在相同供電條件下,數(shù)據(jù)中心可以進行4倍于之前的AI運算,這直接轉(zhuǎn)化為更高的營收能力。
黃仁勛強調(diào),這種提升非常重要,因為未來幾乎所有應用都會使用AI進行文本處理(tokens)。目前大模型的token生成速度為每秒20-30個,與人類閱讀速度相當。但在未來,GPT-o1/o2/o3、Gemini Pro等新模型能夠進行自我對話、思考、反思,因此token的生成速度將大幅提高,而這些處理都需要在數(shù)據(jù)中心進行,他將這些數(shù)據(jù)中心比喻為“AI工廠”,而新一代芯片的能效提升,本質(zhì)上就是在提高這些“AI工廠”的生產(chǎn)效率。
要點三:“Agenic AI是企業(yè)最重要的變革之一”,所以英偉達軟硬兼施。
黃仁勛描繪了一個令人振奮的AI未來圖景——“Agenic AI將成為企業(yè)最重要的變革之一。”這種變革不僅是技術(shù)的進步,更是工作方式的根本轉(zhuǎn)變。
在他的描述中,AI代理不再是簡單的問答系統(tǒng),而是一個復雜的智能網(wǎng)絡,它能夠理解用戶需求,搜索信息、調(diào)用各種工具、并通過多個模型的協(xié)同工作,來幫助用戶解決問題。
為了幫助企業(yè)和合作伙伴實現(xiàn)Agenic AI的未來圖景,英偉達推出了三個重要產(chǎn)品:
-
第一個是NVIDIA NIMS,這是一套打包好的AI微服務,包含CUDA DNN、Cutlass、Tensor RTLM、Triton等CUDA軟件,以及一系列模型(涵蓋語義理解、數(shù)字人、虛擬內(nèi)容生成、數(shù)字生物等領域,并即將上線“物理AI”模型),方便開發(fā)者集成到自身軟件中,可以在大部分云平臺上運行。
-
第二個是NVIDIA NEMO,這是一個“數(shù)字員工”管理系統(tǒng),負責訓練AI智能體適應企業(yè)特定需求、設置行為準則和權(quán)限、并且通過反饋不斷改進,就像是給AI代理做“入職培訓”。
-
第三是一整套AI Blueprints(AI藍圖),以便生態(tài)系統(tǒng)伙伴和開發(fā)者自主構(gòu)建AI智能體,而且它完全開源。黃仁勛介紹了其中的一套模型——Llama Nemotron開源模型套件,這是一個企業(yè)級語言模型的“全家桶”,是英偉達針對Meta的Llama進行微調(diào)而成(黃仁勛解釋說,是因為英偉達發(fā)現(xiàn)Llama 3.1已經(jīng)成為一個現(xiàn)象級產(chǎn)品,它被下載65萬次,衍生出了6萬個不同版本,是大部分企業(yè)研發(fā)AI的開始,而且可以它能被很好地微調(diào))。
英偉達的Llama Nemotron包括三種規(guī)格:
-
Nano:極其小巧、響應快、最具成本效益的模型,針對PC和邊緣設備所需的低時延模型進行了優(yōu)化;
-
Super:在單個GPU上提供卓越吞吐量的高精度模型;
-
Ultra:精度最高的模型,專為要求最高性能的數(shù)據(jù)中心規(guī)模應用而設計。
黃仁勛預測,未來企業(yè)的IT部門將轉(zhuǎn)變成AI智能體的HR部門,它們不再僅僅是維護軟件系統(tǒng),而是要管理一支數(shù)字勞動力隊伍。全球有3000萬程序員和10億知識工作者將受益于這場變革,AI智能體將成為他們的得力助手。
這種AI智能體帶來的變革,正在影響各行各業(yè),黃仁勛在現(xiàn)場通過一支視頻展示了5種AI代理的應用場景:
-
AI研究助手:在研究領域,AI智能體可以快速處理講座、期刊、財報等復雜資料,生成易于理解的內(nèi)容;
-
天氣預報系統(tǒng):在氣象預報中,AI智能體將預報精度從25公里提升到2公里;
-
軟件安全AI:在軟件開發(fā)過程中,AI智能體可以自動掃描代碼漏洞并提出修復建議;
-
虛擬實驗室:在制藥研究中,AI智能體可以幫助研究人員快速篩選藥物候選物,加速新藥研發(fā)過程。
英偉達選擇了一條獨特的市場路徑。他們不直接面向企業(yè)用戶,而是與生態(tài)系統(tǒng)的合作伙伴一起工作,就像當年推廣CUDA一樣。生態(tài)系統(tǒng)中的合作伙伴有CrewAI、Daily、LangChain、LlamaIndex、Weights & Biases的工具,也有ServiceNow、SAP、西門子的工業(yè)平臺,也有甲骨文、dataloop的數(shù)據(jù)平臺等。英偉達正在將AI代理滲透到各個行業(yè)。
這個戰(zhàn)略顯示了英偉達對未來AI的深刻理解:AI代理不僅是一個技術(shù)產(chǎn)品,而是企業(yè)的“數(shù)字員工”,它們需要培訓、管理和持續(xù)改進,就像管理人類員工一樣,這些AI代理可被訓練為領域特定的任務專家。
通過這番演講,黃仁勛展現(xiàn)了一個AI代理與人類協(xié)同工作的未來。在這個未來中,企業(yè)將擁有一支由人類+AI代理組成的勞動力隊伍,該隊伍是推動生產(chǎn)力提升的重要力量,而英偉達正在通過完整的技術(shù)方案和生態(tài)系統(tǒng)建設,來幫助企業(yè)實現(xiàn)這個未來。
要點四:“將Windows PC轉(zhuǎn)變?yōu)锳I超級計算機”,所以英偉達發(fā)布了WSL2。
說完了Agenic AI的愿景之后,如何才能真正落地呢?黃仁勛的答案是——本地算力:
“雖然云端計算對AI 來說是完美的選擇,但AI的未來不應該僅限于云端,而是應該無處不在,特別是要進入我們的個人電腦。就像Windows 95革新了個人計算時代一樣,未來的PC將開創(chuàng)新的計算范式,讓每個用戶都能夠充分利用AI的力量來提升工作效率和創(chuàng)造力。”
從這個角度來看,黃仁勛介紹了未來PC的概念:不再只是簡單地擁有3D、聲音和視頻API,而是要具備各種生成式API的能力(包括3D生成、語言生成、聲音生成等),這意味著每臺電腦都將成為一個強大的AI助手。
英偉達提供了一個解決方案:Windows WSL2(Windows Subsystem for Linux 2),這是一個Window系統(tǒng)內(nèi)的雙操作系統(tǒng),為開發(fā)者提供直接訪問硬件的能力,并且已經(jīng)針對云原生應用和CUDA進行了優(yōu)化,這使得包括NVIDIA NIMS、NVIDIA NEMO在內(nèi)的所有AI工具都能在Windows PC上運行。
通過WSL2,英偉達可以將其所有AI工具和服務帶到個人電腦上,包括各種模型。換句話說,這是一種計算范式的轉(zhuǎn)變——每臺個人電腦都將成為一個強大的AI工作站。
要點五:“我們要創(chuàng)造一個物理世界的AI模型”,所以英偉達發(fā)布Cosmos。
黃仁勛接下來的演講內(nèi)容,我認為是本場最重要也是英偉達接下來最重要的戰(zhàn)略布局,我覺得可以理解為“讓AI化形”。
什么意思?如果說GPT等大語言模型讓AI掌握了“說”的能力,那么英偉達希望創(chuàng)造一個能理解物理世界的AI系統(tǒng),賦予AI“做”的能力,這預示著AI即將從虛擬世界走向現(xiàn)實世界的重要一步。
接下來我們就逐步來講講。
黃仁勛首先說,當我們使用ChatGPT這樣的語言模型時,我們輸入一段提示詞,模型會分析這段文字中的每個詞語(token)之間的關(guān)系,然后一個接一個地生成回答的詞語。這個過程看似簡單,實際上模型內(nèi)部有數(shù)十億個參數(shù)在運作,每個詞語都要和上下文中的其他詞語建立聯(lián)系,計算它們之間的相關(guān)性。
但是,我們生活的現(xiàn)實世界比文本復雜得多,AI需要理解重力、摩擦力、慣性等物理規(guī)律,還要明白空間關(guān)系和因果關(guān)系。比如,當你把球推出去時,它會如何運動;當你推倒一個物體時,會發(fā)生什么;物體從桌子上掉下去后,并不會消失——這些在人類看來很簡單的常識,對AI來說都是巨大的挑戰(zhàn)。
為了達成這個極具挑戰(zhàn)性的“讓AI理解物理世界”目標,于是英偉達正式推出Cosmos——一個強大的、能理解物理世界的、全球基礎模型。
Cosmos是如何工作的?就像嬰兒通過觀察、觸摸、實驗來認識這個物理世界,Cosmos通過看大量視頻來學習物理世界的規(guī)律,就像是一個加速學習的嬰兒。黃仁勛說,Cosmos已經(jīng)學習了2000萬小時的視頻,內(nèi)容包括:自然現(xiàn)象(水會怎么流動)、物理規(guī)律(物體會如何碰撞)、人類動作(人是如何走路和抓取物品的)等。這些都成為它理解物理世界的“經(jīng)驗”。
但是,Cosmos的作用遠不止于此。黃仁勛說,因為有Cosmos,我們可以因此創(chuàng)造一個物理世界的基礎模型,基于Autoregressive Model(自回歸模型)、Diffusion Model(擴散模型)、Video Tokenizer(將視頻內(nèi)容編碼為緊湊的潛在token)、Video Processing and Curation Pipeline(視頻處理管道)。
比如,它可以用來生成訓練數(shù)據(jù),幫助開發(fā)更智能的機器人,被黃仁勛比喻成“機器人的種子”;它能生成多種未來的物理場景,幫助AI做出更好的決策,“就像是一個奇異博士”;它甚至可以為視頻生成準確的描述,這些描述又可以用來訓練語言模型。
最重要的是,英偉達選擇將Cosmos開源,就像Meta開源Llama一樣。黃仁勛表示,希望Cosmos能為機器人和工業(yè)AI領域帶來類似Llama 3.1對企業(yè)AI的革命性影響。
現(xiàn)在關(guān)鍵來了:當Cosmos與英偉達的虛擬現(xiàn)實仿真平臺Omniverse結(jié)合時,這就像是給AI創(chuàng)造了一個“物理世界的實驗場”,讓它能在這里學習、實驗和成長,它就能創(chuàng)造出基于真實物理規(guī)律的虛擬世界。
這里梳理一下黃仁勛的解釋:Omniverse是一個基于物理規(guī)律運行的模擬器,而Cosmos則可以理解為一個物理世界的AI生成系統(tǒng)。當這兩個系統(tǒng)結(jié)合時,這就像是我們在用大語言模型時,通過RAG(檢索增強生成)系統(tǒng)來確保AI生成的內(nèi)容是基于真實信息一樣。在這里,Omniverse的物理模擬確保了Cosmos生成的內(nèi)容符合現(xiàn)實世界的物理規(guī)律。
黃仁勛用了一個很好的類比:就像我們需要讓語言模型的輸出建立在真實信息的基礎上一樣,我們也需要讓機器人的行為建立在真實物理規(guī)律的基礎上,這樣的結(jié)合創(chuàng)造出了一個“基于物理規(guī)律的多元宇宙生成器”。
在實際應用中,這種結(jié)合特別適合機器人和工業(yè)應用場景。正因為如此,黃仁勛提出了一個“三個計算機系統(tǒng)”概念:
-
第一個計算機系統(tǒng)(DGX)是用來訓練AI的。這就像是機器人的“學校”,在這里進行基礎的AI訓練。
-
第二個計算機系統(tǒng)(AGX)是部署在實際場景中的,比如安裝在自動駕駛汽車里、機器人身上或者體育場館中的計算機。這些是在“前線”工作的計算機,負責實際的自主操作。
-
第二個計算機系統(tǒng)正是Omniverse+Cosmos系統(tǒng),它是一個數(shù)字孿生平臺。這就像是機器人的“虛擬訓練場”。在這里,已經(jīng)訓練好的AI可以進行練習、完善,通過合成數(shù)據(jù)生成和強化學習,來提升性能。這個系統(tǒng)將前兩個系統(tǒng)連接起來,使它們能夠協(xié)同工作。
為什么需要Cosmos+Omniverse?因為假設你在教一個孩子學物理,不可能讓孩子去做所有危險的實驗,比如從高處跳下來感受重力,或者去碰滾燙的物體了解溫度。而Omniverse就提供了一個“虛擬實驗場”:比如可以無限嘗試各種動作,而不用擔心損壞真實設備;或者,快速模擬數(shù)千種不同的場景,而不用擔心時間不夠;或者測試各種極端情況,而不用承擔實際風險。
這種組合的強大之處還在于:一方面,就算AI出錯,也不會造成實際損失,可以立即重來。另一方面,Cosmos通過觀察視頻學習到的“經(jīng)驗”,可以在Omniverse中得到驗證和完善。
黃仁勛特別強調(diào)了Omniverse+Cosmos系統(tǒng)在工業(yè)領域的重要性:“全球制造業(yè)大約有50萬億美元的規(guī)模,包括數(shù)以百萬計的工廠和數(shù)十萬個倉庫,這些設施都需要向軟件定義和自動化方向發(fā)展。無論是工廠的自動化系統(tǒng),還是自動駕駛汽車,都需要這樣的系統(tǒng),來保證其行為既符合AI的智能決策,又符合現(xiàn)實世界的物理規(guī)律。”
圖:英偉達Omniverse的合作伙伴生態(tài)系統(tǒng)
也因此,黃仁勛預測:工業(yè)生產(chǎn)正在向數(shù)字化、智能化方向發(fā)展,數(shù)字孿生將成為未來每一個工廠的標配,它就像工廠的“虛擬分身”,能夠完全模擬真實工廠的運作,通過Omniverse+Cosmos系統(tǒng),可以模擬出多種未來可能的運營方案,然后讓AI選擇最優(yōu)方案,這些方案會成為真實工廠的運營指導。
要點六:“三個計算機系統(tǒng)”理論構(gòu)筑自動駕駛未來,所以英偉達帶來了Thor。
接著,黃仁勛談到了自動駕駛革命,又秀出一張生態(tài)合作圖,展示了英偉達在自動駕駛領域的廣泛合作,覆蓋Waymo、特斯拉、捷豹路虎、奔馳、豐田,還有比亞迪、理想、小鵬等眾多中國車企。
黃仁勛提供了一組數(shù)據(jù):全球每年生產(chǎn)1億輛汽車,道路上有10億輛車,每年行駛里程達到1萬億英里。他預測,“這些車輛未來都將實現(xiàn)高度自動化或完全自動化駕駛,這代表自動駕駛很可能成為第一個萬億美元級別的機器人產(chǎn)業(yè)。”目前,僅僅是少量開始量產(chǎn)的自動駕駛汽車,就已經(jīng)為英偉達帶來了40億美元收入規(guī)模,預計今年將達到50億美元。
針對于此,英偉達這次發(fā)布了新一代車載處理器Thor。
圖:英偉達Thor
這款芯片的處理能力是上一代Orin的20倍。在安全方面,DRIVE OS獲得了ASIL-D認證,這是汽車功能安全的最高標準,這背后凝聚了約15000個工程年的努力,使CUDA發(fā)展成為一個功能完備、安全可靠的自動駕駛計算平臺。
要點七:“通用機器人的ChatGPT時刻來臨”,所以英偉達用ISAAC Groot重新定義機器人開發(fā)。
談到機器人變革,黃仁勛說了一句金句:“通用機器人的ChatGPT時刻來臨”,并指出了三種最有前景的機器人類型,這三種機器人的獨特之處在于,它們不需要特殊的環(huán)境改造,可以直接在我們現(xiàn)有的世界中使用:
1、通用型AI或AI代理:因為它們是信息工作者,只要能適應我們現(xiàn)有的辦公環(huán)境和電腦系統(tǒng),就可以工作。
2、自動駕駛汽車:因為人類已經(jīng)花了一百多年建設道路和城市,這些基礎設施已經(jīng)完備。
3、人形機器人:可以直接適應為人類設計的所有環(huán)境和工具。
黃仁勛認為,如果這三種機器人技術(shù)獲得突破,將創(chuàng)造人類歷史上最大的科技產(chǎn)業(yè)。
但他也指出了當前面臨的關(guān)鍵挑戰(zhàn),特別是在人形機器人的訓練方面,與自動駕駛汽車不同(我們每天都在產(chǎn)生大量的駕駛數(shù)據(jù)),收集人類動作示范數(shù)據(jù)是非常耗時費力的。
為了解決這個問題,英偉達提出了一個創(chuàng)新方案——ISAAC Groot平臺,這是一個面向人形機器人開發(fā)的完整解決方案。
該平臺的創(chuàng)新之處在于其獨特的數(shù)據(jù)獲取和訓練方法:開發(fā)者可以使用Apple Vision Pro進行遠程操作來捕獲數(shù)據(jù),通過少量人類示范就能生成大規(guī)模訓練數(shù)據(jù),并利用Omniverse+Cosmos進行領域隨機化和3D真實感放大,這是一種AI訓練方法的創(chuàng)新。
這個環(huán)節(jié)其實也揭示了機器人領域的重大變革:我們正在從專用機器人向通用機器人過渡,而這個轉(zhuǎn)變的關(guān)鍵在于如何高效地訓練這些機器人,通過AI和虛擬仿真技術(shù)的結(jié)合,我們可以大大加速這個過程。
要點八:“每個用計算機的人,都需要AI超級計算機”,所以英偉達用“DIGITS”開啟個人AI超算的新紀元。
作為壓軸的重磅產(chǎn)品,黃仁勛介紹了公司內(nèi)部的一個項目“Project DIGITS”,展現(xiàn)了將企業(yè)級AI計算能力帶入個人桌面的雄心。
首先,黃仁勛解釋了項目名字的由來。最初項目叫“DIGITS”(Deep Learning GPU Intelligence Training System,深度學習GPU智能訓練系統(tǒng)),后來為了與公司其他產(chǎn)品線(如RTX、AGX等)保持一致,簡化為DGX。
DGX-1的推出是一個革命性的轉(zhuǎn)折點。在此之前,如果想要使用超級計算機,你需要建設專門的設施和基礎設施,這對大多數(shù)機構(gòu)來說都是難以實現(xiàn)的。而DGX-1改變了這一切,它是一臺“開箱即用”的AI超級計算機。黃仁勛還特別提到,2016年他們將第一臺DGX-1交付給了OpenAI,當時包括馬斯克、Ilya Sutskever在內(nèi)的團隊都在場。
圖:英偉達DGX-1
但現(xiàn)在情況不一樣了,AI的應用已經(jīng)不再局限于研究機構(gòu)或創(chuàng)業(yè)公司。正如黃仁勛在演講開始時提到的,AI計算正成為新的計算方式、新的軟件開發(fā)方式,每個軟件工程師、工程師、創(chuàng)意藝術(shù)家,實際上是每個用計算機的人,都需要AI超級計算機。
因此,英偉達希望能做出比DGX-1更小的設備,于是正式發(fā)布“Project DIGITS”:一個小型化的AI超級計算機。
圖:英偉達“Project DIGITS”
該產(chǎn)品基于英偉達的GB110芯片(最小的Grace Blackwell芯片),通過與MediaTek合作開發(fā)CPU,并采用NVLink連接到Blackwell GPU,實現(xiàn)了前所未有的性能突破。
圖:英偉達“Project DIGITS”的內(nèi)部結(jié)構(gòu)
它的設計理念,是成為一個放在桌面上的云計算平臺,無論你的PC是什么系統(tǒng)都能連接使用,也可以作為Linux工作站使用,支持ConnectX和GPU Direct等技術(shù),是一臺袖珍版的超級計算機。預計將在2025年5月上市。
換句話說,英偉達正在將高性能計算從專業(yè)數(shù)據(jù)中心,帶入普通用戶的辦公桌面,這種小型化、便攜化的AI超級計算機,可能會像個人電腦革命一樣,讓更多人使用AI技術(shù)進行創(chuàng)新和開發(fā)。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
