
CES 2025 | 代理式AI崛起:NVIDIA定義下一代“代理式 AI Blueprint”

老黃說:下一個時代,是"代理式AI"的時代
隨著“代理式人工智能”( 代理式AI)正悄然進(jìn)入人工智能開發(fā)社區(qū),越發(fā)成為科技巨頭和AI領(lǐng)域?qū)<覀儫嶙h的新焦點。
NVIDIA認(rèn)為, 代理式AI是人工智能發(fā)展的下一個前沿,它通過復(fù)雜的推理和迭代規(guī)劃,自主解決復(fù)雜的多步驟問題,從而顯著提高各行業(yè)的生產(chǎn)力和運(yùn)營效率。
OpenAI前首席科學(xué)家、安全超級智能公司聯(lián)合創(chuàng)始人伊利亞·蘇茨克維(Ilya Sutskever)預(yù)測,下一代AI模型將“以一種真正的方式實現(xiàn)代理化”,未來的系統(tǒng)不僅具備自主性,更將擁有強(qiáng)大的推理能力。
代理式AI通過四個關(guān)鍵步驟實現(xiàn)高效的問題解決——感知(Perception),推理(Reasoning),執(zhí)行(Execution)和學(xué)習(xí)(Learning)。在感知階段,AI智能體從傳感器、數(shù)據(jù)庫和數(shù)字接口等多種來源收集并處理數(shù)據(jù),提取有意義的特征,識別物體或環(huán)境中的相關(guān)實體。推理階段,大型模型作為核心推理引擎,深入理解任務(wù)需求,生成解決方案,并協(xié)調(diào)調(diào)用專門模型完成特定功能。執(zhí)行階段中, 代理式AI通過API與外部工具和軟件集成,快速高效地完成規(guī)劃任務(wù)。而在學(xué)習(xí)階段, 代理式AI利用交互中產(chǎn)生的反饋數(shù)據(jù),驅(qū)動“數(shù)據(jù)飛輪”機(jī)制,不斷優(yōu)化系統(tǒng)性能和模型能力。這種閉環(huán)流程使 代理式AI能夠在復(fù)雜場景中展現(xiàn)卓越的自主決策與執(zhí)行能力。
其實, 代理式AI不僅能自動化重復(fù)性任務(wù),還能感知環(huán)境、進(jìn)行復(fù)雜的推理和決策,成為解決企業(yè)效率瓶頸的關(guān)鍵技術(shù)。在這一趨勢下,NVIDIA在2025年CES期間,推出了一系列新的 代理式AI工具和技術(shù),包括Llama Nemotron模型、 代理式 AI Blueprint,以及Cosmos Nemotron視覺語言模型。這些創(chuàng)新不僅代表了技術(shù)的巨大飛躍,也為企業(yè)應(yīng)對數(shù)據(jù)洪流中的挑戰(zhàn)提供了全新的解決方案。
NVIDIA首席執(zhí)行官黃仁勛表示,人工智能正邁入一個新時代—— 代理式AI時代。專業(yè)的AI代理可以幫助人們解決復(fù)雜問題并自動執(zhí)行重復(fù)性任務(wù),從而使各行各業(yè)的企業(yè)都能實現(xiàn)前所未有的生產(chǎn)力提升。
然而,這些先進(jìn)的AI代理需要一套針對代理AI功能和能力進(jìn)行優(yōu)化的多生成式AI模型系統(tǒng)。這種復(fù)雜性意味著,對強(qiáng)大、高效的企業(yè)級模型的需求比以往任何時候都更加迫切。
從邊緣到云端:解鎖代理AI新玩法
代理式AI的核心在于構(gòu)建能夠感知、推理并采取行動的智能代理。要實現(xiàn)這一目標(biāo),背后的生成式AI模型系統(tǒng)必須兼具高效的計算性能和卓越的準(zhǔn)確性。NVIDIA推出的Llama Nemotron系列模型通過剪枝和蒸餾技術(shù)優(yōu)化了計算效率,在模型規(guī)模和性能之間找到了最佳平衡,為企業(yè)構(gòu)建代理AI提供了堅實基礎(chǔ)。
來源:NVIDIA
通過NVIDIA NeMo定制并連接到業(yè)務(wù)知識 Llama Nemotron和Cosmos Nemotron模型系列即將以Nano、Super和Ultra的大小提供,為在各種規(guī)模部署AI代理提供選項。
Nano版本專為實時應(yīng)用設(shè)計,低延遲特性使其非常適合邊緣設(shè)備和個人電腦。無論是小型零售店還是復(fù)雜的工業(yè)場景,它都能提供及時的響應(yīng);Super版本則將高吞吐量和準(zhǔn)確性相結(jié)合,在單GPU上即可提供卓越性能,是企業(yè)級應(yīng)用的理想選擇;而Ultra版本面向要求最高性能的數(shù)據(jù)中心應(yīng)用,能夠支持復(fù)雜的大規(guī)模部署場景。
如今,時間與資源的競爭尤為激烈。從金融服務(wù)到零售管理,企業(yè)希望能夠快速應(yīng)對市場變化,優(yōu)化資源配置。靈活部署選項,讓企業(yè)可以更快地集成AI代理,以便更有效地完成任務(wù)。此外,其還能夠適應(yīng)不同規(guī)模的需求,從個人電腦到數(shù)據(jù)中心,無縫支持各種計算環(huán)境。這種靈活性和效率,為企業(yè)提供了以前難以實現(xiàn)的生產(chǎn)力提升。
為解決傳統(tǒng)AI模型在部署過程中的效率問題,還提供了高度適配的解決方案。據(jù)了解SAP通過其Joule平臺將這些模型應(yīng)用于多任務(wù)AI代理互動,讓企業(yè)用戶得以快速實現(xiàn)目標(biāo)。而ServiceNow則利用其平臺能力開發(fā)出能夠解決跨功能復(fù)雜問題的高級AI服務(wù),進(jìn)一步提升了業(yè)務(wù)效率。
事實上,Llama Nemotron模型的開放性也是其受到關(guān)注的重要原因。Meta等合作伙伴的積極評價表明,開放式模型的設(shè)計降低了開發(fā)門檻,企業(yè)可以更靈活地根據(jù)自身需求調(diào)整和部署。這種開放性和高效性,不僅滿足了邊緣計算和云計算的多樣化需求,也讓代理式AI的應(yīng)用范圍進(jìn)一步擴(kuò)大。
從概念到現(xiàn)實:AI代理創(chuàng)變行業(yè)規(guī)則
來源:NVIDIA
為了幫助企業(yè)將代理式AI從概念轉(zhuǎn)化為現(xiàn)實應(yīng)用,NVIDIA推出了代理式 AI Blueprint。這些代理式 AI Blueprint是整合多種技術(shù)能力的端到端解決方案,為開發(fā)者提供了一條清晰的路徑,將復(fù)雜的AI開發(fā)過程簡化為可操作的步驟。
代理式 AI Blueprint不僅僅是工具的集合,它是一種系統(tǒng)性的設(shè)計思路。通過整合NVIDIA NeMo微服務(wù)和NIM微服務(wù),代理式 AI Blueprint為開發(fā)者提供了靈活的模塊化組件,支持從報告生成到實時語音代理的多種應(yīng)用場景。借助這些工具,開發(fā)者能夠快速響應(yīng)不同業(yè)務(wù)需求,構(gòu)建高效且可靠的AI代理。
NVIDIA的合作伙伴可以通過代理式AI編排層,為人工智能代理的高效協(xié)作提供了關(guān)鍵支撐。全新推出的合作伙伴代理式 AI Blueprint,作為代理式AI編排的行業(yè)標(biāo)桿,現(xiàn)已開放獲取。該代理式 AI Blueprint與NVIDIA AI Enterprise軟件平臺無縫集成,包括NIM微服務(wù)和NVIDIA NeMo Retriever,不僅顯著提升了檢索準(zhǔn)確性,還大幅降低了代理工作流程的延遲,為企業(yè)智能化運(yùn)營提供強(qiáng)大助力。
CrewAI、Daily、LangChain、LlamaIndex 和 Weights & Biases,作為代理式AI領(lǐng)域的“編排大師”,正在與NVIDIA攜手書寫AI應(yīng)用新圖景。這些頂尖工具通過與NVIDIA AI Enterprise軟件平臺(包括NVIDIA NIM微服務(wù)和NeMo)深度整合,推出了五大代理式 AI Blueprint。尤其是新增的代理式AI合作伙伴代理式 AI Blueprint,更像是一張通往未來的地圖,為開發(fā)者鋪設(shè)了打造下一代AI應(yīng)用的基石。這些創(chuàng)新將滲透各行各業(yè),重塑我們的工作和生活方式。具體而言:
CrewAI:降低代碼維護(hù)的門檻。通過整合NIM微服務(wù)和NeMo檢索器,CrewAI實現(xiàn)了代碼文檔化的高效處理。對于開發(fā)團(tuán)隊而言,這意味著代碼庫的維護(hù)與擴(kuò)展將變得更加輕松。這項功能尤其適用于依賴復(fù)雜代碼庫的企業(yè),幫助顯著降低維護(hù)成本,同時提升開發(fā)效率。
Daily:語音代理開啟實時對話新時代。借助Pipecat框架與NVIDIA Riva語音識別技術(shù),Daily打造了一款支持實時對話的語音代理。這一解決方案不僅優(yōu)化了客戶服務(wù)效率,還為語音交互技術(shù)的未來應(yīng)用開辟了更多可能性。從客戶支持到虛擬助手,這種技術(shù)突破將持續(xù)為企業(yè)賦能。
LangChain:精準(zhǔn)生成結(jié)構(gòu)化報告。LangChain依托Llama 3.3 70B模型,提供結(jié)構(gòu)化報告生成功能,讓用戶可以根據(jù)需求自定義主題與大綱。這項功能顯著提升了信息搜索與報告生成效率,幫助企業(yè)以更加針對性的方式管理復(fù)雜數(shù)據(jù)。對于需要數(shù)據(jù)驅(qū)動決策的組織來說,LangChain提供了靈活且強(qiáng)大的支持。
LlamaIndex:加速高質(zhì)量內(nèi)容創(chuàng)作。作為文檔研究助手的代理式 AI Blueprint,LlamaIndex通過檢索增強(qiáng)生成能力,為內(nèi)容創(chuàng)作者提供了高效創(chuàng)作工具。無論是媒體機(jī)構(gòu)還是研究組織,這一技術(shù)都能大幅提升信息整合與內(nèi)容創(chuàng)作的效率,滿足高質(zhì)量內(nèi)容生產(chǎn)的需求。
Weights & Biases:優(yōu)化AI開發(fā)流程。Weights & Biases構(gòu)建的AI虛擬助手專注于調(diào)試與性能追蹤,幫助研發(fā)團(tuán)隊優(yōu)化開發(fā)流程,加速應(yīng)用的迭代速度。對于需要快速測試與迭代的企業(yè),這一解決方案無疑是提高研發(fā)效率的利器,為AI開發(fā)注入了更多可能性。
這些代理式 AI Blueprint所展現(xiàn)的能力遠(yuǎn)不止工具本身,它們是推動行業(yè)變革的重要驅(qū)動力。從消費(fèi)品到醫(yī)療健康,各個領(lǐng)域正在通過 代理式 AI Blueprint加速數(shù)字化轉(zhuǎn)型。特別是在復(fù)雜數(shù)據(jù)管理與智能分析方面,這些代理式 AI Blueprint為企業(yè)提供了強(qiáng)大的支持。
從視覺到價值:AI代理掀起新浪潮
當(dāng)超級個體時代加速到來,未來包括金融、內(nèi)容、醫(yī)療、咨詢等各個領(lǐng)域的人力資本行業(yè)可能都會出現(xiàn)大量“solo組織”,如何能更好的使用各種軟件,AI工具和創(chuàng)造力將會成為核心競爭力。
其實,視頻數(shù)據(jù)是“solo組織”必須充分挖掘的重要資源。從數(shù)據(jù)上看,每年產(chǎn)生的數(shù)萬億小時視頻中,絕大部分尚未被深入分析,這不僅浪費(fèi)了潛在的信息價值,也無形中增加了運(yùn)營成本與安全風(fēng)險。NVIDIA在這一領(lǐng)域的突破性技術(shù),為視頻數(shù)據(jù)分析注入了全新的可能性與效率。
NVIDIA推出的Cosmos Nemotron視覺語言模型(VLMs)為核心的Metropolis平臺,為開發(fā)者提供了構(gòu)建智能視頻分析代理的工具。這些代理能夠通過鏈?zhǔn)剿季S推理和任務(wù)規(guī)劃,從視頻內(nèi)容中快速提取關(guān)鍵信息,以超過30倍于實時觀看的速度完成分析。這種高效性使其成為工業(yè)、體育和娛樂領(lǐng)域的理想選擇。
基于NVIDIA Metropolis平臺,集成了Cosmos Nemotron視覺語言模型(VLM)、Llama Nemotron大型語言模型(LLM)以及NeMo Retriever等核心組件,可實現(xiàn)比實時觀看快30倍的視頻批量處理。開發(fā)者通過這些工具,可簡化構(gòu)建復(fù)雜AI代理的流程,實現(xiàn)任務(wù)規(guī)劃、工具調(diào)用等關(guān)鍵功能。這些視覺代理還能與其他具備不同技能的AI代理結(jié)合,支持企業(yè)從邊緣到云的靈活部署。
此外,這一工具不僅著眼當(dāng)前,更能從歷史視頻中提取關(guān)鍵信息,用于問題解決和新流程創(chuàng)建,幫助企業(yè)實現(xiàn)智能化轉(zhuǎn)型。通過這些強(qiáng)大的功能,視覺AI代理正在為工業(yè)運(yùn)營開辟新路徑。
在工業(yè)場景中,視覺AI代理大有用武之地。具有視覺感知和分析能力的人工智能代理正為工業(yè)運(yùn)營注入新動能。通過微調(diào),這些代理可確保在復(fù)雜生產(chǎn)過程中嚴(yán)格遵循標(biāo)準(zhǔn)操作程序,精準(zhǔn)分析動作細(xì)節(jié),提升生產(chǎn)力并減少浪費(fèi)。在資產(chǎn)管理方面,AI代理可利用3D體積估算和多攝像頭流分析,優(yōu)化倉儲空間利用效率。
在安全性要求下,AI代理能夠快速處理大量視頻,生成帶有上下文信息的事故報告,同時確保個人防護(hù)裝備合規(guī),大幅提升工人安全性。它們還能識別異;顒樱焖夙憫(yīng)以防止事故和生產(chǎn)問題,無論是在工廠、倉庫還是交通樞紐等場景。此外,AI代理善于從歷史視頻中提取相關(guān)信息,用于解決問題或優(yōu)化流程設(shè)計。憑借這些強(qiáng)大的功能,視覺AI代理正在重塑工業(yè)運(yùn)營的效率與安全標(biāo)準(zhǔn)
體育行業(yè)則通過視頻分析技術(shù)提升運(yùn)動員表現(xiàn)。在CES開幕主題演講中,NVIDIA創(chuàng)始人兼首席執(zhí)行官Jensen Huang展示了一個人工智能視頻分析代理,該代理評估了業(yè)余棒球運(yùn)動員與職業(yè)棒球運(yùn)動員的快球投擲技能。視頻分析人工智能代理使用黃為舊金山巨人隊棒球隊投出的儀式性第一球拍攝的視頻,能夠提出需要改進(jìn)的領(lǐng)域。
截取自NVIDIA視頻
在娛樂行業(yè),代理通過分析用戶行為和偏好,幫助內(nèi)容創(chuàng)作者生產(chǎn)更具針對性的作品。NVIDIA的Media2計劃正利用這些技術(shù)構(gòu)建更加智能和定制化的內(nèi)容生態(tài),為媒體行業(yè)帶來新一輪增長。
視覺感知能力的提升不僅帶來了即時效益,還為長遠(yuǎn)的智能社會建設(shè)奠定了基礎(chǔ)。從優(yōu)化工業(yè)流程到提升用戶體驗,NVIDIA的技術(shù)正在逐步改變我們對視頻數(shù)據(jù)的認(rèn)知與利用方式。
目前,埃森哲、美力、德勤、安永、Infosys、Linker Vision、Pegatron、TATA咨詢服務(wù)(TCS)、Telit Cinterion和VAST等NVIDIA合作伙伴正在將構(gòu)建用于視頻分析的代理式 AI Blueprint整合到其開發(fā)人員工作流程中。
寫在最后
從技術(shù)研發(fā)到行業(yè)賦能,NVIDIA正在通過推動 代理式AI,定義新的“智能生態(tài)論”。無論是Llama Nemotron模型的技術(shù)創(chuàng)新, 代理式 AI Blueprint的實際應(yīng)用,還是視覺感知技術(shù)的賦能突破,NVIDIA的每一步都在推動代理式AI從理論走向?qū)嵺`。這標(biāo)志著AI發(fā)展的一個新階段,也為企業(yè)迎接數(shù)據(jù)時代的挑戰(zhàn)提供了強(qiáng)有力的支持。未來,隨著代理式AI的不斷成熟,它將成為企業(yè)和社會實現(xiàn)智能化轉(zhuǎn)型的核心驅(qū)動力。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
