就算研究人員認為在未來一兩年內(nèi)就能實現(xiàn)通用人工智能的觀點是正確的,他們也很可能高估了人類采用和適應(yīng)一項技術(shù)的速度。
智能體的認知架構(gòu)是其核心所在,主要包含三個關(guān)鍵要素:模型、工具和編排層。其中,模型(Model)在智能體的運行過程中充當著核心決策制定者的角色。這些模型可以是單個或多個不同規(guī)模的語言模型,并且需要遵循基于指令的推理和邏輯框架,例如ReAct、Chain-of-Thought或Tree-of-Thoughts等。
百度發(fā)了一張2024年AI成績單,涵蓋百度在大模型、智能體、AI應(yīng)用等領(lǐng)域的多項AI獎項。透過這份AI成績單,我們或許能通過百度做AI的思路總結(jié)出一些布局AI的重點方向,找找明年做AI的機會。
字節(jié)跳動在AI領(lǐng)域采取了激進的高舉高打戰(zhàn)略。依托其強大資源,在賽道上采取“全方位布局”的策略,在產(chǎn)品上采用“頭部產(chǎn)品集中力量,新型產(chǎn)品快速迭代”的打法。取得了不錯的成效。
智能體不僅可以像聊天機器人那樣回答問題,還能接受人類甚至是其他智能體委托給它們的任務(wù)。而且與AI領(lǐng)域的其他成果一樣,智能體同樣保持著迅猛的發(fā)展速度。
雖然其中前兩大市場已經(jīng)相當成熟,但最為核心的潛力卻來自企業(yè)AI市場,只是采用曲線相對較緩。Roese解釋稱,“AI并非單一市場,而是囊括三大完全獨立但又相互關(guān)聯(lián)的市場!彼赋,計算機視覺與機器人等前生成式AI技術(shù)正是將數(shù)據(jù)提煉為生成式AI可用格式的關(guān)鍵一層。
在 OpenAI o1 的背景下,Q-learning 略顯神秘,這里來解讀。Q-learning 是一種基于值的強化學(xué)習(xí)算法,它旨在學(xué)習(xí)一個策略,使得智能體在環(huán)境中采取行動后,能夠最大化累積的獎勵。它通過估計狀態(tài)-動作值函數(shù)(即 Q 函數(shù))來實現(xiàn)這一目標。
開發(fā)人員可以在Swarm中定義Python函數(shù)作為智能體可調(diào)用的工具,這些函數(shù)被轉(zhuǎn)換成符合OpenAI API要求的格式,可以在對話過程中由模型自動調(diào)用以執(zhí)行實際任務(wù),例如,查找商品信息或處理退款。
OpenAI的首席執(zhí)行官Sam Altman曾嘗試定義AGI,將AGI描述為“相當于你可以雇傭的中等水平的人類同事”。與此同時,OpenAI的章程將AGI定義為“在大多數(shù)經(jīng)濟價值工作上超越人類的高自主系統(tǒng)”。
生成式AI不再只是面向?qū)m椨美母呒壒ぞ摺F湔谏罨癁橐环N新的并行技術(shù)!愃朴趥鹘y(tǒng)操作系統(tǒng)中的基礎(chǔ)層,從根本上重新定義組織的運營、創(chuàng)新與競爭方式。隨著我們步入生成式AI的新時代,智能體開始作為新的應(yīng)用程序出現(xiàn),而這一轉(zhuǎn)變也將重塑各個行業(yè)的基本商業(yè)戰(zhàn)略。
“思維鏈”這個過程可以比作是給 AI 一個"思考框架",讓它能夠像人類專家那樣,分步驟、有邏輯地分析問題,而不是簡單地給出直接答案。
為了解決訓(xùn)練數(shù)據(jù)短缺和質(zhì)量差的難題,微軟研究院發(fā)布了一個專門用于生成高質(zhì)量合成數(shù)據(jù)的的AI Agent——Agent Instruct。
由LLM驅(qū)動的自主Agent集合,涵蓋任務(wù)解決、多智能體協(xié)作、社會模擬等項目,提供框架、基準評估和相關(guān)資源,推動AI代理技術(shù)的發(fā)展。
在Create 2024百度AI開發(fā)者大會上,李彥宏宣布推出三款A(yù)I開發(fā)工具:AgentBuilder、AppBuilder、ModelBuilder,并強調(diào)自然語言將成為新的編程語言。文心大模型用戶數(shù)突破2億,百度在AI原生應(yīng)用開發(fā)方面提出MoE、小模型和智能體三大思路。
今日,“走進鵬城智能體”系列首場活動“光明科學(xué)城園區(qū)智能體高峰論壇”在深圳市光明區(qū)拉開序幕。
在HUAWEI CONNECT 2020期間,華為發(fā)布了智能體,這是業(yè)界首次針對政企智能升級提出的系統(tǒng)化參考架構(gòu)。