k1 模型基于強化學(xué)習(xí)技術(shù)打造,原生支持端到端圖像理解和思維鏈技術(shù),并將能力擴展到數(shù)學(xué)之外的更多基礎(chǔ)科學(xué)領(lǐng)域。
智譜AI率先推出了 AutoGLM,試圖打造一款能夠理解、規(guī)劃、執(zhí)行,并最終實現(xiàn)“無人駕駛”操作系統(tǒng)的 AI Agent。
這個模型的最大特色便是深度思維鏈推理,尤其是在數(shù)學(xué)、代碼以及各種復(fù)雜推理任務(wù)上,可以生成數(shù)萬字的推理流程,讓用戶深度了解模型生成內(nèi)容的全過程。
OpenAI發(fā)布了新的大語言模型o1,專注于邏輯推理優(yōu)化,其推理能力在多個領(lǐng)域超越現(xiàn)有模型。o1模型通過思維鏈模式訓(xùn)練,提升了數(shù)學(xué)、編程、科學(xué)問題解決能力。在AIME和GPQA測試中表現(xiàn)優(yōu)異,超越人類專家水平。o1模型使用大規(guī)模強化學(xué)習(xí)算法,強調(diào)思維鏈和強化學(xué)習(xí)的重要性。OpenAI未向用戶展示原始思維鏈,但提供摘要。o1模型目前可供ChatGPT Plus訂閱用戶使用。
“思維鏈”這個過程可以比作是給 AI 一個"思考框架",讓它能夠像人類專家那樣,分步驟、有邏輯地分析問題,而不是簡單地給出直接答案。
著名的教育家約翰·杜威這樣定義思維:“以一種觀察到的事物為依據(jù),去推測或判斷出其他的事物,然后將作為依據(jù)的事物當(dāng)做后者推測數(shù)的事物的機遇或者基礎(chǔ),從而產(chǎn)生信念!