xAI 公司發(fā)布了新一代大語(yǔ)言模型 Grok-3,具備模擬人類思維的推理能力。該模型比前代產(chǎn)品計(jì)算能力提升 10-15 倍,可在數(shù)學(xué)、科學(xué)和編程領(lǐng)域超越競(jìng)爭(zhēng)對(duì)手。Grok-3 包含大型復(fù)雜模型和小型快速模型,能進(jìn)行逐步推理并提供深度搜索功能。未來(lái)還將推出語(yǔ)音交互模式。
2023年和2024年,不少初創(chuàng)公司都推出了令人印象深刻的AI服務(wù),但很快就被微軟和谷歌等能夠直接觸達(dá)客戶的巨頭所覆蓋。以Jasper.ai為例,這是一款曾經(jīng)備受推崇、用于編寫(xiě)文本的AI工具。
上海AI實(shí)驗(yàn)室的研究團(tuán)隊(duì)創(chuàng)新性地設(shè)計(jì)了元?jiǎng)幼魉伎挤妒絹?lái)引導(dǎo)模型的搜索空間,使模型更高效地習(xí)得和產(chǎn)生多樣化的推理策略組合;基于通專融合的方式進(jìn)行數(shù)據(jù)合成,并通過(guò)構(gòu)建大規(guī)模沙盒環(huán)境獲取反饋,在不依賴o1這類已有強(qiáng)推理模型的情況下,實(shí)現(xiàn)高質(zhì)量思維鏈的獨(dú)立構(gòu)建,并大幅提升模型的復(fù)雜任務(wù)處理性能。
Llama3.1 版本模型提供了更好的推理能力、更大的 128K token 上下文窗口,并改進(jìn)了對(duì)8種語(yǔ)言的支持。