阿里巴巴旗下的 Qwen 團(tuán)隊(duì)推出了 QwQ-32B,這是一款擁有 320 億參數(shù)的推理模型,旨在通過強(qiáng)化學(xué)習(xí)提升復(fù)雜問題解決任務(wù)的表現(xiàn)。該模型在 Hugging Face 和 ModelScope 上以開源權(quán)重形式發(fā)布,適用于商業(yè)和研究用途,企業(yè)可以立即將其應(yīng)用于產(chǎn)品和應(yīng)用程序中。
谷歌今天推出了兩項(xiàng)新的人工智能功能,旨在幫助用戶更快速地找到信息。第一項(xiàng)是增強(qiáng)版的 AI 概述功能,該功能在標(biāo)準(zhǔn)搜索結(jié)果上方顯示自然語言響應(yīng)。谷歌將這一功能切換到最新的 Gemini 2.0 大型語言模型系列。該系列的最強(qiáng)算法 Gemini 2.0 Pro 支持多達(dá) 200 萬個(gè)標(biāo)記的提示,能夠更好地理解復(fù)雜查詢、生成代碼并進(jìn)行推理。AI 概述功能預(yù)計(jì)將為美國(guó)用戶提供更準(zhǔn)確的響應(yīng)。
中國(guó)人工智能實(shí)驗(yàn)室深度思考發(fā)布了其所謂的推理模型DeepSeek-R1的開放版本,聲稱在某些人工智能基準(zhǔn)測(cè)試中表現(xiàn)與OpenAI的o1相當(dāng)。R1在AI開發(fā)平臺(tái)Hugging Face上以MIT許可證提供,意味著可以在商業(yè)上無限制使用。深度思考表示,R1在AIME、MATH-500和SWE-bench Verified基準(zhǔn)測(cè)試中超越了o1。AIME使用其他模型來評(píng)估模型的性能,而MATH-500是一個(gè)包含文字問題的集合。SWE-bench Verified則專注于編程任務(wù)。
領(lǐng)先的 AI 公司正在采用"蒸餾"技術(shù),以創(chuàng)造更便宜、更易采用的 AI 模型。這種技術(shù)在 DeepSeek 成功應(yīng)用后引起廣泛關(guān)注,引發(fā)了硅谷 AI 領(lǐng)導(dǎo)地位的動(dòng)搖。蒸餾技術(shù)通過將大型語言模型的知識(shí)轉(zhuǎn)移到小型模型中,實(shí)現(xiàn)了高效且經(jīng)濟(jì)的 AI 應(yīng)用。這一突破為初創(chuàng)公司和開發(fā)者提供了更多機(jī)會(huì),同時(shí)也對(duì)現(xiàn)有 AI 公司的商業(yè)模式構(gòu)成了挑戰(zhàn)。
OpenAI推出的GPT-4.5企業(yè)版引發(fā)了爭(zhēng)議,其高昂價(jià)格讓許多人質(zhì)疑其性價(jià)比。然而,作為OpenAI最大且最強(qiáng)大的非推理模型,GPT-4.5在知識(shí)儲(chǔ)備、文檔處理、任務(wù)規(guī)劃等方面表現(xiàn)出色。盡管成本高昂,但隨著推理成本的下降和未來潛在的強(qiáng)化學(xué)習(xí)訓(xùn)練,GPT-4.5仍有望成為企業(yè)應(yīng)用的有力工具。
OpenAI 發(fā)布 ChatGPT 4.5 預(yù)覽版,承諾對(duì)話更自然、情感智能更強(qiáng)、知識(shí)面更廣。新模型能更好理解語境和細(xì)微差別,創(chuàng)造力和協(xié)作能力提升,幻覺現(xiàn)象減少。這一升級(jí)體現(xiàn)了 AI 向著匹敵甚至超越人類能力的目標(biāo)邁進(jìn),為未來更強(qiáng)大的 GPT-5 奠定基礎(chǔ)。
騰訊推出新AI模型"混元Turbo S",定位為"快思考模型",旨在與DeepSeek-R1等"慢思考模型"競(jìng)爭(zhēng)。該模型通過提高輸出速度和減少首字延遲,實(shí)現(xiàn)近乎"即時(shí)回復(fù)";煸猅urbo S融合了直覺式短思考鏈和理性推理長(zhǎng)思考鏈,在數(shù)學(xué)、推理和知識(shí)等方面表現(xiàn)可比肩主流AI模型。騰訊采用混合Mamba-Transformer架構(gòu),提高效率并降低成本,有望成為未來基礎(chǔ)模型的核心。
OpenAI 今日推出最新最大的 AI 語言模型 GPT-4.5。該模型將首先向 ChatGPT Pro 用戶提供研究預(yù)覽。雖然 OpenAI 稱其為"最具知識(shí)性的模型",但也警告 GPT-4.5 并非前沿模型,可能無法超越 o1 或 o3-mini 的表現(xiàn)。GPT-4.5 在寫作、知識(shí)儲(chǔ)備和個(gè)性方面有所提升,但不會(huì)引入足夠的新功能被視為前沿模型。
ElevenLabs是一家剛剛完成1.8億美元融資的人工智能初創(chuàng)公司,主要以其音頻生成能力而聞名。該公司通過推出首個(gè)獨(dú)立的語音轉(zhuǎn)文本模型Scribe,邁出了另一個(gè)技術(shù)方向。該初創(chuàng)公司估值為33億美元,已幫助許多其他公司提供語音轉(zhuǎn)文本服務(wù),利用其龐大的聲音庫(kù)。然而,該公司現(xiàn)在希望進(jìn)入語音檢測(cè)領(lǐng)域,與Gladia、Speechmatics、AssemblyAI、Deepgram和OpenAI的Whisper模型競(jìng)爭(zhēng)。
OpenAI 推出代號(hào)"Orion"的 GPT-4.5 模型,這是公司迄今最大規(guī)模的 AI 模型。GPT-4.5 在計(jì)算能力和訓(xùn)練數(shù)據(jù)方面均超越以往版本,但 OpenAI 并不認(rèn)為它是前沿模型。該模型將逐步向付費(fèi)用戶開放,但運(yùn)營(yíng)成本高昂。盡管在某些基準(zhǔn)測(cè)試中表現(xiàn)出色,但 GPT-4.5 在部分任務(wù)上仍落后于其他 AI 推理模型,凸顯了傳統(tǒng)預(yù)訓(xùn)練方法的局限性。
IBM 公司今天推出了新的 Granite AI 模型系列,具備實(shí)驗(yàn)性推理、視覺和預(yù)測(cè)能力,旨在在企業(yè)人工智能市場(chǎng)中占據(jù)一席之地。所有 Granite 模型均在 Apache 2.0 開源許可證下開放,現(xiàn)已在 Hugging Face 和 IBM watson.ai 等平臺(tái)上提供。新系列的旗艦產(chǎn)品是 Granite 3.2 Instruct 變體,支持文本處理,能夠執(zhí)行摘要、問題解決和代碼生成等任務(wù),并設(shè)計(jì)為遵循指令。
埃隆·馬斯克的人工智能公司 xAI 推出了備受期待的旗艦 AI 模型 Grok 3。新模型推出后,Grok 應(yīng)用的下載量和活躍用戶數(shù)大幅增長(zhǎng)。然而,近期圍繞 Grok 3 的爭(zhēng)議可能會(huì)影響用戶的熱情。能否保持增長(zhǎng)勢(shì)頭并留住用戶,成為 xAI 面臨的重要挑戰(zhàn)。
Google 宣布擴(kuò)展 Gemini AI 模型系列,增加現(xiàn)有模型的可用性。公司推出了更新的 Gemini 2.0 Flash 模型,并發(fā)布了 2.0 Pro 和 2.0 Flash Thinking 的實(shí)驗(yàn)版本。此外,Google 還推出了新的 2.0 Flash-Lite 模型,旨在提供最具成本效益的 AI 解決方案。這些舉措旨在提升 AI 性能,并為開發(fā)者和用戶提供更多選擇。
OpenAI 發(fā)布了其 o3-mini 大語言模型,這是一款低成本、高速的推理優(yōu)化模型。它在 ChatGPT 多個(gè)版本中可用,并通過 API 向開發(fā)者開放。o3-mini 在性能測(cè)試中表現(xiàn)出色,顯示出 OpenAI 在推理模型領(lǐng)域的持續(xù)進(jìn)展。
OpenAI正尋求400億美元新一輪融資,估值或達(dá)3400億美元。軟銀可能領(lǐng)投150-250億美元,并協(xié)助尋找其他投資者。這筆資金將用于支持虧損業(yè)務(wù)運(yùn)營(yíng)和建設(shè)AI數(shù)據(jù)中心網(wǎng)絡(luò),以應(yīng)對(duì)來自競(jìng)爭(zhēng)對(duì)手的挑戰(zhàn),推動(dòng)AI技術(shù)進(jìn)步。
Mistral AI 和艾倫人工智能研究所發(fā)布了新的開源大語言模型。Mistral Small 3 擁有 240 億參數(shù),可在某些 MacBook 上運(yùn)行。AI2 的 Tülu 3 405B 是基于 Meta 的 Llama 3.1 405B 模型改進(jìn)而來。兩個(gè)模型都聲稱在各自類別中處于領(lǐng)先地位,并以開源許可發(fā)布。
文章深入探討了 AI 技術(shù)的快速發(fā)展趨勢(shì)及其未來影響。作者通過分析量級(jí)增長(zhǎng) (OOM)、AI 能力躍升以及模型的情境意識(shí)等方面,論證了 AI 即將迎來重大突破。特別強(qiáng)調(diào)了到 2027 年 AI 可能具備 AI 研究員/工程師的工作能力,以及 AI 系統(tǒng)在獲得持久記憶和更廣泛上下文后將產(chǎn)生質(zhì)的飛躍。
谷歌正在向人工智能公司Anthropic追加投資超10億美元,總投資額已達(dá)30億美元。Anthropic還將從其他投資者籌集20億美元,估值可能達(dá)到600億美元。該公司開發(fā)的Claude大語言模型在某些任務(wù)上據(jù)稱優(yōu)于GPT-4,并計(jì)劃進(jìn)一步提升模型能力和基礎(chǔ)設(shè)施,以應(yīng)對(duì)不斷增長(zhǎng)的需求。