本周在巴塞羅那的移動世界大會上,一款聲稱預(yù)示著智能手機(jī)未來 AI 的新奇移動操作系統(tǒng)亮相。
Hugging Face 的聯(lián)合創(chuàng)始人兼首席科學(xué)官 Thomas Wolf 表示,當(dāng)前 AI 發(fā)展范式無法產(chǎn)生具有創(chuàng)造性問題解決能力的 AI。他認(rèn)為,AI 目前主要是填補(bǔ)人類已知之間的空白,而非通過連接不相關(guān)事實來產(chǎn)生新知識。Wolf 呼吁 AI 行業(yè)轉(zhuǎn)向能夠衡量 AI 提出非常規(guī)問題和開辟新研究路徑能力的評估方法。
領(lǐng)先的 AI 公司正在采用"蒸餾"技術(shù),以創(chuàng)造更便宜、更易采用的 AI 模型。這種技術(shù)在 DeepSeek 成功應(yīng)用后引起廣泛關(guān)注,引發(fā)了硅谷 AI 領(lǐng)導(dǎo)地位的動搖。蒸餾技術(shù)通過將大型語言模型的知識轉(zhuǎn)移到小型模型中,實現(xiàn)了高效且經(jīng)濟(jì)的 AI 應(yīng)用。這一突破為初創(chuàng)公司和開發(fā)者提供了更多機(jī)會,同時也對現(xiàn)有 AI 公司的商業(yè)模式構(gòu)成了挑戰(zhàn)。
物理人工智能代表了人工智能從純數(shù)字系統(tǒng)向能夠與現(xiàn)實世界互動的智能機(jī)器的演變。與僅依賴軟件的人工智能不同,物理人工智能將算法與傳感器和執(zhí)行器結(jié)合在機(jī)器人、車輛和設(shè)備中,使它們能夠感知周圍環(huán)境并實時做出決策。這些系統(tǒng)能夠自主運行,適應(yīng)不斷變化的環(huán)境,而不是遵循固定的編程。
Google聯(lián)合創(chuàng)始人謝爾蓋·布林重返公司,呼吁員工每周工作60小時,以贏得人工智能競賽。他認(rèn)為Google有望實現(xiàn)通用人工智能(AGI)突破,但需要員工全身心投入。這一呼吁引發(fā)了對工作效率和AI發(fā)展前景的討論,同時也反映了科技巨頭在AI競爭中的緊迫感。
騰訊推出新AI模型"混元Turbo S",定位為"快思考模型",旨在與DeepSeek-R1等"慢思考模型"競爭。該模型通過提高輸出速度和減少首字延遲,實現(xiàn)近乎"即時回復(fù)";煸猅urbo S融合了直覺式短思考鏈和理性推理長思考鏈,在數(shù)學(xué)、推理和知識等方面表現(xiàn)可比肩主流AI模型。騰訊采用混合Mamba-Transformer架構(gòu),提高效率并降低成本,有望成為未來基礎(chǔ)模型的核心。
IBM 公司今天推出了新的 Granite AI 模型系列,具備實驗性推理、視覺和預(yù)測能力,旨在在企業(yè)人工智能市場中占據(jù)一席之地。所有 Granite 模型均在 Apache 2.0 開源許可證下開放,現(xiàn)已在 Hugging Face 和 IBM watson.ai 等平臺上提供。新系列的旗艦產(chǎn)品是 Granite 3.2 Instruct 變體,支持文本處理,能夠執(zhí)行摘要、問題解決和代碼生成等任務(wù),并設(shè)計為遵循指令。
Anthropic 發(fā)布全新前沿 AI 模型 Claude 3.7 Sonnet,這是首個混合推理模型,能夠?qū)崟r回答問題,也可根據(jù)用戶需求延長思考時間以提供更深入的答案。該模型在多項基準(zhǔn)測試中表現(xiàn)優(yōu)異,并推出了專注于代碼開發(fā)的 Claude Code 版本。
DeepSeek 在上個月發(fā)布了一個開放權(quán)重的 AI 模型后,現(xiàn)在計劃進(jìn)一步開源其底層代碼。公司將從下周開始發(fā)布五個開源倉庫,涵蓋其在線服務(wù)中的關(guān)鍵組件。這一舉措將使 DeepSeek 的技術(shù)更加透明,有助于推動 AI 領(lǐng)域的集體進(jìn)步,同時也與 OpenAI 等保持專有模型的公司形成對比。
蘋果推出售價599美元的iPhone 16E,搭載與高端機(jī)型相同的A18芯片,支持全套Apple Intelligence功能。這款平價iPhone的推出表明蘋果正努力將AI技術(shù)普及到更多用戶手中,降低了用戶體驗AI的門檻。此舉不僅擴(kuò)大了AI技術(shù)的可及性,還有助于蘋果收集更多用戶反饋,進(jìn)一步完善其AI功能。
上海人工智能實驗室的一項新研究表明,通過適當(dāng)?shù)墓ぞ吆蜏y試時擴(kuò)展技術(shù),參數(shù)僅有10億的小型語言模型在復(fù)雜數(shù)學(xué)基準(zhǔn)測試中可以超越4050億參數(shù)的大型語言模型。這一發(fā)現(xiàn)為企業(yè)在不同環(huán)境和應(yīng)用中部署小型語言模型進(jìn)行復(fù)雜推理任務(wù)提供了新的可能性。
深度節(jié)奏是一家專注于日志數(shù)據(jù)的AI安全初創(chuàng)公司,成立16個月后聘請了首位銷售副總裁。該公司由Evan Powell于2023年11月創(chuàng)立,去年11月首次公開。新任銷售副總裁Chris Bowen曾在Hammerspace擔(dān)任銷售高級副總裁。深度節(jié)奏開發(fā)的日志語言模型(LLGM)能夠識別日志數(shù)據(jù)中的攻擊事件,并將檢測到的事件轉(zhuǎn)發(fā)至安全信息和事件管理(SIEM)資源。該軟件在Snowflake環(huán)境中運行,能夠在任何數(shù)據(jù)湖中識別異;顒硬l(fā)送警報。通過聘請Bowen,深度節(jié)奏表明其有產(chǎn)品可售,并可能將銷售重點放在Snowflake渠道上。
馬斯克的 AI 公司 xAI 推出了 Grok 3 模型,號稱在多項技術(shù)指標(biāo)上超越競爭對手。這款 AI 在數(shù)學(xué)、科學(xué)推理和編程等方面表現(xiàn)出色,并在用戶測試中領(lǐng)先 GPT-4 等模型。Grok 3 的發(fā)布標(biāo)志著 AI 領(lǐng)域競爭加劇,也凸顯了馬斯克與 OpenAI 之間的緊張關(guān)系。
DeepSeek于1月推出的R-1 AI模型顯著改變了企業(yè)AI的格局,導(dǎo)致美國科技股市損失超過1萬億美元。該公司聲稱其推理模型在性能上可與OpenAI的o1相媲美,速度是其兩倍,成本僅為10%。盡管模型開發(fā)存在爭議,DeepSeek加速了AI模型的商品化,為CIO提供了更多選擇和更低的內(nèi)部構(gòu)建AI能力的門檻。隨著模型成本下降,企業(yè)在商業(yè)解決方案上將有更大選擇,內(nèi)部開發(fā)應(yīng)用變得更為現(xiàn)實。
Perplexity 通過推出 Deep Research 工具,顛覆了 AI 市場的現(xiàn)狀。該工具能夠在幾分鐘內(nèi)生成全面的研究報告,并以極低的企業(yè)成本向用戶開放先進(jìn)的 AI 能力。Perplexity 的 CEO Aravind Srinivas 強(qiáng)調(diào),知識應(yīng)該是普遍可獲取和有用的,而不是被高昂的訂閱計劃所限制。Deep Research 的推出揭示了 AI 定價的痛苦真相:昂貴的企業(yè)訂閱可能是多余的。Perplexity 提供的服務(wù)在價格上具有競爭力,可能迫使大型 AI 公司重新審視其定價結(jié)構(gòu)。
{一項來自上海交通大學(xué)的研究表明,大型語言模型(LLMs)可以在不依賴大數(shù)據(jù)集的情況下學(xué)習(xí)復(fù)雜的推理任務(wù)。研究結(jié)果顯示,僅需少量精心挑選的示例,就能訓(xùn)練LLM完成原本認(rèn)為需要數(shù)萬個訓(xùn)練實例的任務(wù)。這種高效性源于現(xiàn)代LLM在預(yù)訓(xùn)練階段獲得的內(nèi)在知識。隨著新的訓(xùn)練方法變得更加數(shù)據(jù)和計算高效,企業(yè)可能能夠在不需要大型AI實驗室資源的情況下創(chuàng)建定制模型。}
{如今,幾乎所有前沿的 AI 產(chǎn)品和模型都采用變壓器架構(gòu)。大型語言模型(LLMs)如 GPT-4o、LLaMA、Gemini 和 Claude 都是基于變壓器的,其他 AI 應(yīng)用如文本轉(zhuǎn)語音、自動語音識別、圖像生成和文本到視頻模型也以變壓器作為其基礎(chǔ)技術(shù)。隨著 AI 熱潮的持續(xù),了解變壓器的工作原理及其在可擴(kuò)展解決方案增長中的重要性顯得尤為重要。變壓器不僅僅是表面現(xiàn)象,它們是處理數(shù)據(jù)序列的神經(jīng)網(wǎng)絡(luò)架構(gòu),適用于語言翻譯、句子補(bǔ)全和自動語音識別等任務(wù)。}
Anthropic CEO Dario Amodei警告,人工智能將在兩年內(nèi)達(dá)到"天才國家"的集體智能水平。他批評巴黎AI峰會錯失良機(jī),呼吁加快AI治理進(jìn)程。Amodei強(qiáng)調(diào)民主國家在AI發(fā)展中的領(lǐng)導(dǎo)地位,并提出了關(guān)于安全風(fēng)險和經(jīng)濟(jì)影響的擔(dān)憂。這一警告凸顯了AI快速發(fā)展與有效監(jiān)管之間的緊迫挑戰(zhàn)。
人工智能正在重塑網(wǎng)絡(luò)安全格局,既帶來機(jī)遇也帶來挑戰(zhàn)。企業(yè)需要充分認(rèn)識 AI 的雙面性,既要利用 AI 提升防御能力,也要防范 AI 被用于網(wǎng)絡(luò)攻擊。本文提出四點建議:獲得高層支持、評估風(fēng)險、培養(yǎng)安全文化、做好應(yīng)對準(zhǔn)備,以幫助企業(yè)應(yīng)對 AI 驅(qū)動的網(wǎng)絡(luò)威脅。
DeepSeek公司最近發(fā)布的開源推理AI模型R1在開發(fā)者和研究人員中迅速流行,引發(fā)科技股大幅拋售。R1的出現(xiàn)以及同期宣布的Stargate項目,凸顯了AI投資和商業(yè)模式的深度不確定性。這些事件引發(fā)了關(guān)于開源vs閉源AI系統(tǒng)、硬件vs軟件優(yōu)化、以及AI公司盈利模式等多方面的爭議和思考。