一個目標是讓來自不同組織的 AI 代理能夠自由無縫地相互交流。但要實現這一點,需要實現互操作性,而這些代理可能是使用不同的 LLM、數據框架和代碼構建的。為了實現互操作性,這些代理的開發(fā)者必須就如何相互通信達成一致。這是一項具有挑戰(zhàn)性的任務。
周四,法國大型語言模型(LLM)開發(fā)商Mistral推出了一款新API,專為處理復雜PDF文檔的開發(fā)者設計。Mistral OCR是一種光學字符識別(OCR)API,可以將任何PDF轉換為文本文件,以便AI模型更容易地進行處理。
Google 正在測試一種全新的 AI 搜索模式,將搜索引擎轉變?yōu)橛?Gemini 2.0 驅動的定制聊天機器人界面。用戶可以通過這個界面提問、獲取答案,并深入探討特定主題。這一模式目前作為小規(guī)模實驗推出,但可能預示著 Google 搜索的未來發(fā)展方向:一種以 AI 為主導的搜索體驗,可能會改變信息呈現和獲取的方式。
OpenAI 的 ChatGPT 應用程序在 macOS 平臺上推出了直接編輯代碼的新功能。該功能支持 Xcode、VS Code 和 JetBrains 等主流開發(fā)工具,并提供自動應用模式。目前僅向付費用戶開放,免費用戶將于下周獲得支持。這一更新強化了 ChatGPT 在代碼編輯領域的競爭力,但也引發(fā)了對 AI 輔助編碼工具安全性和可靠性的討論。
谷歌正在推出一項新的“AI 模式”實驗性功能,旨在與 Perplexity AI 和 OpenAI 的 ChatGPT 搜索等流行服務競爭。該科技巨頭在周三宣布,這種新模式旨在讓用戶能夠在谷歌搜索中直接提出復雜的多部分問題和后續(xù)問題,以便更深入地探討某個主題。
人工智能在健康領域正迎來重要時刻。從能夠將醫(yī)療指南翻譯成地方語言的聊天機器人,到能在幾秒鐘內檢測貧血的手機應用,再到減少疾病診斷錯誤的數字顯微鏡,新的人工智能驅動解決方案似乎每天都在推出。然而,單純的技術“驚艷”只講述了部分故事。當人工智能與人類的同理心、文化理解和理想價值觀相結合時,它才真正具有變革性。這種合成被稱為混合智能,確保技術能夠滿足真實需求,而不是追求新奇。
谷歌今天推出了兩項新的人工智能功能,旨在幫助用戶更快速地找到信息。第一項是增強版的 AI 概述功能,該功能在標準搜索結果上方顯示自然語言響應。谷歌將這一功能切換到最新的 Gemini 2.0 大型語言模型系列。該系列的最強算法 Gemini 2.0 Pro 支持多達 200 萬個標記的提示,能夠更好地理解復雜查詢、生成代碼并進行推理。AI 概述功能預計將為美國用戶提供更準確的響應。
CoreWeave 從一家小型加密貨幣礦場發(fā)展成為大規(guī)模 GPU 數據中心運營商,現已申請首次公開募股。公司專注于 AI 訓練和推理工作負載,擁有 25 萬個 GPU,分布在 32 個數據中心。CoreWeave 通過獨特的軟件堆棧提高 GPU 利用率,價格僅為主流云服務商的一半。雖然收入增長迅速,但仍處于虧損狀態(tài),且客戶集中度高。此次 IPO 將是 GPU 云市場的一個重要里程碑。
微軟終于推出了其 Copilot Windows 應用程序的本地版本,距離將其轉變?yōu)榛揪W頁應用程序已經快一年了。本周,新的 Copilot 應用程序正在向 Windows Insider 用戶推出,該應用程序使用本地 XAML 構建,包含新的側邊面板和改進的用戶界面。
中國人工智能實驗室深度思考發(fā)布了其所謂的推理模型DeepSeek-R1的開放版本,聲稱在某些人工智能基準測試中表現與OpenAI的o1相當。R1在AI開發(fā)平臺Hugging Face上以MIT許可證提供,意味著可以在商業(yè)上無限制使用。深度思考表示,R1在AIME、MATH-500和SWE-bench Verified基準測試中超越了o1。AIME使用其他模型來評估模型的性能,而MATH-500是一個包含文字問題的集合。SWE-bench Verified則專注于編程任務。
一家來自英國的初創(chuàng)公司 Epoch Biodesign,源于創(chuàng)始人 Jacob Nathan 在高中時的科學項目,利用酶分解塑料廢物,已成功獲得超額認購的 1830 萬美元 A 輪融資。
OpenAI 已開始向其 ChatGPT Plus 用戶推出最新的 AI 模型 GPT-4.5。OpenAI 在 X 平臺上發(fā)布的一系列帖子中表示,此次推出將持續(xù)“1-3 天”,并預計速率限制會有所變化。
PEAK:AIO推出了一款新的2RU 1.5 PB AI 數據服務器產品,使用戴爾硬件,數據傳輸速率達到120 GBps。PEAK:AIO是一家專注于人工智能的英國存儲初創(chuàng)公司,提供基于第三方硬件的軟件定義存儲,密切管理和控制以降低延遲并提高吞吐量。其2RU服務器已為中型GPU集群提供40 GBps的傳輸速率,現可實現三倍的速度。
在巴塞羅那的移動世界大會上,OpenAI董事會主席布雷特·泰勒在與CNN主持人安娜·斯圖爾特的對話中并沒有給出“AI代理”的明確定義。他回避了關于“代理AI”與“生成AI聊天機器人”之間區(qū)別的問題,指出人們對前者的反感與對AI代理“富有同情心”回應的喜愛。泰勒表示,他對大型語言模型和當前技術浪潮的興奮程度超過了他記憶中的任何技術,甚至自他青少年時期發(fā)現互聯網以來。
一段令人驚嘆又讓人不安的AI語音演示在網上引發(fā)熱議。2013年,斯派克·瓊斯的電影《她》描繪了一個人們與AI語音助手建立情感聯系的未來。近12年后,AI初創(chuàng)公司Sesame發(fā)布的新對話語音模型使這一虛構的設想更接近現實,許多用戶對此感到既著迷又不安。
Cohere的非營利研究實驗室本周發(fā)布了一款多模態(tài)“開放”AI模型Aya Vision,該實驗室聲稱其為同類最佳。Aya Vision能夠執(zhí)行圖像描述、回答照片相關問題、翻譯文本以及生成23種主要語言的摘要等任務。Cohere還通過WhatsApp免費提供Aya Vision,稱這是“使技術突破對全球研究人員可及的重要一步”。
對于企業(yè)來說,從啟動到可持續(xù)增長的道路可能充滿不確定性,但關鍵在于:解決真實問題,讓客戶為你的解決方案付費,并確保收入超過獲取成本。對于獨立創(chuàng)業(yè)者而言,在沒有雇傭資源的情況下實現規(guī);奶魬(zhàn)更為艱巨。幸運的是,今天的企業(yè)家有一個強大的替代方案:人工智能代理。這些自主的人工智能工具可以幫助你的企業(yè)在不立即擴展團隊的情況下實現增長,這在每一美元收入都要重新投入到業(yè)務中的階段尤為重要。
AI助手正如火如荼,但專注于分析、整理和得出結論的大量數據的助手又如何呢?Google的數據科學助手正是為此而生:這款新的、免費的Gemini 2.0驅動的AI助手,旨在自動化數據分析,現已在特定國家和語言中向18歲及以上用戶免費提供。
OpenAI 最近推出了 GPT-4.5,這款新模型在準確性測試中表現優(yōu)于之前的版本,能夠更好地理解細微差別。盡管面臨 GPU 短缺的挑戰(zhàn),OpenAI 仍然致力于將這一模型推向市場,并計劃在未來推出更先進的推理能力模型。
Contextual AI今天發(fā)布了其基礎語言模型(GLM),聲稱在行業(yè)中提供了最高的事實準確性,超越了Google、Anthropic和OpenAI的領先AI系統(tǒng),在一個關鍵的真實性基準測試中表現出色。該公司由檢索增強生成(RAG)技術的先驅創(chuàng)立,GLM在FACTS基準測試中獲得了88%的事實得分,而Google的Gemini 2.0 Flash為84.6%,Anthropic的Claude 3.5 Sonnet為79.4%,OpenAI的GPT-4o為78.8%。