當前,AI模型的推出速度令人眼花繚亂,從谷歌等大型科技公司到OpenAI和Anthropic等初創(chuàng)企業(yè)都在不斷推出新模型。跟蹤最新的AI模型可能會讓人感到不知所措。AI模型通常根據(jù)行業(yè)基準進行宣傳,但這些技術指標往往無法真實反映人們和公司如何實際使用它們。為了幫助讀者理清思路,TechCrunch匯總了自2024年以來發(fā)布的最先進的AI模型概述,包括如何使用它們及其最佳應用場景。我們也會持續(xù)更新這個列表,添加最新的發(fā)布信息。
谷歌在周三的博客中表示,正在將 AI 概述擴展到美國更多用戶,并對其進行 Gemini 2.0 升級。
Motorola 在巴塞羅那世界移動通信大會上宣布升級 Smart Connect 工具。新版本將支持所有 Windows 10 和 11 電腦,以及更多 Android 設備,實現(xiàn)跨設備無縫集成。用戶可通過語音或文本命令輕松在手機、平板和電腦間傳輸內(nèi)容。AI 技術的應用使搜索和設備管理更加智能化,大大提升了用戶體驗。
Google 正在測試一種全新的 AI 搜索模式,將搜索引擎轉(zhuǎn)變?yōu)橛?Gemini 2.0 驅(qū)動的定制聊天機器人界面。用戶可以通過這個界面提問、獲取答案,并深入探討特定主題。這一模式目前作為小規(guī)模實驗推出,但可能預示著 Google 搜索的未來發(fā)展方向:一種以 AI 為主導的搜索體驗,可能會改變信息呈現(xiàn)和獲取的方式。
谷歌正在推出一項新的“AI 模式”實驗性功能,旨在與 Perplexity AI 和 OpenAI 的 ChatGPT 搜索等流行服務競爭。該科技巨頭在周三宣布,這種新模式旨在讓用戶能夠在谷歌搜索中直接提出復雜的多部分問題和后續(xù)問題,以便更深入地探討某個主題。
在巴塞羅那的移動世界大會上,OpenAI董事會主席布雷特·泰勒在與CNN主持人安娜·斯圖爾特的對話中并沒有給出“AI代理”的明確定義。他回避了關于“代理AI”與“生成AI聊天機器人”之間區(qū)別的問題,指出人們對前者的反感與對AI代理“富有同情心”回應的喜愛。泰勒表示,他對大型語言模型和當前技術浪潮的興奮程度超過了他記憶中的任何技術,甚至自他青少年時期發(fā)現(xiàn)互聯(lián)網(wǎng)以來。
Google Cloud 推出兩項新的 AI 功能:一是面向數(shù)據(jù)科學家的 Data Science Agent,可在 Google Colab 中快速進行數(shù)據(jù)分析;二是面向醫(yī)療專業(yè)人士的 Vertex AI Search 多模態(tài)搜索功能,可更全面地分析患者健康信息。這些 AI 創(chuàng)新旨在提高數(shù)據(jù)分析效率和醫(yī)療診斷準確性,推動 AI 在科技和醫(yī)療領域的應用。
自2022年末ChatGPT推出以來,專家們一直在討論人工智能語言模型將如何影響世界。幾年后,情況逐漸明朗。根據(jù)斯坦福大學領導的新研究,分析了跨多個行業(yè)的超過3億條文本樣本,發(fā)現(xiàn)人工智能語言模型現(xiàn)在在各行業(yè)的專業(yè)溝通中提供了高達四分之一的寫作支持,尤其是在美國教育水平較低的地區(qū)影響顯著。
Zoom Communications的研究團隊開發(fā)了一種突破性技術,能夠顯著降低人工智能系統(tǒng)在處理復雜推理問題時所需的成本和計算資源,可能會改變企業(yè)大規(guī)模部署AI的方式。該方法稱為草稿鏈(Chain of Draft,CoD),使大型語言模型能夠用最少的文字解決問題——所需文本僅為當前方法的7.6%,同時保持或甚至提高準確性。研究結(jié)果上周在arXiv研究庫中發(fā)表。
Opera瀏覽器現(xiàn)在擁有“代理AI”,用戶可以請求內(nèi)置的AI模型執(zhí)行需要一系列瀏覽器內(nèi)操作的任務。雖然這項技術展示可能有趣,但實際上它只是將網(wǎng)絡瀏覽委托給一個能力有限的個人助手。AI代理被稱為瀏覽器操作員,可以幫助用戶找到可購買的12雙10碼Nike襪子。盡管用戶可以在15秒內(nèi)通過訪問Walmart在線商店完成相同操作,但這項技術的推出標志著瀏覽器角色的轉(zhuǎn)變。
一項新研究發(fā)現(xiàn),深度搜索(DeepSeek)生成的文本中,有驚人的 74.2% 與 OpenAI 的 ChatGPT 輸出在風格上有顯著相似性。這一發(fā)現(xiàn)表明,深度搜索可能是基于 ChatGPT 的輸出進行訓練的。
Microsoft 終于為其免費的生成式 AI 聊天機器人 Copilot 推出了 macOS 應用。這款應用類似于 ChatGPT,可以幫助用戶完成多項任務,如起草郵件、總結(jié)文檔和撰寫求職信等。新應用為 Mac 用戶提供了專屬體驗,但需要 macOS 14.0 或更高版本,以及搭載 Apple M1 或更新芯片的 Mac 設備。
OpenAI推出的GPT-4.5企業(yè)版引發(fā)了爭議,其高昂價格讓許多人質(zhì)疑其性價比。然而,作為OpenAI最大且最強大的非推理模型,GPT-4.5在知識儲備、文檔處理、任務規(guī)劃等方面表現(xiàn)出色。盡管成本高昂,但隨著推理成本的下降和未來潛在的強化學習訓練,GPT-4.5仍有望成為企業(yè)應用的有力工具。
ServiceNow 攜手 NVIDIA 推出電信行業(yè)專用 AI 智能代理,旨在提升客戶服務和網(wǎng)絡運營效率。這些 AI 代理能夠自主分析網(wǎng)絡數(shù)據(jù)、解決問題、優(yōu)化賬單等,有望為電信服務提供商帶來顯著的生產(chǎn)力提升和價值創(chuàng)造。新功能將于 3 月 12 日在 ServiceNow 平臺的最新版本中向所有電信客戶開放。
Inception Labs 于周四發(fā)布了 Mercury Coder,這是一種新的 AI 語言模型,利用擴散技術比傳統(tǒng)模型更快地生成文本。與逐字生成文本的傳統(tǒng)模型(如 ChatGPT)不同,基于擴散的模型(如 Mercury)能夠同時生成完整的響應,并將其從最初的遮蔽狀態(tài)逐步精煉為連貫的文本。
微軟終于將其 AI 助手 Copilot 作為獨立應用程序推出 macOS 版本。這款免費應用現(xiàn)已在 Mac App Store 上線,支持多種功能如文本翻譯、問題解答、文檔生成等。Copilot 采用 OpenAI 的 GPT-4 和 DALL-E 3 等模型,標志著微軟在 AI 領域的重要布局。該應用要求 M1 或更新的 Mac 設備,以及 macOS 14 或更高版本。
OpenAI 發(fā)布 ChatGPT 4.5 預覽版,承諾對話更自然、情感智能更強、知識面更廣。新模型能更好理解語境和細微差別,創(chuàng)造力和協(xié)作能力提升,幻覺現(xiàn)象減少。這一升級體現(xiàn)了 AI 向著匹敵甚至超越人類能力的目標邁進,為未來更強大的 GPT-5 奠定基礎。
亞馬遜正在重塑其旗艦語音助手 Alexa,通過整合 AI 代理、模型混合和瀏覽器操作能力,打造更智能的 Alexa+。新版本不僅可以主動提供個性化信息,還能理解復雜指令并完成多步驟任務。亞馬遜希望通過這種創(chuàng)新方式,讓 Alexa 成為更強大、更智能的家庭語音助手。
亞馬遜在周三分享了一個令人印象深刻的“代理”未來愿景——在這個未來中,改進后的 Alexa+ 將處理無數(shù)日常任務,從預訂餐廳到尋找家電維修工。如果亞馬遜能夠?qū)崿F(xiàn)這一目標,它可能會成為首個推出全面、以消費者為中心的代理工具的公司。該公司希望將更自然、更具表現(xiàn)力的 Alexa(由生成性 AI 模型驅(qū)動)與能夠以完全自主、智能的方式接入第一方和第三方應用、服務及平臺的能力結(jié)合起來。
Akool推出了一項創(chuàng)新技術,將生成式AI模型與2D頭像相結(jié)合,創(chuàng)造出栩栩如生的虛擬角色。用戶只需上傳照片和錄音,即可定制個性化頭像,實現(xiàn)與AI模型的自然交互。這項技術可廣泛應用于電商、教育、醫(yī)療等領域,大幅提升用戶體驗和參與度。Akool的解決方案已為多家全球品牌節(jié)省了大量制作成本,加速了市場拓展。