ElevenLabs是一家剛剛完成1.8億美元融資的人工智能初創(chuàng)公司,主要以其音頻生成能力而聞名。該公司通過推出首個獨立的語音轉文本模型Scribe,邁出了另一個技術方向。該初創(chuàng)公司估值為33億美元,已幫助許多其他公司提供語音轉文本服務,利用其龐大的聲音庫。然而,該公司現在希望進入語音檢測領域,與Gladia、Speechmatics、AssemblyAI、Deepgram和OpenAI的Whisper模型競爭。
OpenAI 推出代號"Orion"的 GPT-4.5 模型,這是公司迄今最大規(guī)模的 AI 模型。GPT-4.5 在計算能力和訓練數據方面均超越以往版本,但 OpenAI 并不認為它是前沿模型。該模型將逐步向付費用戶開放,但運營成本高昂。盡管在某些基準測試中表現出色,但 GPT-4.5 在部分任務上仍落后于其他 AI 推理模型,凸顯了傳統(tǒng)預訓練方法的局限性。
亞馬遜正在重塑其旗艦語音助手 Alexa,通過整合 AI 代理、模型混合和瀏覽器操作能力,打造更智能的 Alexa+。新版本不僅可以主動提供個性化信息,還能理解復雜指令并完成多步驟任務。亞馬遜希望通過這種創(chuàng)新方式,讓 Alexa 成為更強大、更智能的家庭語音助手。
亞馬遜在周三分享了一個令人印象深刻的“代理”未來愿景——在這個未來中,改進后的 Alexa+ 將處理無數日常任務,從預訂餐廳到尋找家電維修工。如果亞馬遜能夠實現這一目標,它可能會成為首個推出全面、以消費者為中心的代理工具的公司。該公司希望將更自然、更具表現力的 Alexa(由生成性 AI 模型驅動)與能夠以完全自主、智能的方式接入第一方和第三方應用、服務及平臺的能力結合起來。
微軟推出了新一代高效 AI 模型 Phi-4,可同時處理文本、圖像和語音,且計算資源需求大幅降低。其中 Phi-4-Multimodal 僅有 56 億參數,Phi-4-Mini 僅有 38 億參數,性能卻超越同等規(guī)模競品,甚至在某些任務上媲美兩倍大小的模型。這一突破性進展為開發(fā)者提供了先進的 AI 能力,有望推動邊緣計算和普及 AI 應用。
阿里云開源了其視頻基礎模型系列,為企業(yè)和研究人員提供視頻創(chuàng)作能力。這包括兩個版本的四個模型,分別擁有140億和13億參數。這些模型可以從文本和圖像輸入生成高質量視頻,支持中英文文本效果,并在視頻生成模型基準測試中表現出色。此舉旨在降低AI應用門檻,讓更多企業(yè)能夠創(chuàng)建高質量視覺內容。
亞馬遜推出Alexa+訂閱服務,大幅提升Alexa的對話和任務處理能力。它能理解日常用語,執(zhí)行復雜指令,并整合多種第三方服務。Prime會員可免費使用,非會員每月需付20美元。這項服務旨在提升Alexa的盈利能力,但也引發(fā)了隱私和數據使用方面的擔憂。
盡管風險投資市場依然緊張,但每個月仍有新的獨角獸公司誕生。根據 Crunchbase 和 PitchBook 的數據,TechCrunch 跟蹤了截至 1 月底新成立的風險投資支持的獨角獸初創(chuàng)公司。這些公司包括醫(yī)療保健公司 Hippocratic AI 和衛(wèi)星公司 Loft Orbital。此列表將在全年更新,敬請關注今年的強勁企業(yè)!
Akool推出了一項創(chuàng)新技術,將生成式AI模型與2D頭像相結合,創(chuàng)造出栩栩如生的虛擬角色。用戶只需上傳照片和錄音,即可定制個性化頭像,實現與AI模型的自然交互。這項技術可廣泛應用于電商、教育、醫(yī)療等領域,大幅提升用戶體驗和參與度。Akool的解決方案已為多家全球品牌節(jié)省了大量制作成本,加速了市場拓展。
高通和諾基亞貝爾實驗室成功展示了多廠商AI模型在無線網絡中的互操作性。通過序列學習技術,他們實現了編碼器和解碼器模型的無縫協(xié)作,提高了網絡效率和用戶體驗。這項突破性成果為AI在無線通信領域的應用開辟了新的可能性,有望顯著提升網絡容量、可靠性和能源效率。
一家新創(chuàng)公司希望幫助開發(fā)者創(chuàng)建定制化的上下文編碼助手,這些助手可以與任何模型連接,并與他們的開發(fā)環(huán)境無縫集成。Continue成立于2023年6月,由首席執(zhí)行官Ty Dunn和首席技術官Nate Sesti創(chuàng)辦,作為Y Combinator的校友,Continue在過去幾年中已經在GitHub上獲得了約23,000個星標,并在Discord社區(qū)中擁有11,000名成員。為了進一步發(fā)展,Continue宣布其產品的1.0版本,并獲得了300萬美元的種子資金支持。
這篇文章探討了如何使用人工智能工具 goblin.tools 來改善工作郵件的語氣,避免不必要的冒犯。作者分享了自己在準備一項活動時的挫折感,并介紹了 goblin.tools 的功能,特別是其“Formalizer”工具,能夠將郵件內容轉化為更專業(yè)、更禮貌的表達。通過使用這個工具,作者發(fā)現自己能夠更有效地傳達需求,同時保持良好的溝通關系。
Flexport 推出一系列新產品和功能,大多基于 AI 技術。這是公司首次嘗試半年一次的產品發(fā)布模式,靈感來自 Airbnb。新產品旨在提高物流效率,包括自然語言查詢和全網絡可視化控制等功能。Flexport 希望通過 AI 實現自動化,同時保持"以人為本"的服務理念。
Inova健康系統(tǒng)是弗吉尼亞州最大的醫(yī)療系統(tǒng),致力于滿足城市人口日益增長的醫(yī)療需求。首席信息與數字官馬修·庫爾負責傳統(tǒng)IT職能及人工智能、分析和流程改進等數字化項目。他的愿景是創(chuàng)建一個“數據流暢的組織”,確保所有決策都有堅實的證據支持。Inova通過與臨床醫(yī)生的合作,推動前沿研究,特別是在女性健康領域,同時重視數據隱私和安全,利用人工智能減輕行政負擔,提升患者護理效率。
隨著人工智能(AI)滲透到連接生產和工程的世界,AI的成熟度和創(chuàng)建強大AI模型的能力推動工業(yè)部門進入一個基于經驗代理和生成經濟的新紀元。
IBM 公司今天推出了新的 Granite AI 模型系列,具備實驗性推理、視覺和預測能力,旨在在企業(yè)人工智能市場中占據一席之地。所有 Granite 模型均在 Apache 2.0 開源許可證下開放,現已在 Hugging Face 和 IBM watson.ai 等平臺上提供。新系列的旗艦產品是 Granite 3.2 Instruct 變體,支持文本處理,能夠執(zhí)行摘要、問題解決和代碼生成等任務,并設計為遵循指令。
社會要信任人工智能需要什么?人工智能算法生成的每一個決策、預測和洞察都依賴于數據的可用性和質量。為了充分發(fā)揮人工智能的潛力,數據必須有效且高效地存儲。換句話說,數據支撐著人工智能,而存儲則支撐著數據。這種相互促進的關系使得人工智能也推動了當今存儲創(chuàng)新的發(fā)展。要理解人工智能如何幫助創(chuàng)造更好的存儲解決方案,我們首先需要考察它與數據的關系。
埃隆·馬斯克的人工智能公司 xAI 推出了備受期待的旗艦 AI 模型 Grok 3。新模型推出后,Grok 應用的下載量和活躍用戶數大幅增長。然而,近期圍繞 Grok 3 的爭議可能會影響用戶的熱情。能否保持增長勢頭并留住用戶,成為 xAI 面臨的重要挑戰(zhàn)。
Google 宣布面向個人開發(fā)者的 Gemini Code Assist 正式推出公開預覽版。這款強大的 AI 編程助手每月提供高達 18 萬次代碼補全,遠超其他同類產品。它支持多種編程語言和開發(fā)環(huán)境,通過自然語言交互為用戶提供代碼生成、補全和調試等全方位輔助,旨在讓學生、愛好者和自由職業(yè)者等個人開發(fā)者也能便捷地使用先進的 AI 編程工具。
隨著生成式人工智能和 GPU 加速 AI 訓練與推理的興起,數據中心仍需關注 CPU 的重要性,F代化 CPU 不僅可以提升傳統(tǒng)工作負載性能,還能幫助企業(yè)為昂貴的 AI 基礎設施投資節(jié)省成本。高性能 CPU 可以顯著提升 AI 推理和訓練效率,同時在某些場景下直接運行 AI 算法。企業(yè)應考慮采用單插槽服務器等創(chuàng)新方案,以優(yōu)化數據中心架構。