根據(jù)發(fā)布的o3測試數(shù)據(jù)顯示,美國AIME數(shù)學(xué)競賽中達(dá)到了96.7分,大幅度超過了o1預(yù)覽版的56.7和o1的83.3%,僅錯(cuò)了一道題相當(dāng)于一名頂級數(shù)學(xué)家的水平。
偏好微調(diào)特別適合那些對回答格式、語氣或者抽象特質(zhì)(如友好度、創(chuàng)造力)有較高要求的應(yīng)用場合。例如,在構(gòu)建金融咨詢聊天機(jī)器人時(shí),開發(fā)團(tuán)隊(duì)不僅希望模型能夠提供專業(yè)且準(zhǔn)確的財(cái)務(wù)建議,還期望它能保持友好和易于理解的溝通方式。
ChatGPT還與超級應(yīng)用WhatsApp完成了集成,同樣是這個(gè)號碼可以直接發(fā)短信咨詢各種內(nèi)容,使用方法和web、移動(dòng)版本一樣。
新增的功能包括,實(shí)時(shí)搜索,OpenAI對搜索的算法進(jìn)行了深度優(yōu)化,可在用戶提出問題后獲取實(shí)時(shí)內(nèi)容(分鐘級別),包括股票、新聞等;高級語音,在高級語音模式下,用戶可以與ChatGPT進(jìn)行更自然的多輪搜索對話,更像是一位語音搜索管家;
Phi系列模型自今已經(jīng)發(fā)布了5代,Phi-4也延續(xù)了之前的小參數(shù)模式只有140億。但在GPQA研究生水平、MATH數(shù)學(xué)基準(zhǔn)中,分別達(dá)到了56.1和80.4超過了GPT-4o,同時(shí)也超過了同類型的開源模型Qwen 2.5 -14B和Llama-3.3-70B。
現(xiàn)在ChatGPT已經(jīng)從一個(gè)單一的AI對話,演變成一個(gè)高效率的協(xié)作平臺,無論是開發(fā)代碼、分析文件、搜索新聞都非常方便,成為提升工作效率的利器。
Canvas直接內(nèi)置在ChatGPT中,提供了一個(gè)單獨(dú)的窗口,主要用于編程、寫作任務(wù),會提供意見、審核和執(zhí)行具體的功能,可以提供更細(xì)致的服務(wù)。
Sora的核心技術(shù)之一便是對Patch的應(yīng)用。它允許Sora在大量的圖像和視頻數(shù)據(jù)上進(jìn)行密集訓(xùn)練。從每一個(gè)存在的視頻中剪出的Patch,可以被堆疊起來并輸入到模型中。
谷歌DeepMind研究人員則直接把這項(xiàng)技術(shù)集成到AI Agent中開發(fā)了Talker-Reasoner框架,讓其具備“快”、“慢”兩種擬人化思考方式。這對于解決復(fù)雜、冗長的任務(wù)來說幫助巨大,也突破了傳統(tǒng)AI Agent執(zhí)行業(yè)務(wù)流程的方法,極大提升了效率。
用反向提綱測試你的邏輯。反向提綱是一種通過識別每個(gè)段落的要點(diǎn)來評估文章結(jié)構(gòu)的技術(shù)。能一目了然地看懂結(jié)構(gòu),可以幫助你退后一步并評估思想的邏輯流程。
這個(gè)模型的最大特色便是深度思維鏈推理,尤其是在數(shù)學(xué)、代碼以及各種復(fù)雜推理任務(wù)上,可以生成數(shù)萬字的推理流程,讓用戶深度了解模型生成內(nèi)容的全過程。
最近OpenAI受到了嚴(yán)重的離職風(fēng)波影響,首席科學(xué)家Ilya Sutskever,首席技術(shù)官M(fèi)ira Murati,安全團(tuán)隊(duì)負(fù)責(zé)人Lilian Weng等高管相繼離職。
OpenAI首席執(zhí)行官Sam Altman公開確認(rèn)購買了該域名,沒有說收購價(jià)格。但肯定比之前1100萬美元收購的AI.com(也是跳轉(zhuǎn)到ChatGPT)貴很多。
騰訊開源了基于Transformer架構(gòu)的Hunyuan-Large模型,擁有3890億參數(shù),優(yōu)于Meta的LLama3.1 - 405B模型。Hunyuan-Large采用MoE結(jié)構(gòu),高效訓(xùn)練和推理,支持長達(dá)256K上下文。使用了KV緩存壓縮技術(shù),減少內(nèi)存占用。訓(xùn)練數(shù)據(jù)包括7萬億token,包括高質(zhì)量合成數(shù)據(jù)。模型在CommonsenseQA、PIQA、WinoGrande等測試中表現(xiàn)優(yōu)異。
用戶通過自然語言就能獲取各種網(wǎng)絡(luò)信息,例如,幫我看看今天華爾街日報(bào)的頭條新聞是什么;雅虎體育板塊中的NBA熱門新聞?dòng)心男;CNBC的熱門財(cái)經(jīng)新聞報(bào)道了哪些內(nèi)容,ChatGPT都能快速幫你找到這些并附帶原始鏈接。
微軟研究人員開源了純視覺GUI智能體OmniParser,能夠?qū)⒂脩艚缑娼貓D解析為結(jié)構(gòu)化元素,增強(qiáng)大語言模型如GPT-4V在理解和推理視覺內(nèi)容方面的能力。OmniParser通過圖標(biāo)檢測、圖標(biāo)描述和OCR模塊協(xié)同工作,生成用戶界面的結(jié)構(gòu)化表示,并提升模型在UI識別操作任務(wù)中的性能。在多個(gè)基準(zhǔn)測試中,與OmniParser集成的GPT-4V性能得到顯著提升。
目前,很多大模型會出現(xiàn)一本正經(jīng)胡說八道的問題,例如,你提問NBA歷史上得分最多的是誰,它回答是邁克爾喬丹,實(shí)際上是勒布朗詹姆斯。包括OpenAI自己發(fā)布的GPT-4o、o1-preview、o1mini等前沿模型都有這些“幻覺”難題。
OpenAI宣布ChatGPT新增重磅功能——聊天記錄搜索。用戶可以快速一鍵搜索自己的聊天記錄,或者從中斷的地方繼續(xù)聊天了。無論你開了多少個(gè)聊天頁面、這個(gè)聊天有多難找,都能通過一鍵搜索輕松把它找出來。
Sierra AI主要通過OpenAI的GPT-4o、o1等模型打造了一個(gè)對話式AI Agent平臺,主要聚焦在客戶服務(wù)領(lǐng)域,可以混合處理文本、語音自動(dòng)執(zhí)行超復(fù)雜工作流程。包括客服咨詢、退訂商單、訂閱更新等。
專業(yè)社區(qū)關(guān)注大語言模型(LLM)如微軟&OpenAI、百度文心一言、訊飛星火的發(fā)展。OpenAI計(jì)劃推出性能遠(yuǎn)超GPT-4的Orion模型,但首席執(zhí)行官Sam Altman否認(rèn)相關(guān)消息。網(wǎng)友質(zhì)疑Sam的辟謠,認(rèn)為Orion項(xiàng)目的存在已被暗示。微軟可能在Azure云上提供Orion服務(wù)。Sam的推文和ChatGPT-o1的解讀進(jìn)一步加深了Orion即將發(fā)布的猜測。