人工智能領域正在通過改進模型工作方式來釋放新功能。研究人員開發(fā)了一種名為"SVDquant"的4位量化系統(tǒng),可以使擴散模型運行速度提高3倍,同時提升圖像質量和兼容性。這種技術通過壓縮參數和激活值來大幅降低內存和處理需求,為資源受限的系統(tǒng)帶來新的可能性。
微軟發(fā)布了名為 Phi-4 的小型語言模型的開源代碼。該模型具有 140 億參數,能夠生成文本和解決數學問題。經過內部評估,Phi-4 在某些基準測試中的表現優(yōu)于參數量是其 5 倍的大型模型。這一舉動加入了科技巨頭開源小型語言模型的潮流中。