人工智能初創(chuàng)公司Zyphra推出了兩款開源文本轉(zhuǎn)語(yǔ)音模型,聲稱只需5秒樣本音頻就能克隆聲音。測(cè)試顯示,使用不到30秒的錄音即可生成逼真效果。這項(xiàng)技術(shù)雖然存在濫用風(fēng)險(xiǎn),但也有積極應(yīng)用前景,如幫助失聲者重獲聲音。該模型采用開源許可證發(fā)布,為語(yǔ)音合成領(lǐng)域帶來(lái)新的可能。
上海人工智能實(shí)驗(yàn)室對(duì)書生大模型進(jìn)行重要版本升級(jí),書生·浦語(yǔ)3.0(InternLM3)通過(guò)精煉數(shù)據(jù)框架,大幅提升了數(shù)據(jù)效率,并實(shí)現(xiàn)思維密度的躍升。僅使用4T訓(xùn)練數(shù)據(jù)的InternLM3-8B-Instruct,其綜合性能超過(guò)了同量級(jí)開源模型,節(jié)約訓(xùn)練成本75%以上;同時(shí),書生·浦語(yǔ)3.0首次在通用模型中實(shí)現(xiàn)了常規(guī)對(duì)話與深度思考能力融合,可應(yīng)對(duì)更多真實(shí)使用場(chǎng)景。
上海AI實(shí)驗(yàn)室的研究團(tuán)隊(duì)創(chuàng)新性地設(shè)計(jì)了元?jiǎng)幼魉伎挤妒絹?lái)引導(dǎo)模型的搜索空間,使模型更高效地習(xí)得和產(chǎn)生多樣化的推理策略組合;基于通專融合的方式進(jìn)行數(shù)據(jù)合成,并通過(guò)構(gòu)建大規(guī)模沙盒環(huán)境獲取反饋,在不依賴o1這類已有強(qiáng)推理模型的情況下,實(shí)現(xiàn)高質(zhì)量思維鏈的獨(dú)立構(gòu)建,并大幅提升模型的復(fù)雜任務(wù)處理性能。
這個(gè)模型的最大特色便是深度思維鏈推理,尤其是在數(shù)學(xué)、代碼以及各種復(fù)雜推理任務(wù)上,可以生成數(shù)萬(wàn)字的推理流程,讓用戶深度了解模型生成內(nèi)容的全過(guò)程。