把兩款主力大模型免費(fèi),百度是怎么想的?
價(jià)格戰(zhàn)打到免費(fèi),只為“賠錢賺吆喝”?
在互聯(lián)網(wǎng)企業(yè)的競(jìng)技場(chǎng)上,價(jià)格戰(zhàn)早已司空見慣。通常,價(jià)格戰(zhàn)會(huì)出現(xiàn)在行業(yè)發(fā)展的中后期,那時(shí)技術(shù)和市場(chǎng)都趨于成熟、競(jìng)爭(zhēng)格局明朗,廠商通過降價(jià)策略搶奪蛋糕。但在大模型行業(yè),情況卻不盡相同,這場(chǎng)價(jià)格戰(zhàn)打得異常激烈且提前到來,企業(yè)們尚未收回前期燒掉的錢,競(jìng)爭(zhēng)的火焰就已熊熊燃起。
從上個(gè)月初開始,國(guó)內(nèi)的大模型企業(yè)紛紛調(diào)降產(chǎn)品和服務(wù)的價(jià)格。在一連串“全線降價(jià)”和“遠(yuǎn)低于行業(yè)均價(jià)”的營(yíng)銷聲浪中,百度智能云直接宣布兩款主力模型免費(fèi),且立即生效,此舉無疑撼動(dòng)了整個(gè)大模型市場(chǎng)的價(jià)格體系。
那么,百度云為什么要采取這樣激進(jìn)的策略?
大模型廠商集體“賠錢賺吆喝”?
事實(shí)上,國(guó)內(nèi)這場(chǎng)大模型價(jià)格戰(zhàn)是從AI公司DeepSeek開始的。5月6日,DeepSeek率先將旗下對(duì)標(biāo)GPT-4的大模型DeepSeek-V2價(jià)格大幅下調(diào)至GPT-4-Turbo的1%,每百萬(wàn)tokens僅需1元。緊接著,智譜AI和字節(jié)跳動(dòng)也相繼調(diào)整價(jià)格,形成了一股降價(jià)潮。
面對(duì)這一趨勢(shì),其他模型廠商不得不加入價(jià)格戰(zhàn)。阿里云將通義千問主力模型Qwen-Long價(jià)格直降97%,聲稱“擊穿全球底價(jià)”。而僅過了數(shù)小時(shí),百度智能云便宣布其文心大模型的ENIRE Speed和ENIRE Lite模型全面免費(fèi)。據(jù)了解,該兩款模型免費(fèi)開放半個(gè)月內(nèi),日調(diào)用量翻了10倍。
當(dāng)前的價(jià)格戰(zhàn)主要體現(xiàn)在token降價(jià)的層面上。從商業(yè)模式的角度看,大模型廠商把經(jīng)過訓(xùn)練的模型以API形式銷售,計(jì)費(fèi)法則一般按token所對(duì)應(yīng)的漢字、字母的使用量來計(jì)算,有些類似于我們熟悉的手機(jī)流量套餐,只不過變了計(jì)算單位。
不過要注意的是,大模型行業(yè)尚未成熟,核心依然是提升技術(shù)和拓展應(yīng)用。當(dāng)前的價(jià)格戰(zhàn)不僅是廠商們對(duì)市場(chǎng)焦慮的反應(yīng),也顯示了在用戶增長(zhǎng)停滯和缺乏市場(chǎng)爆款應(yīng)用的背景下,降價(jià)成為吸引開發(fā)者和用戶的首選策略。大模型廠商試圖以價(jià)格上的“退”,換取用戶增長(zhǎng)上的“進(jìn)”。
而對(duì)于兼具大模型廠商和云服務(wù)商雙重身份的百度云、阿里云、騰訊云來說,這場(chǎng)價(jià)格戰(zhàn)可能不只是單純的價(jià)格競(jìng)爭(zhēng),更是一種通過低價(jià)大模型吸引用戶,進(jìn)而拉動(dòng)背后云消費(fèi)的戰(zhàn)略。
當(dāng)然,這并非是盲目降價(jià),隨著大模型技術(shù)的不斷發(fā)展和優(yōu)化,大模型推理成本已經(jīng)大幅下降,模型訓(xùn)練所需的邊際時(shí)間和資源也逐漸減少,因此大模型廠商們有了更多底氣來調(diào)整價(jià)格。
百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏就曾透露,相比一年前,文心大模型的訓(xùn)練效率提升到了原來的5.1倍,周均訓(xùn)練有效率達(dá)到98.8%,推理性能提升了105倍,推理成本則降到了原來的1%。換言之,客戶原來一天調(diào)用1萬(wàn)次,同樣成本之下,現(xiàn)在一天可以調(diào)用100萬(wàn)次。
百度智能云事業(yè)群總裁沈抖強(qiáng)調(diào),“價(jià)格只是消費(fèi)者選擇大模型的一個(gè)考量因素。比起價(jià)格,更重要的是模型效果、應(yīng)用場(chǎng)景、已落地案例。這幾年,百度一直在用技術(shù)手段降低企業(yè)使用大模型的成本,尤其是業(yè)界最高效的AI異構(gòu)算力管理平臺(tái)和‘一云多芯’。我們希望通過降價(jià)讓大家創(chuàng)新的膽子更大一些、步子更快一些,快速探索并復(fù)制更多大模型可能的應(yīng)用場(chǎng)景。”
不論怎樣,大模型價(jià)格下降對(duì)市場(chǎng)和消費(fèi)者都是利好,AI應(yīng)用門檻降下來,企業(yè)創(chuàng)新試錯(cuò)的成本在很大程度上減小了,就會(huì)有更多的人使用,而大的使用量,才能打磨出好模型。
AI大模型給百度帶來了什么?
作為中國(guó)首個(gè)發(fā)布大模型的平臺(tái),百度在這一領(lǐng)域擁有明顯的先發(fā)優(yōu)勢(shì),AI產(chǎn)品體系相對(duì)完備。百度的文心大模型系列涵蓋了旗艦版的ERNIE 3.5和4.0,和輕量版的ERNIE Speed、Lite、Tiny等多個(gè)版本。這次百度免費(fèi)開放的便是ENIRE Speed和ENIRE Lite這兩款小尺寸模型,這兩款產(chǎn)品都在今年3月推出,支持8K和128k的上下文長(zhǎng)度。
根據(jù)官方介紹,百度自研的大語(yǔ)言模型ENIRE Speed,通用能力優(yōu)異,適合作為基座模型進(jìn)行精調(diào),更好地處理特定場(chǎng)景問題,并具備優(yōu)秀的推理性能。而ENIRE Lite作為百度自研的輕量級(jí)大語(yǔ)言模型,兼顧優(yōu)異的模型效果與推理性能,適合低算力AI加速卡推理使用。
盡管這兩款模型的規(guī)模不大,但對(duì)于初創(chuàng)企業(yè)和開發(fā)者來說或許已經(jīng)足夠。百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏在2024百度AI開發(fā)者大會(huì)上表示:“小模型推理成本低,響應(yīng)速度快,在一些特定場(chǎng)景中,經(jīng)過SFT(監(jiān)督)精調(diào)后的小模型,它的使用效果可以媲美大模型。這就是我們發(fā)布ERNIE Speed、Lite、Tiny三個(gè)輕量模型的原因。”
從文心大模型的實(shí)際應(yīng)用情況看,據(jù)了解,其每日處理的Tokens文本數(shù)量約為2500億,日均API調(diào)用量超過2億次,服務(wù)的客戶或企業(yè)數(shù)量達(dá)到8.5萬(wàn),可以看出市場(chǎng)對(duì)百度AI技術(shù)的需求強(qiáng)勁。
AI大模型也為百度云帶來了新的收入來源。反映在財(cái)務(wù)數(shù)據(jù)上,百度2024年Q1財(cái)報(bào)顯示,百度總營(yíng)收315億元,同比增長(zhǎng)1%,智能云業(yè)務(wù)部分營(yíng)收47億元,同比增長(zhǎng)12%,其中有6.9%來自外部客戶使用大模型及生成式AI相關(guān)服務(wù)。以此計(jì)算,當(dāng)季生成式AI給百度云帶來的收入約為3.24億元。
在當(dāng)前激烈價(jià)格戰(zhàn)的背景下,廠商們急需在持續(xù)的技術(shù)創(chuàng)新和成本控制之間找到平衡點(diǎn),百度亦是如此。而這場(chǎng)提前開始的價(jià)格戰(zhàn),大概率會(huì)加速大模型行業(yè)的“大浪淘沙”,但這似乎也是行業(yè)發(fā)展過程中的必經(jīng)階段。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼