
把兩款主力大模型免費,百度是怎么想的?

價格戰(zhàn)打到免費,只為“賠錢賺吆喝”?
在互聯(lián)網(wǎng)企業(yè)的競技場上,價格戰(zhàn)早已司空見慣。通常,價格戰(zhàn)會出現(xiàn)在行業(yè)發(fā)展的中后期,那時技術(shù)和市場都趨于成熟、競爭格局明朗,廠商通過降價策略搶奪蛋糕。但在大模型行業(yè),情況卻不盡相同,這場價格戰(zhàn)打得異常激烈且提前到來,企業(yè)們尚未收回前期燒掉的錢,競爭的火焰就已熊熊燃起。
從上個月初開始,國內(nèi)的大模型企業(yè)紛紛調(diào)降產(chǎn)品和服務的價格。在一連串“全線降價”和“遠低于行業(yè)均價”的營銷聲浪中,百度智能云直接宣布兩款主力模型免費,且立即生效,此舉無疑撼動了整個大模型市場的價格體系。
那么,百度云為什么要采取這樣激進的策略?
大模型廠商集體“賠錢賺吆喝”?
事實上,國內(nèi)這場大模型價格戰(zhàn)是從AI公司DeepSeek開始的。5月6日,DeepSeek率先將旗下對標GPT-4的大模型DeepSeek-V2價格大幅下調(diào)至GPT-4-Turbo的1%,每百萬tokens僅需1元。緊接著,智譜AI和字節(jié)跳動也相繼調(diào)整價格,形成了一股降價潮。
面對這一趨勢,其他模型廠商不得不加入價格戰(zhàn)。阿里云將通義千問主力模型Qwen-Long價格直降97%,聲稱“擊穿全球底價”。而僅過了數(shù)小時,百度智能云便宣布其文心大模型的ENIRE Speed和ENIRE Lite模型全面免費。據(jù)了解,該兩款模型免費開放半個月內(nèi),日調(diào)用量翻了10倍。
當前的價格戰(zhàn)主要體現(xiàn)在token降價的層面上。從商業(yè)模式的角度看,大模型廠商把經(jīng)過訓練的模型以API形式銷售,計費法則一般按token所對應的漢字、字母的使用量來計算,有些類似于我們熟悉的手機流量套餐,只不過變了計算單位。
不過要注意的是,大模型行業(yè)尚未成熟,核心依然是提升技術(shù)和拓展應用。當前的價格戰(zhàn)不僅是廠商們對市場焦慮的反應,也顯示了在用戶增長停滯和缺乏市場爆款應用的背景下,降價成為吸引開發(fā)者和用戶的首選策略。大模型廠商試圖以價格上的“退”,換取用戶增長上的“進”。
而對于兼具大模型廠商和云服務商雙重身份的百度云、阿里云、騰訊云來說,這場價格戰(zhàn)可能不只是單純的價格競爭,更是一種通過低價大模型吸引用戶,進而拉動背后云消費的戰(zhàn)略。
當然,這并非是盲目降價,隨著大模型技術(shù)的不斷發(fā)展和優(yōu)化,大模型推理成本已經(jīng)大幅下降,模型訓練所需的邊際時間和資源也逐漸減少,因此大模型廠商們有了更多底氣來調(diào)整價格。
百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏就曾透露,相比一年前,文心大模型的訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理性能提升了105倍,推理成本則降到了原來的1%。換言之,客戶原來一天調(diào)用1萬次,同樣成本之下,現(xiàn)在一天可以調(diào)用100萬次。
百度智能云事業(yè)群總裁沈抖強調(diào),“價格只是消費者選擇大模型的一個考量因素。比起價格,更重要的是模型效果、應用場景、已落地案例。這幾年,百度一直在用技術(shù)手段降低企業(yè)使用大模型的成本,尤其是業(yè)界最高效的AI異構(gòu)算力管理平臺和‘一云多芯’。我們希望通過降價讓大家創(chuàng)新的膽子更大一些、步子更快一些,快速探索并復制更多大模型可能的應用場景。”
不論怎樣,大模型價格下降對市場和消費者都是利好,AI應用門檻降下來,企業(yè)創(chuàng)新試錯的成本在很大程度上減小了,就會有更多的人使用,而大的使用量,才能打磨出好模型。
AI大模型給百度帶來了什么?
作為中國首個發(fā)布大模型的平臺,百度在這一領(lǐng)域擁有明顯的先發(fā)優(yōu)勢,AI產(chǎn)品體系相對完備。百度的文心大模型系列涵蓋了旗艦版的ERNIE 3.5和4.0,和輕量版的ERNIE Speed、Lite、Tiny等多個版本。這次百度免費開放的便是ENIRE Speed和ENIRE Lite這兩款小尺寸模型,這兩款產(chǎn)品都在今年3月推出,支持8K和128k的上下文長度。
根據(jù)官方介紹,百度自研的大語言模型ENIRE Speed,通用能力優(yōu)異,適合作為基座模型進行精調(diào),更好地處理特定場景問題,并具備優(yōu)秀的推理性能。而ENIRE Lite作為百度自研的輕量級大語言模型,兼顧優(yōu)異的模型效果與推理性能,適合低算力AI加速卡推理使用。
盡管這兩款模型的規(guī)模不大,但對于初創(chuàng)企業(yè)和開發(fā)者來說或許已經(jīng)足夠。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏在2024百度AI開發(fā)者大會上表示:“小模型推理成本低,響應速度快,在一些特定場景中,經(jīng)過SFT(監(jiān)督)精調(diào)后的小模型,它的使用效果可以媲美大模型。這就是我們發(fā)布ERNIE Speed、Lite、Tiny三個輕量模型的原因。”
從文心大模型的實際應用情況看,據(jù)了解,其每日處理的Tokens文本數(shù)量約為2500億,日均API調(diào)用量超過2億次,服務的客戶或企業(yè)數(shù)量達到8.5萬,可以看出市場對百度AI技術(shù)的需求強勁。
AI大模型也為百度云帶來了新的收入來源。反映在財務數(shù)據(jù)上,百度2024年Q1財報顯示,百度總營收315億元,同比增長1%,智能云業(yè)務部分營收47億元,同比增長12%,其中有6.9%來自外部客戶使用大模型及生成式AI相關(guān)服務。以此計算,當季生成式AI給百度云帶來的收入約為3.24億元。
在當前激烈價格戰(zhàn)的背景下,廠商們急需在持續(xù)的技術(shù)創(chuàng)新和成本控制之間找到平衡點,百度亦是如此。而這場提前開始的價格戰(zhàn),大概率會加速大模型行業(yè)的“大浪淘沙”,但這似乎也是行業(yè)發(fā)展過程中的必經(jīng)階段。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
