
追趕ChatGPT,文心一言需要兩個(gè)月

但對于百度來說,這兩個(gè)月什么時(shí)候能追上,才是更重要的問題。
舞臺上燈光閃爍,宣傳片還在播放,李彥宏已經(jīng)站在側(cè)臺的暗場中等候。在之后的采訪中他說:“對這次發(fā)布會的內(nèi)容,我做好了充分的準(zhǔn)備。”
這是他距今年年初舉辦的第五屆百度Create AI開發(fā)者大會后的再次公開露面,這一次他帶來的是一款生成式AI“百度文心一言”。
此時(shí)百度線上直播間已經(jīng)有幾十萬的觀眾在等待,但李彥宏未曾預(yù)料到,同一時(shí)刻百度的股價(jià)卻下跌了10%。
就在前一天,OpenAI率先發(fā)布了多模態(tài)大型語言模型 GPT-4,它的進(jìn)化速度讓人們再次為之震撼。國內(nèi)生成式AI和以ChatGPT為代表的GPT-4比較肯定是有差距的,正是因?yàn)橘Y本市場看到了這個(gè)差距,股市才會出現(xiàn)這樣的反饋。
這時(shí)舞臺燈光亮起,李彥宏緩步走上臺前,開始了這場關(guān)于百度文心一言的發(fā)布。百度投入AI已經(jīng)12年,在人工智能剛開始被大家討論的時(shí)候,百度就已經(jīng)默默耕耘了兩年之久,研發(fā)費(fèi)用將近23億元。2014年百度開始涉足智能駕駛領(lǐng)域,2015年上線世界首個(gè)大規(guī)模神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯系統(tǒng),比Google早了一年多。2016年百度正式發(fā)布“百度大腦”并開源中國第一個(gè)深度學(xué)習(xí)框架飛槳。這一次李彥宏帶著百度走向了大模型。
舞臺上的他看不到資本市場的震蕩,也看不到網(wǎng)友們對白色腰帶的戲謔評論,F(xiàn)在更重要的是,這是屬于文心一言的時(shí)刻,百度內(nèi)部的各個(gè)產(chǎn)品線、生態(tài)合作伙伴都在等著這個(gè)技術(shù),百度沒有退路可言。
文心一言能做什么?
面對眾人的好奇,李彥宏在發(fā)布會上率先回應(yīng):文心一言在內(nèi)測時(shí)體驗(yàn)感并不完美,但他表示文心一言的進(jìn)步空間很大,平臺發(fā)布后百度將把用戶的反饋、開發(fā)者的模型迭代、調(diào)用形成正向閉環(huán),未來會帶給大家新的驚喜。
在發(fā)布會后,我們也申請到了文心一言的邀請碼,并根據(jù)發(fā)布會展示的五個(gè)使用場景進(jìn)行了測試,包括文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成。
這五大場景也是ChatGPT所擁有的大部分能力。李彥宏在接受采訪時(shí)表示,前三個(gè)場景是對標(biāo)ChatGPT已有的功能,希望讓大家能夠感受到國產(chǎn)大模型并不差。
首先第一個(gè)場景是創(chuàng)作能力,文心一言稱自己可以創(chuàng)作各種類型的文學(xué)作品,例如詩歌、小說、散文、新聞報(bào)道等。
在文心一言創(chuàng)作的小故事中,描述了一個(gè)田園鄉(xiāng)村人與人之間相處的溫馨故事,但當(dāng)我繼續(xù)提問,希望它以此為背景創(chuàng)作一首現(xiàn)代詩時(shí),文心一言只提取出了上一個(gè)問題中“鄉(xiāng)村田園”的關(guān)鍵詞,創(chuàng)作了一首贊美鄉(xiāng)村風(fēng)景的詩,并沒有與它之前的回答相結(jié)合。
接下來測試的是文心一言商業(yè)文案創(chuàng)作能力,文心一可以創(chuàng)作各種類型的商業(yè)文案,例如廣告文案、宣傳文案、產(chǎn)品文案等。
我讓文心一言生成一個(gè)推廣巧克力脆皮冰淇淋的策劃方案,但在描述方案的過程中,卻幾乎沒有提及冰淇淋,也沒有針對巧克力脆皮的特點(diǎn)進(jìn)行創(chuàng)造。這樣的“套話”似乎適用于各種商業(yè)策劃,更像是一個(gè)通用模板。
同時(shí),文心一言還存在字?jǐn)?shù)限制,在成本評估的第三項(xiàng)內(nèi)容描述中戛然而止,共計(jì)909字。當(dāng)我問及文心一言單次輸出多少字時(shí),它拒絕了我的回答,并告訴我這是百度的商業(yè)機(jī)密。
在測試的過程當(dāng)中,我們發(fā)現(xiàn)文心一言是有自己的觀點(diǎn)的。當(dāng)被問到“道德感高是不是一件好事”的時(shí)候,它給出了肯定的答案。而讓我要求它以否定角度給出答案時(shí),它拒絕了我的要求。
我舉例論證道德感高不是一件好事,并問了它的意見。有趣的是,它尊重了我的看法,但仍然堅(jiān)持了自己的觀點(diǎn)。
接下來,我測試了文心一言的多模態(tài)生成理解能力。我嘗試讓文心一言用方言說話,它準(zhǔn)確地說出了我要求的句子,但接下來我讓它換一個(gè)口音時(shí),它竟然說出來另一句話。
廣東話翻譯:嗯,聽到了,我現(xiàn)在心情很好。
在繪畫方面,文心一言有著不錯(cuò)的理解能力。此前網(wǎng)上傳出了文心一言很多段子,例如“車水馬龍”展示的則是一輛車在馬路上載著一條龍。“魚香肉絲”是身上纏滿絲帶的熱帶魚。也有傳聞?wù)f是“漢譯英”再傳給Stable Diffusion,盡管這一點(diǎn)已經(jīng)被百度官方辟謠。
而在測試中,當(dāng)我讓文心一言畫出“魚香肉絲”時(shí),它為我呈現(xiàn)了一道色澤紅亮的菜肴。由此看來,文心一言也有了非常大的進(jìn)步。
由于文心一言的視頻生成成本較高,現(xiàn)階段還未對所有用戶開放,但對于使用百家號的編輯來說一定不陌生,因?yàn)橐曨l生成能力早已接入了百家號,為文章自動生成視頻。
經(jīng)過測試來看,文心一言確實(shí)可以生成簡單的文案,可以為使用者提供一個(gè)基本的內(nèi)容框架,只需要進(jìn)行內(nèi)容填充就可以成為一篇簡單直白的介紹文。當(dāng)然要求不高的話,直接復(fù)制粘貼使用也是可以的。
但在生產(chǎn)力方面,文心一言的表現(xiàn)并不突出,甚至可以說有些稀疏平常。一個(gè)相對明顯的bug在于,文心一言并不能很好地聯(lián)系上下文,并做出具有邏輯性的回答,這使得文心一言更像是一個(gè)對話形式的搜索引擎。
你不是文心一言,你是魚,你的記憶只有7秒
而在面對同樣的系列提問時(shí),ChatGPT給出了能夠聯(lián)系上下文的答案。
在發(fā)布會現(xiàn)場,PPT演示了文心一言正確回答出“《三體》作者是哪里人”的問題。或許是多年深耕于搜索引擎的自信,李彥宏表示ChatGPT目前無法正確回答出這個(gè)問題。李彥宏也在另一個(gè)采訪中列舉,當(dāng)用戶提問“二戰(zhàn)期間蘇聯(lián)為什么轟炸波蘭”時(shí),文心一言能夠辨別出蘇聯(lián)沒有轟炸過波蘭,是德國轟炸波蘭。
然而,當(dāng)我重復(fù)這個(gè)問題給文心一言時(shí),它給出了和李彥宏不同的說法。
鑒于歷史上蘇聯(lián)的確幫助過德國對波蘭進(jìn)行攻擊,我換了一個(gè)離譜的問法,結(jié)果是得到了更離譜的答案。
而向“喵娘GPT”提出同樣離譜的問題時(shí),它給出了正確答案,不得不承認(rèn)喵的進(jìn)步速度確實(shí)更快一些。
但仍然不知道劉慈欣是哪里人。
在文心一言第一版產(chǎn)品測試時(shí),百度內(nèi)部將它與ChatGPT進(jìn)行了對比,得出結(jié)論是相差40分。李彥宏坦言,當(dāng)時(shí)文心一言團(tuán)隊(duì)認(rèn)為文心一言的提升空間不止40分,一定能在一個(gè)月內(nèi)追趕上。然而在一個(gè)月后的測評時(shí)發(fā)現(xiàn)距離不僅沒有縮小,反而拉大了,尤其是ChatGPT所擅長的英文、編程等能力的進(jìn)步讓他們有了緊迫感。
在經(jīng)過研究后,他們發(fā)現(xiàn)ChatGPT有著自己的發(fā)展規(guī)律,并不是勻速升級。而文心一言是版本迭代的方式,升級速度同樣非?臁@顝┖瓯硎,文心一言在發(fā)布當(dāng)天的能力已經(jīng)達(dá)到了ChatGPT在去年12月,甚至是今年1月的水平。
現(xiàn)在文心一言與ChatGPT之間的差距可能最多是兩個(gè)月,但對于百度來說,這兩個(gè)月什么時(shí)候能追上,才是更重要的問題。
AI的十倍機(jī)會
在此之前,我們聊到ChatGPT,除了驚嘆于強(qiáng)大的對話式問答功能,其在生產(chǎn)力方面的表現(xiàn)也讓許多人產(chǎn)生了危機(jī)感,甚至有聲音認(rèn)為,ChatGPT將會取代許多工作,導(dǎo)致失業(yè)危機(jī)。
OpenAI的創(chuàng)始人Sam Altman曾公開表示,大量的人一定會失業(yè),所以O(shè)penAI會按需收費(fèi),給沒有工作的人補(bǔ)貼。但李彥宏對此更加樂觀,他說,今天沒有馬車夫這樣的工作,因?yàn)槌霈F(xiàn)了汽車。但是今天世界上存在的工作機(jī)會跟100年前相比,不僅是多了,而且多了很多倍。
不管有多少工作被替代,這只是整個(gè)圖景的一部分,另外一部分是,存在我們現(xiàn)在甚至無法想象的更多新機(jī)會。他預(yù)測,十年以后,全世界有50%工作會是提示詞工程(prompt engineering),不會寫提示詞(prompt)的人會被淘汰。
百度將目光聚焦到了產(chǎn)業(yè)上。李彥宏在發(fā)布會上表示,在國內(nèi),乃至全球大廠中,百度是第一個(gè)發(fā)布大語言模型的公司,也是全球范圍內(nèi)在IT技術(shù)棧的芯片層、框架層、模型層和應(yīng)用層,4個(gè)層級中都有領(lǐng)先產(chǎn)品的公司。從高端芯片昆侖芯,到飛槳深度學(xué)習(xí)框架,再到文心預(yù)訓(xùn)練大模型,到搜索、智能云、自動駕駛、小度等應(yīng)用,各個(gè)層面都有領(lǐng)先業(yè)界的自研技術(shù)。
百度在每一層都提早了很多年來布局,能力也更加完整,未來當(dāng)人們基于百度智能云去開發(fā)新的應(yīng)用,就會非常方便。李彥宏認(rèn)為,百度AI全棧布局的優(yōu)勢在于,可以在技術(shù)棧的四層架構(gòu)中實(shí)現(xiàn)端到端優(yōu)化,大幅提升效率。尤其是框架層和模型層之間,有很強(qiáng)的協(xié)同作用,可以幫助構(gòu)建更高效的模型,并顯著降低成本。
就在2月27日,百度智能云正式發(fā)布企業(yè)級大語言模型服務(wù)平臺“文心千帆”。“文心千帆”大模型平臺除文心一言外,還包括百度文心一格、文心百中等全套文心大模型,以及相應(yīng)的開發(fā)工具鏈。未來,文心千帆平臺還有望支持第三方的開源大模型,成為大模型生產(chǎn)和分發(fā)的集散地。
利用大模型生成的文字、圖像、音頻,和數(shù)字人結(jié)合,再加上超強(qiáng)的理解能力和表達(dá)能力,就會創(chuàng)造出很多新的可能。李彥宏認(rèn)為,未來最大機(jī)會不在基礎(chǔ)服務(wù),也不是行業(yè)服務(wù),而是像微信、抖音、淘寶這樣的應(yīng)用產(chǎn)品,這些基于AI而創(chuàng)造出的應(yīng)用,誕生10倍于目前APP價(jià)值的機(jī)會,完全是存在的。
在人工智能時(shí)代,一定會出現(xiàn)殺手級應(yīng)用、現(xiàn)象級產(chǎn)品不斷帶領(lǐng)大家走向新的里程。“那時(shí)人類一定是更幸福的。”李彥宏說道。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
