
AIGC為元宇宙生產(chǎn)內(nèi)容前夜

未來市場中,只有需要體驗感的工作,才需要人類親自參與其中。
從AI作畫、AI編曲到AI生成視頻,越來越“聰明”的AI帶來了一種全新的內(nèi)容生產(chǎn)模式,AIGC。
在過往數(shù)十年里,人類獲取的內(nèi)容大致分為兩類:PGC(專業(yè)生產(chǎn)內(nèi)容)、UGC(用戶生產(chǎn)內(nèi)容)。AIGC的出現(xiàn),使得內(nèi)容生產(chǎn)模式再次多樣化,同時,也讓人類對數(shù)字世界的依賴程度在潛移默化中進一步加深。
據(jù)IDC統(tǒng)計數(shù)據(jù)顯示,2021年全球VR/AR終端出貨量達到1123萬臺。作為元宇宙入口,VR/AR的千萬銷量也讓人們開始思考,相較于互聯(lián)網(wǎng),更復(fù)雜的元宇宙的內(nèi)容應(yīng)該如何生產(chǎn)?
AIGC的出現(xiàn)為元宇宙的內(nèi)容生產(chǎn)提供了一個新思路。
然而,就在元宇宙尚且處于萌芽期、AIGC還未進化完成的2022年,身處AIGC大流行中,一些新的問題開始浮出水面。
AI續(xù)命良藥
2016年,Alpha Go戰(zhàn)勝世界圍棋大師李世石,由深度學(xué)習(xí)引領(lǐng)的第三波人工智能浪潮達到頂峰,隨后,人工智能再次歸于沉寂,尤其在全球經(jīng)濟下滑趨勢的影響下,人工智能的火苗開始變得微弱。
“我們原本看好的一些人工智能頭部企業(yè)(這期間)在上市時并不順利,很多人工智能企業(yè)不得不面對經(jīng)營壓力,”回顧過去幾年人工智能企業(yè)發(fā)展歷路,中國信通院云計算與大數(shù)據(jù)研究所內(nèi)容科技部副主任石霖如是說。
這時的人工智能亟需一款現(xiàn)象級產(chǎn)品提振整個行業(yè),AIGC適時出圈成了人工智能的續(xù)命“良藥”。
所謂AIGC,實際上是一種利用人工智能算法自動生成內(nèi)容的技術(shù)。
AIGC的應(yīng)用早已有之,早在2011年,美國《洛杉磯時報》就已經(jīng)開始研發(fā)面向地震領(lǐng)域的新聞寫作機器人Quakebot。2013年3月,Quakebot因率先報道了南加州發(fā)生的4.4級地震,一時引起社會關(guān)注。隨后,包括路透社、彭博社、《華盛頓日報》、《紐約時報》紛紛引入寫作機器人,自動化新聞成了AIGC最早的應(yīng)用形式。
2022年,在美國科羅拉多州博覽會的美術(shù)比賽中,一位名為Jason Allen的游戲設(shè)計師憑借AI繪畫工具Midjourney生成的作品「Thétre D’opéra Spatial」拿下了數(shù)字藝術(shù)/數(shù)碼攝影競賽冠軍,這一消息一經(jīng)公布,迅速引起了廣泛的社會關(guān)注。
而這,還不是AIGC在這一年里唯一一條全球范圍內(nèi)的熱搜。
2022年12月5日,OpenAI首席執(zhí)行官Sam Altman在社交媒體上發(fā)文稱,OpenAI訓(xùn)練的大型語言模型ChatGPT截至當(dāng)日已突破100萬用戶。這時,ChatGPT上線僅僅五天,而如今的硅谷四巨頭之一的Facebook最初獲得百萬注冊用戶花了有10個月之久。
同伴客數(shù)據(jù)首席科學(xué)家馬志博分析稱,“OpenAI本身是一個非盈利組織,但它發(fā)布的chatGPT又能在一周之內(nèi)獲得百萬用戶,盡管震驚的資本市場無法為其做出估值,但如果有企業(yè)能夠?qū)⒓夹g(shù)服務(wù)或技術(shù)商業(yè)落地做好,資本市場還是會設(shè)計出一套估值體系來賺取這波紅利。”
資本與技術(shù)向來都是相伴相生,也只有資本能夠為技術(shù)鋪出一條迅速通向商業(yè)應(yīng)用的道路。
AIGC四重限制
從自動化新聞到ChatGPT,AIGC演進已有十年之久,不過,清華大學(xué)繼續(xù)教育學(xué)院數(shù)字化學(xué)習(xí)主管李璇認(rèn)為,如果將AIGC劃分為雛形、標(biāo)準(zhǔn)、完備、高超、極致五個階段的話,現(xiàn)在的AIGC也僅僅是初具雛形。
今年AIGC能夠爆火,一個很重要的原因在于Stable Diffusion模型的開源。2022年8月,就在Stability AI發(fā)布Stable Diffusion時,該公司還一并將這一模型的權(quán)重和代碼對外開源。
NVIDIA高級解決方案架構(gòu)師唐康祺表示,“Stable Diffusion模型很小,大概只有十幾個G,只需要一臺20系列的GPU就能跑起來,而且由文本生成圖片的速度只需要大概一分鐘(自己部署開源模型只要十幾秒),這在之前是無法想象的。”
不過,唐康祺也指出,AIGC要大規(guī)模商用部署,仍然存在四個局限:
第一,算力的局限,雖然Stable Diffusion使用起來很方便,但整個模型的訓(xùn)練成本還很高,這類模型的訓(xùn)練一般都需要516塊頂配的安培GPU,數(shù)十萬小時的訓(xùn)練時間,訓(xùn)練成本一般都要在百萬美元量級;
第二,數(shù)據(jù)來源的局限,Stable Diffusion模型訓(xùn)練所用的數(shù)據(jù)是目前全球最大的開放圖像-文本對數(shù)據(jù)集LAION-5B,chatGPT模型的訓(xùn)練數(shù)據(jù)則來自于維基百科和一些問答論壇,數(shù)據(jù)產(chǎn)權(quán)歸誰所有?數(shù)據(jù)“制造商”之后是否會對數(shù)據(jù)使用有所限制?這些也是未來需要明晰的問題;
第三,準(zhǔn)確使用觸發(fā)詞的局限,Stable Diffusion模型要求輸入的觸發(fā)詞足夠精確,表達的含義足夠清晰,如此才能更容易創(chuàng)造出使用者想要的內(nèi)容;
第四,三維模型生成的局限,要到真正生產(chǎn)元宇宙內(nèi)容時,必然會涉及三維模型,目前三維模型生成上還有很大的提升空間,包括在CG(計算機圖形學(xué))方面專業(yè)知識的提升等。
這四重限制,使得AIGC要真正走向大規(guī)模商用,尤其生產(chǎn)出真正屬于元宇宙獨有的內(nèi)容,還有很長的路要走。
AI新技能,人類新挑戰(zhàn)
盡管AIGC規(guī)模商用長路漫漫,但作為未來生產(chǎn)力工具之路已經(jīng)開始明晰。
對于未來AIGC,乃至整個AI技術(shù)的發(fā)展,李璇認(rèn)為,“就像科幻片中的場景一樣, 真實世界中的體力或腦力勞動被機器人替代,虛擬世界中的體力或腦力勞動被虛擬人替代的場景或許在不遠的未來就會發(fā)生,未來市場中,只有需要體驗感的工作,才需要人類親自參與其中。”
此外,李璇也指出,隨著AIGC帶來的AI工具越來越多,我們現(xiàn)在生活、工作中出現(xiàn)了幾個方面的“遮蔽”:
第一,信息“遮蔽”,人工智能幫我們做出「選擇」的同時,信息繭房也就逐漸生成,例如我們經(jīng)常用到的APP,你喜歡看的那些內(nèi)容會不斷為你疊加推送,你遇到的信息壁壘會越來越多, 信息繭房也會越來越大;
第二,器官“遮蔽”,未來VR、AR這樣的時空流,它的密度和含量會越來越大,這時就會出現(xiàn)信息的“膠狀體”,這類信息會發(fā)生折射、歪曲、模糊;
第三,交互“遮蔽”,隨著AI和機器人的發(fā)展,人類與平臺越來越多,這類交互實際上是與非人類進行的交互,這類交互可能會導(dǎo)致資本控制或平臺控制的最大化。
面對這樣一個即將到來的新世界,我們應(yīng)該如何突破“繭房”、避免“遮蔽”,在充滿AI的元宇宙里更好地生活?
李璇給出的答案是:擁抱變革,終身學(xué)習(xí),突破繭房,超越遮蔽,通過系統(tǒng)化思維、開源技術(shù)和工具,以及終身學(xué)習(xí)的心態(tài),更好地在未來獲得長足的發(fā)展。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
