
我的畫拿獎(jiǎng)了,但是用AI畫的

古典夢(mèng)幻的巴洛克歌劇院舞臺(tái)上,墻壁上畫滿了精妙的壁畫,在大廳內(nèi),兩位穿著華麗鮮艷裙子的婦人站在兩側(cè),圍繞著穿著一襲白裙的歌者,向黑暗中的觀眾表演歌唱。在觀眾席之中的巨大的弧形玻璃窗外,是通往另一個(gè)世界的入口……
這是一副剛剛獲得獲得了美國科羅拉多州博覽會(huì)舉辦的藝術(shù)比賽一等獎(jiǎng)的作品《太空歌劇院》。而該畫的創(chuàng)作者杰森艾倫自曝該作品是其用AI繪畫 App“Midjourney”創(chuàng)作產(chǎn)生的。
《太空歌劇院》的出現(xiàn),讓人們?cè)俅螌⒛抗夥旁贏I與藝術(shù)的融合上。伴隨著技術(shù)和軟件能力的提升,“人人都可以畫畫”的時(shí)代已經(jīng)到來了。百度文心一格相關(guān)負(fù)責(zé)人表示,計(jì)算機(jī)與藝術(shù)創(chuàng)作的融合,具有很大的想象空間,AI將對(duì)藝術(shù)創(chuàng)新起到正向促進(jìn)作用。
每個(gè)普通人都可以通過文字來描述自己的想法,然后通過機(jī)器來實(shí)現(xiàn)創(chuàng)作,人工智能在藝術(shù)領(lǐng)域的學(xué)習(xí)與創(chuàng)作能力正以蓬勃之勢(shì)不斷刷新我們的認(rèn)知,一個(gè)新的藝術(shù)類別也逐漸興起。
藝術(shù)因?yàn)锳I消亡?
“我們正在目睹藝術(shù)在眼前消亡。”這是諸多網(wǎng)友在得知《太空歌劇院》的創(chuàng)作過程后最直觀的看法。他們認(rèn)為Allen使用AI生成圖像完全是在作弊,但Allen自己卻不以為然。
他介紹了這幅作品的創(chuàng)作過程耗時(shí)一個(gè)月,不停地修改輸入關(guān)鍵詞,給MidJourney提交盡可能精確具體的詞語,創(chuàng)作了100多張作品后,挑選出了三張自己認(rèn)為最滿意的,用GipaPixel AI將圖片清晰化,又用Photoshop進(jìn)行多次調(diào)整,最后才打印在畫布上。
這并不是AI作品第一次在正式的藝術(shù)舞臺(tái)上亮相,2018年10月,藝術(shù)品拍賣行佳士得曾以約一萬美元的價(jià)格成交了一幅由AI生成的油畫《Edmond Belamy的肖像》。創(chuàng)作者讓AI模型分析了15000幅14至20世紀(jì)的油畫后,仿出了一幅風(fēng)格類似的作品。
佳士得對(duì)作品的形容是:在藝術(shù)與人工智能之間交互的實(shí)驗(yàn)。意味著,這幅拍賣作品的核心價(jià)值并不在畫作本身,人們關(guān)注更多的是當(dāng)時(shí)看來前所未有的生產(chǎn)方式。這足以說明,AI技術(shù)生成的圖片不是既有圖片的拼湊,而是類似人類經(jīng)過長期繪畫訓(xùn)練后的“再創(chuàng)作”。
盡管人工智能作品充滿了沖擊力和視覺張力,但和幾乎所有其他的深度學(xué)習(xí)模型一樣,在理解知識(shí)、推理、邏輯方面做得都不夠好。一個(gè)已經(jīng)被廣泛注意到的問題,是人工智能經(jīng)常會(huì)生成奇形怪狀的手。
這就要先提到AI繪圖的原理。據(jù)百度文心一格相關(guān)負(fù)責(zé)人介紹,AI從海量圖文對(duì)應(yīng)的數(shù)據(jù)中學(xué)習(xí)到了“語言描述”與“藝術(shù)畫面”的關(guān)聯(lián),以隨機(jī)化的起點(diǎn)開始,不斷修正畫作,最終形成在審美上與人類經(jīng)驗(yàn)與知識(shí)高度一致的成品。
人的一只手有超過 20 個(gè)關(guān)節(jié),是人類身體上形狀最豐富的結(jié)構(gòu)之一。在大部分用來訓(xùn)練的圖片中,手部經(jīng)常不是最核心的部位,不同角度、不同距離、手不同勢(shì)、還有被陰影和其他物體遮擋等現(xiàn)象,就會(huì)讓AI在手的表現(xiàn)上出現(xiàn)問題。
從技術(shù)角度來看,需要提高的主要是兩個(gè)方面,包括生成的可控性和細(xì)節(jié)描述能力。目前AI對(duì)于數(shù)量、邏輯、關(guān)系、多圖關(guān)聯(lián)等問題暫無有效的解決方案。例如要求生成2個(gè)蘋果,左邊是紅色,右邊是綠色。雖然這邊的關(guān)系并不負(fù)責(zé),但是在通常情況下,模型并不能穩(wěn)定的生成正確的結(jié)果。
另一方面,AI對(duì)于更加復(fù)雜的、有規(guī)律性細(xì)節(jié)的描述能力有待提升。例如一棟居民樓的窗戶應(yīng)該具有多種形態(tài),開著的、關(guān)上的、有人在窗邊看風(fēng)景、有晾在陽臺(tái)上的衣服等等……但目前的AI繪畫尚未具備這樣的能力,同理,手部繪畫也是這樣的問題。
“大力出奇跡”的大模型
人工智能上一次驚艷互聯(lián)網(wǎng)還是2020年。
這一年,由OpenAI公司開發(fā)的GPT-3橫空出世。有開發(fā)者給GPT-3 做了圖靈測(cè)試,發(fā)現(xiàn)GPT-3對(duì)答如流,正常得不像個(gè)機(jī)器。而最近又一次驚艷互聯(lián)網(wǎng)的ChatGPT同樣出自這家公司。
相比GPT-3,ChatGPT的主要提升點(diǎn)在于記憶能力。ChatGPT可以儲(chǔ)存對(duì)話信息,延續(xù)上下文,從而實(shí)現(xiàn)連續(xù)對(duì)話,這在對(duì)話場景中至關(guān)重要,極大地提升了對(duì)話交互模式下的用戶體驗(yàn)。
ChatGPT的背后離不開大模型、大數(shù)據(jù)、大算力。根據(jù)國盛證券研報(bào)數(shù)據(jù)顯示,ChatGPT技術(shù)底座使用的是微調(diào)后的GPT-3.5系列模型,有著多達(dá)1750億個(gè)模型參數(shù),OpenAI主要使用的公共爬蟲數(shù)據(jù)集有著超過萬億單詞的人類語言數(shù)據(jù)集。GPT-3.5在微軟Azure AI超算基礎(chǔ)設(shè)施上進(jìn)行訓(xùn)練,總算力消耗約3640PF-days(即每秒一千萬億次計(jì)算,運(yùn)行3640個(gè)整日)。
而為AI繪畫提供優(yōu)質(zhì)應(yīng)用體驗(yàn)的關(guān)鍵技術(shù)是大模型。2021年3月OpenAI發(fā)布人工智能繪畫產(chǎn)品DALL·E,現(xiàn)已升級(jí)到DALL·E 2;谷歌、Meta、百度、阿里等互聯(lián)網(wǎng)巨頭也推出了支持生成內(nèi)容的AI大模型以及對(duì)應(yīng)產(chǎn)品。
百度基于文心大模型推出了AI藝術(shù)與輔助創(chuàng)作平臺(tái)文心一格,是百度依托于飛槳、文心大模型持續(xù)的技術(shù)創(chuàng)新,在“AI作圖”方面發(fā)布的產(chǎn)品和技術(shù)工具。定位為面向有設(shè)計(jì)需求和創(chuàng)意的人群,基于文心大模型智能生成多樣化AI創(chuàng)意圖片,輔助創(chuàng)意設(shè)計(jì),打破創(chuàng)意瓶頸。
文心一格是基于文心大模型的文生圖系統(tǒng)實(shí)現(xiàn)的產(chǎn)品化創(chuàng)新。在文心一格官網(wǎng),用戶只需輸入自己的創(chuàng)想文字,并選擇期望的畫作風(fēng)格,即可快速獲取由一格生成的相應(yīng)畫作。文心一格既能生產(chǎn)恢弘絢麗的藝術(shù)畫,也能生產(chǎn)創(chuàng)意腦洞的超寫實(shí)圖,兼具中國特色,支持國風(fēng)、動(dòng)漫、插畫、油畫等十余種繪畫風(fēng)格和不同畫幅的選擇。
百度文心大模型已摸索出一條大模型產(chǎn)業(yè)化路徑。百度CTO王海峰指出,具有算法、算力和數(shù)據(jù)綜合優(yōu)勢(shì)的企業(yè),可以將模型生產(chǎn)的復(fù)雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺(tái),為千行百業(yè)提供大模型服務(wù),從而形成一條大模型產(chǎn)業(yè)化路徑。
突破繪畫的邊界
1839年,照相機(jī)問世,給彼時(shí)純手工的繪畫帶來了巨大的沖擊。法國知名藝術(shù)家德拉洛奇也曾發(fā)出悲嘆:“繪畫已死!”但隨著相機(jī)普及,攝影作品作為一種藝術(shù)品的觀念,也逐漸為大眾所接受。
19世紀(jì)英國著名的“盧德運(yùn)動(dòng)”中,大量英國工人闖進(jìn)工廠破壞紡織機(jī)等機(jī)器,因?yàn)樗麄冋J(rèn)為機(jī)器搶走了他們的工作。
但最終,繪畫沒有死,藝術(shù)出現(xiàn)了新的表現(xiàn)形式,機(jī)器幫助社會(huì)創(chuàng)造了更多的生產(chǎn)力。經(jīng)濟(jì)學(xué)家凱恩斯曾分析,新技術(shù)的出現(xiàn)會(huì)導(dǎo)致技術(shù)性失業(yè)。為了避免被淘汰,人們總是不得不提升應(yīng)用各類技術(shù)的能力。
從目前的實(shí)踐來看,AI繪畫帶來了新的創(chuàng)作方式,大幅提高了繪畫效率。無論是對(duì)畫師、設(shè)計(jì)師、藝術(shù)家等專業(yè)視覺內(nèi)容創(chuàng)作者還是媒體、作者等文字內(nèi)容創(chuàng)作者來說,AI作畫無疑是提供創(chuàng)意思路,輔助進(jìn)行藝術(shù)創(chuàng)作,既提升效率也提升質(zhì)量。
對(duì)于未來,技術(shù)和應(yīng)用都還將快速發(fā)展。從技術(shù)上來看,未來AI不止可以作畫,還可以基于文字內(nèi)容一鍵生成AI原創(chuàng)短視頻,并自動(dòng)配上字幕、語音、音樂等等。例如,2022萬象·百度移動(dòng)生態(tài)大會(huì)上,由百度APP推出的數(shù)字人度曉曉作詞作曲演唱的《啟航星》,是首支全AIGC生成的MV,其中畫面部分由文心一格根據(jù)歌詞自動(dòng)生成。應(yīng)用上,AI作畫將不斷的融入到各種內(nèi)容創(chuàng)作場景,除了常見的插畫師和藝術(shù)設(shè)計(jì)領(lǐng)域,未來在移動(dòng)內(nèi)容生產(chǎn)、游戲、工業(yè)設(shè)計(jì)、AI教育等場景都會(huì)有越來越廣泛的應(yīng)用。
對(duì)于卓越的藝術(shù)家來說,他們不可能會(huì)被AI替代。但普通的藝術(shù)家為了更具競爭力,很可能需要學(xué)習(xí)利用AI進(jìn)行藝術(shù)創(chuàng)作,就好像現(xiàn)在的畫師都要掌握數(shù)字繪圖軟件一樣,先進(jìn)的工具最終會(huì)成為必要的生產(chǎn)資料。
就像《太空歌劇院》的創(chuàng)作者對(duì)于爭議回應(yīng)時(shí)說的那樣:“我不會(huì)為此道歉,我沒有違反任何規(guī)則,我贏了。”
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼
