
孿生、編輯、創(chuàng)作,AIGC 將走入更多場景

在傳媒、電商、影視、娛樂等多個領(lǐng)域,AIGC 將通過推進數(shù)實融合,加快產(chǎn)業(yè)升級。
今年 8 月,美國科羅拉多州博覽會中的一場藝術(shù)比賽,一幅由人工智能創(chuàng)作的畫脫穎而出。這幅畫具有古典特色的巴洛克風(fēng)格,畫中人物在圓形的巨大窗口凝視著陽光普照、光芒四射的景觀,風(fēng)格、構(gòu)圖都相當(dāng)優(yōu)美,這幅作品通過輸入關(guān)鍵字再由 Midjourney AI 產(chǎn)生,這也使該作品飽受爭議。
在這之后,AIGC 成為輿論焦點,全球產(chǎn)業(yè)界和資本方也很看好 AIGC 的發(fā)展方向,例如 Gartner 在2022年的重要戰(zhàn)略技術(shù)趨勢中,認(rèn)為生成式 AI 是非常重要的人工智能技術(shù)之一;一些科技巨頭也在這個領(lǐng)域持續(xù)布局,加大投入,包括 Meta、Google、微軟、OpenAI 等等,它們已經(jīng)在這個領(lǐng)域深耕了多年,公布了許多的預(yù)訓(xùn)練模型。
不過真正把 AIGC 推上風(fēng)口浪尖的并不是 AI 繪畫,一款由 OpenAI 推出的聊天機器人模型 ChatGPT 在不久前上線,開放免費注冊體驗,大約只用了兩天時間,便成為互聯(lián)網(wǎng)上的”現(xiàn)象級”事件,引起各界關(guān)注。可能是由于更多人直接體驗了一把 AIGC,這次網(wǎng)上的輿論聲浪更大,涉及的議題也更寬泛,除了針對使用方式和提問技巧的交流,像是AI 未來會不會取代人類、如何設(shè)定人工智能的邊界這樣的問題也再次被廣泛討論,人們對 AIGC 的好奇心更強烈了。
誕生,AIGC 的前世今生
不過想要更好地了解 AIGC,了解它的原理自然是必不可少的,在”智能”這個概念剛剛出現(xiàn)時,有一個著名的”圖靈測試”,圖靈測試最早也是通過判斷內(nèi)容是否出自機器,來判定機器是否具備智能。中國信通院云計算與大數(shù)據(jù)研究所內(nèi)容科技部副主任石霖指出:”早期也出現(xiàn)了 AIGC 的萌芽,在早期階段,受限于科技水平,AIGC 主要也局限于小范圍的實驗。”
在第二個階段,AIGC 也開始從實驗室那么轉(zhuǎn)向一些實用場景。石霖表示,當(dāng)時一些機構(gòu)和企業(yè)探索了基于人工智能的同聲傳譯技術(shù),但同樣受限于當(dāng)時的技術(shù)瓶頸,很多應(yīng)用實際上無法大規(guī)模落地。
隨著深度學(xué)習(xí)技術(shù)和大型模型相關(guān)應(yīng)用的落地,目前我們已經(jīng)正處在一個 AIGC 快速發(fā)展的階段,像 ChatGPT 這種產(chǎn)品的誕生也充分反映出這一點。
石霖指出:”AIGC 進入到落地的階段,它生成的一些內(nèi)容基本上也可以用于日常的生產(chǎn)和生活。”近年來,已經(jīng)有很多AIGC相關(guān)應(yīng)用開始落地,包括一些翻譯工具、導(dǎo)航中的語音合成等等。隨著元宇宙相關(guān)概念的誕生,人們對數(shù)字空間和數(shù)字內(nèi)容的需求和依賴度也越來越高,當(dāng)傳統(tǒng)的 PGC 和 UGC 較難滿足日益增長的內(nèi)容需求時,AIGC 可望成為未來滿足人們內(nèi)容需求的重要途徑。
邊界,AIGC 的能與不能
AIGC 擁有廣闊的應(yīng)用空間,但也暴露出一系列問題。石霖指出,AIGC 使用了人工智能的算法,而人工智能本身存在一些缺陷,包括黑箱機制、偏見數(shù)據(jù)等因素的影響,內(nèi)容編輯與創(chuàng)作技術(shù)的不完善,也導(dǎo)致產(chǎn)出的作品千篇一律、語音機械感強、圖像處理效果不理想等問題。
此外,AIGC 也面臨著政策監(jiān)管的問題。石霖舉例稱:”我們最近也在交流 ChatGPT是不是有可能被一些黑/灰產(chǎn)利用,例如支撐一些水軍來刷屏。另外,AIGC 生成內(nèi)容的版權(quán)歸屬問題也有待進一步的認(rèn)定和解決。”
我國最近出臺了《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》,規(guī)范了深度合成技術(shù)和相關(guān)產(chǎn)業(yè)的發(fā)展。石霖指出,深度合成技術(shù)與 AIGC 存在關(guān)聯(lián)性,在這套管理規(guī)定中,提出了內(nèi)容標(biāo)識技術(shù)管理的這樣一套制度,可以便于追蹤深度合成內(nèi)容的制作與發(fā)布。
石霖指出,《規(guī)定》明確提出了顯性和隱性層面兩種不同的標(biāo)識方法。在顯性層面,通過嵌入標(biāo)識來告訴用戶當(dāng)前的內(nèi)容采用了深度合成技術(shù),隱性層面,通過水印或可追蹤的標(biāo)識,來追蹤這些合成的數(shù)據(jù)。
此外,還需要持續(xù)保證這些標(biāo)識的有效性,任何組織和個人不得采取技術(shù)手段刪除、替換和隱秘相關(guān)標(biāo)識。不過目前更具體的細則尚未公布,針對這一點,石霖表示:”我們的團隊也會依托一些產(chǎn)業(yè)的機構(gòu)和聯(lián)盟性的組織,開展一些標(biāo)準(zhǔn)制定的工作。”
未來,AIGC 的應(yīng)用滲透
有了配套的政策,AIGC 技術(shù)和產(chǎn)業(yè)的發(fā)展得到規(guī)范,未來也可望衍生出更多應(yīng)用場景。石霖表示,AIGC 將加速滲透整個經(jīng)濟社會的方方面面:
在傳媒領(lǐng)域,通過人機協(xié)同生產(chǎn),推動媒體融合;在電商領(lǐng)域,通過推進虛實交融,營造沉浸體驗;在影視領(lǐng)域,拓展創(chuàng)作空間,提升作品質(zhì)量;在娛樂領(lǐng)域,通過擴展輻射邊界,獲得發(fā)展動能;在其他領(lǐng)域,AIGC 也將通過推進數(shù)實融合,加快產(chǎn)業(yè)升級。
對于 AIGC 未來的發(fā)展方向,石霖總結(jié)了三大能力:孿生、編輯和創(chuàng)作。
孿生能力可以為現(xiàn)實的物理世界提供一些高效可感知的數(shù)字化增強;編輯能力通過高效率仿真和低成本試錯,為現(xiàn)實世界提供快速迭代能力;創(chuàng)作能力通過算法的自我演化,來支持海量內(nèi)容生態(tài)。
石霖指出,未來 AIGC 的應(yīng)用空間會非常廣闊,目前隨著相關(guān)應(yīng)用的不斷前進,以及國家政策的出臺,也會使整個的產(chǎn)業(yè)的發(fā)展越來越健康。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
