生成式AI助陣,為虛擬數(shù)字人注入靈魂
通過整合生成式AI的能力,虛擬數(shù)字人也找到了更豐富的應(yīng)用場(chǎng)景。
在電視臺(tái)的新聞報(bào)道中,虛擬數(shù)字人正逐漸取代傳統(tǒng)的手語老師,提供漢語到手語的實(shí)時(shí)翻譯,確保聽障人士的觀看體驗(yàn)。以前,為了讓翻譯準(zhǔn)確,手語虛擬數(shù)字人還需要較多的人工干預(yù),在生成式AI出現(xiàn)后,通過對(duì)自然語言的理解,AI就能直接讓虛擬數(shù)字人實(shí)現(xiàn)漢語、手語互譯的能力。
生成式AI正成為虛擬數(shù)字人智能化的關(guān)鍵角色,通過整合生成式AI的能力,虛擬數(shù)字人也找到了更豐富的應(yīng)用場(chǎng)景。數(shù)字栩生(北京)科技有限公司首席市場(chǎng)官郭學(xué)赟表示,生成式AI讓虛擬數(shù)字人從一種單純的虛擬形象,進(jìn)化成能夠與人互動(dòng)的智能實(shí)體。
從建模到AI,虛擬數(shù)字人的升級(jí)之路
虛擬數(shù)字人的制作需要依靠光場(chǎng)建模、動(dòng)作捕捉等技術(shù),動(dòng)作捕捉通過捕捉真人的動(dòng)作來生成數(shù)字人的動(dòng)作。生成式AI的出現(xiàn),也為虛擬數(shù)字人的制作提供另一種方案——AI生成,讓AI通過算法來生成數(shù)字人匹配的動(dòng)作。
數(shù)字栩生通過構(gòu)建人臉數(shù)據(jù)庫(kù),供給深度學(xué)習(xí)算法訓(xùn)練
郭學(xué)赟指出,這兩種技術(shù)各有優(yōu)勢(shì),動(dòng)作捕捉在真實(shí)性上表現(xiàn)更好,AI生成則是在靈活性和成本上更勝一籌。為了讓虛擬數(shù)字人提供更真實(shí)的視覺體驗(yàn),依然需要光場(chǎng)建模和大量的算法模型。
虛擬數(shù)字人的應(yīng)用浪潮最早出現(xiàn)在影視制作領(lǐng)域,利用傳統(tǒng)的影視技術(shù)完成制作;生成式AI的出現(xiàn)和快速迭代,讓虛擬數(shù)字人迎來第二波發(fā)展。
AI極大降低了虛擬數(shù)字人的制作成本,郭學(xué)赟表示,通過AI算法,很短時(shí)間內(nèi)生成的2D虛擬數(shù)字人,可以應(yīng)用到直播等領(lǐng)域,3D數(shù)字人的制作周期也大幅縮減,極大提高了數(shù)字人的生產(chǎn)效率,加速了數(shù)字人從概念到現(xiàn)實(shí)的轉(zhuǎn)化。
由AI驅(qū)動(dòng),加速應(yīng)用場(chǎng)景落地
除了生成虛擬數(shù)字人,生成式AI也能幫助虛擬數(shù)字人獲得交互能力,并且在功能上不斷擴(kuò)展。虛擬數(shù)字人已經(jīng)被應(yīng)用于智能客服、教育輔助、娛樂互動(dòng)等多個(gè)領(lǐng)域,例如,銀行和教育機(jī)構(gòu)已經(jīng)開始利用數(shù)字人提供服務(wù),而娛樂行業(yè)則利用數(shù)字人進(jìn)行互動(dòng)表演和游戲。
數(shù)字栩生推出的虛擬數(shù)字人已經(jīng)深入多個(gè)領(lǐng)域,主要包括游戲娛樂、教育講解、手語服務(wù)、名人復(fù)現(xiàn)等等。
國(guó)內(nèi)首個(gè)京劇數(shù)字人“數(shù)字梅蘭芳”
游戲娛樂方面,通過與虛擬數(shù)字人的結(jié)合,在線游戲?qū)@得更智能的NPC,線下娛樂場(chǎng)所也能通過虛擬數(shù)字人提供更豐富的娛樂體驗(yàn)。在北京三里屯的一家KTV,數(shù)字栩生的數(shù)字人不僅可以充當(dāng)服務(wù)員的角色,還能搖身一變成為現(xiàn)場(chǎng)的DJ或主持人。在游戲中,虛擬數(shù)字人形態(tài)的NPC能夠與玩家實(shí)時(shí)交互,由AI實(shí)時(shí)生成動(dòng)態(tài)的對(duì)話和反應(yīng),而不是傳統(tǒng)NPC的預(yù)設(shè)劇本,更有沉浸感。
教育講解方面,虛擬數(shù)字人可以擔(dān)任講解員或輔助教師,例如在景區(qū)、博物館等公共場(chǎng)所提供講解服務(wù)。虛擬數(shù)字人在景點(diǎn)或博物館中擔(dān)任講解員,能夠向參觀者提供詳細(xì)的展品解說和歷史背景介紹。對(duì)于圖書館或大型展覽,虛擬數(shù)字人也可以提供導(dǎo)覽服務(wù),指引訪客瀏覽不同的區(qū)域,并提供關(guān)鍵信息。在教育場(chǎng)景中,數(shù)字人可以用作教學(xué)輔助工具,幫助解釋復(fù)雜的概念或進(jìn)行語言學(xué)習(xí)練習(xí)。
為上海博物館“古埃及文明大展”提供導(dǎo)覽服務(wù)的AI數(shù)字人“小可”
手語服務(wù)方面,虛擬數(shù)字人被應(yīng)用到廣電和特殊教育場(chǎng)景,提供標(biāo)準(zhǔn)化的手語翻譯。郭學(xué)赟表示,數(shù)字栩生公司在手語數(shù)字人領(lǐng)域與專業(yè)機(jī)構(gòu)合作,確保手勢(shì)的準(zhǔn)確性和標(biāo)準(zhǔn)化,同時(shí)利用AI技術(shù)提升信息服務(wù)的可接入性。事實(shí)上,在北京冬奧會(huì)期間,手語虛擬數(shù)字人得到了更加廣泛的應(yīng)用,為聽障觀眾提供無障礙的觀看體驗(yàn)。
名人復(fù)現(xiàn)方面,數(shù)字栩生通過與北京理工大學(xué)、中央戲劇學(xué)院等機(jī)構(gòu)的共同合作,復(fù)原了如梅蘭芳等歷史名人的數(shù)字化形象,提供更好的傳統(tǒng)文化教育和傳播。郭學(xué)赟提到,他們?cè)瓿?ldquo;梅蘭芳”、“魯迅”、“李大釗”等歷史名人的數(shù)字化復(fù)原。
挑戰(zhàn)與前景,虛擬數(shù)字人的未來
虛擬數(shù)字人的制作和功能落地是一個(gè)復(fù)雜的過程,涉及大量的技術(shù)細(xì)節(jié)。盡管AI拉近了虛擬數(shù)字人與真人的差距,但情感表達(dá)和交互能力上,當(dāng)前的技術(shù)很難讓虛擬數(shù)字人完美實(shí)現(xiàn)。
數(shù)字栩生參與打造的高逼真數(shù)字演員“春草”
除此之外,人們對(duì)虛擬數(shù)字人的接受程度仍然存在挑戰(zhàn)。盡管虛擬數(shù)字人技術(shù)在某些領(lǐng)域已經(jīng)得到應(yīng)用,但市場(chǎng)仍處于發(fā)展階段。用戶對(duì)虛擬數(shù)字人的認(rèn)知和接受程度,將直接影響數(shù)字人技術(shù)的普及和應(yīng)用。
虛擬數(shù)字人市場(chǎng)尚未成熟,競(jìng)爭(zhēng)卻已經(jīng)非常激烈,尤其是在技術(shù)能力和設(shè)計(jì)美學(xué)方面,競(jìng)爭(zhēng)者們也各有優(yōu)勢(shì)。不過對(duì)普通用戶來說,當(dāng)前的虛擬數(shù)字人仍然缺乏真人的情感價(jià)值與柔和性,這意味著數(shù)字人在真實(shí)性和情感表達(dá)方面仍有長(zhǎng)遠(yuǎn)的路要走。郭學(xué)赟認(rèn)為,虛擬數(shù)字人技術(shù)充滿可能性,數(shù)字栩生還在探索如何將虛擬數(shù)字人技術(shù)應(yīng)用于高端養(yǎng)老和情感療愈中,但目前還存在很多限制,需要時(shí)間和進(jìn)一步的技術(shù)發(fā)展才能解決。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼