虛擬數(shù)字人因“AI”破繭 多元場(chǎng)景煥新
當(dāng)生成式AI時(shí)代的東風(fēng)吹過,便為虛擬數(shù)字人企業(yè)開啟了一場(chǎng)蛻變。
無論是電商領(lǐng)域,虛擬數(shù)字人化身虛擬主播、客服,創(chuàng)新購物體驗(yàn),提升平臺(tái)效率;還是文旅領(lǐng)域,虛擬數(shù)字人扮演者導(dǎo)游角色,豐富旅行體驗(yàn),注入產(chǎn)業(yè)新活力;或是影視領(lǐng)域,擔(dān)任特效角色、虛擬偶像,營(yíng)造逼真視覺的虛擬數(shù)字人,開創(chuàng)了娛樂的新形式......
當(dāng)前,虛擬數(shù)字人行業(yè)得益于生成式AI、實(shí)時(shí)渲染、動(dòng)作捕捉和語音合成等技術(shù)的進(jìn)步,正在迅速發(fā)展和變革在多個(gè)應(yīng)用場(chǎng)景,展現(xiàn)出廣泛的應(yīng)用潛力和實(shí)際價(jià)值。
在生成式AI問世之前,虛擬數(shù)字人的發(fā)展可謂歷經(jīng)坎坷。高昂的制作成本和技術(shù)門檻讓許多企業(yè)望而卻步,建模、動(dòng)畫和渲染過程復(fù)雜且耗時(shí),且傳統(tǒng)虛擬數(shù)字人的互動(dòng)體驗(yàn)單一,主要依賴預(yù)設(shè)腳本和動(dòng)畫,顯得機(jī)械且不自然;虛擬數(shù)字人的應(yīng)用場(chǎng)景有限,多集中在娛樂和廣告領(lǐng)域,難以在教育、醫(yī)療和企業(yè)服務(wù)等其他行業(yè)中普及。
正因如此,虛擬數(shù)字人的普及和商業(yè)化應(yīng)用受到極大限制。而近幾年來,隨著生成式AI提高了虛擬數(shù)字人的交互能力,推動(dòng)著虛擬數(shù)字人在現(xiàn)有應(yīng)用場(chǎng)景中的更深入應(yīng)用,虛擬數(shù)字人如雨后春筍一般涌現(xiàn),成為各行業(yè)的“寵兒”。
東風(fēng)——虛擬數(shù)字人的“AI”之變
對(duì)于作為虛擬數(shù)字人企業(yè)的北京海百川科技(以下簡(jiǎn)稱“海百川科技”)而言,當(dāng)生成式AI時(shí)代的東風(fēng)吹過,便為其開啟了一場(chǎng)蛻變。
從娛樂、電商,到企業(yè)服務(wù)和醫(yī)療健康,再到智慧城市。現(xiàn)在,海百川科技的虛擬數(shù)字人產(chǎn)品和服務(wù),在生成式AI加持下正深入各個(gè)領(lǐng)域。更是推出了虛擬偶像、虛擬演員、虛擬導(dǎo)購、虛擬主播、虛擬客服、虛擬導(dǎo)覽;AI攝像師、AI畫師和AI剪輯師等數(shù)字人形態(tài)產(chǎn)品等多種解決方案。
虛擬人背后的現(xiàn)實(shí)能力,來源于“圖靈九歌大模型”中臺(tái)系統(tǒng),憑借多模態(tài)智能內(nèi)容生成與交互模型的能力,能夠?qū)⒓夹g(shù)與數(shù)據(jù)轉(zhuǎn)化為各行各業(yè)的“AI員工”促進(jìn)企業(yè)提高工作流效率,通過整合最前沿的人工智能技術(shù),為企業(yè)提供高效、精準(zhǔn)的智能內(nèi)容生成和互動(dòng)解決方案。
北京海百川科技聯(lián)合創(chuàng)始人、副總經(jīng)理 楊星蕊
北京海百川科技聯(lián)合創(chuàng)始人、副總經(jīng)理?xiàng)钚侨锝忉屨f,“圖靈九歌大模型”融合了海百川科技自研的TURING GANS深度學(xué)習(xí)算法和TURING VAE大數(shù)據(jù)處理技術(shù),能夠快速構(gòu)建并優(yōu)化各類模型,為企業(yè)提供強(qiáng)有力的智能化轉(zhuǎn)型支持。
除了技術(shù)上的創(chuàng)新,海百川科技的前期積累也是強(qiáng)有力的支撐。
其實(shí),早在2014年,海百川科技旗下的“AI Star”就開始研發(fā)AI換臉相關(guān)技術(shù),并建立了較成熟的算法模型。
到2019年,國(guó)內(nèi)掀起了“AI換臉”風(fēng)潮,海百川科技便順理成章地在這一時(shí)期立在潮頭。
當(dāng)稱之為元宇宙“元年”的2021年到來,海百川科技用便開始用AI算法生成虛擬形象,進(jìn)行直播互動(dòng)、拍攝寫真及短視頻。
基于多年積累的豐富語料庫和數(shù)字人資產(chǎn)庫,讓海百川科技為虛擬數(shù)字人提供了多樣化的知識(shí)基礎(chǔ)和語言表達(dá)能力。同時(shí),海百川科技還通過整合OpenAI行業(yè)領(lǐng)先的開源大模型,增強(qiáng)虛擬數(shù)字人的語言理解和生成能力。“這些開源模型經(jīng)過廣泛的數(shù)據(jù)訓(xùn)練,具備強(qiáng)大的通用性和靈活性,能夠處理復(fù)雜的語言任務(wù)。”楊星蕊強(qiáng)調(diào)。
這種半開源半自研的策略,使海百川科技在生成式AI和虛擬數(shù)字人的融合之路上走的更加順暢。
模式——虛擬數(shù)字人開辟多元新場(chǎng)景
現(xiàn)在,海百川科技憑借其虛擬數(shù)字人技術(shù),在娛樂、教育、文化旅游、先進(jìn)制造業(yè)及數(shù)字內(nèi)容創(chuàng)作領(lǐng)域開辟了新天地,徹底改變了其傳統(tǒng)服務(wù)模式,推動(dòng)了個(gè)性化和智能化服務(wù)的發(fā)展。
在娛樂領(lǐng)域,海百川科技的虛擬偶像和演員正通過AI和動(dòng)作捕捉技術(shù),為觀眾帶來沉浸式體驗(yàn)。楊星蕊直言:“我們的目標(biāo)是通過高科技手段減少影視制作成本,同時(shí)提升視覺效果的真實(shí)性。”
在教育行業(yè),海百川科技與高校的合作中,開發(fā)了虛擬慕課系統(tǒng)。虛擬教師能夠根據(jù)學(xué)生的學(xué)習(xí)進(jìn)度提供個(gè)性化輔導(dǎo),從而提高教學(xué)質(zhì)量。楊星蕊解釋說:“這種技術(shù)的應(yīng)用,使得技術(shù)探索和創(chuàng)新教育更加容易。”
這兩年火熱的文旅領(lǐng)域也不例外,在福建的茶葉元宇宙項(xiàng)目中,海百川科技的虛擬導(dǎo)覽角色不僅提供實(shí)時(shí)信息,還增加了與游客的互動(dòng)性。“通過虛擬技術(shù),我們能夠重現(xiàn)歷史文化,增強(qiáng)游客的文化體驗(yàn),”楊星蕊坦言。
在先進(jìn)制造業(yè)和數(shù)字內(nèi)容創(chuàng)作領(lǐng)域,也能看到海百川科技的虛擬數(shù)字人技術(shù)被應(yīng)用其中,被作為提高制造企業(yè)的運(yùn)營(yíng)效率、加速了高質(zhì)量?jī)?nèi)容的生成的“利器”。楊星蕊提到,“在輕紡城元宇宙產(chǎn)品交易平臺(tái)中,虛擬數(shù)字人的3D商品展示和實(shí)時(shí)渲染技術(shù),為用戶創(chuàng)造了全新的購物體驗(yàn)。”
事實(shí)上,生成式AI顯著降低了制作成本和技術(shù)門檻,提高了其廣泛應(yīng)用的可能性。這項(xiàng)技術(shù)賦予虛擬數(shù)字人自我學(xué)習(xí)和進(jìn)化的能力,大大增強(qiáng)了它們的交互性和情感表達(dá),讓虛擬數(shù)字人不僅可以實(shí)時(shí)與用戶對(duì)話,理解并回應(yīng)需求,提供個(gè)性化服務(wù)。還能模擬人類情感,與用戶建立更深層次的情感連接,極大程度地提升了虛擬數(shù)字人的場(chǎng)景適應(yīng)能力。
當(dāng)技術(shù)創(chuàng)新和商業(yè)模式不斷優(yōu)化,虛擬數(shù)字人將在更多領(lǐng)域發(fā)揮重要作用,提升體驗(yàn)和服務(wù)效率。楊星蕊預(yù)計(jì),隨著技術(shù)成熟和應(yīng)用場(chǎng)景的擴(kuò)展,預(yù)計(jì)未來三到五年內(nèi),虛擬數(shù)字人將在更多行業(yè)和場(chǎng)景中廣泛應(yīng)用。
她舉例稱,在文化旅游領(lǐng)域,虛擬導(dǎo)游能提供沉浸式講解和互動(dòng)體驗(yàn),并通過虛擬現(xiàn)實(shí)技術(shù)生動(dòng)展示旅游目的地;在文化出海方面,虛擬數(shù)字人將推動(dòng)中華文化全球傳播,以虛擬演出和藝術(shù)展覽讓海外觀眾深入了解中華文化。
虛擬數(shù)字人還可在國(guó)際文化交流中擔(dān)任文化大使,促進(jìn)跨文化理解。技術(shù)創(chuàng)新和商業(yè)模式優(yōu)化將使虛擬數(shù)字人在娛樂、文化旅游和國(guó)際交流等領(lǐng)域發(fā)揮重要作用,提升體驗(yàn)和服務(wù)效率。
演進(jìn)——技術(shù)創(chuàng)新 場(chǎng)景深化
盡管新一代虛擬數(shù)字人已經(jīng)走入普羅大眾的視野,但熱度持續(xù)提升的“B面”是日新月異的技術(shù)更迭、用戶體驗(yàn)的更多訴求,都在向這一新興賽道發(fā)起挑戰(zhàn)。當(dāng)市場(chǎng)開始逐漸回歸理性,行業(yè)將更加關(guān)注數(shù)字人在場(chǎng)景中的表現(xiàn),以及落地后的成效和商業(yè)價(jià)值。
事實(shí)上,盡管虛擬數(shù)字人技術(shù)在高精度渲染方面已經(jīng)取得顯著進(jìn)步,但在大規(guī)模應(yīng)用場(chǎng)景中仍需優(yōu)化,以確保每個(gè)虛擬數(shù)字人的表現(xiàn)質(zhì)量和流暢度。實(shí)時(shí)交互技術(shù)在處理復(fù)雜對(duì)話和多輪交互時(shí),也仍需提高響應(yīng)速度和準(zhǔn)確性。同樣的,融入生成式AI的虛擬數(shù)字人在落地成效上,也面臨技術(shù)的穩(wěn)定性、用戶接受度,以及具體應(yīng)用場(chǎng)景的適配等問題。
談及技未來的優(yōu)化方向,楊星蕊強(qiáng)調(diào)了四個(gè)關(guān)鍵層面。
第一,提升表現(xiàn)力和自然度:進(jìn)一步改進(jìn)虛擬數(shù)字人的面部表情和動(dòng)作捕捉技術(shù),使其表現(xiàn)更加逼真和自然,增強(qiáng)用戶的沉浸感。
第二,加強(qiáng)情感計(jì)算和多模態(tài)交互能力:開發(fā)更先進(jìn)的情感計(jì)算模型,使虛擬數(shù)字人能夠識(shí)別和表達(dá)更復(fù)雜的情感狀態(tài);同時(shí),增強(qiáng)虛擬數(shù)字人與用戶在視覺、聽覺和觸覺等多模態(tài)上的交互能力。
第三,優(yōu)化大規(guī)模應(yīng)用場(chǎng)景中的性能和穩(wěn)定性:提升系統(tǒng)的計(jì)算效率和穩(wěn)定性,確保在大規(guī)模應(yīng)用中依然能夠提供高質(zhì)量的服務(wù),滿足用戶的需求。
第四,數(shù)據(jù)隱私和安全:持續(xù)關(guān)注和改進(jìn)數(shù)據(jù)隱私和安全問題,確保用戶數(shù)據(jù)的安全性和隱私保護(hù),建立用戶對(duì)虛擬數(shù)字人的信任。
對(duì)于海百川科技而言,下一步將繼續(xù)深化虛擬數(shù)字人的技術(shù)研發(fā),重點(diǎn)提升智能化和交互能力,加強(qiáng)開發(fā)更加逼真的面部表情和動(dòng)作捕捉技術(shù),增強(qiáng)虛擬數(shù)字人的情感表達(dá)和互動(dòng)體驗(yàn)。同時(shí),拓展更多的應(yīng)用場(chǎng)景重點(diǎn)布局智慧城市和醫(yī)療健康等領(lǐng)域。在智慧城市方面,虛擬數(shù)字人將作為智能助手,提供城市信息、公共服務(wù)和緊急響應(yīng)等功能;在醫(yī)療健康領(lǐng)域,虛擬數(shù)字人將輔助醫(yī)療診斷、健康管理和患者隨訪,提升醫(yī)療服務(wù)的效率和精準(zhǔn)度。
楊星蕊進(jìn)一步透露,海百川科技還會(huì)加強(qiáng)產(chǎn)學(xué)研合作,帶動(dòng)產(chǎn)業(yè)鏈發(fā)展。通過建立開放合作的平臺(tái),希望與更多的企業(yè)、研究機(jī)構(gòu)和開發(fā)者攜手,共同探索和開發(fā)新的應(yīng)用場(chǎng)景和商業(yè)模式,推動(dòng)虛擬數(shù)字人技術(shù)的普及和應(yīng)用。
隨著技術(shù)的加快演進(jìn),虛擬數(shù)字人技術(shù)應(yīng)用場(chǎng)景的不斷增多,企業(yè)需要面對(duì)如何挑選最適合自己的開發(fā)商這一問題。“技術(shù)實(shí)力、產(chǎn)品成熟度、客戶案例、服務(wù)支持、數(shù)據(jù)安全,是企業(yè)在選擇虛擬數(shù)字人技術(shù)提供商時(shí),應(yīng)該主要關(guān)注的維度。”楊星蕊說。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼