世優(yōu)科技紀(jì)智輝:AI加速數(shù)字人照進(jìn)現(xiàn)實(shí)
生成式AI讓數(shù)字人更更快“活起來(lái)”。
2023年10月8日,來(lái)自45個(gè)國(guó)家和地區(qū)的12500名運(yùn)動(dòng)員在400多個(gè)體育項(xiàng)目中經(jīng)過(guò)15天激烈角逐后,杭州亞運(yùn)會(huì)正式閉幕。
作為有史以來(lái)數(shù)字化程度最高的體育盛會(huì),杭州亞運(yùn)會(huì)選取了一位獨(dú)特的數(shù)字人火炬手,進(jìn)行了亞運(yùn)會(huì)開(kāi)幕式的點(diǎn)火儀式。
實(shí)際上,作為亞運(yùn)史上首個(gè)數(shù)字點(diǎn)火儀式,共有1億多位數(shù)字火炬手參與到了這次火炬接力中,甚至在閉幕儀式上,備受關(guān)注的數(shù)字火炬手“弄潮兒”再次返場(chǎng),由遠(yuǎn)及近地駐足于主火炬前,與觀眾“比心”互動(dòng),直至邁向遠(yuǎn)方化為漫天星辰。
作為一項(xiàng)全民關(guān)注的體育賽事,數(shù)字人的形象在潛移默化中深入人心。
據(jù)亞運(yùn)會(huì)開(kāi)閉幕式虛擬AR技術(shù)及閉幕式數(shù)字火炬手技術(shù)服務(wù)商,世優(yōu)科技CEO&創(chuàng)始人紀(jì)智輝透露,目前世優(yōu)科技已經(jīng)為近千家客戶(hù)提供了數(shù)字人相關(guān)服務(wù),累計(jì)打造的數(shù)字人超1000個(gè)。
世優(yōu)科技CEO&創(chuàng)始人 紀(jì)智輝
尤其是在AI的加持下,越來(lái)越多數(shù)字人開(kāi)始融入人類(lèi)世界中。
數(shù)字人的催化劑
數(shù)字人近年來(lái)的商業(yè)化歷程與人工智能技術(shù)息息相關(guān),尤其是AI模型的興起,為數(shù)字人商業(yè)化再添一把火。
生成式AI對(duì)數(shù)字人產(chǎn)業(yè)最顯著的影響,是研發(fā)效率的提升。
紀(jì)智輝稱(chēng),“在生成式AI出現(xiàn)之前,數(shù)字人的制造成本高昂,生產(chǎn)周期長(zhǎng),大多數(shù)數(shù)字人企業(yè)都只能做定制化內(nèi)容,用途也比較單一,主要作為數(shù)字代言人、虛擬IP使用。”
高成本、定制化,注定了當(dāng)時(shí)數(shù)字人的繁華只能浮于表象,批量應(yīng)用就這樣卡在了批量生產(chǎn)這一工程難題上。
直到生成式AI、大模型的出現(xiàn),讓數(shù)字人產(chǎn)業(yè)從業(yè)者看到了曙光。
2022年11月,ChatGPT面向全球發(fā)布,作為隨后引發(fā)百模大戰(zhàn)的導(dǎo)火索,ChatGPT的發(fā)布也為數(shù)字人的研發(fā)、突破批量生產(chǎn)的困境提供了一條新思路。
據(jù)紀(jì)智輝介紹,基于生成式AI技術(shù)的自然語(yǔ)言處理模型、3D表情驅(qū)動(dòng)模型等,可以讓數(shù)字人的動(dòng)作、表達(dá)更生動(dòng)、更有表現(xiàn)力,更重要的是,生成式AI的強(qiáng)大語(yǔ)言理解和生成能力,能使數(shù)字人更好地理解用戶(hù)的復(fù)雜需求和情感,提供更智能、個(gè)性化和精準(zhǔn)的交互體驗(yàn),實(shí)現(xiàn)自主自發(fā)與他人對(duì)話互動(dòng),讓數(shù)字人快速“活起來(lái)”。
讓數(shù)字人照進(jìn)現(xiàn)實(shí)
世優(yōu)科技當(dāng)下的主力產(chǎn)品——AI數(shù)字人多模態(tài)交互系統(tǒng)“世優(yōu)波塔”,在產(chǎn)品適配上,支持?jǐn)?shù)字大屏、AI數(shù)字人一體機(jī)、PC端以及H5小程序等多種應(yīng)用終端形態(tài),同時(shí)支持私有化部署等集成方案,在大模型的加持下,增強(qiáng)了數(shù)字人的智能性、互動(dòng)性和真實(shí)性,打造出的數(shù)字人更具沉浸式、個(gè)性化體驗(yàn)。
據(jù)官方公開(kāi)數(shù)據(jù)顯示,基于這一平臺(tái)構(gòu)建的數(shù)字人的交互準(zhǔn)確率達(dá)到了98%。
在瀘州市舉辦的“瀘州40正當(dāng)紅”晚會(huì)上,世優(yōu)科技打造的虛擬IP酒麒麟“酣酣”,就基于AI數(shù)字人多模態(tài)交互系統(tǒng)“世優(yōu)波塔”,以世優(yōu)AI數(shù)字人一體機(jī)為載體,與現(xiàn)場(chǎng)觀眾實(shí)時(shí)自主智能互動(dòng),為“酣酣”IP提供數(shù)字人“造人”、“養(yǎng)人”、“用人”全棧式服務(wù),讓文化藝術(shù)實(shí)現(xiàn)真正的零距離傳播。
這是數(shù)字人在文旅行業(yè)中的應(yīng)用,通過(guò)這樣的技術(shù)應(yīng)用,智慧文旅正在以更符合當(dāng)代年輕人喜好的方式,為文旅行業(yè)賦予更多新的時(shí)代元素。
其實(shí)不僅僅是文旅行業(yè), 在大模型的加持下,數(shù)字人的應(yīng)用領(lǐng)域逐步拓展。
據(jù)悉,世優(yōu)科技的數(shù)字人產(chǎn)品,正以2.5D、3D等形象,在娛樂(lè)、金融、電商、教育、醫(yī)療、文旅、商業(yè)、政務(wù)、科研等多個(gè)領(lǐng)域得到應(yīng)用,形成如虛擬醫(yī)生、虛擬教師、虛擬導(dǎo)游、虛擬顧問(wèn)、虛擬辦事員、虛擬主播、虛擬偶像、虛擬客服等身份,真正融入到了人類(lèi)生活中。
不過(guò),紀(jì)智輝指出,目前定制化數(shù)字人的成本依然比較高,無(wú)法普及到普通個(gè)人用戶(hù),而生成式數(shù)字人打造只能套用視覺(jué)模板生成,無(wú)法讓每一位用戶(hù)按自己的喜好風(fēng)格打造專(zhuān)屬數(shù)字人,行業(yè)依然需要降本增效,繼續(xù)深耕。
此外,就行業(yè)發(fā)展趨勢(shì),他也指出,數(shù)字人的規(guī);谥鸩铰涞刂,尤其是在生成式AI與數(shù)字人融合發(fā)展后,但落地增速已經(jīng)從前期的高速,逐漸放緩,“如果行業(yè)能夠突破現(xiàn)在算法、算力、數(shù)據(jù)的瓶頸,數(shù)字人的規(guī)模會(huì)重新進(jìn)入到高速發(fā)展階段。”
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼