
世優(yōu)科技紀(jì)智輝:AI加速數(shù)字人照進(jìn)現(xiàn)實

生成式AI讓數(shù)字人更更快“活起來”。
2023年10月8日,來自45個國家和地區(qū)的12500名運(yùn)動員在400多個體育項目中經(jīng)過15天激烈角逐后,杭州亞運(yùn)會正式閉幕。
作為有史以來數(shù)字化程度最高的體育盛會,杭州亞運(yùn)會選取了一位獨特的數(shù)字人火炬手,進(jìn)行了亞運(yùn)會開幕式的點火儀式。
實際上,作為亞運(yùn)史上首個數(shù)字點火儀式,共有1億多位數(shù)字火炬手參與到了這次火炬接力中,甚至在閉幕儀式上,備受關(guān)注的數(shù)字火炬手“弄潮兒”再次返場,由遠(yuǎn)及近地駐足于主火炬前,與觀眾“比心”互動,直至邁向遠(yuǎn)方化為漫天星辰。
作為一項全民關(guān)注的體育賽事,數(shù)字人的形象在潛移默化中深入人心。
據(jù)亞運(yùn)會開閉幕式虛擬AR技術(shù)及閉幕式數(shù)字火炬手技術(shù)服務(wù)商,世優(yōu)科技CEO&創(chuàng)始人紀(jì)智輝透露,目前世優(yōu)科技已經(jīng)為近千家客戶提供了數(shù)字人相關(guān)服務(wù),累計打造的數(shù)字人超1000個。
世優(yōu)科技CEO&創(chuàng)始人 紀(jì)智輝
尤其是在AI的加持下,越來越多數(shù)字人開始融入人類世界中。
數(shù)字人的催化劑
數(shù)字人近年來的商業(yè)化歷程與人工智能技術(shù)息息相關(guān),尤其是AI模型的興起,為數(shù)字人商業(yè)化再添一把火。
生成式AI對數(shù)字人產(chǎn)業(yè)最顯著的影響,是研發(fā)效率的提升。
紀(jì)智輝稱,“在生成式AI出現(xiàn)之前,數(shù)字人的制造成本高昂,生產(chǎn)周期長,大多數(shù)數(shù)字人企業(yè)都只能做定制化內(nèi)容,用途也比較單一,主要作為數(shù)字代言人、虛擬IP使用。”
高成本、定制化,注定了當(dāng)時數(shù)字人的繁華只能浮于表象,批量應(yīng)用就這樣卡在了批量生產(chǎn)這一工程難題上。
直到生成式AI、大模型的出現(xiàn),讓數(shù)字人產(chǎn)業(yè)從業(yè)者看到了曙光。
2022年11月,ChatGPT面向全球發(fā)布,作為隨后引發(fā)百模大戰(zhàn)的導(dǎo)火索,ChatGPT的發(fā)布也為數(shù)字人的研發(fā)、突破批量生產(chǎn)的困境提供了一條新思路。
據(jù)紀(jì)智輝介紹,基于生成式AI技術(shù)的自然語言處理模型、3D表情驅(qū)動模型等,可以讓數(shù)字人的動作、表達(dá)更生動、更有表現(xiàn)力,更重要的是,生成式AI的強(qiáng)大語言理解和生成能力,能使數(shù)字人更好地理解用戶的復(fù)雜需求和情感,提供更智能、個性化和精準(zhǔn)的交互體驗,實現(xiàn)自主自發(fā)與他人對話互動,讓數(shù)字人快速“活起來”。
讓數(shù)字人照進(jìn)現(xiàn)實
世優(yōu)科技當(dāng)下的主力產(chǎn)品——AI數(shù)字人多模態(tài)交互系統(tǒng)“世優(yōu)波塔”,在產(chǎn)品適配上,支持?jǐn)?shù)字大屏、AI數(shù)字人一體機(jī)、PC端以及H5小程序等多種應(yīng)用終端形態(tài),同時支持私有化部署等集成方案,在大模型的加持下,增強(qiáng)了數(shù)字人的智能性、互動性和真實性,打造出的數(shù)字人更具沉浸式、個性化體驗。
據(jù)官方公開數(shù)據(jù)顯示,基于這一平臺構(gòu)建的數(shù)字人的交互準(zhǔn)確率達(dá)到了98%。
在瀘州市舉辦的“瀘州40正當(dāng)紅”晚會上,世優(yōu)科技打造的虛擬IP酒麒麟“酣酣”,就基于AI數(shù)字人多模態(tài)交互系統(tǒng)“世優(yōu)波塔”,以世優(yōu)AI數(shù)字人一體機(jī)為載體,與現(xiàn)場觀眾實時自主智能互動,為“酣酣”IP提供數(shù)字人“造人”、“養(yǎng)人”、“用人”全棧式服務(wù),讓文化藝術(shù)實現(xiàn)真正的零距離傳播。
這是數(shù)字人在文旅行業(yè)中的應(yīng)用,通過這樣的技術(shù)應(yīng)用,智慧文旅正在以更符合當(dāng)代年輕人喜好的方式,為文旅行業(yè)賦予更多新的時代元素。
其實不僅僅是文旅行業(yè), 在大模型的加持下,數(shù)字人的應(yīng)用領(lǐng)域逐步拓展。
據(jù)悉,世優(yōu)科技的數(shù)字人產(chǎn)品,正以2.5D、3D等形象,在娛樂、金融、電商、教育、醫(yī)療、文旅、商業(yè)、政務(wù)、科研等多個領(lǐng)域得到應(yīng)用,形成如虛擬醫(yī)生、虛擬教師、虛擬導(dǎo)游、虛擬顧問、虛擬辦事員、虛擬主播、虛擬偶像、虛擬客服等身份,真正融入到了人類生活中。
不過,紀(jì)智輝指出,目前定制化數(shù)字人的成本依然比較高,無法普及到普通個人用戶,而生成式數(shù)字人打造只能套用視覺模板生成,無法讓每一位用戶按自己的喜好風(fēng)格打造專屬數(shù)字人,行業(yè)依然需要降本增效,繼續(xù)深耕。
此外,就行業(yè)發(fā)展趨勢,他也指出,數(shù)字人的規(guī);谥鸩铰涞刂校绕涫窃谏墒紸I與數(shù)字人融合發(fā)展后,但落地增速已經(jīng)從前期的高速,逐漸放緩,“如果行業(yè)能夠突破現(xiàn)在算法、算力、數(shù)據(jù)的瓶頸,數(shù)字人的規(guī)模會重新進(jìn)入到高速發(fā)展階段。”
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
