生成式AI帶來“新生” 智境云創(chuàng)多舉措推動(dòng)推動(dòng)數(shù)字人規(guī)模化落地
智境云創(chuàng)將拓展AI數(shù)字人在各行業(yè)的應(yīng)用場(chǎng)景,定制化解決方案,并加強(qiáng)與產(chǎn)業(yè)鏈上下游企業(yè)的合作,共同構(gòu)建AI數(shù)字人生態(tài)系統(tǒng)。
數(shù)字人行業(yè)正處于前所未有的快速發(fā)展期。2023年,中國(guó)虛擬人核心市場(chǎng)規(guī)模達(dá)到了205.2億元,并預(yù)計(jì)到2025年將達(dá)到480.6億元。技術(shù)的進(jìn)步是推動(dòng)這一行業(yè)發(fā)展的核心動(dòng)力,AIGC等前沿技術(shù)的應(yīng)用極大地提升了數(shù)字人的交互能力、內(nèi)容生成能力及智能化水平。
數(shù)字人的應(yīng)用場(chǎng)景已經(jīng)從傳統(tǒng)的影視娛樂領(lǐng)域擴(kuò)展到了品牌營(yíng)銷、電商直播、金融教育等多個(gè)領(lǐng)域,為各行各業(yè)帶來全新的交互體驗(yàn)和服務(wù)模式。
智境云創(chuàng)創(chuàng)始人&CEO王智武告訴記者,智境云創(chuàng)注重技術(shù)創(chuàng)新與應(yīng)用拓展,特別是AI與3D技術(shù)的融合。公司持續(xù)投入研發(fā)資源,在前沿技術(shù)領(lǐng)域進(jìn)行探索和突破,提升數(shù)字人的智能水平和交互能力,并關(guān)注新興技術(shù)如3D數(shù)據(jù)集、AIGC、大模型等的融合應(yīng)用。同時(shí),智境云創(chuàng)將拓展AI數(shù)字人在各行業(yè)的應(yīng)用場(chǎng)景,定制化解決方案,并加強(qiáng)與產(chǎn)業(yè)鏈上下游企業(yè)的合作,共同構(gòu)建AI數(shù)字人生態(tài)系統(tǒng)。
此外,公司還根據(jù)市場(chǎng)需求和競(jìng)爭(zhēng)態(tài)勢(shì)靈活調(diào)整市場(chǎng)布局,積極探索數(shù)字人技術(shù)的國(guó)際化應(yīng)用和推廣,特別是在AI+3D技術(shù)方面的全球化發(fā)展,不斷拓寬數(shù)字人的應(yīng)用領(lǐng)域和市場(chǎng)邊界。
生成式AI讓數(shù)字人“煥發(fā)新生”
在生成式AI出現(xiàn)之前,數(shù)字人的發(fā)展面臨了多方面的挑戰(zhàn),包括技術(shù)上的建模與渲染、動(dòng)作與表情捕捉、語音合成與交互的不成熟,資源上的計(jì)算和數(shù)據(jù)獲取成本高昂,倫理上的隱私保護(hù)和形象權(quán)歸屬問題,以及應(yīng)用上的用戶接受度低和技術(shù)整合難度大等問題。
然而,生成式AI技術(shù)的出現(xiàn)極大地改變了這一狀況。它不僅顯著提升了數(shù)字人在建模、渲染、交互等多方面的技術(shù)水平,還極大地豐富了數(shù)字人的應(yīng)用場(chǎng)景,拓展了其商業(yè)價(jià)值。
生成式AI技術(shù)為數(shù)字人帶來了多項(xiàng)新能力,包括高度個(gè)性化的定制能力、多模態(tài)交互能力、自主學(xué)習(xí)與進(jìn)化能力,以及情感理解與陪伴能力。這些新能力不僅增強(qiáng)了數(shù)字人的實(shí)用性和用戶體驗(yàn),還使其更加符合用戶的期望和需求。智境云創(chuàng)將充分利用這些技術(shù)優(yōu)勢(shì),為用戶帶來更加優(yōu)質(zhì)、便捷和個(gè)性化的數(shù)字人體驗(yàn)。
王智武表示,生成式AI技術(shù)的加入,極大地?cái)U(kuò)展了數(shù)字人的落地場(chǎng)景。與過去相比,數(shù)字人現(xiàn)在不僅應(yīng)用于影視、游戲等娛樂領(lǐng)域,還深入到了教育、金融、零售等多個(gè)行業(yè),提供了個(gè)性化教學(xué)、專業(yè)理財(cái)建議、個(gè)性化營(yíng)銷等多樣化服務(wù)。同時(shí),數(shù)字人的交互能力也得到了顯著提升,能夠與用戶進(jìn)行更加自然、流暢的對(duì)話,并結(jié)合多種模態(tài)進(jìn)行交互。此外,個(gè)性化定制服務(wù)和自主學(xué)習(xí)與進(jìn)化能力的增強(qiáng),也使得數(shù)字人能夠更好地適應(yīng)不同場(chǎng)景下的需求變化,提供更加精準(zhǔn)和個(gè)性化的服務(wù)。
化解生成式AI與數(shù)字人的融合挑戰(zhàn)
雖然生成式AI與數(shù)字人的融合是大勢(shì)所趨,但是挑戰(zhàn)也顯而易見,包括技術(shù)層面的模型訓(xùn)練與數(shù)據(jù)需求、計(jì)算資源消耗、多模態(tài)交互協(xié)同以及情感理解與表達(dá);倫理法律層面的隱私保護(hù)、版權(quán)與知識(shí)產(chǎn)權(quán)界定、內(nèi)容真實(shí)性與可信度保障;用戶體驗(yàn)層面的個(gè)性化與定制化服務(wù)、交互自然度提升以及一致性與穩(wěn)定性確保;以及商業(yè)化層面的商業(yè)模式探索和市場(chǎng)競(jìng)爭(zhēng)應(yīng)對(duì)。
這些挑戰(zhàn)需要企業(yè)、研究機(jī)構(gòu)和社會(huì)各界共同努力,通過技術(shù)創(chuàng)新、行業(yè)規(guī)范、用戶體驗(yàn)優(yōu)化和商業(yè)模式創(chuàng)新等方式來逐步解決。
王智武表示,當(dāng)前數(shù)字人技術(shù)雖然取得了顯著進(jìn)展但仍存在一些不足之處。以下是一些可能的不足點(diǎn)和未來的優(yōu)化方向:
真實(shí)感與交互性不足:盡管數(shù)字人在視覺和聲音效果上已經(jīng)取得了很大進(jìn)步但在真實(shí)感和交互性方面仍有待提升。未來的優(yōu)化方向可能包括引入更高級(jí)的圖形渲染技術(shù)和動(dòng)作捕捉技術(shù)以提高數(shù)字人的逼真度和自然度;同時(shí)加強(qiáng)多模態(tài)交互技術(shù)的研發(fā)以實(shí)現(xiàn)更加自然和流暢的交互體驗(yàn)。
智能水平有限:當(dāng)前數(shù)字人的智能水平仍受到算法和模型性能的限制在復(fù)雜語境理解、情感計(jì)算等方面仍有待提升。未來的優(yōu)化方向可能包括加強(qiáng)預(yù)訓(xùn)練大模型和垂域小模型的研發(fā)和應(yīng)用以提高數(shù)字人的智能水平和泛化能力;同時(shí)引入更多領(lǐng)域知識(shí)和規(guī)則以豐富數(shù)字人的知識(shí)庫和決策依據(jù)。
個(gè)性化與定制化不足:不同用戶對(duì)于數(shù)字人的需求和期望存在差異但在個(gè)性化與定制化方面仍有待提升。未來的優(yōu)化方向可能包括加強(qiáng)用戶畫像和行為分析技術(shù)的研究以更好地理解用戶需求;同時(shí)提供更加豐富和靈活的定制化選項(xiàng)以滿足不同用戶的個(gè)性化需求。
隱私與安全問題:隨著數(shù)字人技術(shù)的普及和應(yīng)用隱私與安全問題也日益凸顯。未來的優(yōu)化方向可能包括加強(qiáng)數(shù)據(jù)加密和隱私保護(hù)技術(shù)的研究以保障用戶隱私的安全;同時(shí)建立完善的安全機(jī)制和監(jiān)管體系以應(yīng)對(duì)潛在的安全威脅和風(fēng)險(xiǎn)。
基于這些思考,智境云創(chuàng)在提升數(shù)字人交互能力方面,采取了自研智者千問大模型與合作接入相結(jié)合的方式。一方面,智境云創(chuàng)自研了“智者千問”行業(yè)大模型,通過大規(guī)模的預(yù)訓(xùn)練和自學(xué)習(xí),學(xué)會(huì)語言的語義和語法。在預(yù)訓(xùn)練時(shí),處理海量文本,學(xué)到很多語言知識(shí)和模式,所以能理解和生成各種語言,適應(yīng)不同的場(chǎng)景和任務(wù)。與自研元享云平臺(tái)組成“AI+3D的元宇宙多模態(tài)云平臺(tái)”,為數(shù)字人提供了復(fù)雜語境理解、長(zhǎng)時(shí)間連貫性問答以及多語言交流服務(wù)的能力。另一方面,智境云創(chuàng)也積極與行業(yè)內(nèi)領(lǐng)先的企業(yè)和機(jī)構(gòu)進(jìn)行合作,通過接入外部大模型來進(jìn)一步豐富和提升數(shù)字人的交互能力。這種自研與合作相結(jié)合的方式使得智境云創(chuàng)在數(shù)字人交互技術(shù)方面保持了領(lǐng)先地位并持續(xù)進(jìn)行創(chuàng)新。
推動(dòng)數(shù)字人的規(guī);涞
在王智武看來,數(shù)字人的規(guī);涞睾腿诤线M(jìn)產(chǎn)業(yè)是一個(gè)復(fù)雜而長(zhǎng)期的過程涉及技術(shù)、市場(chǎng)、政策等多個(gè)方面的因素。雖然當(dāng)前數(shù)字人技術(shù)已經(jīng)取得了顯著進(jìn)展但在規(guī);涞睾彤a(chǎn)業(yè)化應(yīng)用方面仍面臨一些挑戰(zhàn)。不過隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展數(shù)字人的規(guī);涞睾彤a(chǎn)業(yè)化應(yīng)用已經(jīng)初具雛形并有望在未來幾年內(nèi)取得更大進(jìn)展。
具體來說數(shù)字人的規(guī);涞睾彤a(chǎn)業(yè)化應(yīng)用需要解決以下幾個(gè)關(guān)鍵問題:一是技術(shù)成熟度和穩(wěn)定性問題需要通過持續(xù)的技術(shù)創(chuàng)新和優(yōu)化來提高數(shù)字人的性能和可靠性;二是市場(chǎng)需求和接受度問題需要通過深入了解用戶需求和應(yīng)用場(chǎng)景來推動(dòng)數(shù)字人在更多領(lǐng)域的落地應(yīng)用;三是政策支持和監(jiān)管問題需要加強(qiáng)政策引導(dǎo)和監(jiān)管力度以規(guī)范數(shù)字人產(chǎn)業(yè)的發(fā)展秩序和保障用戶權(quán)益。
在技術(shù)創(chuàng)新方面,依托在數(shù)據(jù)、算法、算力三大核心要素的持續(xù)積淀,智境云創(chuàng)通過大規(guī)模、高精度的3D數(shù)據(jù)進(jìn)行模型訓(xùn)練,讓AI更全面地理解和計(jì)算物理世界;再通過跨模態(tài)的數(shù)據(jù)算法融合。讓虛擬世界更接近真實(shí),讓物理世界更加智能。
智境云創(chuàng)的數(shù)字人產(chǎn)品具備文本、語音、動(dòng)作等多模態(tài)交互能力,可以適用于VR、MR、AR等多樣化智能終端。這種多模態(tài)交互技術(shù)使得數(shù)字人能夠更自然地與用戶進(jìn)行互動(dòng),提升用戶體驗(yàn)。
智境云創(chuàng)自研了“智者千問”行業(yè)大模型,與元享云平臺(tái)組成“AI+3D的空間計(jì)算多模態(tài)云平臺(tái),平臺(tái)核心驅(qū)動(dòng)力在于AI與大模型的深度應(yīng)用,它們共同構(gòu)建了一站式AI智能服務(wù)體系,涵蓋了生成、驅(qū)動(dòng)、數(shù)智人交互等多個(gè)環(huán)節(jié)。
在空間計(jì)算領(lǐng)域,智境云創(chuàng)具備3D數(shù)據(jù)采集、訓(xùn)練、內(nèi)容創(chuàng)作、云渲染等方面的優(yōu)勢(shì)。這些技術(shù)為數(shù)字人的生成和交互提供了堅(jiān)實(shí)的基礎(chǔ),使得數(shù)字人在視覺和交互效果上更加逼真和流暢。
在行業(yè)方面,智境云創(chuàng)針對(duì)教育、金融、電商等多個(gè)應(yīng)用場(chǎng)景打造了數(shù)字人解決方案。智境云創(chuàng)在數(shù)字人領(lǐng)域已經(jīng)成功實(shí)施了多個(gè)案例,并取得了顯著的效果。例如,智境云創(chuàng)與華山景區(qū)攜手合作,共同推出了虛擬形象——沉小香。這一創(chuàng)新舉措將傳統(tǒng)文化與現(xiàn)代科技完美融合,為游客帶來前所未有的沉浸式旅游體驗(yàn)。沉小香作為華山景區(qū)的虛擬代言人,不僅擁有文人俠士的清新脫俗外形,更蘊(yùn)含著深厚的文化內(nèi)涵和華山精神的獨(dú)特魅力。以數(shù)字化的形式,活靈活現(xiàn)地展現(xiàn)華山的歷史傳說、自然風(fēng)光與人文風(fēng)情,引領(lǐng)游客穿梭于現(xiàn)實(shí)與虛擬交織的奇妙世界,感受華山的壯麗與神秘,開啟一場(chǎng)別開生面的文化探索之旅。此外,智境云創(chuàng)還攜手外研在線打造了虛擬數(shù)字人“子衿”,在教育領(lǐng)域的應(yīng)用中,子衿能夠?yàn)閷W(xué)生提供個(gè)性化的學(xué)習(xí)輔導(dǎo)和情感支持,提高了教學(xué)效果和學(xué)習(xí)體驗(yàn)。
結(jié)語
數(shù)字人的規(guī);涞睾腿诤线M(jìn)產(chǎn)業(yè)是一個(gè)復(fù)雜而長(zhǎng)期的過程,涉及技術(shù)、市場(chǎng)、政策等多個(gè)方面的因素。雖然當(dāng)前數(shù)字人技術(shù)已經(jīng)取得了顯著進(jìn)展,但在規(guī)模化落地和產(chǎn)業(yè)化應(yīng)用方面仍面臨一些挑戰(zhàn)。不過隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展,數(shù)字人的規(guī);涞睾彤a(chǎn)業(yè)化應(yīng)用已經(jīng)初具雛形,并有望在未來幾年內(nèi)取得更大進(jìn)展。
數(shù)字人市場(chǎng)競(jìng)爭(zhēng)格局呈現(xiàn)出多元化特點(diǎn),眾多參與者憑借各自的技術(shù)優(yōu)勢(shì)和市場(chǎng)渠道展開激烈競(jìng)爭(zhēng),推動(dòng)了整個(gè)行業(yè)的快速發(fā)展。政策支持力度的加大也為數(shù)字人行業(yè)的發(fā)展提供了有力保障,政府在數(shù)據(jù)政策、人才培養(yǎng)等方面的舉措將進(jìn)一步促進(jìn)數(shù)字人行業(yè)的繁榮。
最后,王智武表示,企業(yè)在選擇數(shù)字人技術(shù)提供商時(shí),應(yīng)綜合考慮技術(shù)實(shí)力與經(jīng)驗(yàn)、成功案例與作品、資質(zhì)與合規(guī)性、定制化能力、服務(wù)與支持以及價(jià)格與性價(jià)比等多個(gè)維度。技術(shù)實(shí)力是確保項(xiàng)目成功的關(guān)鍵,成功案例能夠評(píng)估提供商的項(xiàng)目執(zhí)行能力和成果質(zhì)量,資質(zhì)合規(guī)性保障項(xiàng)目的合法性和企業(yè)信息的安全,定制化能力確保滿足企業(yè)的個(gè)性化需求,服務(wù)與支持則保障項(xiàng)目執(zhí)行過程中的問題解決和技術(shù)更新,而價(jià)格與性價(jià)比則需綜合考慮以確保投資回報(bào)。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼