
破解算力成本難題 青云科技用云原生讓AI更普惠

我們看到不管是芯片廠商還是服務(wù)器廠商,以及云廠商,整個(gè)產(chǎn)業(yè)鏈都在協(xié)同努力降低AI成本。青云科技通過(guò)云原生手段讓AI成本更低的做法值得借鑒,畢竟技術(shù)的問(wèn)題需要通過(guò)技術(shù)來(lái)解決。
當(dāng)前,人工智能在經(jīng)濟(jì)和戰(zhàn)略上的重要性,將成為企業(yè)、政府?dāng)?shù)字化轉(zhuǎn)型的首選項(xiàng)。企業(yè)在發(fā)展數(shù)智化轉(zhuǎn)型中,AI的使用仍受到諸多限制,首當(dāng)其沖的是AI成本居高不下。
IDC數(shù)據(jù)顯示,2021年全球企業(yè)在人工智能軟件、硬件和服務(wù)的總投資將超過(guò)850億美元,預(yù)計(jì)將在2025年增至2045億美元,五年復(fù)合增長(zhǎng)率達(dá)24.5%。
在青云科技云原生產(chǎn)品負(fù)責(zé)人于爽看來(lái),AI所需的算力是一種高階算力,也是一種更高成本的算力。這種情況下,不管是AI框架和工具,還是AI應(yīng)用,都面臨著一種“內(nèi)驅(qū)”產(chǎn)生的變化,也就是說(shuō)AI應(yīng)用本身對(duì)外的輸送能力可能沒(méi)有變化,但對(duì)內(nèi)需要能兼容更多的計(jì)算架構(gòu),兼容更多的輕量調(diào)度框架。
如何評(píng)估AI算力成本?
算力計(jì)算成本高昂,不禁讓人疑惑,AI是否真可以實(shí)現(xiàn)普惠于民?任何技術(shù)過(guò)于昂貴都會(huì)成為少數(shù)人才能享受的奢侈品,比如早期的電腦、手機(jī)、互聯(lián)網(wǎng)等。同樣,AI算力過(guò)高也會(huì)影響之后的應(yīng)用和落地。
AI算力成本主要是設(shè)備、電力、網(wǎng)絡(luò)帶寬等支出,其中又以設(shè)備的支出為最大,最新型號(hào)的CPU、GPU、閃存、智能網(wǎng)卡等IT設(shè)備都會(huì)給AI算力帶來(lái)更大的好處,企業(yè)需要確保AI算力能滿(mǎn)足業(yè)務(wù)需求。
企業(yè)將AI視為業(yè)務(wù)轉(zhuǎn)型、流程再造的重要組成部分,而不能孤立看AI的技術(shù)或者應(yīng)用。由于AI投入巨大,企業(yè)在評(píng)估ROI時(shí)需要從多維度來(lái)進(jìn)行衡量,在AI的價(jià)值體現(xiàn)中,業(yè)務(wù)應(yīng)用至少占6成。
另外,企業(yè)需要從行業(yè)競(jìng)爭(zhēng)、公司戰(zhàn)略角度進(jìn)行評(píng)估:
- AI是否是公司業(yè)務(wù)戰(zhàn)略的核心,例如車(chē)聯(lián)網(wǎng)企業(yè)就需要基于AI實(shí)現(xiàn)自動(dòng)駕駛。
- AI是否成為增加收入的手段,如農(nóng)業(yè)通過(guò)AI及時(shí)發(fā)現(xiàn)病害生物,航運(yùn)業(yè)通過(guò)AI增加航運(yùn)效能,這些都將從AI場(chǎng)景中直接獲得收益。
- AI能否成為降低風(fēng)險(xiǎn)和成本的手段,如倉(cāng)儲(chǔ)物流業(yè)通過(guò)AI及時(shí)發(fā)現(xiàn)危險(xiǎn)情況。
用云原生化解AI成本
人工智能發(fā)展已經(jīng)進(jìn)入與行業(yè)深度融合的階段,AI計(jì)算能力反映了一個(gè)國(guó)家最前沿的計(jì)算能力。中國(guó)和美國(guó)是AI算力支出占總算力支出最高的兩個(gè)國(guó)家。
AI的投入不斷增加,主要是因?yàn)锳I涉及的業(yè)務(wù)場(chǎng)景在不斷普及,比如車(chē)聯(lián)網(wǎng)、監(jiān)控及應(yīng)急管理,這些都需要AI進(jìn)行海量數(shù)據(jù)分析以?xún)?yōu)化算法,實(shí)現(xiàn)更高效的智能化處理。這里的投入既有算法研發(fā)人員的投入、更需要有AI設(shè)備(算力和GPU資源)的投入等。
于爽表示,AI場(chǎng)景靈活多變,對(duì)于企業(yè),特別是中國(guó)企業(yè)來(lái)說(shuō),IT環(huán)境更加復(fù)雜多樣,而形式和服務(wù)模式固定的公有云很難滿(mǎn)足企業(yè)在AI場(chǎng)景上的需求。因此很多企業(yè)選擇云原生架構(gòu)來(lái)解決這類(lèi)問(wèn)題,將AI業(yè)務(wù)、工具和容器、K8s結(jié)合,可以兼容多種基礎(chǔ)設(shè)施環(huán)境,可以靈活地快速部署交付,讓企業(yè)可以放下負(fù)擔(dān),更快速高效地發(fā)揮AI的真正價(jià)值。
通過(guò)云原生,可以充分釋放云的彈性、靈活、分布式、高可用等特性,幫助企業(yè)實(shí)現(xiàn)降本增效。青云科技開(kāi)源了KubeSphere云原生容器平臺(tái),利用云原生的技術(shù)特性,將AI的使用和管理成本降低,同時(shí)結(jié)合自身的云網(wǎng)邊端一體化能力,將AI的價(jià)值輸送變得更便捷。
云原生對(duì)于AI場(chǎng)景的友好及效率提升,云廠商也可以通過(guò)海量AI算力資源池,存儲(chǔ)資源池來(lái)解決AI生產(chǎn)成本過(guò)高與AI算法需求增加之間的矛盾。
GPU/CPU/存儲(chǔ)的高額成本往往成為企業(yè)進(jìn)行AI規(guī);瘧(yīng)用的攔路虎。在特定場(chǎng)景下,模型訓(xùn)練往往是周期性的,同時(shí)更希望借助龐大算力來(lái)縮短訓(xùn)練時(shí)間,及時(shí)產(chǎn)生業(yè)務(wù)價(jià)值,此時(shí)就可以充分發(fā)揮云廠商在算力資源上的優(yōu)勢(shì),借助其規(guī);(yīng),按需使用、按需付費(fèi)來(lái)實(shí)現(xiàn)AI場(chǎng)景的落地。
青云科技在公有云上也提供了GPU云服務(wù)器,對(duì)于企業(yè)來(lái)說(shuō)有四個(gè)明顯優(yōu)點(diǎn):超強(qiáng)計(jì)算加速、極致網(wǎng)絡(luò)性能、彈性購(gòu)買(mǎi)方式、高性?xún)r(jià)比。例如,采用深度生成模型來(lái)實(shí)現(xiàn)精準(zhǔn)降雨預(yù)測(cè),該模型只需1.3秒即可生成一個(gè)全分辨率的臨近天氣預(yù)測(cè)樣本。在私有云環(huán)境里,可以通過(guò)超級(jí)智算平臺(tái)來(lái)統(tǒng)一管理CPU與GPU資源,形成橫向與縱向資源的彈性伸縮及優(yōu)勢(shì)互補(bǔ)。
結(jié)語(yǔ)
如今人工智能類(lèi)工作負(fù)載成為企業(yè)IT基礎(chǔ)設(shè)施的重要承載對(duì)象,眾所周知,AI的投入巨大,尤其是以算力為主,如何降低AI算力成本成為產(chǎn)業(yè)的關(guān)注焦點(diǎn)。
可以預(yù)見(jiàn),人工智能只會(huì)越來(lái)越普及,越來(lái)越普惠,對(duì)算力的需求越來(lái)越大、越來(lái)越多樣,要支撐AI產(chǎn)業(yè)的真正爆發(fā),低成本普惠且包容的算力供給必不可少。
我們看到不管是芯片廠商還是服務(wù)器廠商,以及云廠商,整個(gè)產(chǎn)業(yè)鏈都在協(xié)同努力降低AI成本。青云科技通過(guò)云原生手段讓AI成本更低的做法值得借鑒,畢竟技術(shù)的問(wèn)題需要通過(guò)技術(shù)來(lái)解決。
不過(guò)AI成本不光只是基礎(chǔ)設(shè)施的問(wèn)題,這是一個(gè)綜合問(wèn)題,需要企業(yè)進(jìn)行全局評(píng)估。隨著AI的加速落地,企業(yè)在AI的投入持續(xù)增加,成本問(wèn)題的解決也將成為重點(diǎn),這需要我們一起共同應(yīng)對(duì)挑戰(zhàn)。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼
