破解算力成本難題 青云科技用云原生讓AI更普惠
我們看到不管是芯片廠商還是服務(wù)器廠商,以及云廠商,整個產(chǎn)業(yè)鏈都在協(xié)同努力降低AI成本。青云科技通過云原生手段讓AI成本更低的做法值得借鑒,畢竟技術(shù)的問題需要通過技術(shù)來解決。
當(dāng)前,人工智能在經(jīng)濟和戰(zhàn)略上的重要性,將成為企業(yè)、政府?dāng)?shù)字化轉(zhuǎn)型的首選項。企業(yè)在發(fā)展數(shù)智化轉(zhuǎn)型中,AI的使用仍受到諸多限制,首當(dāng)其沖的是AI成本居高不下。
IDC數(shù)據(jù)顯示,2021年全球企業(yè)在人工智能軟件、硬件和服務(wù)的總投資將超過850億美元,預(yù)計將在2025年增至2045億美元,五年復(fù)合增長率達24.5%。
在青云科技云原生產(chǎn)品負(fù)責(zé)人于爽看來,AI所需的算力是一種高階算力,也是一種更高成本的算力。這種情況下,不管是AI框架和工具,還是AI應(yīng)用,都面臨著一種“內(nèi)驅(qū)”產(chǎn)生的變化,也就是說AI應(yīng)用本身對外的輸送能力可能沒有變化,但對內(nèi)需要能兼容更多的計算架構(gòu),兼容更多的輕量調(diào)度框架。
如何評估AI算力成本?
算力計算成本高昂,不禁讓人疑惑,AI是否真可以實現(xiàn)普惠于民?任何技術(shù)過于昂貴都會成為少數(shù)人才能享受的奢侈品,比如早期的電腦、手機、互聯(lián)網(wǎng)等。同樣,AI算力過高也會影響之后的應(yīng)用和落地。
AI算力成本主要是設(shè)備、電力、網(wǎng)絡(luò)帶寬等支出,其中又以設(shè)備的支出為最大,最新型號的CPU、GPU、閃存、智能網(wǎng)卡等IT設(shè)備都會給AI算力帶來更大的好處,企業(yè)需要確保AI算力能滿足業(yè)務(wù)需求。
企業(yè)將AI視為業(yè)務(wù)轉(zhuǎn)型、流程再造的重要組成部分,而不能孤立看AI的技術(shù)或者應(yīng)用。由于AI投入巨大,企業(yè)在評估ROI時需要從多維度來進行衡量,在AI的價值體現(xiàn)中,業(yè)務(wù)應(yīng)用至少占6成。
另外,企業(yè)需要從行業(yè)競爭、公司戰(zhàn)略角度進行評估:
- AI是否是公司業(yè)務(wù)戰(zhàn)略的核心,例如車聯(lián)網(wǎng)企業(yè)就需要基于AI實現(xiàn)自動駕駛。
- AI是否成為增加收入的手段,如農(nóng)業(yè)通過AI及時發(fā)現(xiàn)病害生物,航運業(yè)通過AI增加航運效能,這些都將從AI場景中直接獲得收益。
- AI能否成為降低風(fēng)險和成本的手段,如倉儲物流業(yè)通過AI及時發(fā)現(xiàn)危險情況。
用云原生化解AI成本
人工智能發(fā)展已經(jīng)進入與行業(yè)深度融合的階段,AI計算能力反映了一個國家最前沿的計算能力。中國和美國是AI算力支出占總算力支出最高的兩個國家。
AI的投入不斷增加,主要是因為AI涉及的業(yè)務(wù)場景在不斷普及,比如車聯(lián)網(wǎng)、監(jiān)控及應(yīng)急管理,這些都需要AI進行海量數(shù)據(jù)分析以優(yōu)化算法,實現(xiàn)更高效的智能化處理。這里的投入既有算法研發(fā)人員的投入、更需要有AI設(shè)備(算力和GPU資源)的投入等。
于爽表示,AI場景靈活多變,對于企業(yè),特別是中國企業(yè)來說,IT環(huán)境更加復(fù)雜多樣,而形式和服務(wù)模式固定的公有云很難滿足企業(yè)在AI場景上的需求。因此很多企業(yè)選擇云原生架構(gòu)來解決這類問題,將AI業(yè)務(wù)、工具和容器、K8s結(jié)合,可以兼容多種基礎(chǔ)設(shè)施環(huán)境,可以靈活地快速部署交付,讓企業(yè)可以放下負(fù)擔(dān),更快速高效地發(fā)揮AI的真正價值。
通過云原生,可以充分釋放云的彈性、靈活、分布式、高可用等特性,幫助企業(yè)實現(xiàn)降本增效。青云科技開源了KubeSphere云原生容器平臺,利用云原生的技術(shù)特性,將AI的使用和管理成本降低,同時結(jié)合自身的云網(wǎng)邊端一體化能力,將AI的價值輸送變得更便捷。
云原生對于AI場景的友好及效率提升,云廠商也可以通過海量AI算力資源池,存儲資源池來解決AI生產(chǎn)成本過高與AI算法需求增加之間的矛盾。
GPU/CPU/存儲的高額成本往往成為企業(yè)進行AI規(guī);瘧(yīng)用的攔路虎。在特定場景下,模型訓(xùn)練往往是周期性的,同時更希望借助龐大算力來縮短訓(xùn)練時間,及時產(chǎn)生業(yè)務(wù)價值,此時就可以充分發(fā)揮云廠商在算力資源上的優(yōu)勢,借助其規(guī);(yīng),按需使用、按需付費來實現(xiàn)AI場景的落地。
青云科技在公有云上也提供了GPU云服務(wù)器,對于企業(yè)來說有四個明顯優(yōu)點:超強計算加速、極致網(wǎng)絡(luò)性能、彈性購買方式、高性價比。例如,采用深度生成模型來實現(xiàn)精準(zhǔn)降雨預(yù)測,該模型只需1.3秒即可生成一個全分辨率的臨近天氣預(yù)測樣本。在私有云環(huán)境里,可以通過超級智算平臺來統(tǒng)一管理CPU與GPU資源,形成橫向與縱向資源的彈性伸縮及優(yōu)勢互補。
結(jié)語
如今人工智能類工作負(fù)載成為企業(yè)IT基礎(chǔ)設(shè)施的重要承載對象,眾所周知,AI的投入巨大,尤其是以算力為主,如何降低AI算力成本成為產(chǎn)業(yè)的關(guān)注焦點。
可以預(yù)見,人工智能只會越來越普及,越來越普惠,對算力的需求越來越大、越來越多樣,要支撐AI產(chǎn)業(yè)的真正爆發(fā),低成本普惠且包容的算力供給必不可少。
我們看到不管是芯片廠商還是服務(wù)器廠商,以及云廠商,整個產(chǎn)業(yè)鏈都在協(xié)同努力降低AI成本。青云科技通過云原生手段讓AI成本更低的做法值得借鑒,畢竟技術(shù)的問題需要通過技術(shù)來解決。
不過AI成本不光只是基礎(chǔ)設(shè)施的問題,這是一個綜合問題,需要企業(yè)進行全局評估。隨著AI的加速落地,企業(yè)在AI的投入持續(xù)增加,成本問題的解決也將成為重點,這需要我們一起共同應(yīng)對挑戰(zhàn)。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼