AI需要什么樣的IT基礎(chǔ)設(shè)施
多年以來,隨著AI技術(shù)的發(fā)展與變革,各個行業(yè)及IT決策者都在大力投資這一領(lǐng)域。AI有望改變企業(yè)內(nèi)的一切、轉(zhuǎn)變?nèi)藗兊墓ぷ鞣绞,因此對業(yè)務(wù)及企業(yè)的宏觀/微觀層面控制體系至關(guān)重要。而隨著AI的發(fā)展演進(jìn),我們更需要關(guān)注自己的業(yè)務(wù)功能變化,將每時每刻的需求與改進(jìn)融入AI解決方案。
雖然只處于試點(diǎn)和起步階段,AI已經(jīng)顯示出無可比擬的力量與影響力。隨著AI的后續(xù)發(fā)展,預(yù)計我們將迎來一波又一波更大、更廣泛的變革。那么,AI到底要怎樣繼續(xù)改進(jìn)?
隨著人們對于AI的努力改進(jìn),全社會對計算及基礎(chǔ)設(shè)施資源的需求也將同步增長。當(dāng)AI真正實(shí)現(xiàn)全面普及之后,我們無疑需要一個更經(jīng)濟(jì)、更高效的環(huán)境容納如此龐大的流程。每家企業(yè)都需要適應(yīng)這些變化,并以充分的靈活度迎接新型基礎(chǔ)設(shè)施。換言之,云技術(shù)、特別是混合云解決方案,必將成為AI的實(shí)現(xiàn)基礎(chǔ)。混合云解決方案能夠保證將AI基礎(chǔ)設(shè)施需求消解為業(yè)務(wù)需求,同時從容維持并匹配技術(shù)動態(tài)。只有這樣,企業(yè)才能在持續(xù)使用、開發(fā)并實(shí)現(xiàn)AI方案的同時,不致對自身基礎(chǔ)設(shè)施性能造成嚴(yán)重影響。
下面,我們就聊聊在評估潛在合作伙伴、選擇最佳平臺時需要關(guān)注的幾大核心因素。
核心因素一 高算力
企業(yè)需要高性能計算資源(包括CPU與GPU)探索AI領(lǐng)域內(nèi)的種種可能性。目前大部分企業(yè)仍在AI實(shí)驗(yàn)階段,所以傾向于建立強(qiáng)大的CPU環(huán)境處理基礎(chǔ)AI負(fù)載。但事實(shí)證明,基于CPU的現(xiàn)有計算架構(gòu)并不能滿足深度學(xué)習(xí)流程的需求;可擴(kuò)展神經(jīng)網(wǎng)絡(luò)算法的部署以及高性能網(wǎng)絡(luò)/存儲管理都對算力和數(shù)據(jù)處理密度提出了極高的要求。
核心因素二 存儲容量
存儲容量是一切AI基礎(chǔ)設(shè)施的基本要求;隨著數(shù)據(jù)量的增長,存儲系統(tǒng)也必須擁有擴(kuò)展能力。因此對企業(yè)來說,最重要的就是明確AI實(shí)驗(yàn)究竟需要何等規(guī)模的存儲系統(tǒng)支持。只有以強(qiáng)大的存儲擴(kuò)展計劃與容量管理能力為依托,企業(yè)才能從容做出實(shí)時決策;也只有這樣,我們手中的AI應(yīng)用才能在數(shù)據(jù)的滋養(yǎng)下愈發(fā)完善。
核心因素三 網(wǎng)絡(luò)基礎(chǔ)設(shè)施
無縫網(wǎng)絡(luò)是AI基礎(chǔ)設(shè)施中的又一重要組成部分?紤]到可擴(kuò)展性的重要意義,企業(yè)必須建立起高帶寬、低延遲的網(wǎng)絡(luò)體系。深度學(xué)習(xí)算法高度依賴于通信能力,隨著AI實(shí)驗(yàn)的推進(jìn)與擴(kuò)展,網(wǎng)絡(luò)系統(tǒng)自然要同步成長與進(jìn)化。對于網(wǎng)絡(luò)這種泛用性服務(wù),企業(yè)有必要選擇一家專業(yè)的基礎(chǔ)設(shè)施服務(wù)商,由他們在全球范圍內(nèi)提供服務(wù)打包與技術(shù)支持,并確保不同區(qū)域內(nèi)的堆棧始終擁有良好的分布式與一致性。
核心因素四 安全性
由于AI模型往往會接觸到大量來自醫(yī)療保健、金融等部門的敏感數(shù)據(jù),因此對個人數(shù)據(jù)的安全維護(hù)就成了一大現(xiàn)實(shí)挑戰(zhàn)。這些信息在本質(zhì)上極其脆弱;一旦管理不當(dāng)、特別是被不可靠來源所利用,則可能對使用AI模型的企業(yè)造成巨大危害。此外,如果向AI系統(tǒng)中添加了非必要數(shù)據(jù),則可能引發(fā)決策和推理錯誤。因此,我們需要一套更安全的AI基礎(chǔ)設(shè)施保障數(shù)據(jù)免受侵?jǐn)_。
核心因素五 解決方案必須具有成本效益
這一切還只是AI模型的發(fā)展起點(diǎn)。隨著研究工作的緩慢推進(jìn),AI本身也會變得更加復(fù)雜、開發(fā)成本隨之一路飆升。各個企業(yè)必須努力找到具有成本效益的解決方案,這樣才能推動流程延續(xù)與業(yè)務(wù)增長。具體來講,企業(yè)在支撐AI探索方面勢必要不斷升級網(wǎng)絡(luò)、服務(wù)器及存儲等基礎(chǔ)設(shè)施,滿足AI模型的訓(xùn)練與推理需求。整個過程將極其昂貴,因此必須謹(jǐn)慎選擇那些資源經(jīng)濟(jì)性更好的服務(wù)供應(yīng)商。只有這樣,企業(yè)才能更明智地規(guī)劃、決策并投資于AI基礎(chǔ)設(shè)施,保證自身在被資源支出壓垮之前找到提升自身業(yè)務(wù)績效的寶貴機(jī)會。