AIOps“入坑”之前必須了解的知識(shí)
AIOps憑借著強(qiáng)有力的表現(xiàn)在行業(yè)中引起廣泛的關(guān)注與支持,已經(jīng)有充分理由證明,AIOps也許將為我們開啟一扇新的大門,在AI的支持下高效發(fā)現(xiàn)并處理基礎(chǔ)設(shè)施運(yùn)營領(lǐng)域的種種常見問題。
AIOps(人工智能與運(yùn)營)是指在IT運(yùn)營當(dāng)中引入AI算法,借此解決網(wǎng)絡(luò)當(dāng)中不斷增長的數(shù)據(jù)與復(fù)雜性難題,同時(shí)緩解IT預(yù)算緊張帶來的長期壓力。AIOps解決方案與谷歌地圖或者Uber的出行價(jià)格預(yù)測(cè)模型采用相同的機(jī)器學(xué)習(xí)與高級(jí)分析技術(shù),能夠幫助IT部門在用戶感受甚至意識(shí)到故障之前,就搶先完成預(yù)測(cè)與基礎(chǔ)設(shè)施修復(fù)。
在這樣的AI自主修復(fù)網(wǎng)絡(luò)當(dāng)中,用戶將享受到穩(wěn)定的性能體驗(yàn),企業(yè)不再需要為了“維穩(wěn)”而投入大量寶貴IT資源。AIOps在保障無線網(wǎng)絡(luò)運(yùn)行速度與可靠性方面的表現(xiàn)尤其突出。時(shí)至今日,Wi-Fi已經(jīng)與供水、供電與照明等基礎(chǔ)保障系統(tǒng)一道,成為我們?nèi)粘I钪斜夭豢缮俚囊徊糠。而在這個(gè)高度移動(dòng)性、應(yīng)用程序驅(qū)動(dòng)型時(shí)代下,企業(yè)也開始以無線網(wǎng)絡(luò)為基礎(chǔ)設(shè)計(jì)并構(gòu)建面向消費(fèi)者及內(nèi)部員工的服務(wù)組合。因此,無線網(wǎng)絡(luò)連接必須比以往任何時(shí)候都更加可預(yù)測(cè)、可量化且易于管理。
換言之,企業(yè)需要對(duì)流經(jīng)無線網(wǎng)絡(luò)的PB級(jí)數(shù)據(jù)建立起更好的可見性,并根據(jù)由此獲得的洞見實(shí)時(shí)、主動(dòng)甚至自動(dòng)調(diào)整其基礎(chǔ)設(shè)施,避免故障及性能優(yōu)化問題影響到用戶體驗(yàn)。企業(yè)如何利用AIOps作為這種新型自主運(yùn)行網(wǎng)絡(luò)的實(shí)施基礎(chǔ)?我們不妨從以下五項(xiàng)優(yōu)先事務(wù)出發(fā)。
第一,選擇真正的AI解決方案。與自動(dòng)駕駛汽車及醫(yī)療診斷系統(tǒng)中的AI系統(tǒng)一樣,IT運(yùn)營領(lǐng)域的真正AI方案必須能夠隨時(shí)間推移而不斷分析更多數(shù)據(jù),借此提升自身智能水平并持續(xù)增強(qiáng)其自動(dòng)監(jiān)控并修復(fù)網(wǎng)絡(luò)問題的能力。
目前市面上不少AI解決方案,在本質(zhì)上只是一種花哨的數(shù)據(jù)收集或數(shù)字運(yùn)算產(chǎn)品。它們雖然能夠高效收集并分析統(tǒng)計(jì)數(shù)據(jù),但實(shí)際使用的底層AI技術(shù)與自動(dòng)駕駛汽車等并不相同。因此,企業(yè)需要認(rèn)真考量選定的AIOps平臺(tái),保證其中包含以下要素:1、數(shù)據(jù)管道:支持從多種數(shù)據(jù)源處獲取數(shù)據(jù);2、AI原語:向數(shù)據(jù)當(dāng)中添加特定領(lǐng)域?qū)I(yè)知識(shí)的能力;3、數(shù)據(jù)科學(xué)算法庫:在工具箱中提供深度學(xué)習(xí)選項(xiàng);4、易于上手的用戶界面:只有可供業(yè)務(wù)員工快速使用的解決方案,才是實(shí)現(xiàn)數(shù)據(jù)科學(xué)大眾化的可行載體;5、對(duì)CIO們來說,了解不同平臺(tái)之間的差異并制定出將AIOps納入網(wǎng)絡(luò)自動(dòng)運(yùn)行策略將非常重要。
第二,數(shù)據(jù)協(xié)調(diào)。高質(zhì)量的AI模型離不開清潔的集成化數(shù)據(jù)。AI系統(tǒng)需要分析數(shù)據(jù)并從中學(xué)習(xí)種種特征,而如果遍布企業(yè)內(nèi)部的WLAN、WAN、路由器、防火墻等要素之間無法實(shí)現(xiàn)數(shù)據(jù)共享與關(guān)聯(lián),我們將永遠(yuǎn)得不到準(zhǔn)確可靠的模型方案。因此,企業(yè)必須消除整個(gè)IT堆棧內(nèi)的一切數(shù)據(jù)孤島,將多種不同系統(tǒng)整合成統(tǒng)一的數(shù)據(jù)共享整體。
第三,建立正確的技能儲(chǔ)備。AIOps對(duì)于IT人員代表著一波重大變革,從配置框命令行界面、到用于從數(shù)據(jù)中獲取洞見的API編程模型,都在挑戰(zhàn)內(nèi)部員工的以往工作習(xí)慣。在傳統(tǒng)上,大多數(shù)網(wǎng)絡(luò)管理員的主要培訓(xùn)內(nèi)容都集中在配置硬件方面。但對(duì)AIOps來說,這還遠(yuǎn)遠(yuǎn)不夠。員工們需要掌握更廣泛的技能,從各類設(shè)備中獲取數(shù)據(jù),并將其轉(zhuǎn)化為通用且可互操作的格式以供AI系統(tǒng)使用。
CIO及其他企業(yè)高管當(dāng)然需要了解其中的區(qū)別,并在招聘、任用與再培訓(xùn)等方面做出相應(yīng)調(diào)整?偠灾瑳]有強(qiáng)大的開發(fā)技能作為基礎(chǔ),AIOps永遠(yuǎn)發(fā)揮不出應(yīng)有的作用。
第四,了解AIOps與分布式軟件云架構(gòu)之間的密切聯(lián)系。
人們所熟悉的第一代云托管端點(diǎn)技術(shù),在本質(zhì)上是由采用嵌入式軟件架構(gòu)的本地控制器所組成。雖然這種結(jié)構(gòu)能夠讓無線網(wǎng)絡(luò)的部署與管理變得更為輕松,但未來的自主運(yùn)行網(wǎng)絡(luò)更需要分布式云軟件架構(gòu)的支持,由此保證我們可以隨時(shí)添加新的AI模型。
從這個(gè)角度看,希望采用AIOps的企業(yè)需要推廣分布式微服務(wù)架構(gòu),允許在網(wǎng)絡(luò)的各個(gè)層面應(yīng)用新的算法,借此實(shí)現(xiàn)跨部門可見性并快速實(shí)現(xiàn)維修與新功能。
第五,擁抱云計(jì)算。雖然企業(yè)在銷售、人力資源、財(cái)務(wù)及其他業(yè)務(wù)領(lǐng)域已經(jīng)開始積極引入云要素,但網(wǎng)絡(luò)層面的云升級(jí)速度一直比較遲緩。CIO們必須意識(shí)到,云是AIOps的最佳搭檔。云計(jì)算能夠提供極具可擴(kuò)展性的基礎(chǔ)設(shè)施,用于從無線網(wǎng)絡(luò)數(shù)據(jù)當(dāng)中提取并推理出可行洞見。
通過這五個(gè)基本步驟,企業(yè)有望充分發(fā)揮AIOps的強(qiáng)大威能,由此構(gòu)建起更易于運(yùn)營、且使用感受更為友好的自主運(yùn)行網(wǎng)絡(luò)體系。

