AIOps :改善客戶滿意度的關(guān)鍵技術(shù)
企業(yè)如何快速解決運(yùn)營問題,并為企業(yè)帶來更理想的業(yè)務(wù)產(chǎn)出?這個(gè)問題的答案,可能就在AIOps當(dāng)中。隨著基礎(chǔ)設(shè)施與業(yè)務(wù)應(yīng)用生成的數(shù)據(jù)量越來越大,IT團(tuán)隊(duì)往往需要在彼此離散的孤島中工作,這意味著運(yùn)營管理與改進(jìn),包括監(jiān)控與服務(wù)臺(tái)流程等層面的全面自動(dòng)化將成為一種必需。
作為由Gartner Research在2016年創(chuàng)造的新興詞匯,AIOps 是指利用分析與機(jī)器學(xué)習(xí)技術(shù)并運(yùn)用IT運(yùn)營工具中的各類歷史數(shù)據(jù)。AIOps平臺(tái)能夠?qū)崟r(shí)響應(yīng)各類問題,并以此提供智能洞見以協(xié)助各團(tuán)隊(duì)持續(xù)改進(jìn)核心IT職能,避免潛在故障。
自2020年疫情以來,大部分IT運(yùn)營體系開始轉(zhuǎn)向在線模式,特別是性能監(jiān)控等,流程中收集的數(shù)據(jù)也越來越多。在這一背景下,企業(yè)承受的數(shù)據(jù)收集與處理的壓力不斷提升,而且必須在基礎(chǔ)設(shè)施發(fā)生任何問題的同時(shí)盡快處理。簡而言之,如今IT環(huán)境的特性與要求遠(yuǎn)遠(yuǎn)超出了人類的能力極限,我們已經(jīng)不可能結(jié)合信息采取行動(dòng)并快速做出反應(yīng)。為了保障業(yè)務(wù)成功,這些流程需要也必然要走向自動(dòng)化。
AIOps平臺(tái)能夠?yàn)镮T企業(yè)提供這種必要的運(yùn)營敏捷性優(yōu)勢。通過將數(shù)據(jù)移出孤島,企業(yè)能夠極大提升可擴(kuò)展性與運(yùn)營速度,顯著強(qiáng)化IT運(yùn)營的敏捷水平。只有這樣,企業(yè)才有可能支撐復(fù)雜全球服務(wù)與物流運(yùn)營所產(chǎn)生的海量數(shù)據(jù)集。
此外,AIOps平臺(tái)還能夠減少各類本地解決方案的依賴性,借此消除外包成本。AIOps技術(shù)幫助企業(yè)以無縫方式擴(kuò)展基礎(chǔ)設(shè)施,幫助整個(gè)服務(wù)交付生態(tài)系統(tǒng)高效運(yùn)行,進(jìn)而改善客戶體驗(yàn)。在它的支持下,制造生產(chǎn)或分銷中心不再時(shí)刻被籠罩在服務(wù)中斷的陰影之下。通過智能化自動(dòng)運(yùn)營,企業(yè)還將持續(xù)提升決策準(zhǔn)確性、業(yè)務(wù)可預(yù)測性,借此迎來理想的客戶留存率。
如何發(fā)掘AIOps潛能
企業(yè)首先需要完成大量準(zhǔn)備工作,才能將AIOps的各個(gè)組件拼湊起來,真正建立起易用且可靠的自動(dòng)化運(yùn)營解決方案。下面來看其中的幾個(gè)關(guān)鍵步驟:
第一,收集廣泛而多樣的數(shù)據(jù)。數(shù)據(jù)是AIOps得以成功實(shí)施的基礎(chǔ),因此,我們必須思考如何將不同來源的數(shù)據(jù)組合起來并高效利用。企業(yè)需要從各種來源處收集數(shù)據(jù),包括內(nèi)部部署系統(tǒng)、云平臺(tái)以及應(yīng)用程序等。最終,采集到的數(shù)據(jù)應(yīng)存儲(chǔ)在集中式數(shù)據(jù)湖內(nèi)。得益于AI的強(qiáng)大功能,AIOps平臺(tái)將自動(dòng)完成這一系列操作,并保證更快、更全面地做出高質(zhì)量決策與有意義分析。
第二,將數(shù)據(jù)內(nèi)容劃分為多個(gè)有意義類別。在數(shù)據(jù)攝取過程中,我們需要根據(jù)企業(yè)的運(yùn)營需求對數(shù)據(jù)內(nèi)容進(jìn)行重組。這種重組處理對歷史乃至實(shí)時(shí)攝取數(shù)據(jù)都非常重要。根據(jù)AIOps具體用例,企業(yè)應(yīng)定義出與業(yè)務(wù)規(guī)則相匹配的分類機(jī)制。例如,對于制藥企業(yè),可能需要考慮合成設(shè)備健康數(shù)據(jù)、設(shè)備運(yùn)行效率數(shù)據(jù)以及環(huán)境因素等。
第三,將AIOps機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于初始大數(shù)據(jù)測試用例。一切轉(zhuǎn)型都可以從細(xì)微處著手,AIOps也同樣如此。大家不妨從積累專業(yè)知識(shí)開始,首先嘗試將機(jī)器學(xué)習(xí)功能應(yīng)用于有限的少數(shù)測試用例,再以此為基礎(chǔ)逐步推進(jìn)更大規(guī)模的迭代。
第四,通過量化與反饋提高預(yù)測準(zhǔn)確性。一旦AIOps平臺(tái)解析出數(shù)據(jù)模式,即可智能預(yù)測出接下來可能出現(xiàn)的各類情況,甚至根據(jù)實(shí)時(shí)數(shù)據(jù)做出準(zhǔn)確推理。企業(yè)可以設(shè)計(jì)測試與量化指標(biāo),向模型提供反饋以改進(jìn)預(yù)測質(zhì)量。接下來,AIOps平臺(tái)即可將摸索出的邏輯應(yīng)用于離散數(shù)據(jù),一步步設(shè)計(jì)出更合理的行動(dòng)路線。AIOps平臺(tái)將通過歷史與最新數(shù)據(jù)不斷學(xué)習(xí),持續(xù)自我改進(jìn)并帶來更快、更準(zhǔn)確的決策能力。最終,AIOps將為企業(yè)建立起這樣一個(gè)持續(xù)且穩(wěn)健的反饋加改進(jìn)周期。
AIOps平臺(tái)的探索之旅
Gartner公司預(yù)計(jì),到2023年,使用AIOps及其他數(shù)字體驗(yàn)監(jiān)控工具跟蹤應(yīng)用程序與基礎(chǔ)設(shè)施的大型企業(yè)比例將由2018年的5%上升至30%。面對突如其來的疫情,這種趨勢只會(huì)進(jìn)一步加速,IT部門也迫切需要這種能力快速處理大量在線服務(wù)與運(yùn)營信息,最終根據(jù)數(shù)據(jù)分析結(jié)論與自動(dòng)化運(yùn)營、幫助企業(yè)取得更大的商業(yè)成功。
這里需要再次強(qiáng)調(diào),成功實(shí)現(xiàn)AIOps可能并不像想象中那么困難。IT企業(yè)已經(jīng)具備收集及攝取數(shù)據(jù)的成熟方法,接下來只需要選擇正確的AIOps平臺(tái)、經(jīng)驗(yàn)豐富的開發(fā)合作伙伴,并根據(jù)預(yù)期業(yè)務(wù)收益挑選出合適的試驗(yàn)性用例。

