AIOps工具,要開源還是閉源?
關(guān)于開源工具與專有工具的爭論早已不是什么新鮮事。但在AIOps工具方面,還有其他一些特殊的因素需要考量。
AIOps工具市場不僅特別復(fù)雜,而且相關(guān)工具總是有著很多獨特的性質(zhì),例如需要訪問敏感數(shù)據(jù),往往進一步影響到采購方在評估方面的具體判斷。
在深入探討開源與專有問題之前,我們首先需要明確定義何謂AIOps工具。以此為基礎(chǔ),我們再比較兩類工具,嘗試解釋企業(yè)應(yīng)當(dāng)結(jié)合哪些因素在開源與專有AIOps方案之間做出抉擇。
作為一個流行詞匯,不同的人往往對AIOps有著不同的定義與理解。在本文中,我們將AIOps定義為使用人工智能(AI)或機器學(xué)習(xí)的一切IT工具或服務(wù)。很明顯,這是一種相當(dāng)寬泛的定義方法;也有部分供應(yīng)商及分析師認為,工具必須要用到復(fù)雜的AI與機器學(xué)習(xí)算法,才有資格被列入AIOps陣營。
但是,隨著AIOps市場的迅速發(fā)展,我們倒不妨把標(biāo)準(zhǔn)放寬一點。某些工具雖然未被明確劃定為AIOps平臺,但采購方很可能就是想把它當(dāng)成AIOps工具來使用。對于這類情況,堅持狹義AIOps定義顯然不利于做出確切的判斷。
開源AIOps工具
就目前來看,只有少部分開源項目將自身標(biāo)榜為AIOps。但不少開源平臺提供的某些功能完全符合AIOps的理念。例如,使用數(shù)據(jù)分析(在一定程度上)實現(xiàn)工作流程編排自動化的Kubernetes正是AIOps平臺的重要特征。Nagios及Zabbix等開源監(jiān)控平臺也能夠提供相當(dāng)一部分AIOps基本分析功能。此外,各類開源編程語言模塊或框架,如PyTorch與TensorFlow也有助于實現(xiàn)AIOps功能,而這些顯然不算是完整的AIOps平臺。
從各個角度來看,支持開源AIOps工具的觀點與支持整個開源生態(tài)的思路基本相同 ——與專有替代方案相比,開源AIOps工具往往成本更低、更易于修改或自定義,同時也降低了供應(yīng)商及平臺鎖定的風(fēng)險。
除此之外,評估開源AIOps工具時還應(yīng)關(guān)注一些特殊的注意事項。首先,到目前為止還沒有出現(xiàn)任何端到端開源AIOps平臺。換句話說,沒有哪種單一的開源平臺能夠直接為企業(yè)提供簡化IT運營的全部必要AIOps功能。相反,我們需要將多種不同開源工具整合起來,每款工具只能提供一部分AIOps功能。要使用這些開源工具并充分發(fā)揮AIOps的優(yōu)勢,IT運營團隊需要面對大量工具選項,自然也就得耗費大量精力。
除此之外,AIOps工具在本質(zhì)上需要訪問到大量數(shù)據(jù),其中一部分數(shù)據(jù)可能相當(dāng)敏感,或者可能被攻擊者用于發(fā)動入侵乃至破壞。這意味著使用專有的AIOps工具,買方必須信任賣方,允許后者成為在客戶系統(tǒng)及環(huán)境中提取并分析數(shù)據(jù)的稱職管家。此外,合規(guī)性問題也很重要,目前不少法律已經(jīng)對供應(yīng)商工具將用戶數(shù)據(jù)移動至自有基礎(chǔ)設(shè)施內(nèi)以進行處理或存儲的場景做出約束。
如果平臺需要借助外部基礎(chǔ)設(shè)施進行數(shù)據(jù)處理,那么開源AIOps工具也會受到同樣的影響。但大多數(shù)開源工具主要運行在用戶的自有數(shù)據(jù)中心內(nèi),或者至少是在用戶控制的公有云基礎(chǔ)設(shè)施之上運行,因此帶來的合規(guī)性或數(shù)據(jù)隱私問題一般更少。畢竟每個人都可以觀察開源工具的源代碼,借此確定項目對用戶信息的處理方式,借此提升數(shù)據(jù)管理流程的透明度與可信度。
專有AIOps工具
與開源領(lǐng)域相反,專有軟件市場上已經(jīng)出現(xiàn)了大量被明確標(biāo)榜為“AIOps”的工具。例如,Broadcom公司就在著力以AIOps產(chǎn)品的名義推銷其可觀察性軟件。Splunk以及Instana與PagerDuty等小型廠商也已經(jīng)涉足于AIOps。作為一種整體趨勢,越來越多專有監(jiān)控與事件響應(yīng)工具都在用AIOps強化自己的市場影響力。
選擇專有AIOps工具的核心原因,在于其難度往往比開源方案更低。專有工具的用戶友好度一般較高,而且與開源選項相比,前者更傾向于提供較為廣泛的AIOps功能。此外,相當(dāng)一部分專有 AIOps工具都以托管服務(wù)的形式運行,所以用戶不必費神建立起用于托管這些服務(wù)的自有基礎(chǔ)設(shè)施。
但對于部分專有AIOps工具,上述數(shù)據(jù)管理問題可能會構(gòu)成新的挑戰(zhàn)。因此,一般企業(yè)在選擇供應(yīng)商必須認真評估對方的合規(guī)性保障與防止數(shù)據(jù)遭到濫用的能力。好消息是,AIOps領(lǐng)域的大多數(shù)供應(yīng)商都擁有良好的商業(yè)聲譽,在以合規(guī)且安全方式管理客戶數(shù)據(jù)方面也擁有豐富的經(jīng)驗。
開源與專有AIOps的未來
評估AIOps工具的最后一個因素,在于市場的快速發(fā)展。盡管截至2021年初,AIOps產(chǎn)品中的開源生態(tài)還遠遠落后于專有軟件市場,但隨著更多開源開發(fā)者及支持者向AIOps領(lǐng)域投入資源,雙方的關(guān)系與競爭形勢有可能發(fā)生改變。
當(dāng)然,專有供應(yīng)商也會繼續(xù)增強AIOps功能。如今,大多數(shù)商業(yè)AIOps工具都集中在監(jiān)控與事件管理方案層面。但在不久的未來,將有更多專有AIOps工具嘗試在日志管理、基礎(chǔ)設(shè)施配置以及其他IT運營利基領(lǐng)域發(fā)揮作用。
總而言之,AIOps工具的評估工作需要充分的耐心與對細節(jié)的關(guān)注。另外,企業(yè)也不應(yīng)將選擇視為一勞永逸的工作——只要出現(xiàn)了更好的選擇,大家必須迅速行動、順應(yīng)變革。

