三招為AIOps落地開(kāi)個(gè)好頭
面對(duì)激烈的市場(chǎng)競(jìng)爭(zhēng),企業(yè)意識(shí)到必須在業(yè)務(wù)與IT之間建立一條通暢的“紐帶”。作為制定企業(yè)發(fā)展規(guī)劃與戰(zhàn)略路線的兩大支柱,IT部門應(yīng)當(dāng)成為業(yè)務(wù)部門的重要合作伙伴與助力。
IT部門的誕生與早期的大型機(jī)同步,當(dāng)時(shí)其基本作用僅限于“速度與饋送”。但在之后的發(fā)展過(guò)程中,開(kāi)明的CIO們開(kāi)始與業(yè)務(wù)負(fù)責(zé)人主動(dòng)合作,著力思考運(yùn)營(yíng)指標(biāo)對(duì)下游業(yè)務(wù)的實(shí)際影響。這種將生態(tài)系統(tǒng)可觀察性及運(yùn)營(yíng)指標(biāo)、同業(yè)務(wù)成果關(guān)聯(lián)起來(lái)的能力,不僅代表著明確的競(jìng)爭(zhēng)優(yōu)勢(shì),同時(shí)也是企業(yè)實(shí)現(xiàn)轉(zhuǎn)型與快速創(chuàng)新的必要條件。
但說(shuō)起來(lái)簡(jiǎn)單,我們?cè)撊绾我徊讲竭~向這個(gè)終極目標(biāo)?
目前衡量IT績(jī)效的方法主要分兩種:效率與效能。效率衡量的是IT性能,通常以速度、可用性與吞吐量為指標(biāo)。另一方面,效能表達(dá)的則是IT部門對(duì)于業(yè)務(wù)產(chǎn)出的影響能力。很明顯,業(yè)務(wù)部門更熟悉效能這類指標(biāo),具體涵蓋可用性、客戶滿意度、客戶轉(zhuǎn)化率與財(cái)務(wù)指標(biāo)等等。誰(shuí)能達(dá)成這些目標(biāo),誰(shuí)就能維持高于市場(chǎng)平均水平的增長(zhǎng)率、為股東提供價(jià)值并為客戶提供助力。
傳奇大師Peter Drucker在暢銷書《卓有成效的管理者》當(dāng)中,解釋了效率與效能之間的區(qū)別。雖然他的結(jié)論誕生于1966年,但仍然經(jīng)受住了時(shí)間的考驗(yàn)。Drucker認(rèn)為,二者可以分別理解為“把事做對(duì)”和“做對(duì)的事”。以CIO職能為例,把事做對(duì)最重要,而做對(duì)的事代表設(shè)定正確的目標(biāo)以推動(dòng)業(yè)務(wù)發(fā)展,屬于達(dá)成目標(biāo)的一種前提性思考。
事實(shí)證明,IT價(jià)值往往在預(yù)算與人員配備方面有所體現(xiàn)。在解釋價(jià)值的過(guò)程中,CIO其實(shí)是在證明自己如何理解系統(tǒng)、服務(wù)/應(yīng)用乃至客戶群體對(duì)業(yè)務(wù)成果所產(chǎn)生的直接影響——例如客戶轉(zhuǎn)化、凈推薦值(NPS)所量化的客戶忠誠(chéng)度,以及最終收入與盈利能力。他們可以在服務(wù)與客戶的背景之下,證明IT支出的合理性。以此為前提,我們快速梳理一下哪些指標(biāo)無(wú)法證明IT價(jià)值,而哪些能夠準(zhǔn)確體現(xiàn)IT的回報(bào)。
IT管理中經(jīng)常會(huì)用到正常運(yùn)行時(shí)間與服務(wù)水平協(xié)議(SLA)等指標(biāo),但這些顯然與高管層無(wú)關(guān)。相反,更具意義的IT指標(biāo)應(yīng)該指向創(chuàng)新與擴(kuò)展能力,例如新服務(wù)發(fā)布時(shí)間(TTNS)等指標(biāo)。另一個(gè)重要指標(biāo),則是證明IT方案應(yīng)對(duì)變更的能力。如今,敏捷企業(yè)已經(jīng)將數(shù)字化服務(wù)納入日常運(yùn)營(yíng)當(dāng)中。過(guò)度頻繁的變更與創(chuàng)新往往導(dǎo)致服務(wù)故障,并嚴(yán)重影響客戶體驗(yàn)。一旦受到影響,客戶很可能削減采購(gòu)數(shù)額甚至考慮轉(zhuǎn)向新的服務(wù)商。面對(duì)這類問(wèn)題,IT需要在故障響應(yīng)速度與創(chuàng)新發(fā)布速度之間取得平衡點(diǎn)。理想情況下,IT部門應(yīng)該在客戶受到實(shí)際影響之前檢測(cè)并響應(yīng)故障。雖然IT無(wú)法徹底消滅故障,但往往能夠率先識(shí)別到問(wèn)題的存在、并運(yùn)用知識(shí)預(yù)防潛在的嚴(yán)重后果。
為了提升這種效能,現(xiàn)代CIO開(kāi)始采用AIOps。AIOps是指將人工智能與IT運(yùn)營(yíng)整合起來(lái),具體涵蓋大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)(ML)以及其他各類人工智能(AI)技術(shù),借此自動(dòng)識(shí)別并解決常見(jiàn)的IT問(wèn)題。舉例來(lái)說(shuō),IT人員可以使用AIOps衡量變更操作引發(fā)意外事件的頻率,并將事件與特定客戶群體關(guān)聯(lián)起來(lái)。IT團(tuán)隊(duì)還可以進(jìn)行假設(shè)性分析,甚至在客戶遭遇實(shí)際故障前自動(dòng)完成響應(yīng)。通過(guò)這種前瞻性的識(shí)別與應(yīng)對(duì)能力,AIOps即可防范后續(xù)發(fā)生類似故障、改善IT指標(biāo)。這種主動(dòng)管理能力不僅可以改善客戶體驗(yàn),同時(shí)也可通過(guò)NPS進(jìn)行效果量化。最終,運(yùn)營(yíng)成本將由此降低、客戶更樂(lè)于接受新服務(wù),同時(shí)也保證技術(shù)措施更易被高層管理人員所理解及接納。
效率與效能,可以說(shuō)是CIO職能定位的核心。要想與業(yè)務(wù)部門開(kāi)展良好合作,CIO必須立足特定時(shí)間段判斷哪些內(nèi)容對(duì)業(yè)務(wù)更為重要,而后據(jù)此注入資源以確保IT體系擁有必要的技術(shù)與人才。只有將IT與業(yè)務(wù)部門的優(yōu)先級(jí)事務(wù)統(tǒng)一起來(lái),雙方才能真正建立合作關(guān)系、保證CIO“做對(duì)的事”。結(jié)合實(shí)踐,我們發(fā)現(xiàn)以下三個(gè)步驟可以作為企業(yè)探索AIOps的理想起點(diǎn):
• 打好第一仗:清點(diǎn)您的系統(tǒng)與流程,找到其中重復(fù)、笨拙且效率低下的系統(tǒng)流程。消除及簡(jiǎn)化這類流程,可幫助您提高業(yè)務(wù)效率。
• 關(guān)注正確數(shù)據(jù):很多數(shù)據(jù)與業(yè)務(wù)并沒(méi)有什么關(guān)聯(lián)。因此,請(qǐng)保證只記錄最具價(jià)值的用例以及最值得解決的問(wèn)題,而后判斷解決過(guò)程需要哪些數(shù)據(jù)。這項(xiàng)實(shí)踐的意義,在于引導(dǎo)我們將精力集中在正確的數(shù)據(jù)身上。
• 繪制生態(tài)系統(tǒng)圖:明確整個(gè)企業(yè)生態(tài)系統(tǒng)中的各跨職能團(tuán)隊(duì)。通過(guò)這份系統(tǒng)圖,我們可以明確誰(shuí)需要參與協(xié)作,而后據(jù)此匯總數(shù)據(jù)以訓(xùn)練模型。
希望這三項(xiàng)提示,能幫助大家成功邁出AIOps探索之旅的第一步。

