興業(yè)證券「現(xiàn)身說(shuō)法」:談云原生時(shí)代技術(shù)架構(gòu)和運(yùn)維的「解題技巧」
有人說(shuō),互聯(lián)網(wǎng)時(shí)代所有行業(yè)的宿命,是披著傳統(tǒng)行業(yè)的外衣,內(nèi)里是朝著科技公司進(jìn)化變異的物種。
你以為星巴克只是賣(mài)咖啡,其實(shí)它已經(jīng)把科技看得比賣(mài)咖啡還重要,利用數(shù)字科技拓展全球業(yè)務(wù)的版圖;你以為達(dá)美樂(lè)只是賣(mài)披薩,但是它最大的部門(mén)不是研發(fā)部門(mén),不是營(yíng)銷(xiāo)部門(mén),而是IT部門(mén)……科技和傳統(tǒng)行業(yè)之間的界限,已經(jīng)越來(lái)越模糊。我們熟知的傳統(tǒng)行業(yè),其實(shí)都是科技公司。
其中,被影響最深刻的行業(yè)之一,還屬金融業(yè)。身處金融科技比拼較量的重要陣地之一的興業(yè)證券,它自然了解其中的規(guī)則——從數(shù)據(jù)中心到云平臺(tái),再到最上層運(yùn)維全方位技術(shù)改革,興業(yè)證券用自身搭建新一代數(shù)字基礎(chǔ)設(shè)施的成功實(shí)踐,特別是如何構(gòu)建容器云平臺(tái)、實(shí)施AIOps等實(shí)踐現(xiàn)身說(shuō)法。
興業(yè)證券信息技術(shù)部副總經(jīng)理王玥表示,興業(yè)證券一直將數(shù)字化轉(zhuǎn)型戰(zhàn)略置于集團(tuán)戰(zhàn)略的高度,作為企業(yè)一線開(kāi)源實(shí)踐者,興業(yè)證券將持續(xù)保持對(duì)IT建設(shè)的高水位投入和前瞻布局。
談三大挑戰(zhàn)和三大抓手
記者:興業(yè)證券面臨什么數(shù)字化轉(zhuǎn)型挑戰(zhàn),落實(shí)到信息技術(shù)部門(mén),對(duì)信息技術(shù)部門(mén)提出了什么訴求?
王玥:過(guò)去五年,我們明顯感受到以數(shù)字化和智能化為特征的新技術(shù)發(fā)展正在推動(dòng)著企業(yè)整個(gè)信息技術(shù)體系的變化。過(guò)去IT部門(mén)的定位是助力業(yè)務(wù)發(fā)展,而現(xiàn)在的定位是引領(lǐng)業(yè)務(wù)發(fā)展,技術(shù)體系更是朝著數(shù)字化和智能化場(chǎng)景轉(zhuǎn)變。
從我們自己的角度來(lái)看,能夠清晰感受到三個(gè)挑戰(zhàn)。第一,證券行業(yè)歷來(lái)是對(duì)風(fēng)險(xiǎn)和監(jiān)管要求比較嚴(yán)格的行業(yè),在這種態(tài)勢(shì)下,我們一方面要保障系統(tǒng)安全穩(wěn)定運(yùn)行,另一方面又要做到業(yè)務(wù)創(chuàng)新、系統(tǒng)敏捷,在這兩個(gè)之間權(quán)衡有一定的挑戰(zhàn)。
第二,云計(jì)算是整個(gè)金融科技發(fā)展的底座,正不斷影響著我們上層的應(yīng)用架構(gòu),對(duì)于證券公司來(lái)講,也需要深入研究并且充分發(fā)揮云原生架構(gòu)的效能,來(lái)支撐企業(yè)業(yè)務(wù)快速創(chuàng)新。
第三,云原生技術(shù)體系比如微服務(wù)、容器應(yīng)用快速迭代,其交付的敏捷模式越來(lái)越普遍,架構(gòu)也越來(lái)越復(fù)雜,這種情況下,過(guò)去依賴(lài)個(gè)人經(jīng)驗(yàn)和手工操作的傳統(tǒng)運(yùn)維模式,在敏態(tài)的狀態(tài)下行不通,因此我們的運(yùn)維模式也進(jìn)行了轉(zhuǎn)型。
針對(duì)這種情況,興業(yè)證券經(jīng)過(guò)充分調(diào)研,我們也做了“十四五”金融科技發(fā)展規(guī)劃,提出了”數(shù)智興證愿景“,在全面推進(jìn)集團(tuán)數(shù)智化轉(zhuǎn)型,以強(qiáng)保障為基石、以超融合為抓手、以促發(fā)展為主線,重點(diǎn)打造金融科技、財(cái)富管理,機(jī)構(gòu)服務(wù)三大業(yè)務(wù)生態(tài),目標(biāo)是提升三項(xiàng)核心能力,分別是數(shù)智化客戶(hù)服務(wù)能力、數(shù)智化風(fēng)險(xiǎn)管理能力和數(shù)智化運(yùn)營(yíng)能力。
記者: 面對(duì)上面這些訴求你們確立哪些重點(diǎn)工作?是基于什么考慮?
王玥:數(shù)智化基建是整個(gè)金融科技發(fā)展的基礎(chǔ)支撐平臺(tái),這個(gè)平臺(tái)上我們重點(diǎn)會(huì)朝三條主線發(fā)力,一是數(shù)據(jù)中心的建設(shè),我們參考了一些國(guó)際標(biāo)準(zhǔn)和行業(yè)實(shí)踐,重構(gòu)了整個(gè)企業(yè)架構(gòu),完善了整個(gè)系統(tǒng)的可用性設(shè)計(jì)和災(zāi)備格局,大幅提升了基礎(chǔ)設(shè)施的性能和容量,以期支撐集團(tuán)未來(lái)5-10年的業(yè)務(wù)發(fā)展需要。
具體來(lái)看,我們現(xiàn)在在福州、上海兩地建設(shè)了雙活的數(shù)據(jù)中心,所有的重要系統(tǒng)我們?cè)诋惖刈隽送纫?guī)模部署,在新的架構(gòu)下,每個(gè)數(shù)據(jù)中心都可以獨(dú)立支撐集團(tuán)重要業(yè)務(wù)系統(tǒng)的連續(xù)穩(wěn)定運(yùn)行,這是我們第一條主線。
第二條主線是云原生的生態(tài)建設(shè),云計(jì)算已經(jīng)成為了國(guó)家數(shù)字經(jīng)濟(jì)發(fā)展一個(gè)重要的基礎(chǔ),我們興業(yè)證券也一直在擁抱云計(jì)算的浪潮,在云原生架構(gòu)里我們以容器化還有微服務(wù)為抓手,在分域建設(shè),生產(chǎn)云、測(cè)試云、托管云、數(shù)據(jù)庫(kù)云,還有生態(tài)云為核心的云原生體系,這是“五朵云”。由過(guò)去的單點(diǎn)突破走向整體效能的提升,整體推進(jìn)集團(tuán)的云計(jì)算建設(shè)。
第三個(gè)抓手是一體化智能運(yùn)維體系建設(shè)。集團(tuán)的整個(gè)研發(fā)體系,包括業(yè)務(wù)支撐能力都是在朝著敏態(tài)轉(zhuǎn)型。
過(guò)去,集團(tuán)遵循傳統(tǒng)的IT運(yùn)維管理規(guī)范,結(jié)合 ISO20000 國(guó)際先進(jìn)管理理念,它有好的一面,但是它也急需要跟上金融科技的發(fā)展,特別是數(shù)字化進(jìn)程的加快,帶來(lái)運(yùn)維管理壓力的提升。因此集團(tuán)全面重新規(guī)劃運(yùn)維管理體系,以“監(jiān)、管、控、析、營(yíng)”為主線推進(jìn)運(yùn)維管理的轉(zhuǎn)型。
總的來(lái)講,我們重點(diǎn)落地是三大抓手,一是數(shù)據(jù)中心建設(shè),二是云原生生態(tài)建設(shè),三是一體化智能運(yùn)維體系的建設(shè)。
談云原生建設(shè)五大思路
記者: 容器云作為云原生生態(tài)建設(shè)的核心,你們選擇了哪個(gè)技術(shù)平臺(tái)來(lái)搭建,為什么選它?
王玥:數(shù)據(jù)中心給技術(shù)體系帶來(lái)了變革,大幅提升了整體能力,讓研發(fā)和運(yùn)維人員都能夠更好更快掌握整個(gè)應(yīng)用的生命周期,能夠以代碼化、工程化方法來(lái)設(shè)計(jì)、創(chuàng)建、管理、控制,甚至度量我們整個(gè)應(yīng)用系統(tǒng)。
從我們興業(yè)證券自己的容器云選型過(guò)程來(lái)講,我們確實(shí)經(jīng)過(guò)了大量技術(shù)調(diào)研,了解同業(yè)使用的平臺(tái)使用效果,我們也選取了多家容器云產(chǎn)品做了長(zhǎng)達(dá)半年的 POC 測(cè)試對(duì)比,最終我們還是紅帽O(jiān)penShift作為我們的技術(shù)平臺(tái)來(lái)建設(shè)容器云。
之所以選擇了紅帽主要是考量了幾點(diǎn),一是OpenShift是一個(gè)企業(yè)級(jí)產(chǎn)品,在功能全面性、穩(wěn)定性和安全性方面我們覺(jué)得是有保障的,而且確實(shí)也有比較多的同業(yè)案例支撐,平臺(tái)也提供了很強(qiáng)的擴(kuò)展性。
另一方面,我們看重了紅帽的服務(wù)能力,從證券公司角度來(lái)說(shuō),我們還是非常需要供應(yīng)商能提供很好的服務(wù)能力,與我們一起協(xié)同,共同發(fā)展。
基于這兩點(diǎn),我們選擇了紅帽的OpenShift,整個(gè)項(xiàng)目實(shí)施過(guò)程中也比較順利,印證了我們前面的一些考量點(diǎn),實(shí)施過(guò)程中一些知識(shí)傳遞、培訓(xùn)、最佳實(shí)踐服務(wù)確實(shí)都發(fā)揮了很大作用,幫助我們少走了彎路,對(duì)我們整個(gè)云原生體系建設(shè)還是非常有幫助的。
記者: 容器云建設(shè)過(guò)程中是否遇到了挑戰(zhàn),如果有,如何解決的?
王玥:大家做每一件事都希望找到竅門(mén),看前面的是怎么走過(guò)來(lái)的,希望少走一些彎路,但其實(shí)還是要一步一個(gè)腳印走下去,該踩的坑大概率還是要踩。
總體來(lái)看,容器云確實(shí)對(duì)傳統(tǒng)的架構(gòu)有較大改變,它對(duì)應(yīng)用的研發(fā)、測(cè)試、發(fā)布、運(yùn)維的各個(gè)階段,涉及到各個(gè)人員的角色都會(huì)有不小的變革。只有文化理念和知識(shí)的認(rèn)同與同步,才能享受到它帶來(lái)的技術(shù)變革,因此對(duì)整個(gè)團(tuán)隊(duì)的知識(shí)傳遞和培訓(xùn)是必不可少。其次,企業(yè)要選擇合適的合作伙伴來(lái)推進(jìn)工作,幫助企業(yè)盡可能在這條路上走得順暢一點(diǎn)。
記者: AIOps是你們的又一個(gè)工作重點(diǎn),你們是如何落地AIOps的,取得了哪些效果?
王玥:AIOps之所以成為我們的工作重點(diǎn),主要是因?yàn)槲覀円恢痹噲D在平穩(wěn)運(yùn)行和創(chuàng)新之間找平衡,希望“兩手都要抓,兩手都要硬“。
現(xiàn)在我們的技術(shù)架構(gòu)越來(lái)越復(fù)雜,快速迭代開(kāi)發(fā)模式越來(lái)越普遍,我們期望用AIOps的轉(zhuǎn)型來(lái)應(yīng)對(duì)傳統(tǒng)運(yùn)維模式的挑戰(zhàn)。我覺(jué)得建設(shè)AIOps的主要思路有五點(diǎn),即監(jiān)、管、控、析、營(yíng)。
分開(kāi)來(lái)講,“監(jiān)”就是我們所說(shuō)的監(jiān)控,這是整個(gè)運(yùn)維能力的基礎(chǔ)。企業(yè)時(shí)刻要提升對(duì)于系統(tǒng)運(yùn)行的感知能力,“監(jiān)”重點(diǎn)的目標(biāo)是統(tǒng)一指標(biāo),覆蓋全面,從基礎(chǔ)設(shè)施層、中間件層、應(yīng)用層、業(yè)務(wù)層分層構(gòu)建整個(gè)統(tǒng)一監(jiān)控體系,通過(guò)監(jiān)控體系標(biāo)準(zhǔn)化提高覆蓋面,解決整個(gè)系統(tǒng)運(yùn)行態(tài)勢(shì)的感知能力提升問(wèn)題。
二是“管”,核心是規(guī)范化,即企業(yè)如何管理整個(gè)運(yùn)維體系。一方面要堅(jiān)持ISO2000體系下傳統(tǒng)的穩(wěn)態(tài),但同時(shí)我們又會(huì)進(jìn)行CMDB平臺(tái)建設(shè)、ITSM平臺(tái)建設(shè),把整個(gè)信息技術(shù)的各類(lèi)資源統(tǒng)一納管起來(lái),同時(shí)規(guī)范各類(lèi)的流程,包括變通、事件、問(wèn)題和SLA等等。
三是“控”,也就是自動(dòng)化。我們希望用應(yīng)用商店方式,讓運(yùn)維人員可以在整個(gè)運(yùn)維平臺(tái)上找到他們適合的工具,或者也可以編寫(xiě)相關(guān)腳本和工具,經(jīng)過(guò)審核發(fā)布到平臺(tái)上成為整個(gè)自動(dòng)化運(yùn)維平臺(tái)能力的一部分。這個(gè)平臺(tái)經(jīng)過(guò)持續(xù)建設(shè)和迭代會(huì)越來(lái)越成熟,越來(lái)越流暢,讓越來(lái)越多的工作通過(guò)自服務(wù)的方式來(lái)實(shí)現(xiàn)。
四是“析”,也就是分析。我們利用運(yùn)維大數(shù)據(jù)平臺(tái)把監(jiān)控類(lèi)、日志類(lèi)、自動(dòng)化類(lèi)、流程類(lèi)、知識(shí)類(lèi)等各種數(shù)據(jù)進(jìn)行匯總,通過(guò)機(jī)器學(xué)習(xí)的算法分析和挖掘,應(yīng)用于各類(lèi)的智能運(yùn)維場(chǎng)景,比如說(shuō)異常指標(biāo)檢測(cè)、難點(diǎn)問(wèn)題分析等,從而降低運(yùn)維人員使用自動(dòng)化能力的門(mén)檻,提升智能化水平和效率。這個(gè)過(guò)程中我們不指望智能化能解決一切問(wèn)題,可能最終20%的工作還是要人來(lái)做,不過(guò)我們希望通過(guò)智能化幫助又快又好解決80%的工作。
最后是持續(xù)運(yùn)營(yíng),我們明白“羅馬不是一天建成的”,整個(gè)智能運(yùn)維體系也不可能一年就會(huì)建好,它永遠(yuǎn)是一個(gè)持續(xù)運(yùn)營(yíng)、迭代優(yōu)化的過(guò)程,集團(tuán)的目標(biāo)是經(jīng)過(guò)2-3年的發(fā)展,讓大家再上一個(gè)臺(tái)階,只要這個(gè)方向?qū)Φ模蚁嘈磐ㄟ^(guò)持續(xù)迭代未來(lái)肯定能達(dá)到比較好的遠(yuǎn)景。