自動化運維,開源大有可為
近年來,隨著科技技術的不斷進步,IT廣泛地滲透到我們的生產和生活中,“IT即業(yè)務”也成為越來越多行業(yè)的一個共同特征,IT的重要性不言而喻。與此同時,IT技術演進的速度越來越快,系統(tǒng)的復雜性與日俱增,而運維的預算并沒有相應增加,有的甚至只減不增。在這一背景下,自動化、智能化成為IT運維的必然之選,如何實現(xiàn)自動化、智能化成為IT運維人員和CIO必須思考的問題,而開源運維平臺以其廣泛的適應性、靈活性以及技術先進性備受青睞。
更復雜的IT環(huán)境,更少的預算
對今天的IT運維人員而言,要保證系統(tǒng)的可靠運行面臨著挑戰(zhàn)越來越大。一方面,業(yè)務更新和變化越來越頻繁,業(yè)務對IT的靈活度、可擴展性、交付效率等要求越來越高,另一方面,新的技術不斷涌現(xiàn),新技術在加速創(chuàng)新的同時也對業(yè)務的連續(xù)性、安全性、穩(wěn)定性也構成了挑戰(zhàn)。面對這些挑戰(zhàn),傳統(tǒng)的依靠個人經驗、靠人工或者依靠腳本打天下的日子越來越難以為繼。
“運維人員要做的事情變多了、變復雜了,業(yè)務對我們要求又變高了,同時預算又變少了,如何應對這個問題,的確值得好好去規(guī)劃。”紅帽資深解決方案架構師嚴興華告訴至頂網記者。
嚴興華是一位資深的咨詢顧問,曾在惠普、IBM、埃森哲等多個公司工作,參與眾多數(shù)字化轉型項目的規(guī)劃,對這個行業(yè)的變化深有感觸,對IT運維目前的困境感同身受。
他告訴記者,對運維人員而言,最為核心的是要確保企業(yè)業(yè)務的連續(xù)性,而今天要做到這一點變得越來越困難。因為企業(yè)業(yè)務越來越復雜,為了支撐業(yè)務,數(shù)據中心變得越來越龐大,數(shù)據量越來越多。同時,需求發(fā)生的變化頻率越來越快,而且業(yè)務要求對變化的響應要快。比如,前些年“互聯(lián)網+”很流行,“互聯(lián)網+”的核心是把業(yè)務互聯(lián)網化,背后的一個潛臺詞就是“敏捷”,IT要能敏捷地支持業(yè)務的快速變化。
另一方面,這些年IT基礎架構也在發(fā)生重大變化,在虛擬化、云計算之后,緊接著又迎來了容器化。在普遍容器化的時代,運維模式和傳統(tǒng)的物理機時代、虛擬化時代甚至云計算時代都有很大不同。
“今天要監(jiān)控的對象、要采集的數(shù)據和處理手段都發(fā)生了變化,要管理的對象變得更多,數(shù)據量變得更大。同時,多種IT環(huán)境(傳統(tǒng)的物理機、虛擬化環(huán)境、云計算、容器)并存,使得IT環(huán)境非常復雜。”嚴興華說。
還有,大量涌現(xiàn)的新場景迫使運維技術和手段必須更新,這些場景包括大數(shù)據以及各種人工智能等各種數(shù)據分析。在運維面臨的種種壓力和挑戰(zhàn)面臨,自動化幾乎是必然的選擇。
“只有自動化才可以幫助企業(yè)解決業(yè)務連續(xù)性、穩(wěn)定性問題,才可以應對新技術給運維帶來的挑戰(zhàn)。”嚴興華說。
實際上,今天運維也的確正在走向自動化、智能化,一些運維水平比較高企業(yè)現(xiàn)在甚至已經有一些比較好的自動化體系,包括有了成熟的管理流程和一些對應的工具。不過,大多數(shù)企業(yè)還在摸索階段,特別是一些傳統(tǒng)企業(yè),并沒有成熟的運維流程和可靠好用的運維工具。
選開源還是閉源?
作為企業(yè)CIO或者IT運維負責人,面對運維當前的困境如何破?嚴興華提出了三個建議。首先,要對運維目前整體水平有一定了解,給自己的企業(yè)明確一個標桿。其次,對于本企業(yè)的運維水平有正確的認知,特別是與同行的對比,本企業(yè)處于什么水平。第三,需要選擇合適的運維平臺和工具。
“其中尤其要注意的是要有全局觀點和整體規(guī)劃,一個常犯的錯誤就是滿足于一個個小的解決方案,比如寫一個腳本解決一個問題。” 嚴興華提醒說。
合適的工具和平臺是確保自動化運維成功的關鍵。目前,有兩大技術方向,即開源和閉源,如何選擇也是不少企業(yè)面臨的一個困惑。作為一個運維行業(yè)多年工作經驗,并且在開源(紅帽)、閉源(IBM、惠普等)都有過工作經歷的資深從業(yè)者,嚴興華的觀點是,到底該選開源還是閉源并沒有絕對的答案,合適的才是最好的,但企業(yè)在決定之前一定要對這兩類平臺的優(yōu)缺點有全面的認識。
一般而言,閉源產品和方案具有如下特點:第一,功能比較多,比較全面,但模塊關系比較復雜,架構比較重;第二,如果企業(yè)已經部署了一些工具,一般不太好與它們進行整合,大概率要放棄原來的工具。
“閉源產品往往功能很全,幾乎是面面俱到。到落地時候如果客戶有新的個性化需求或一些功能需要擴展,或者是業(yè)務發(fā)生變化的時候需要對軟件進行調整,會比較困難。”嚴興華表示。
另外,閉源產品更新迭代周期非常長,基本上就是小版本也要半年,大版本可能2-3年,穩(wěn)定性是不錯,但是這些年技術更新得非?欤苋菀壮霈F(xiàn)運維平臺從上線的第一天就落后,這也正是很多閉源軟件廠商逐漸被市場淘汰的原因之一。
第三,部署周期比較長,價格也比較貴。當然它也有它的好處,就是針對一些大型企業(yè),它的大而全能全面匹配這些企業(yè)的需求。
而開源在這些方面的表現(xiàn)完全不同。今天的開源工具幾乎都采用了最流行的技術,廣泛采用分布式、輕量級、模塊化的架構,支持快速橫向擴展。比如開源的自動化工具Ansible就是如此,其不僅功能多,同時迭代也非?。而且,對于開源產品,用戶擁有更大的自主權和靈活性,結合其模塊化的架構,稍微調整就能快速投入使用。另外,不少開源產品采用非侵入式部署,部署后對企業(yè)原來的運維體系不會產生太大的影響,而且上線周期可以非常短,
同樣,開源也有不足。比如,開源軟件對使用者技術能力要求比較高,學習曲線比較陡,易學難精,雖然很快可以用起來,但用好需要求助于社區(qū)或者自己要投入比較多的時間。使用中一旦出了問題,沒有人來兜底。另外,開源軟件還有一個通病是,由于來自國外,其設計主要基于國外用戶的使用習慣,對于中國用戶不太友好。
讓更多人從開源軟件中受益
開源的運維平臺具有諸多優(yōu)點,同時缺點也是實實在在。問題的關鍵是如何揚長避短,讓開源的運維平臺或者工具能為我所用。實際上,在業(yè)界共同努力下,特別是有像紅帽這樣的開源公司的存在,開源平臺的挑戰(zhàn)正在逐步得到解決:因為市場上出現(xiàn)了一些基于開源軟件來構建一站式的解決方案以及相關的咨詢和技術服務,從而大大降低了開源軟件的門檻。
紅帽的OPlus就是一個面向運維市場的插件。嚴興華介紹說,OPlus基于自動化運維工具Ansible構建。它有幾個特點:首先,它是非侵入式,不需要對企業(yè)已有運維架構進行任何調整,也不用在服務器上部署探針,開箱即用。其次,OPlus把執(zhí)行工作交給了Ansible,而自己側重在UI,側重在數(shù)據的集成,克服了傳統(tǒng)開源工具對用戶不太友好的問題。第三,OPlus支持二次開發(fā),方便運維人員進行優(yōu)化。
“OPlus不是在Ansible上套個皮,OPlus還是一個運維開發(fā)平臺,運維人員可以在此上自主開發(fā)。而且紅帽已經給大家準備好了很多常用的功能模塊,類似積木,運維人員可以按照自己的需求進行組合,來滿足日常的大部分運維需求。”嚴興華說。
另外, OPlus支持可視化的拖拽式開發(fā)。OPlus把功能做成了API,通過API快速調用,通過統(tǒng)一的接口屏蔽了各個不同平臺或者不同對象間的差異。
更值得一提的是,紅帽在OPlus中內置了針對RHEL、CentOS的安全、合規(guī)、性能等70多個巡檢常用的指標,可以幫助客戶快速發(fā)現(xiàn)問題提前做預防。這是客戶比較喜歡的功能之一。同樣,客戶比較喜歡的還有補丁管理。Ansible不止是針對紅帽的產品,也支持對其他一些開源軟件進行補丁管理。另外,還有權限和密碼管理也是比較貼心的功能。
據悉,OPlus已經擁有眾多用戶,某博彩娛樂公司就是其中之一。該公司業(yè)務眾多,導致IT系統(tǒng)非常復雜,裸金屬服務器、虛擬化、容器并存,同時,多個業(yè)務也導致網絡環(huán)境非常復雜,以前一直是各個業(yè)務單獨進行運維管理。更有挑戰(zhàn)的是,博彩業(yè)對實時性要求很高,這些都對運維工具提出了很高的要求。在紅帽的支持下,該公司部署OPlus,實現(xiàn)了10多萬臺服務器的統(tǒng)一納管,大大提升了管理效率,為其業(yè)務提供了可靠的支撐。
當然,紅帽不止是提供運維工具和平臺,為了幫助客戶徹底解決運維煩惱,紅帽還提供相關咨詢服務。嚴興華介紹說,紅帽有一套成熟度模型,通過這個模型客戶可以從多個維度對企業(yè)的運維水平進行評價,了解自己在各個維度里面自動化水平是怎樣的,自己跟業(yè)界以及和期望的目標差距有多大。基于紅帽再和客戶一起制定出一個解決方案。
“這個解決方案包括整體提升計劃,要補充哪些工具,哪些工具要做調整和優(yōu)化,以及各個工具之間如何去做貫通和整合等。”嚴興華表示。
當然,自動化只是提升運維水平的一個步驟,運維最終會走向智能化,特別是近年來隨著AI技術的進步,AIOps非常熱。對此,嚴興華表示,AIOps的價值大家非常認可,現(xiàn)在的問題是如何讓AIOps落地。
“對于紅帽而言,我們會通過Ansible來保證所有的執(zhí)行可以平滑的,不會出現(xiàn)任何差錯。同時,紅帽也會和企業(yè)、大學或者研究團隊一起,同時借助紅帽全球和開源社區(qū)的力量,共同探討AIOps在哪些場景更好落地,以期間讓AIOps真正賦能客戶,來更好地支持業(yè)務,支持企業(yè)的數(shù)字化轉型。”嚴興華說。

