公有云選型系列:蜂鳥網(wǎng)漸進式混合云之路(上)
云計算就像一列滾滾向前的列車,越來越多的企業(yè)或自愿或被裹挾紛紛登上了這趟列車,享受到了云計算帶來的技術紅利。與此同時,也有不少企業(yè)在觀望和猶疑。它們既想擁抱云計算,同時原有的傳統(tǒng)IT架構(gòu)又無法割舍,如何兼顧它們,通過合理的組合采用混合云模式搭建起一個真正適合自己的IT新平臺?或者,簡單直接,讓這些系統(tǒng)一步到位全部上云,這都是需要CTO、CIO認真考量的問題。本期介紹的蜂鳥網(wǎng)就經(jīng)歷了這一過程,并最終找到了適合自己的最佳模式。
蜂鳥網(wǎng)(fengniao.com)成立于2000年,是中國影像互聯(lián)網(wǎng)平臺領軍企業(yè)。在為廣大攝影用戶提供專業(yè)、豐富的攝影資訊的同時,圍繞“影像生活”為用戶提供互動交流、二手攝影器材交易平臺,以及提供專業(yè)的攝影培訓課程和高品質(zhì)的影像輸出等服務。
在上云路上,蜂鳥網(wǎng)走得不算早。在2015年1月蜂鳥網(wǎng)從原來所屬集團中獨立運營之前,一直采用傳統(tǒng)IT架構(gòu),IT系統(tǒng)運行在原集團托管的數(shù)據(jù)中心中。隨著公司獨立,公司對IT部門提出了新的需求,特別是云計算的流行,讓蜂鳥網(wǎng)有些心動。“本著滿足業(yè)務需求,同時降低成本”這樣樸素的想法,蜂鳥網(wǎng)開始了上云之旅。
蜂鳥網(wǎng)的幾條業(yè)務線卻有著完全不同的業(yè)務特征。一類是媒體業(yè)務,對圖片的存儲和訪問需求很大;第二類是攝影在線教育業(yè)務,對視頻及直播的需求很大;第三類是二手攝影器材的交易業(yè)務,對實時性和安全要求很高。這直接導致了對云服務有著不同的需求,最后選了兩家云服務商來提供服務。另一方面,蜂鳥網(wǎng)還有一些核心業(yè)務目前還不能遷移到公有云上,比如數(shù)據(jù)庫和公司內(nèi)部的一些業(yè)務系統(tǒng)。這讓蜂鳥網(wǎng)面臨著與一些大公司同樣的挑戰(zhàn):多個公有云+私有云,如何管理和進一步優(yōu)化,是留給蜂鳥網(wǎng)未來的課題。
但令人高興的是,通過與云服務商的共同努力,蜂鳥網(wǎng)建起一個適合自己的IT平臺,節(jié)省了開支,還極大地簡化了運維工作,同時提高IT的靈活性,可以快速響應業(yè)務需求,為蜂鳥網(wǎng)的業(yè)務運營提供了更好的支撐。
以下為至頂網(wǎng)對蜂鳥網(wǎng)CTO郭楓的獨家專訪。
郭楓 蜂鳥網(wǎng)CTO,蜂鳥網(wǎng)技術資源的管理者,15年的互聯(lián)網(wǎng)行業(yè)經(jīng)驗,主導了蜂鳥網(wǎng)相關的技術創(chuàng)新產(chǎn)品的設計和研發(fā)。郭楓關注行業(yè)技術發(fā)展動態(tài),從用戶和業(yè)務的角度制定產(chǎn)品、技術的發(fā)展戰(zhàn)略規(guī)劃,為公司技術發(fā)展提供決策性建議。
至頂網(wǎng):請您介紹下蜂鳥網(wǎng)的主營業(yè)務以及這些業(yè)務對IT提出的要求?
郭楓:蜂鳥網(wǎng)成立于2000年,2015年1月蜂鳥網(wǎng)獨立運營,是中國影像互聯(lián)網(wǎng)平臺領軍企業(yè)。在為廣大攝影用戶提供專業(yè)、豐富的攝影資訊的同時,為器材廠商和經(jīng)銷商提供卓越有效的互聯(lián)網(wǎng)營銷解決方案。圍繞“影像生活”為用戶提供互動交流、二手攝影器材交易平臺,以及提供專業(yè)的攝影培訓課程和高品質(zhì)的影像輸出等服務。
就業(yè)務線而言主要有三條:第一條是我們從2000年建站開始一直到現(xiàn)在都有的媒體業(yè)務:主要有編輯主導的評測和采編文章,另一個是論壇部分,有大量攝影愛好者在這個論壇交流。
蜂鳥的媒體業(yè)務給IT帶來的主要挑戰(zhàn)是圖片的存儲,一方面我們這么多年積累了大量的圖片,達到100TB了,還在不斷增長。另一方面,攝影圖片本身就比較大。比如,一臺1萬像素相機拍攝出來的圖片很可能達幾百兆。這些年網(wǎng)站對單張圖片大小上線一直在提高,現(xiàn)在我們允許20M,編輯手里的很多樣張原圖都已經(jīng)是50M、100M了。
大量的圖片給后臺的存儲帶來很大壓力。不僅如此,我們網(wǎng)站要用到各種各樣尺寸的縮略圖,它們大量存在占用了大量存儲空間,能達到原圖的2倍。為了存儲這些數(shù)據(jù),我們用了幾個盤柜,圖片存儲和備份占了幾個機柜,硬盤也經(jīng)常會有損失去換。另外,CDN的開銷也主要服務于圖片瀏覽上。因此降低存儲的成本很有必要。
第二部分是我們的二手業(yè)務,相當于電商部門,主要是攝影器材的買賣、回收、租賃、維修。這項業(yè)務的開展是因為攝影器材一般比較保值,屬于光學儀器,貶值率非常低,在二手東西里它的流通率非常高。最開始我們蜂鳥網(wǎng)在中間提供擔保幫助網(wǎng)友達成這種交易,這兩年我們逐漸把業(yè)務擴充到租賃、維修。這個業(yè)務背后是我們的電商平臺在支持。
第三部分是攝影在線教育業(yè)務,我們提供攝影的在線教育、攝影培訓服務,主要以視頻體現(xiàn),包括直播、視頻文件錄播等,需要直播后臺支持。
至頂網(wǎng):面對上述業(yè)務的需求,IT部門如何滿足它們?
郭楓:我們選擇了多云加私有云的混合云模式。對于圖片存儲方面,我們選擇七牛云。這是我們最早嘗試的公有云服務。選擇七牛云,一方面是因為七牛云主打存儲,能很好地滿足我們的存儲需求。而且,它只存原圖,縮略圖是自動生成的,不占存儲空間,這樣存儲空間得到很大節(jié)省。它對外提供了一個縮略圖的接口,我們只要把自己業(yè)務端的邏輯調(diào)整下,調(diào)用它的接口就好了。調(diào)整業(yè)務邏輯需要花點時間,但這個工作量并不算大,整體對我們來說收益還是非常高的。
選七牛云的另一個重要原因是,七牛云當時和我們都把服務器托管在同一個機房里面,這意味著我們存儲的圖片不用通過公網(wǎng),可以在內(nèi)部直接轉(zhuǎn)移到七牛云上,不用占用我的帶寬。
我們雙方合作過程中彼此磨合,最后贏得了一個讓我們滿意的結(jié)果。當然,在這個過程中,我們有些需求七牛云并不是都能馬上滿足,有些也沒有那么完善,比如我們的大圖片的縮略圖對七牛云也是很大壓力。后來他們根據(jù)我們的一些業(yè)務需求做了些調(diào)整,現(xiàn)在相對來說就非常完善了。
今天我在七牛云上做直播、視頻方面的業(yè)務,要調(diào)用七牛的一些功能。因為本身前面的合作已經(jīng)非常好,也建立了很多信任的關系,所以說它們有一些新的服務,我們也愿意嘗試。
至頂網(wǎng):對于二手交易的電商業(yè)務和直播業(yè)務,IT系統(tǒng)是如何滿足業(yè)務需求的?
郭楓:我們的二手電商平臺放到了另外一個公有云,前端資源和業(yè)務邏輯等都放到了云上,但其中的后臺ERP和電商數(shù)據(jù)部分由于是非常敏感的數(shù)據(jù),我們放到了托管的IDC里面。這公有云用的就是UCloud(優(yōu)刻得)。
由于采用了這種混合云的部署方式給我們帶來了一個挑戰(zhàn),就是我們在公有云上的業(yè)務邏輯要訪問存放在IDC里面的數(shù)據(jù),這里處理不好會有延遲,會影響用戶體驗,可能直接導致用戶直接放棄交易。這里有兩段要打通,一段是從托管數(shù)據(jù)中心到UCloud POP點(相當于網(wǎng)絡匯聚點),一段是從POP點到UCloud機房。后來通過專線的方式解決了,確保了訪問的低延時。
關于我們的知識付費部分,有兩個后臺:一個是我們的APP,自己開發(fā),運行在UCloud,訪問文件存放在七牛云上。另外一個是直接用七牛云的直播平臺,七牛云對于直播提供一些功能支持,比如推流等。
至頂網(wǎng):為什么你們沒選擇把服務器托管到云服務商的機房而是托管到另外一個IDC?
郭楓:這里主要還是風險和收益的平衡。我要進行這種搬遷,最好的辦法是在新的托管機房配置一樣的設備,租好、配置好、熱同步都做好了,這邊切斷瞬間遷移過來,業(yè)務馬上起來,這樣保證業(yè)務不間斷。實際上,我們不可能這樣,成本太高。我們只能把業(yè)務中斷,把設備搬過來。這里面就存在一個風險,業(yè)務可能會中斷很長時間,這對我們的影響會很大。
我們之前曾經(jīng)有過一次IDC搬遷的經(jīng)歷,當時要把服務器從原來的機房遷移到現(xiàn)在托管的這個數(shù)據(jù)中心。即便我們之前做了很多次演練,但中間還是出現(xiàn)了一些問題,原來預計部分業(yè)務停機12個小時就能搞定,到最后用了16個小時,中間還是出現(xiàn)了一些訪客感覺不到的問題,折騰了很久。
原因很多,一個原因是我們原來依賴上級集團的IT基礎設施,很多設備都給你分好、配好,而現(xiàn)在需要重新搭自己的網(wǎng)絡、防火墻、交換機等,相當于要重新搭架構(gòu)。另外,我們從2000年成立到現(xiàn)在這么多年了,IT系統(tǒng)有很多變遷,文檔資料不全,要梳理清楚很不容易。第三,有些機器運行了很久了,現(xiàn)在突然關機,啟動不起來了。記得當時,為了避免這種情況我們所有的服務器和備件都做了備份。那是一段痛苦的經(jīng)歷。
至頂網(wǎng):如果你未來要對IT進行擴容,你會選擇UCloud進行服務器托管,還是會繼續(xù)選擇放在IDC?
郭楓:從整體來看我還是傾向于維持現(xiàn)狀,托管在現(xiàn)有的IDC。因為通過我們測試以及現(xiàn)在的實際運行效果看,通過專線的方式連接IDC和公有云,能夠滿足我的業(yè)務需求。而且成本可控,專線成本不太高,能夠保證數(shù)據(jù)的足夠安全。
雖然看起來,把服務器直接托管在UCloud的機房里,與UCloud上的云主機相連,管理更方便些。但鑒于我們IT架構(gòu)相對比較復雜,移過去并沒有省多少費用,還存在很多未知的風險。所以目前來看,我還是會堅持這種以專線打通IDC內(nèi)的私有云和UCloud公有云的部署方式。
順便一提的是,這種專線在一定程度上提升了安全性。我們在這個專線兩端分別設立了相對獨立的、不同的子網(wǎng)。比如,在UCloud有幾個子網(wǎng),分別對外提供服務的Web端應用和不需要對外提供服務(內(nèi)部的服務有隊列機和Redis、Memcached等)分別屬于不同的子網(wǎng)段,通過這種方式實現(xiàn)一定程度的隔離,提高了安全性。
至頂網(wǎng):前面介紹了現(xiàn)在的上云情況,接下來請您談談當時為什么要上云?
郭楓:之所以會上公有云,有一個外部大環(huán)境的影響,也就是外因。這些年,隨著云計算概念的普及,不管是我們這些做IT的還是我們的領導,都或多或少的聽說過云計算,給大家的印象是能省錢,因此,公司領導也要求我們關注。這是外因。
而內(nèi)因是,我們的業(yè)務需要有一些彈性,尤其是像“雙十一”這樣的大促,我們的物理服務器并不是總能很好地滿足我的業(yè)務需求。比如,遇到“雙十一”我到底要備著多少臺物理機?準備少了,不能滿足業(yè)務需求,多了浪費資源。而公有云的方式可以提供很好的彈性。另外,在存儲方面,原因前面也提到了,云存儲可以直接降低我們的存儲成本。
我們上云還有一個契機,就是我們托管的物理機大多數(shù)是2015年公司獨立時采購的,到2018年時候陸續(xù)都過保了。過保之后意味著成本有了很大不確定性。當時就兩個選擇,一個是采購新的服務器,另一個就是公有云。綜合選擇,我們決定上公有云。
至頂網(wǎng):目前,在UCloud上用了哪些云服務?
郭楓:目前在Uclould上主要用的是云主機、負載均衡ULB等。有些服務雖然云服務商也提供,但我們選擇在托管服務器自己搭,比如隊列機、緩存數(shù)據(jù)庫Memcached、Redis等。我做過一個簡單的測算,認為這樣我們可能更劃算。我認為,云服務有這個特點,就是一定量級以下比較劃算的,過了那個量級之后感覺成本節(jié)省就不太大。當然,公有云服務的便捷性是沒法比,想用馬上可用。我更多的是從成本上考慮,一個是成本,還有一個就是自己可擴展。
至頂網(wǎng):你們現(xiàn)在在數(shù)據(jù)備份方面是怎么做的?
郭楓:我們的數(shù)據(jù)庫運行在托管機房的服務器上,對于這些數(shù)據(jù)每天都會做備份。如果出現(xiàn)問題,我們現(xiàn)在可以回滾到任何時間點。在圖片備份方面,我們就依賴于七牛云本身,只是定期做異地備份。
(未完待續(xù))
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼