是一個分布式的、容錯的實(shí)時計算系統(tǒng),它被托管在GitHub上,遵循 Eclipse Public License 1.0。Storm是由BackType開發(fā)的實(shí)時處理系統(tǒng),BackType現(xiàn)在已在Twitter麾下。GitHub上的最新版本是Storm 0.8.0,基本是用Clojure寫的。
Storm為分布式實(shí)時計算提供了一組通用原語,可被用于“流處理”之中,實(shí)時處理消息并更新數(shù)據(jù)庫。這是管理隊(duì)列及工作者集群的另一種方式。 Storm也可被用于“連續(xù)計算”(continuous computation),對數(shù)據(jù)流做連續(xù)查詢,在計算時就將結(jié)果以流的形式輸出給用戶。它還可被用于“分布式RPC”,以并行的方式運(yùn)行昂貴的運(yùn)算。 Storm的主工程師Nathan Marz表示:
Storm可以方便地在一個計算機(jī)集群中編寫與擴(kuò)展復(fù)雜的實(shí)時計算,Storm用于實(shí)時處理,就好比 Hadoop用于批處理。Storm保證每個消息都會得到處理,而且它很快——在一個小集群中,每秒可以處理數(shù)以百萬計的消息。更棒的是你可以使用任意編程語言來做開發(fā)。
Storm的主要特點(diǎn)如下:
簡單的編程模型。類似于MapReduce降低了并行批處理復(fù)雜性,Storm降低了進(jìn)行實(shí)時處理的復(fù)雜性。
可以使用各種編程語言。你可以在Storm之上使用各種編程語言。默認(rèn)支持Clojure、Java、Ruby和Python。要增加對其他語言的支持,只需實(shí)現(xiàn)一個簡單的Storm通信協(xié)議即可。
容錯性。Storm會管理工作進(jìn)程和節(jié)點(diǎn)的故障。
水平擴(kuò)展。計算是在多個線程、進(jìn)程和服務(wù)器之間并行進(jìn)行的。
可靠的消息處理。Storm保證每個消息至少能得到一次完整處理。任務(wù)失敗時,它會負(fù)責(zé)從消息源重試消息。
快速。系統(tǒng)的設(shè)計保證了消息能得到快速的處理,使用ØMQ作為其底層消息隊(duì)列。
本地模式。Storm有一個“本地模式”,可以在處理過程中完全模擬Storm集群。這讓你可以快速進(jìn)行開發(fā)和單元測試。