分布式數(shù)據(jù)庫是指利用高速計(jì)算機(jī)網(wǎng)絡(luò)將物理上分散的多個(gè)數(shù)據(jù)存儲(chǔ)單元連接起來組成一個(gè)邏輯上統(tǒng)一的數(shù)據(jù)庫。其基本思想是將原來集中式數(shù)據(jù)庫中的數(shù)據(jù)分散存儲(chǔ)到多個(gè)通過網(wǎng)絡(luò)連接的數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)上,以獲取更大的存儲(chǔ)容量和更高的并發(fā)訪問量。近年來,隨著數(shù)據(jù)量的高速增長,分布式數(shù)據(jù)庫技術(shù)也得到了快速的發(fā)展,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫開始從集中式模型向分布式架構(gòu)發(fā)展,基于關(guān)系型的分布式數(shù)據(jù)庫在保留了傳統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)模型和基本特征下,從集中式存儲(chǔ)走向分布式存儲(chǔ),從集中式計(jì)算走向分布式計(jì)算。
另一方面,隨著數(shù)據(jù)量越來越大,關(guān)系型數(shù)據(jù)庫開始暴露出一些難以克服的缺點(diǎn),以NoSQL 為代表的非關(guān)系型數(shù)據(jù)庫,其高可擴(kuò)展性、高并發(fā)性等優(yōu)勢出現(xiàn)了快速發(fā)展,一時(shí)間市場上出現(xiàn)了大量的key-value 存儲(chǔ)系統(tǒng)、文檔型數(shù)據(jù)庫等NoSQL 數(shù)據(jù)庫產(chǎn)品。NoSQL 類型數(shù)據(jù)庫正日漸成為大數(shù)據(jù)時(shí)代下分布式數(shù)據(jù)庫領(lǐng)域的主力。
大數(shù)據(jù)時(shí)代,面對海量數(shù)據(jù)量的井噴式增長和不斷增長的用戶需求,分布式數(shù)據(jù)庫必須具有如下特征,才能應(yīng)對不斷增長的海量數(shù)據(jù)。
● 高可擴(kuò)展性:分布式數(shù)據(jù)庫必須具有高可擴(kuò)展性,能夠動(dòng)態(tài)地增添存儲(chǔ)節(jié)點(diǎn)以實(shí)現(xiàn)存儲(chǔ)容量的線性擴(kuò)展。
● 高并發(fā)性:分布式數(shù)據(jù)庫必須及時(shí)響應(yīng)大規(guī)模用戶的讀/寫請求,能對海量數(shù)據(jù)進(jìn)行隨機(jī)讀/寫。
● 高可用性:分布式數(shù)據(jù)庫必須提供容錯(cuò)機(jī)制,能夠?qū)崿F(xiàn)對數(shù)據(jù)的冗余備份,保證數(shù)據(jù)和服務(wù)的高度可靠性。