分布式數(shù)據(jù)庫(kù)是指利用高速計(jì)算機(jī)網(wǎng)絡(luò)將物理上分散的多個(gè)數(shù)據(jù)存儲(chǔ)單元連接起來(lái)組成一個(gè)邏輯上統(tǒng)一的數(shù)據(jù)庫(kù)。其基本思想是將原來(lái)集中式數(shù)據(jù)庫(kù)中的數(shù)據(jù)分散存儲(chǔ)到多個(gè)通過(guò)網(wǎng)絡(luò)連接的數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)上,以獲取更大的存儲(chǔ)容量和更高的并發(fā)訪問(wèn)量。近年來(lái),隨著數(shù)據(jù)量的高速增長(zhǎng),分布式數(shù)據(jù)庫(kù)技術(shù)也得到了快速的發(fā)展,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)開始從集中式模型向分布式架構(gòu)發(fā)展,基于關(guān)系型的分布式數(shù)據(jù)庫(kù)在保留了傳統(tǒng)數(shù)據(jù)庫(kù)的數(shù)據(jù)模型和基本特征下,從集中式存儲(chǔ)走向分布式存儲(chǔ),從集中式計(jì)算走向分布式計(jì)算。
另一方面,隨著數(shù)據(jù)量越來(lái)越大,關(guān)系型數(shù)據(jù)庫(kù)開始暴露出一些難以克服的缺點(diǎn),以NoSQL 為代表的非關(guān)系型數(shù)據(jù)庫(kù),其高可擴(kuò)展性、高并發(fā)性等優(yōu)勢(shì)出現(xiàn)了快速發(fā)展,一時(shí)間市場(chǎng)上出現(xiàn)了大量的key-value 存儲(chǔ)系統(tǒng)、文檔型數(shù)據(jù)庫(kù)等NoSQL 數(shù)據(jù)庫(kù)產(chǎn)品。NoSQL 類型數(shù)據(jù)庫(kù)正日漸成為大數(shù)據(jù)時(shí)代下分布式數(shù)據(jù)庫(kù)領(lǐng)域的主力。
大數(shù)據(jù)時(shí)代,面對(duì)海量數(shù)據(jù)量的井噴式增長(zhǎng)和不斷增長(zhǎng)的用戶需求,分布式數(shù)據(jù)庫(kù)必須具有如下特征,才能應(yīng)對(duì)不斷增長(zhǎng)的海量數(shù)據(jù)。
● 高可擴(kuò)展性:分布式數(shù)據(jù)庫(kù)必須具有高可擴(kuò)展性,能夠動(dòng)態(tài)地增添存儲(chǔ)節(jié)點(diǎn)以實(shí)現(xiàn)存儲(chǔ)容量的線性擴(kuò)展。
● 高并發(fā)性:分布式數(shù)據(jù)庫(kù)必須及時(shí)響應(yīng)大規(guī)模用戶的讀/寫請(qǐng)求,能對(duì)海量數(shù)據(jù)進(jìn)行隨機(jī)讀/寫。
● 高可用性:分布式數(shù)據(jù)庫(kù)必須提供容錯(cuò)機(jī)制,能夠?qū)崿F(xiàn)對(duì)數(shù)據(jù)的冗余備份,保證數(shù)據(jù)和服務(wù)的高度可靠性。