數(shù)據(jù)湖這個(gè)詞在21世紀(jì)10年代初出現(xiàn)的時(shí)候,有些人認(rèn)為它是在恰當(dāng)?shù)臅r(shí)間出現(xiàn)的一種恰當(dāng)?shù)募軜?gòu)。數(shù)據(jù)湖是一種非結(jié)構(gòu)化的數(shù)據(jù)存儲(chǔ)庫(kù),利用了新的低成本云對(duì)象存儲(chǔ)格式(如Amazon S3),可以容納來自網(wǎng)絡(luò)的大量數(shù)據(jù)。
戴爾提高了旗下數(shù)據(jù)湖倉(cāng)的查詢速度,添加并升級(jí)了連接器,改進(jìn)了監(jiān)控并提升了安全性。
云巨頭AWS選擇通過表格式Apache Iceberg將Redshift數(shù)據(jù)倉(cāng)庫(kù)向數(shù)據(jù)湖延伸,IBM Netezza也是如此。
數(shù)據(jù)湖誕生至今已有十多年的歷史,為全球一些最大的企業(yè)提供了數(shù)據(jù)分析的支持。然而,也有人認(rèn)為,絕大多數(shù)數(shù)據(jù)湖部署已經(jīng)演變成為“數(shù)據(jù)沼澤”。
作為全球領(lǐng)先的云上數(shù)據(jù)平臺(tái)“智能湖倉(cāng)”架構(gòu)的提出者,3月14日,亞馬遜云原生數(shù)據(jù)湖S3迎來17周歲。Amazon S3將繼續(xù)引領(lǐng)云原生技術(shù)的革新,推動(dòng)云計(jì)算技術(shù)的廣泛應(yīng)用和發(fā)展。
本周,在HPE業(yè)務(wù)中增速可觀的這一Alletra產(chǎn)品家族迎來更新,正式接納“Sapphire Rapids”至強(qiáng)SP處理器。
滕昱受邀接受至頂網(wǎng)的采訪,分享了高性能對(duì)象數(shù)據(jù)湖對(duì)于現(xiàn)代化應(yīng)用的價(jià)值以及戴爾科技在高性能對(duì)象數(shù)據(jù)湖領(lǐng)域的創(chuàng)新。
隨著云計(jì)算的發(fā)展, 2015 年,各個(gè)云廠商開始圍繞云上的對(duì)象存儲(chǔ)重新解讀和推廣數(shù)據(jù)庫(kù)。
當(dāng)IT領(lǐng)導(dǎo)者們?cè)噲D從企業(yè)收集的數(shù)據(jù)中獲取商業(yè)價(jià)值的時(shí)候,他們面臨著無數(shù)挑戰(zhàn);蛟S最不為人知的是,沒有很好地利用那些已經(jīng)生成的、頻繁保存的、但卻被很少使用的數(shù)據(jù),正在讓他們錯(cuò)失各種機(jī)會(huì)。
技術(shù)體系繁雜,存在著很多“平行宇宙”。今天,潭主跟大家分享最近學(xué)習(xí)的一個(gè)數(shù)據(jù)湖存儲(chǔ)技術(shù),Ozone。
數(shù)據(jù)湖的起源,應(yīng)該追溯到2010年10月,由 Pentaho 的創(chuàng)始人兼 CTO, James Dixon 所提出
5月13日,在北京舉辦的“騰訊云原生智能數(shù)據(jù)湖”發(fā)布會(huì)上,騰訊云首次對(duì)外展示完整云端數(shù)據(jù)湖產(chǎn)品圖譜,并推出兩款“開箱即用”數(shù)據(jù)湖產(chǎn)品,數(shù)據(jù)湖計(jì)算服務(wù)DLC和數(shù)據(jù)湖構(gòu)建DLF。
單靠數(shù)據(jù)倉(cāng)庫(kù)已經(jīng)無法滿足當(dāng)下的數(shù)據(jù)分析需求,借助數(shù)據(jù)湖可以更從容應(yīng)對(duì)這一需求更從容些。
隨著全球企業(yè)手中數(shù)據(jù)量的快速增長(zhǎng),高級(jí)分析正成為各類業(yè)務(wù)活動(dòng)的核心。消化數(shù)據(jù)、運(yùn)用數(shù)據(jù),企業(yè)才能夠做出更明智的業(yè)務(wù)決策。
大數(shù)據(jù)公司Databricks希望通過一個(gè)全新的開源項(xiàng)目來清理企業(yè)凌亂的數(shù)據(jù)湖。