微軟 Build 2021:展示Power BI與Cosmos DB最新功能
微軟Build開發(fā)者大會——Build 2021,又回來了!現(xiàn)在,即使是線上的活動也形成了一年一度的新傳統(tǒng)不過,微軟還保持了另一項由來已久的傳統(tǒng),就是利用Build開發(fā)人員大會來宣布公司在數(shù)據(jù)和分析方面的新進展。
今年,盡管微軟本身并沒有帶來突破性的新聞,但是在云端的BI和數(shù)據(jù)庫產(chǎn)品方面,微軟交出了長長的清單,里面列舉了很多新功能和新服務(wù),這些內(nèi)容也非常令人印象深刻。
全程強大的數(shù)據(jù)流和聚合
讓我們從微軟的Power BI公告開始。公告包含了處理從數(shù)據(jù)來源(Azure IoT Hub和Azure Event Hubs)獲得數(shù)據(jù)流的Power BI數(shù)據(jù)流功能(云端的功能就是Power Query)。微軟的團隊承諾稱,它將讓流數(shù)據(jù)和實時分析像批處理數(shù)據(jù)和常規(guī)分析一樣易于使用——不僅僅是針對BI專家和數(shù)據(jù)工程師,還可以適用于商業(yè)用戶。而且由于事件中心(Event Hubs)可以在Apache Kafka兼容模式下工作,因此引發(fā)了一個問題,即該功能是否有一天可以與該開源流事件平臺一起工作。
另一個有趣的功能被稱為自動聚合。要了解此功能,你必須了解作為其基礎(chǔ)的基本聚合功能;揪酆瞎δ苁鼓憧梢栽诙攘康幕A(chǔ)上預(yù)先計算聚合,從而獲得出色的性能,特別是針對那些Power BI已經(jīng)通過DirectQuery連接了的數(shù)據(jù)源時,更是如此。DirectQuery可以從后端數(shù)據(jù)源獲取數(shù)據(jù)。
通過聚合,Power BI可以避免一直到后端獲取通用匯總數(shù)據(jù),而將這種方式保留給相對較少的詳細數(shù)據(jù)集。聚合的問題在于,用戶必須在建模Power BI要查詢數(shù)據(jù)的時候設(shè)計聚合。這里有一個好消息,自動聚合功能將根據(jù)實際觀察到的查詢模式自動構(gòu)建這些算法,隨著收集到的此類觀察結(jié)果數(shù)量的增加,它的表現(xiàn)還會變得越來越好。
數(shù)據(jù)流和自動聚合的預(yù)覽版本都將在7月發(fā)布,這兩個功能都是Power BI Premium專有的。由于Premium現(xiàn)在是按用戶提供服務(wù),用戶需要在Power BI Pro的基礎(chǔ)上每個月多支付10美元以使用Premium功能。因此這些功能和更多的用戶都相關(guān)。同時,另一項Premium功能——Power BI部署管道(Power BI deployment pipelines)——可以獲取面向開發(fā)人員的自動化API(Automation APIs)以支持Azure DevOps、GitHub和Azure Pipelines等工具,讓它們可以自動化地部署Power BI資產(chǎn)。自動化API(Automation APIs)現(xiàn)在已經(jīng)可以使用了。
這里有很多只針對Premium用戶的功能,而“高級用戶”的定價意味著我們將會看到更多這樣的功能。同時,微軟還發(fā)布了一個很酷的新功能,該功能允許將Power BI報告被內(nèi)嵌到Jupyter筆記本中——作為開源Python包。而且它與Power BI Pro兼容,包括可免費試用的版本。下圖是一個裝有Power BI的Jupyter筆記本的圖片。
COSMOS DB:無服務(wù)器、緩存、加密和免費
在數(shù)據(jù)庫方面,微軟發(fā)布了很多關(guān)于Cosmos DB的消息,還有一些是關(guān)于MySQL和Postgres的零散消息。
首先,是Cosmos DB——微軟的大規(guī)模多模型托管NoSQL數(shù)據(jù)庫。微軟將無服務(wù)器選項納入了Cosmos DB的通用可選范圍之內(nèi),并包含Cosmos的很多API,將它的云原生譜系拓展了一步。無服務(wù)器版本的Cosmos DB讓用戶可以在無需提供顯式規(guī)模集群的情況下使用它,因此能夠更好地應(yīng)對微軟所謂的“尖峰流量模式”。即使對于習(xí)慣了集群規(guī)模調(diào)整的客戶來說,這種無服務(wù)器的選項也將在實質(zhì)上提供零維護的自動規(guī)模調(diào)整。畢竟,無服務(wù)器的信條是讓服務(wù)承擔在你需要的時候為你分配資源的責(zé)任。
Cosmos也獲得了很多新功能,那些熟悉舊式關(guān)系型數(shù)據(jù)庫的專業(yè)人員們可能會喜歡這些功能。其中包括集成的緩存,基于角色的訪問控制(RBAC)和始終加密(Always Encrypted)——這是一個源自SQL Server和Azure SQL數(shù)據(jù)庫的功能,在數(shù)據(jù)被存入數(shù)據(jù)庫之前,就在應(yīng)用程序內(nèi)進行完全加密。集成的緩存服務(wù)特別有趣,因為它不僅可以提高性能,而且可以通過減少對數(shù)據(jù)庫的完整讀取來節(jié)省資金。微軟表示,緩存可以降低成本,并將大量讀取工作負載的性能分別提高多達96%和300%。
Cosmos DB還擴展了它的免費功能。新產(chǎn)品為開發(fā)人員提供每個月1,000 RU/s(每秒請求單位)的預(yù)配置吞吐量和25GB的免費存儲空間。談到免費——微軟已經(jīng)在這個方向努力了一段時間了,該公司提供了Cosmos DB仿真器,它讓開發(fā)人員能夠在正常工作的Cosmos DB實例上運行其代碼,而且無需支付任何云費用。以前,該仿真器只能在Windows計算機上運行,但是微軟今天發(fā)布了該仿真器的Linux版本,它也可以運行在Mac機器上。像Cosmos DB Serverless一樣,新發(fā)布的免費功能都已經(jīng)全面上市。同時,集成緩存、始終加密(Always Encrypted)和Linux仿真器推出了預(yù)覽版。
回到關(guān)系數(shù)據(jù)庫的世界,微軟宣布將從六月開始提供12個月免費的Azure Database for PostgreSQL和Azure Database for MySQL Flexible Server,微軟將為使用Azure免費帳戶的用戶每個月提供最多750個小時的免費服務(wù)。此外,對于Azure Database for PostgreSQL——Hyperscale (Citus)這個新推出的免費功能預(yù)覽版,微軟將提供基于單節(jié)點部署的入門級功能。至少可以說,對于單節(jié)點部署來說,無論如何都很難說得上有“超大規(guī)模”,所以最好用和Cosmos DB仿真器相同的方式來對待它——作為開發(fā)和測試代碼的一個工作端點。區(qū)別在于它可以就地生產(chǎn),因為微軟提供了后續(xù)增加工作節(jié)點并進行擴展的選項。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼