“加碼”數(shù)據(jù)與AI:微軟Azure的兩點更新與四個優(yōu)勢
天空因為有了云的涌動而有了雨,企業(yè)因為有了數(shù)據(jù)的流動才獲得了洞察。但“骨感”的現(xiàn)實卻告訴我們,現(xiàn)如今大部分的企業(yè)中仍有80%的數(shù)據(jù)都沒有被用上。
微軟CEO薩提亞·納德拉認為,這不是因為認知缺乏,而是因為技術(shù)能力還未跟上。“如今,有一半的‘財富 1000 強’企業(yè)不把數(shù)據(jù)看作業(yè)務(wù)資產(chǎn),不是因為他們不懂得數(shù)據(jù)的重要,而是因為缺少必需的程序和能力對其加以利用。”他在全球Ignite 2021大會上表示。
在微軟看來,企業(yè)要想充分地利用數(shù)據(jù),數(shù)據(jù)的現(xiàn)代化至關(guān)重要。“現(xiàn)在的數(shù)據(jù)全部都是云上處理,要開發(fā)云端原生的應(yīng)用,開發(fā)過程中要進行分析、調(diào)研、使用等環(huán)節(jié),并且利用數(shù)據(jù)科學(xué)和AI最新的技術(shù)。同時,最不容忽略的,是數(shù)據(jù)的管理和治理。”微軟大中華區(qū)副總裁兼市場營銷及運營總經(jīng)理康容在接受記者采訪時強調(diào),“所以,微軟會以客戶的需求為導(dǎo)向,在數(shù)據(jù)合理利用方面推動客戶進步。”
微軟大中華區(qū)副總裁兼市場營銷及運營總經(jīng)理 康容
基于這樣的出發(fā)點,微軟在3月18日舉辦的微軟Ignite China 2021大會上宣布,由微軟和Databricks公司共同研發(fā)的,基于Apache Spark的快速、簡單、協(xié)作型分析服務(wù)Azure Databricks已經(jīng)在由世紀(jì)互聯(lián)運營的Microsoft Azure上正式商用;另外,全世界第一個云原生聚合數(shù)據(jù)分析平臺Azure Synapse Analytics,也將在由世紀(jì)互聯(lián)運營的Microsoft Azure上開放有限預(yù)覽。
由小見大,這兩大服務(wù)內(nèi)容的更新,正是微軟智能云不斷完善和構(gòu)建現(xiàn)代化數(shù)據(jù)平臺的重要之舉。
Azure Databricks:搞定數(shù)據(jù)規(guī);瘑栴}
全球數(shù)據(jù)量的指數(shù)級增長已經(jīng)成為共識,而要對如此龐大的數(shù)據(jù)進行治理和分析,僅靠人力并不現(xiàn)實,結(jié)合人工智能和機器學(xué)習(xí)技術(shù),是高效、充分挖掘數(shù)據(jù)價值的必備手段。但是,在這個過程中,新的問題也在出現(xiàn)。
微軟大中華區(qū)云計算和人工智能事業(yè)部總經(jīng)理林家偉表示,問題主要來自三個方面:第一,是解決方案的復(fù)雜性,雖然針對數(shù)據(jù)治理和分析的產(chǎn)品、工具數(shù)不勝數(shù),但是對企業(yè)來說能夠真正滿足需求、“對癥下藥”的卻并不多,這讓企業(yè)難以從中得到實際的價值;第二,是數(shù)據(jù)的質(zhì)量不高,收集上來的數(shù)據(jù)往往需要經(jīng)過清洗、處理才能真正賦能于業(yè)務(wù),但這需要企業(yè)投入大量的精力和成本;第三,是數(shù)據(jù)量的規(guī)模化增長,要求企業(yè)使用更有效的工具和手段去應(yīng)對。
微軟大中華區(qū)云計算和人工智能事業(yè)部總經(jīng)理 林家偉
“尤其是針對數(shù)據(jù)規(guī);膯栴},Azure Databricks其實就是其中一個解決方案。我們在Azure上做了大量優(yōu)化,以便客戶能夠在全球部署的平臺中,直接使用Databricks的服務(wù)。”林家偉表示。
無論在企業(yè)內(nèi)部還是外部,數(shù)據(jù)通常會有多個不同來源,包括傳統(tǒng)數(shù)據(jù)庫、海量數(shù)據(jù)湖,也包括IoT采集的數(shù)據(jù),有結(jié)構(gòu)化數(shù)據(jù),也有非結(jié)構(gòu)化數(shù)據(jù)。在使用這些數(shù)據(jù)的過程中,如何讓不同的角色,比如數(shù)據(jù)工程師、科學(xué)家、機器學(xué)習(xí)工程師、數(shù)據(jù)分析工程師等,在統(tǒng)一的平臺上實現(xiàn)迅速搭建、集群開啟、數(shù)據(jù)共享,以及計算和分析?Azure Databricks就可以做到。并且,由于該平臺基于的是Apache Spark,使用了內(nèi)存方式進行計算,因此大幅提升了計算能力。
以全球知名的殼牌石油為例,該公司在全球有44,000家加油站,每一家加油站都有數(shù)個攝像機鏡頭,每天24小時都會產(chǎn)生拍攝數(shù)據(jù),過去這些數(shù)據(jù)往往是在后續(xù)做調(diào)查和研究時才會使用。但為了增加加油站的安全性,殼牌把實時數(shù)據(jù)應(yīng)用到了一個非常重要的場景——幫助加油站更好地禁煙。具體來說,利用Azure Databricks,殼牌將所有攝像頭數(shù)據(jù),用流動性的方式輸入進來,再通過數(shù)據(jù)科學(xué)家在Azure Databricks已經(jīng)構(gòu)建好的機器學(xué)習(xí)數(shù)據(jù)模型進行預(yù)警,幾乎可以實時地在偵測到有人點煙或拿起香煙時,立即通知加油站站長,以便及時關(guān)閉加油泵,制止消費者在加油站區(qū)域范圍內(nèi)吸煙。
值得一提的是,面向中國市場,微軟還特別發(fā)布了Power BI connector for Azure Databricks,以便一般的商業(yè)用戶分析師也能夠直接通過Power BI connector去分析在Azure Databricks當(dāng)中的數(shù)據(jù),或者是把相關(guān)數(shù)據(jù)收錄到Synapse中去做分析。“此外,Databricks還能夠根據(jù)客戶的身份或行為進行權(quán)限管理的控制等等,并集合在一個統(tǒng)一的平臺上,擁有和Azure完全一樣的安全性、可控性、魯棒性。”林家偉強調(diào)。
總的來說,Azure Databricks的核心價值可以總結(jié)為四點:第一,讓數(shù)據(jù)不再混亂、孤立和緩慢;第二,讓機器學(xué)習(xí)真正服務(wù)于業(yè)務(wù)運營;第三,為BI提供更高質(zhì)量的服務(wù);第四,提供的是企業(yè)級的就緒服務(wù)。
Azure Synapse Analytics:搞定數(shù)據(jù)聚合與分析難題
數(shù)據(jù)經(jīng)過清洗、處理,下一步,就要對篩選出的高質(zhì)量數(shù)據(jù)進行分析。Azure Synapse Analytics的價值就在這個環(huán)節(jié)體現(xiàn)。
Azure Synapse是微軟智能云SQL 數(shù)據(jù)倉庫的升級版,近期將在中國落地。據(jù)介紹,它從成本上可以幫企業(yè)節(jié)省出每比特計算近94%的成本。而Azure Synapse Analytics是一項將數(shù)據(jù)集成、企業(yè)級數(shù)據(jù)存儲、大數(shù)據(jù)分析融為一體的云原生服務(wù),并且,它的特色之處在于,能無限制地實現(xiàn)跨數(shù)據(jù)倉庫和分析系統(tǒng)提取所有數(shù)據(jù)中的業(yè)務(wù)洞察,并將其通過Power BI及時呈現(xiàn),或者用于機器學(xué)習(xí)和人工智能應(yīng)用。除此之外,由于底層基于的都是Azure,Azure Synapse還可以幫助企業(yè)及時對接自己的Power BI或其它分析平臺,從而維持全平臺的安全可控。
換句話說,Azure Synapse Analytics服務(wù)能幫助企業(yè)更有效地從各種紛繁復(fù)雜的業(yè)務(wù)系統(tǒng)、應(yīng)用、渠道中快速獲取有效數(shù)據(jù),對海量數(shù)據(jù)進行實時分析處理,以最快速度獲取可用于指導(dǎo)決策或者機器學(xué)習(xí)的業(yè)務(wù)洞察。據(jù)了解,這項服務(wù)在全球Azure推出預(yù)覽一年來,推動Azure上處理PB級數(shù)據(jù)的客戶數(shù)量增加了五倍。
“微軟智能云Azure在針對數(shù)據(jù)處理、人工智能服務(wù)當(dāng)中,一直加速創(chuàng)新和部署,不僅僅在全球區(qū)域,也在中國區(qū)域同步為客戶提供這些功能,以便客戶在選擇上、使用方便上進行判斷和選擇。由于我們提供了這些服務(wù),客戶可以針對自己需要的場景,選擇去使用最優(yōu)化、最適合的服務(wù)。在業(yè)界既然有這么多不同的數(shù)據(jù)、不同的場景,作為云計算公司有必要提供給客戶最習(xí)慣或者最想使用,也最優(yōu)化過的一些產(chǎn)品。”林家偉指出。
可以見得,針對數(shù)據(jù)治理與人工智能服務(wù),微軟的最大優(yōu)勢就在于能夠提供一站式的服務(wù),無論是數(shù)據(jù)庫、數(shù)據(jù)分析還是AI、BI等等,微軟的觸角無處不達,而所有的觸角最終都歸回Azure,由Azure背后的Windows Server服務(wù)器、SQL Server資料倉庫、系統(tǒng)中心管理工具等,提供統(tǒng)一的支持和服務(wù)體驗。這意味著,所有其上的應(yīng)用、技術(shù)都由微軟進行整合,從新舊設(shè)備的融合,到混合多云環(huán)境的統(tǒng)一管理,都可以一站式得到處理。
與此同時,在智能方面,經(jīng)過微軟研究院多年來在AI領(lǐng)域的研究、創(chuàng)新和突破,在Azure的產(chǎn)品和服務(wù)中已經(jīng)整合了大量智能化服務(wù),企業(yè)可以根據(jù)業(yè)務(wù)需要選擇和使用。另外,在數(shù)據(jù)安全保護方面,微軟也做了很多的事情,無論企業(yè)在使用數(shù)據(jù)、遷移數(shù)據(jù)還是分析數(shù)據(jù)的任何一個環(huán)節(jié),無論是在PC端、手機端還是移動裝置上,無論是云端還是邊緣端,微軟都有相應(yīng)的安全服務(wù),能夠做到無處不在的安全防護。
用康容的話總結(jié)——一站式的服務(wù)、混合多云的管理、智能化和安全可信,這既是微軟智能云的特色,也是客戶選擇微軟的重要原因。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼