EMC大數(shù)據(jù)的市場(chǎng)策略分成三個(gè)階段,EMC希望通過這三個(gè)階段幫助用戶成功的走向大數(shù)據(jù)之旅。
第一個(gè)階段是建構(gòu)一個(gè)云基礎(chǔ)架構(gòu)。這是因?yàn)榇髷?shù)據(jù)的兩個(gè)特點(diǎn),從數(shù)據(jù)方面,第一是海量,第二是90%是非結(jié)構(gòu)性的,所以要成功的進(jìn)行大數(shù)據(jù),也需要首先有大數(shù)據(jù)方面的存儲(chǔ)。
EMC在過去幾年并購的Isilon可以提供無限的橫向的擴(kuò)展能力,能夠提供非常具有靈活性的擴(kuò)展的環(huán)境,無限的橫向擴(kuò)展。EMC的另外一個(gè)產(chǎn)品是Atmos。Atmos也是EMC在大數(shù)據(jù)方面提供的存儲(chǔ)的解決方案,它跟Isilon不一樣,比如分布式的大數(shù)據(jù)的做法,Atmos是很好的解決方案,很多在提供內(nèi)容的、提供服務(wù)的供應(yīng)。
在數(shù)據(jù)分析方面EMC提供的解決方案、提供的產(chǎn)品是Greenplum,Greenplum有兩個(gè)產(chǎn)品,第一是GreenplumDatabase,GreenplumDatabase是大規(guī)模的并行成立的數(shù)據(jù)庫,它可以管理、存儲(chǔ)、分析PB級(jí)量的一些結(jié)構(gòu)性數(shù)據(jù),它下載的速度非常高,最高可以達(dá)到每小時(shí)10TB,速度非常驚人。這是EMC可以提供給企業(yè)、政府,用來分析海量的數(shù)據(jù)。但是GreenplumDatabase面對(duì)的是結(jié)構(gòu)化數(shù)據(jù)。很多數(shù)據(jù)超過90%是非結(jié)構(gòu)化數(shù)據(jù),EMC有另外一個(gè)產(chǎn)品是GreenplumHD,GreenplumHD可以把非結(jié)構(gòu)化的數(shù)據(jù)或者是半結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù),然后讓GreenplumDatabase去處理。
第二階段是跟協(xié)作有關(guān)系。大數(shù)據(jù)這個(gè)概念的出現(xiàn),也出現(xiàn)了一個(gè)新的角色——“數(shù)據(jù)科學(xué)家”,數(shù)據(jù)科學(xué)家是負(fù)責(zé)分析和解釋無論是在企業(yè)里面、在政府部門里面所有這些數(shù)據(jù)的。EMC要把這些數(shù)據(jù)科學(xué)家跟IT、跟業(yè)務(wù)部門之間的界限打破,給他們提供一個(gè)靈活的環(huán)境、標(biāo)準(zhǔn)的環(huán)境。
大數(shù)據(jù)戰(zhàn)略的第三個(gè)階段是要提供一個(gè)敏捷的環(huán)境。EMC收購的PivotalLabs,就是在敏捷開發(fā)方面提供服務(wù)跟軟件的。