Graphcore加速拓展市場(chǎng),迎接IPU市場(chǎng)快速擴(kuò)張
日前,Graphcore與神州數(shù)碼集團(tuán)簽訂合作協(xié)議,神州數(shù)碼正式成為Graphcore中國(guó)區(qū)總代理。雙方將在中國(guó)范圍內(nèi)發(fā)展銷售渠道網(wǎng)絡(luò)進(jìn)行合作,使得中國(guó)的商業(yè)客戶與廣大創(chuàng)新者能夠更便捷和快速地獲取IPU系統(tǒng),以及配套的本地AI專家服務(wù)和工程支持。此舉對(duì)于Graphcore開(kāi)拓在中國(guó)的市場(chǎng)以及未來(lái)IPU在中國(guó)市場(chǎng)的普及、推動(dòng)中國(guó)AI市場(chǎng)的持續(xù)走高無(wú)疑具有積極意義。
專門(mén)為AI應(yīng)用設(shè)計(jì)的IPU
如今,圍繞AI市場(chǎng)英特爾和英偉達(dá)激斗正酣,雖然GPU在AI芯片賽跑中占據(jù)了主動(dòng),但這場(chǎng)賽跑還遠(yuǎn)未結(jié)束。賽場(chǎng)上除了英特爾、英偉達(dá)外還有眾多參賽選手,很多新興的AI芯片公司在成本、效率、性能以及應(yīng)對(duì)深度學(xué)習(xí)和機(jī)器學(xué)習(xí)等負(fù)載的靈活性等方面各有優(yōu)勢(shì)。根據(jù)市場(chǎng)研究公司Global Market Insights的一份研究報(bào)告,AI芯片的全球市場(chǎng)規(guī)模預(yù)計(jì)每年增長(zhǎng)速度為35%,將從2019年的80億美元增長(zhǎng)到2026年的700億美元,這也說(shuō)明AI芯片市場(chǎng)充滿了各種機(jī)會(huì)。
Graphcore也是參賽的選手之一。Graphcore來(lái)自英國(guó),成立于2016年,有著芯片獨(dú)角獸之稱,成立以來(lái)備受投資者青睞,到目前為止已經(jīng)成功融資超過(guò)7億美元。其推出的IPU(Intelligence Processing Unit,智能處理器)屬于AI芯片,Arm聯(lián)合創(chuàng)始人Hermann Hauser將IPU定義為計(jì)算機(jī)發(fā)展史上繼CPU、GPU之后的第三次革命。
IPU采用的是完全不同于CPU和GPU的芯片架構(gòu)。在Graphcore高級(jí)副總裁兼中國(guó)區(qū)總經(jīng)理盧濤看來(lái),CPU和GPU都不是專門(mén)為AI而設(shè)計(jì)。雖然GPU現(xiàn)在應(yīng)用非常廣泛,但當(dāng)初是為圖形渲染而不是為AI所設(shè)計(jì),只是這種架構(gòu)正好契合了部分AI應(yīng)用。而IPU是專門(mén)為AI設(shè)計(jì)的,其強(qiáng)大的并行處理能力確保了快速訓(xùn)練模型的實(shí)現(xiàn),并能進(jìn)行實(shí)時(shí)操控。
“CPU主要面向標(biāo)量計(jì)算設(shè)計(jì),長(zhǎng)于控制和應(yīng)用;GPU主要面向向量計(jì)算設(shè)計(jì),長(zhǎng)于圖形計(jì)算;而IPU主要面向計(jì)算圖設(shè)計(jì),尤其是稀疏矩陣下計(jì)算效率最高。”盧濤表示。
Graphcore高級(jí)副總裁兼中國(guó)區(qū)總經(jīng)理 盧濤
IPU在架構(gòu)上的一大創(chuàng)新是采用了MIMD(多指令流多數(shù)據(jù)流)眾核架構(gòu),同時(shí),IPU架構(gòu)中具有大容量的分布式片上SRAM,片內(nèi)高達(dá)900MB的SRAM相對(duì)于GPU的GDDR、HBM來(lái)說(shuō),可以做到數(shù)十倍的性能提升。為了解決片內(nèi)眾核之間的通信,IPU還采用了高效的通信技術(shù)BSP(Bulk Synchronous Parallel)。IPU是目前世界上第一款采用BSP通信的處理器。
去年6月,Graphcore發(fā)布了第二代IPU——GC200(Colossus MK2 IPU)和相對(duì)應(yīng)的IPU-M2000系統(tǒng)。GC200采用了7納米制程,每個(gè)芯片在一個(gè)823平方毫米的裸片上包含高達(dá)594億個(gè)晶體管,使其成為有史以來(lái)最精密的處理器。IPU-M2000系統(tǒng)配備了4個(gè)MK2 IPU。根據(jù)Graphcore的資料,8個(gè)IPU-M2000系統(tǒng)在運(yùn)行FP32計(jì)算任務(wù)的時(shí)候性能要比8個(gè)Nvidia DGX A100系統(tǒng)高出12倍,而AI計(jì)算則要高出3倍,總成本卻僅高出30%多。
推動(dòng)IPU在行業(yè)落地
作為一種專門(mén)為AI應(yīng)用設(shè)計(jì)的芯片,IPU在很多GPU典型應(yīng)用場(chǎng)景上表現(xiàn)得非常優(yōu)秀。根據(jù)Graphcore提供的資料,IPU在自然語(yǔ)言處理、圖像識(shí)別、時(shí)序分析等很多GPU主要應(yīng)用領(lǐng)域,都有至少兩倍以上的性能優(yōu)勢(shì),相比GPU構(gòu)成明顯的競(jìng)爭(zhēng)優(yōu)勢(shì)。不過(guò),盧濤表示,Graphcore并不認(rèn)為IPU要替代GPU,他認(rèn)為未來(lái)CPU、GPU、IPU會(huì)三分天下,各自有自己的優(yōu)勢(shì)領(lǐng)域。
目前,IPU與CPU、CPU相比還非常年輕,要把IPU的技術(shù)優(yōu)勢(shì)變成企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì),還有很多工作要做。目前Graphcore正在積極努力,完善IPU的產(chǎn)業(yè)生態(tài)。
在開(kāi)發(fā)者方面,Graphcore推出了IPU配套的開(kāi)發(fā)平臺(tái)——Poplar SDK。Poplar是架構(gòu)在機(jī)器學(xué)習(xí)的框架軟件(比如TensorFlow、ONNX、PyTorch和PaddlePaddle)和硬件之間的一個(gè)基于計(jì)算圖的工具和庫(kù)。目前已經(jīng)提供750個(gè)高性能計(jì)算元素的50多種優(yōu)化功能,可以支持各種標(biāo)準(zhǔn)的機(jī)器學(xué)習(xí)框架,包括TensorFlow 1/2、ONNX和PyTorch,很快也會(huì)支持百度的Paddle。
在銷售渠道上,簽約神州數(shù)碼就是非常重要的一步。神州數(shù)碼將作為Graphcore在中國(guó)的產(chǎn)品總代理。目前Graphcore的主打產(chǎn)品就是基于GC200構(gòu)建的可擴(kuò)展至超大規(guī)模的IPU系統(tǒng),每個(gè)IPU系統(tǒng)以IPU-M2000為單元模塊進(jìn)行堆疊,可擴(kuò)展至超大規(guī)模計(jì)算級(jí)別。每個(gè)IPU-M2000在1U的纖薄尺寸內(nèi)提供了1 petaFLOPS的AI計(jì)算和高達(dá)450GB的Exchange-Memory,可滿足最苛刻的機(jī)器智能工作負(fù)載。目前主要的IPU系統(tǒng)具體包括:
盧濤表示,今年是Graphcore正式進(jìn)入中國(guó)的第三年。中國(guó)是全球領(lǐng)先的AI市場(chǎng),也是Graphcore的重要市場(chǎng)之一。在中國(guó)市場(chǎng),Graphcore與領(lǐng)先的本地商業(yè)用戶展開(kāi)緊密的早期合作,基于IPU的開(kāi)發(fā)者云已于去年7月正式上線,其IPU-POD產(chǎn)品技術(shù)已在IPU開(kāi)發(fā)者云上供用戶訪問(wèn)。他相信,有神州數(shù)碼的助力,中國(guó)這一火爆的AI市場(chǎng)有望率先成為IPU落地實(shí)現(xiàn)爆炸性增長(zhǎng)的區(qū)域之一。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼