Graphcore加速拓展市場,迎接IPU市場快速擴張
日前,Graphcore與神州數(shù)碼集團簽訂合作協(xié)議,神州數(shù)碼正式成為Graphcore中國區(qū)總代理。雙方將在中國范圍內(nèi)發(fā)展銷售渠道網(wǎng)絡(luò)進行合作,使得中國的商業(yè)客戶與廣大創(chuàng)新者能夠更便捷和快速地獲取IPU系統(tǒng),以及配套的本地AI專家服務和工程支持。此舉對于Graphcore開拓在中國的市場以及未來IPU在中國市場的普及、推動中國AI市場的持續(xù)走高無疑具有積極意義。
專門為AI應用設(shè)計的IPU
如今,圍繞AI市場英特爾和英偉達激斗正酣,雖然GPU在AI芯片賽跑中占據(jù)了主動,但這場賽跑還遠未結(jié)束。賽場上除了英特爾、英偉達外還有眾多參賽選手,很多新興的AI芯片公司在成本、效率、性能以及應對深度學習和機器學習等負載的靈活性等方面各有優(yōu)勢。根據(jù)市場研究公司Global Market Insights的一份研究報告,AI芯片的全球市場規(guī)模預計每年增長速度為35%,將從2019年的80億美元增長到2026年的700億美元,這也說明AI芯片市場充滿了各種機會。
Graphcore也是參賽的選手之一。Graphcore來自英國,成立于2016年,有著芯片獨角獸之稱,成立以來備受投資者青睞,到目前為止已經(jīng)成功融資超過7億美元。其推出的IPU(Intelligence Processing Unit,智能處理器)屬于AI芯片,Arm聯(lián)合創(chuàng)始人Hermann Hauser將IPU定義為計算機發(fā)展史上繼CPU、GPU之后的第三次革命。
IPU采用的是完全不同于CPU和GPU的芯片架構(gòu)。在Graphcore高級副總裁兼中國區(qū)總經(jīng)理盧濤看來,CPU和GPU都不是專門為AI而設(shè)計。雖然GPU現(xiàn)在應用非常廣泛,但當初是為圖形渲染而不是為AI所設(shè)計,只是這種架構(gòu)正好契合了部分AI應用。而IPU是專門為AI設(shè)計的,其強大的并行處理能力確保了快速訓練模型的實現(xiàn),并能進行實時操控。
“CPU主要面向標量計算設(shè)計,長于控制和應用;GPU主要面向向量計算設(shè)計,長于圖形計算;而IPU主要面向計算圖設(shè)計,尤其是稀疏矩陣下計算效率最高。”盧濤表示。
Graphcore高級副總裁兼中國區(qū)總經(jīng)理 盧濤
IPU在架構(gòu)上的一大創(chuàng)新是采用了MIMD(多指令流多數(shù)據(jù)流)眾核架構(gòu),同時,IPU架構(gòu)中具有大容量的分布式片上SRAM,片內(nèi)高達900MB的SRAM相對于GPU的GDDR、HBM來說,可以做到數(shù)十倍的性能提升。為了解決片內(nèi)眾核之間的通信,IPU還采用了高效的通信技術(shù)BSP(Bulk Synchronous Parallel)。IPU是目前世界上第一款采用BSP通信的處理器。
去年6月,Graphcore發(fā)布了第二代IPU——GC200(Colossus MK2 IPU)和相對應的IPU-M2000系統(tǒng)。GC200采用了7納米制程,每個芯片在一個823平方毫米的裸片上包含高達594億個晶體管,使其成為有史以來最精密的處理器。IPU-M2000系統(tǒng)配備了4個MK2 IPU。根據(jù)Graphcore的資料,8個IPU-M2000系統(tǒng)在運行FP32計算任務的時候性能要比8個Nvidia DGX A100系統(tǒng)高出12倍,而AI計算則要高出3倍,總成本卻僅高出30%多。
推動IPU在行業(yè)落地
作為一種專門為AI應用設(shè)計的芯片,IPU在很多GPU典型應用場景上表現(xiàn)得非常優(yōu)秀。根據(jù)Graphcore提供的資料,IPU在自然語言處理、圖像識別、時序分析等很多GPU主要應用領(lǐng)域,都有至少兩倍以上的性能優(yōu)勢,相比GPU構(gòu)成明顯的競爭優(yōu)勢。不過,盧濤表示,Graphcore并不認為IPU要替代GPU,他認為未來CPU、GPU、IPU會三分天下,各自有自己的優(yōu)勢領(lǐng)域。
目前,IPU與CPU、CPU相比還非常年輕,要把IPU的技術(shù)優(yōu)勢變成企業(yè)的競爭優(yōu)勢,還有很多工作要做。目前Graphcore正在積極努力,完善IPU的產(chǎn)業(yè)生態(tài)。
在開發(fā)者方面,Graphcore推出了IPU配套的開發(fā)平臺——Poplar SDK。Poplar是架構(gòu)在機器學習的框架軟件(比如TensorFlow、ONNX、PyTorch和PaddlePaddle)和硬件之間的一個基于計算圖的工具和庫。目前已經(jīng)提供750個高性能計算元素的50多種優(yōu)化功能,可以支持各種標準的機器學習框架,包括TensorFlow 1/2、ONNX和PyTorch,很快也會支持百度的Paddle。
在銷售渠道上,簽約神州數(shù)碼就是非常重要的一步。神州數(shù)碼將作為Graphcore在中國的產(chǎn)品總代理。目前Graphcore的主打產(chǎn)品就是基于GC200構(gòu)建的可擴展至超大規(guī)模的IPU系統(tǒng),每個IPU系統(tǒng)以IPU-M2000為單元模塊進行堆疊,可擴展至超大規(guī)模計算級別。每個IPU-M2000在1U的纖薄尺寸內(nèi)提供了1 petaFLOPS的AI計算和高達450GB的Exchange-Memory,可滿足最苛刻的機器智能工作負載。目前主要的IPU系統(tǒng)具體包括:
盧濤表示,今年是Graphcore正式進入中國的第三年。中國是全球領(lǐng)先的AI市場,也是Graphcore的重要市場之一。在中國市場,Graphcore與領(lǐng)先的本地商業(yè)用戶展開緊密的早期合作,基于IPU的開發(fā)者云已于去年7月正式上線,其IPU-POD產(chǎn)品技術(shù)已在IPU開發(fā)者云上供用戶訪問。他相信,有神州數(shù)碼的助力,中國這一火爆的AI市場有望率先成為IPU落地實現(xiàn)爆炸性增長的區(qū)域之一。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
