中科馭數(shù)的芯片夢:讓每個服務(wù)器都有DPU
CPU一統(tǒng)江湖的局面正在慢慢被蠶食,這些蠶食者就是各種名為“XPU”的“小弟”,如GPU、DPU、IPU等等,其中GPU目前已經(jīng)得到市場普遍認(rèn)可,成長非常快,而DPU、IPU以及各種專用AI芯片還有待市場驗證。
在中科馭數(shù)創(chuàng)始人兼CEO鄢貴?磥,DPU很可能是繼GPU之后又一個有望引爆的芯片市場。中科馭數(shù)是一家2018年才剛剛成立的初創(chuàng)公司,選擇的正是DPU這條賽道。不久前,中科馭數(shù)發(fā)布了其下一代DPU芯片計劃,將基于自研的KPU(Kernel Processing Unit)芯片架構(gòu),圍繞網(wǎng)絡(luò)協(xié)議處理、數(shù)據(jù)庫和大數(shù)據(jù)處理加速、存儲運算、安全加密運算等核心功能,推出新一代DPU芯片。
風(fēng)口上的DPU
今天DPU(Data Processing Unit)是業(yè)內(nèi)的熱點話題,不過,鄢貴海告訴至頂網(wǎng)記者,中科馭數(shù)創(chuàng)業(yè)時其實并不清楚有DPU這類芯片的存在,只是因為看到了市場對DPU的需求,而自己有技術(shù)實力才進入這個市場。中科馭數(shù)的核心創(chuàng)業(yè)團隊來自中科院計算所計算機體系結(jié)構(gòu)國家重點實驗室,十多年從事計算機體系結(jié)構(gòu)的研究經(jīng)歷使得他們非常了解產(chǎn)業(yè)的最新變化。
“做著做著,我們發(fā)現(xiàn)我們做得事情和國外一些公司做得一樣,這就是市場說的DPU。” 鄢貴海說。
鄢貴海解釋說,作為最新發(fā)展起來的一種專用處理器,DPU其產(chǎn)生的背景是數(shù)字智能時代,數(shù)據(jù)爆發(fā)導(dǎo)致的對計算延遲、數(shù)據(jù)安全、資源虛擬化的需求。
最初,數(shù)據(jù)中心的所有工作都由CPU來承擔(dān),無論是數(shù)據(jù)的處理、數(shù)據(jù)的傳輸還是圖像的渲染。在數(shù)據(jù)量不太大的時候,CPU還能勝任,而隨著數(shù)據(jù)量爆炸性的增長,單純依靠CPU來打理一切變得不太可行,或者說不經(jīng)濟。這才有了GPU、DPU等芯片的出現(xiàn)。
其實,在現(xiàn)代數(shù)據(jù)中心中,CPU的處理能力中很大一部分被用于執(zhí)行基礎(chǔ)設(shè)施管理任務(wù),例如掃描網(wǎng)絡(luò)流量中是否存在惡意軟件以及編排存儲設(shè)備,而DPU芯片如果接管其中一部分任務(wù),就可以釋放CPU的計算能力去執(zhí)行更高價值的任務(wù),其潛在運營收益是巨大的。據(jù)估計,基礎(chǔ)設(shè)施管理任務(wù)將占數(shù)據(jù)中心CPU核心處理能力的20%至30%,這也正是DPU的價值所在。
簡單地說,CPU相當(dāng)于一個通才,它長處是什么都能干,但效率不高,而GPU、DPU相當(dāng)于專才,專門干一件或者一類事情,因此效率最高。今天,不少企業(yè)開始將CPU、GPU、DPU組合,來實現(xiàn)更經(jīng)濟的效果。 在這個組合中CPU負(fù)責(zé)構(gòu)建應(yīng)用生態(tài),GPU負(fù)責(zé)圖像處理核深度學(xué)習(xí)訓(xùn)練,DPU負(fù)責(zé)卸載基礎(chǔ)層應(yīng)用,比如網(wǎng)絡(luò)、安全、數(shù)據(jù)壓縮等。這就是我們今天說的異構(gòu)計算。
談到CPU、GPU和DPU的區(qū)別,鄢貴海做了一個形象的比喻:如果把一臺計算機或服務(wù)器比作一個團隊,CPU相當(dāng)于這個團隊的“大管家”,負(fù)責(zé)思考并處理各種業(yè)務(wù);GPU是“美工”,專攻圖像處理;DPU則相當(dāng)于“前臺”,負(fù)責(zé)打包、拆包“數(shù)據(jù)包”,提升整個團隊的工作效率。
異構(gòu)核還是眾核?
在DPU的潛在市場,目前已經(jīng)有了不少玩家,既有Intel、Broadcom、Marvall、Nvidia等巨頭,也有Fungible、Pensando等初創(chuàng)公司。這些公司中對DPU市場影響最大的可能是NVIDIA,正是NVIDIA讓DPU成為一個業(yè)內(nèi)熱詞。去年,Nvidia發(fā)布了名為BlueField-2的DPU,今年應(yīng)該會正式上市。不過,在行動上走得比較早的可能是Fungible,目前Fungible已經(jīng)由兩款DPU芯片上市。
中科馭數(shù)與這幾家走的是不同的技術(shù)路線,這幾家選擇的是眾核,而中科馭數(shù)是異構(gòu)核。通俗地說,就是Nvidia和Fungible的DPU的多個核是同構(gòu)的,其中,Nvidia采用的是基于ARM的多核架構(gòu),F(xiàn)ungible采用的是基于MIPS的多核架構(gòu),而中科馭數(shù)DPU的多核是不同架構(gòu)的,比如其中四個核心可能一個專門面向安全設(shè)計,一個面向網(wǎng)絡(luò)設(shè)計,一個面向數(shù)據(jù)庫設(shè)計,一個面向AI設(shè)計,架構(gòu)各不相同。
這背后的一個重要技術(shù)原因是,中科馭數(shù)創(chuàng)新性提出了軟件定義加速器技術(shù)(Software Defined Accelerator),自主研發(fā)了KPU(Kernel Processing Unit)芯片架構(gòu)。KPU架構(gòu)凝聚了中科馭數(shù)創(chuàng)始團隊近十年在體系結(jié)構(gòu)方面研究成果和研發(fā)經(jīng)驗的積累。其相較于傳統(tǒng)的ASIC或SOC DPU芯片架構(gòu),具有極高的靈活性,可以通過即時的軟件配置來定義芯片內(nèi)部數(shù)據(jù)運算邏輯,在保障充沛算力的同時,以最低功耗支撐更多運算負(fù)載類型。
鄢貴海表示,中科馭數(shù)的DPU以針對性算法加速為核心,通過KPU架構(gòu)來組織異構(gòu)核。在KPU架構(gòu)下,中科馭數(shù)研發(fā)了國內(nèi)首款芯片級完善的L2/L3/L4層全網(wǎng)絡(luò)協(xié)議處理核,推出了直接面向OLAP、OLTP及類SQL處理的數(shù)據(jù)查詢處理核,而沒有采用原來眾核為主的架構(gòu)。
2019年成功流片的數(shù)據(jù)庫與時序數(shù)據(jù)處理融合加速芯片
“異構(gòu)核架構(gòu)將帶來更高效的數(shù)據(jù)處理效率、獲得更直接的使用接口,以及更佳的虛擬化支持。”鄢貴海介紹。
據(jù)悉,2019年中科馭數(shù)成功流片業(yè)內(nèi)首顆數(shù)據(jù)庫與時序數(shù)據(jù)處理融合加速芯片。目前,芯片產(chǎn)品已經(jīng)分別在金融領(lǐng)域的實時風(fēng)控、大數(shù)據(jù)處理和異構(gòu)數(shù)據(jù)庫加速等領(lǐng)域得到實際應(yīng)用,并且得到非常用戶非常積極的反饋。今年將會推出第二代產(chǎn)品,功能層面包括完善的L2/ L3/L4層的網(wǎng)絡(luò)協(xié)議處理,可處理高達200G網(wǎng)絡(luò)帶寬數(shù)據(jù)。其次融合數(shù)據(jù)庫、大數(shù)據(jù)處理能力,直接面向OLAP、OLTP及大數(shù)據(jù)處理平臺,如Spark等。另外還囊括機器學(xué)習(xí)計算核以及安全加密運算核。接下來的2022、2023年也將分別新一代的產(chǎn)品推出,制程工藝也將分別從2019年的55納米,到今年的28納米,到明后年的12納米和7納米。
鄢貴海表示,DPU可能是一個比GPU更大的市場。“不一定每臺服務(wù)器都需要GPU,但很有可能每臺服務(wù)器都可能要一個DPU。”
機會很大,挑戰(zhàn)也不小,對于中科馭數(shù)而言,最大的挑戰(zhàn)還是要繼續(xù)打磨自己的產(chǎn)品,用更多的成功案例來教育客戶,贏得市場,讓客戶看到異構(gòu)核DPU的價值。明知這條路上一定荊棘密布,但對技術(shù)的自信和對成功的渴望依然吸引鄢貴海帶領(lǐng)中科馭數(shù)一路向前。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼