CPU、GPU、FPGA、AI芯片,各種XPU哪家強?一篇文章看懂芯片產(chǎn)業(yè)格局
2021年開年雖然業(yè)界面臨“缺芯”問題,但是眾多半導(dǎo)體廠商的新品發(fā)布卻是此起彼伏,“你方唱罷我登場”。
……
GTC 2021上,英偉達(dá)宣布進(jìn)軍CPU,實現(xiàn)CPU、GPU、DPU“3U一體”
英特爾發(fā)布用于數(shù)據(jù)中心的第三代至強可擴展處理器Ice Lake以及其產(chǎn)品組合
AMD EPYC進(jìn)化到代號“米蘭”的第三代
Arm 發(fā)布最新一代架構(gòu)Arm v9,更早些時候Arm推出了面向數(shù)據(jù)中心的Neoverse平臺
……
一時間,原本涇渭分明的數(shù)據(jù)中心芯片市場變得錯綜復(fù)雜,XPU(CPU、GPU、DPU等各種服務(wù)器處理器的統(tǒng)稱)成為半導(dǎo)體芯片廠商競爭的新賽道,一條清晰的競爭主線也逐漸明顯——各大芯片企業(yè)都在構(gòu)建自己的多元化產(chǎn)品能力。
半導(dǎo)體巨頭們圍繞XPU展開了積極布局的同時,在市場驅(qū)動下,各個細(xì)分領(lǐng)域的XPU廠商也紛紛發(fā)力,APU、TPU、IPU等各種加速芯片百花齊放,地平線、寒武紀(jì)、中科馭數(shù)等廠商涌現(xiàn)。特別是在外部斷供以及國產(chǎn)化趨勢下,國產(chǎn)廠商也迎來發(fā)展契機,比如龍芯、飛騰、鯤鵬等在積極構(gòu)建產(chǎn)品與技術(shù)生態(tài)。
算力就是生產(chǎn)力
面對層出不窮的XPU,站在更為宏觀的視角看,這已經(jīng)不簡單只是廠商之間的技術(shù)、產(chǎn)品、市場之爭,其背后代表了一種對先進(jìn)生產(chǎn)力之間的追逐。
人類社會每一次科技躍遷,其本質(zhì)都是計算力的突破與進(jìn)化,每一次新文明的進(jìn)階,都是計算方式和載體變遷帶來社會效率提升的結(jié)果。如果說在工業(yè)時代電力是基礎(chǔ)設(shè)施,是經(jīng)濟(jì)社會發(fā)展的動力保障,那么,隨著人類社會邁入數(shù)字經(jīng)濟(jì)時代,算力正在扮演相似角色。
根據(jù)中國信息通信研究院今年發(fā)布的《中國數(shù)字經(jīng)濟(jì)白皮書》,2020年中國數(shù)字經(jīng)濟(jì)規(guī)模達(dá)到39.2萬億元人民幣,占GDP比重為38.6%。數(shù)字經(jīng)濟(jì)的基礎(chǔ)是對數(shù)據(jù)進(jìn)行處理,也就是利用大大小小各種規(guī)模的數(shù)據(jù)中心——從幾十臺服務(wù)器的小規(guī)模數(shù)據(jù)中心到幾十萬到上百萬臺規(guī)模的超大型數(shù)據(jù)中心提供的算力,運行各種軟件來提供各種服務(wù)以支撐企業(yè)的生產(chǎn)經(jīng)營和消費者的各種消費服務(wù)。由于計算力的大小代表了對數(shù)據(jù)處理能力的強弱,因此,計算力自然成為數(shù)字經(jīng)濟(jì)的核心要素,是核心生產(chǎn)力。
IDC發(fā)布的《2020全球計算力指數(shù)評估報告》也表明,計算力與經(jīng)濟(jì)增長緊密相關(guān),計算力指數(shù)平均每提高1個點,數(shù)字經(jīng)濟(jì)和GDP將分別增長3.3‰和1.8‰。
當(dāng)前,各個國家的數(shù)字經(jīng)濟(jì)占比將持續(xù)提升,而數(shù)字經(jīng)濟(jì)和算力需求處于循環(huán)增強的狀態(tài),同時,新興技術(shù)的投入與算力投入相關(guān)性極高,算力為新興技術(shù)應(yīng)用提供基礎(chǔ)保障,新興技術(shù)的發(fā)展進(jìn)一步推動算力提升,其中物聯(lián)網(wǎng)、人工智能和大數(shù)據(jù)的相關(guān)性最為顯著,新興技術(shù)和算力呈現(xiàn)相互拉動效應(yīng)。
正是看到了算力在數(shù)字經(jīng)濟(jì)發(fā)展中的重要作用,全國一體化算力網(wǎng)絡(luò)國家樞紐節(jié)點建設(shè)也于近期正式啟動,其將成為中國數(shù)字經(jīng)濟(jì)發(fā)展的新基座。
總之,算力不僅僅是一個技術(shù)指標(biāo),而是先進(jìn)生產(chǎn)力的代表。未來,算力與數(shù)字經(jīng)濟(jì)共促共進(jìn)的關(guān)系將進(jìn)一步強化:即算力不斷發(fā)展推動數(shù)字經(jīng)濟(jì)持續(xù)向前,數(shù)字經(jīng)濟(jì)持續(xù)向前加重對算力的支撐依賴,“算力經(jīng)濟(jì)時代”正在到來。
計算場景多樣化催生XPU
站在產(chǎn)業(yè)格局看,芯片廠商令人眼花繚亂的市場活動背后是它們對數(shù)據(jù)中心市場的野心,而這野心又歸結(jié)為看上計算場景的復(fù)雜多元化帶來的市場機會。
從超算系統(tǒng)到桌面到云到終端,都離不開各種不同類型指令集和體系架構(gòu)的計算單元,如CPU、GPU、DSP、ASIC、FPGA等。由于各種不同的處理器采用不同的架構(gòu)和不同指令集使得它們在處理具體計算場景是有著不同的表現(xiàn),導(dǎo)致計算多元化的出現(xiàn)。
比如,GPU芯片是單指令、多數(shù)據(jù)處理,采用數(shù)量眾多的計算單元和超長的流水線,主要處理圖像領(lǐng)域的運算加速;FPGA適用于多指令,單數(shù)據(jù)流的分析,可提供強大的計算力和足夠的靈活性;ASIC是為實現(xiàn)特定場景應(yīng)用要求時,而定制的專用AI芯片,在功耗、可靠性、體積方面都有優(yōu)勢,尤其在低功耗的移動設(shè)備端,基于以上優(yōu)勢,ASIC芯片更多的用于端或邊緣側(cè)。
其實,計算多元化是早已有之,比如x86取代IBM Power、HP PA-RISC、Sun SPARC成為數(shù)據(jù)中心霸主。但是隨著深度學(xué)習(xí)崛起,GPU受到重視,在數(shù)據(jù)中心呈現(xiàn)出強勁的增長趨勢。同時,Arm服務(wù)器、RISC-V的崛起,又使得數(shù)據(jù)中心開始了新的多元化進(jìn)程。
芯片多元化的背后是應(yīng)用場景的復(fù)雜化導(dǎo)致通用計算技術(shù)和通用芯片越來越不能滿足業(yè)務(wù)需求,特別是新涌現(xiàn)的計算場景對于計算芯片指令集、架構(gòu)的要求是不一樣的,這樣就導(dǎo)致之前一直使用的通用CPU已經(jīng)無法滿足多元化計算場景要求,這也是計算芯片的種類越來越多的重要原因,而CPU+GPU、CPU+FPGA、CPU+GPU+FPGA等組合效能更好,通用計算被迫向異構(gòu)計算演進(jìn)。
比如,海量數(shù)據(jù)的處理需要更高密度的計算能力,而通用計算在效能上明顯不能滿足要求。一方面,采用通用處理器需要更多處理器,成本高昂;另一方面,更多處理器帶來更高發(fā)熱,帶來了更多的制冷需求,這些最終都指向了高成本,而在某些場景下(如一些人工智能)GPU、FPG比CPU具有更高的性價比,而在一些細(xì)分的人工場景下AI專用芯片比GPU、FPG的表現(xiàn)還要優(yōu)異,比如IPU處理稀疏矩陣的數(shù)據(jù)類型時效能就有明顯優(yōu)勢。
芯片種類多的另外一個原因是芯片代工模式的普及,現(xiàn)在芯片設(shè)計、制造的關(guān)鍵環(huán)節(jié)都有開源開放的軟件、工具或代工企業(yè)可以利用,例如RISC-V,這也推動了更多創(chuàng)新廠商切入芯片領(lǐng)域。
騰訊云異構(gòu)計算研發(fā)副總監(jiān)宋吉科認(rèn)為,異構(gòu)計算崛起的主要原因兩個:人工智能類應(yīng)用的崛起,工作負(fù)載類型多樣更加多樣化,對應(yīng)芯片架構(gòu)需要量身定制;從互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),芯片產(chǎn)業(yè)的供應(yīng)鏈也在發(fā)生變化,特別是Arm的IP設(shè)計模式,推動了臺積電等代工廠在制程工藝上的快速發(fā)展,從而各種Fabless(IC設(shè)計)芯片廠商有了更多的市場機會。
在計算產(chǎn)業(yè)變革的背景下,“CPU包打天下”一去不復(fù)返,異構(gòu)計算即XPU的發(fā)展成為大勢所趨。我們看到眾多頭部半導(dǎo)體廠商推出多元化的芯片產(chǎn)品,不斷延展業(yè)務(wù)邊界,而創(chuàng)新公司也不示弱,它們在沒有歷史包袱的情況下,紛紛針對不斷涌現(xiàn)的業(yè)務(wù)場景推出了專屬性的芯片產(chǎn)品,讓整個芯片市場迎來“百家爭鳴”時刻。
x86市場的“混戰(zhàn)”
在當(dāng)今XPU市場,通用計算芯片占據(jù)的市場份額和市場需求量是最大的,畢竟作為“全能選手”,不管是x86還是Power或者Arm,它們的計算生態(tài)也是最為成熟的,相關(guān)的技術(shù)產(chǎn)品也在持續(xù)迭代,上演了x86、Power、Arm通用計算市場的“三國殺”,甚至于我們?nèi)绻冒谉峄瘉硇稳莓?dāng)前的x86市場,也一點也不為過。畢竟作為最成熟的計算架構(gòu),x86伴隨著半導(dǎo)體產(chǎn)業(yè)的成長,特別是英特爾與AMD近期新品的發(fā)布更是讓x86市場平添了很多“火藥味”。
在數(shù)據(jù)中心市場,英特爾是毫無爭議的帶頭大哥,英特爾CPU在數(shù)據(jù)中心市場處于壟斷地位。據(jù)英特爾2021年第一季度業(yè)績顯示,第三代英特爾至強可擴展處理器出貨量超過20萬顆。
同時,阿里云、平安科技、騰訊云等英特爾生態(tài)伙伴已經(jīng)基于第三代至強可擴展平臺開展了諸多實踐,比如在騰訊游戲的3D人臉建模中,借助第三代英特爾至強可擴展處理器的VNNI技術(shù),可以加速4.24倍以上,這意味著原有基于3D人臉建模的各種優(yōu)化、緩存、預(yù)處理環(huán)節(jié)可以直接跳過,直接提供照片就能夠生成3D模型。
在用戶端,第三代英特爾至強可擴展處理器也贏得了眾多互聯(lián)網(wǎng)企業(yè)的青睞,例如快手與英特爾展開合作,結(jié)合英特爾至強可擴展處理器平臺和傲騰持久內(nèi)存,快手推薦系統(tǒng)的性能得到大幅提升,同時也能支持更多復(fù)雜算法,總擁有成本(TCO)降低了30%。
雖說英特爾至強的市場地位如此堅固,但是隨著異構(gòu)計算的崛起,英特爾感受到了來自GPU、FPGA的強力挑戰(zhàn)。為了應(yīng)對這些挑戰(zhàn),近些年英特爾調(diào)整了市場戰(zhàn)略,不再以處理器為中心,而是以數(shù)據(jù)為中心,這體現(xiàn)為從CPU到XPU、從芯片(Silicon)到平臺、從傳統(tǒng)IDM到現(xiàn)代、更靈活的IDM。特別是在IDM 2.0的愿景中,英特爾在代工業(yè)務(wù)中以更加開放心態(tài)支持X86內(nèi)核、ARM、RISC-V生態(tài)系統(tǒng)、IP的生產(chǎn)。
英特爾中國研究院院長宋繼強表示,異構(gòu)集成是推動摩爾定律繼續(xù)發(fā)展的重要方式。英特爾轉(zhuǎn)型為包含多種計算架構(gòu)XPU的公司,并在此基礎(chǔ)上推出了適配的軟件,并構(gòu)建相應(yīng)的生態(tài),引領(lǐng)異構(gòu)計算的發(fā)展。
如果說英特爾采取了大而全的策略,以產(chǎn)品組合贏得整體優(yōu)勢,比如第三代英特爾至強可擴展處理器與英特爾傲騰內(nèi)存存儲解決方案、英特爾以太網(wǎng)連接解決方案等共同組成的以數(shù)據(jù)為中心的產(chǎn)品組合才是英特爾的王炸,那么AMD則是重點突破,以點帶面。
雖然同為x86市場的締造者,但長期以來AMD是作為英特爾的陪襯存在,尤其是在服務(wù)器市場幾乎沒有多少存在感。AMD自然不甘心,先后發(fā)起了多次挑戰(zhàn),而近幾年AMD在數(shù)據(jù)中心芯片的進(jìn)步業(yè)界有目共睹。特別是第三代AMD EPYC處理器在技術(shù)領(lǐng)先性方面做足了文章,為行業(yè)帶來了諸多改變,比如性能、成本、生態(tài)等。
AMD總裁兼CEO蘇姿豐(Lisa Su)說,數(shù)據(jù)中心處于發(fā)展進(jìn)化過程中,單一產(chǎn)品無法滿足數(shù)據(jù)中心的需求,AMD能夠提供具有融合、匹配數(shù)據(jù)中心需要的各種IP的能力。
自EPYC(霄龍)處理器問世以來,AMD與眾多合作伙伴展開密切合作,截止到今年,將推出超過100款服務(wù)器產(chǎn)品及400多個實例,幾乎涵蓋了所有的應(yīng)用場景和解決方案。
例如在超算領(lǐng)域,AMD EPYC處理器支持的超級計算機已經(jīng)在全球高性能計算TOP 500強榜單中占據(jù)多席,并為斯圖加特高性能計算中心的HLRS “HAWK”、德國天氣預(yù)報服務(wù)公司(DWD)的NEC SX-AURORA TSUBASA、蘇黎世聯(lián)邦理工學(xué)院(ETH Zurich)的ETH ZURICH EULER VI、圣地亞哥超級計算機中心(SDSC)的DELL EXPANSE、英國國家研究創(chuàng)新局(UKRI)的CRAY ARCHER2、法國國家高性能計算組織(GENCI)的JOLIOT-CURIE等等超算系統(tǒng)提供服務(wù)。
此外,AMD公司與美國橡樹嶺國家實驗室(ORNL)和Cray公司聯(lián)合打造Frontier,其基于下一代AMD EPYC霄龍?zhí)幚砥、Radeon Instinct加速卡、ROCm異構(gòu)計算軟件三大平臺,運行峰值可達(dá)每秒1.5exaflops(百億億次),是實驗室有史以來打造的性能最強的超級計算機。
基于此,2020年Q4季度 Mercury Research的報告中AMD在服務(wù)器CPU市場份額達(dá)到了7.1%,今年Q1季度進(jìn)一步增長到了8.9%。
如今芯片廠商不光在制程工藝上進(jìn)行迭代,還在封裝工藝上持續(xù)創(chuàng)新。比如英特爾推出了EMIB技術(shù)和Foveros技術(shù),其中EMIB是一種高密度的2D平面式封裝技術(shù),可以將不同類型、不同工藝的芯片IP靈活地組合在一起,類似一個松散的SoC;Foveros技術(shù)首次為處理器引入了3D堆疊式設(shè)計,是大幅提升多核心、異構(gòu)集成芯片的關(guān)鍵技術(shù),可以實現(xiàn)芯片上堆疊芯片,而且能整合不同工藝、結(jié)構(gòu)、用途的芯片。
而在Computex 2021上,AMD宣布將Chiplet封裝技術(shù)與芯片堆疊技術(shù)相結(jié)合,為未來的高性能計算產(chǎn)品創(chuàng)造出了3D Chiplet架構(gòu)。這項封裝技術(shù)突破性地將AMD創(chuàng)新芯片架構(gòu)與3D堆疊技術(shù)相結(jié)合,并采用了業(yè)界領(lǐng)先的混合鍵合方法,與現(xiàn)有的3D封裝解決方案相比,可提供超過200倍的2D芯片互連密度和15倍以上的密度。通過與臺積電(TSMC)緊密協(xié)作,與目前的3D解決方案相比,這項行業(yè)前沿的技術(shù)能耗更低,是世界上超靈活的活性硅堆疊技術(shù)。
如上所述,我們看到當(dāng)前x86市場的競爭程度更加激烈,雖然市場格局沒有太大的變化,但是市場情緒也在慢慢變化。所以不管是英特爾還是AMD,唯有技術(shù)創(chuàng)新,匹配用戶需求,緊跟時代要求,才能在市場中立于不敗之地。
Power和Arm發(fā)起挑戰(zhàn)
在通用計算領(lǐng)域,用“傲視群雄、睥睨天下”來形容x86處理器一點兒也不過分,但這并意味著其他類型處理器就甘拜下風(fēng),比如Power和Arm就向x86處理器發(fā)起了強力挑戰(zhàn),近年來不管是Power還是Arm都一直在不斷進(jìn)化,為用戶提供了多樣化的選擇。
對于Power,如果是業(yè)界資深人士,一定會有一種歷史感涌上心頭。雖然被x86壓制,但是Power的生命力還是非常強大的,也在持續(xù)迭代。畢竟在存量市場上Power還是有很強的優(yōu)勢,很多Power承載的都是關(guān)鍵行業(yè)的核心和關(guān)鍵業(yè)務(wù)。
實際上,Power從來就沒有甘心把霸主之位拱手相讓于x86,重新昔日榮光的夢想雖然有些遙遠(yuǎn),但并沒放棄。目前Power處理器已經(jīng)迭代到采用7nm工藝的Power10,并廣泛應(yīng)用于IBM主機產(chǎn)品和Power服務(wù)器產(chǎn)品,而在國內(nèi),浪潮商用機器作為POWER中國區(qū)獨家代言人,承擔(dān)起了重振Power雄風(fēng)的重任。浪潮商用機器在不斷拓展Power架構(gòu)的創(chuàng)新應(yīng)用,讓Power在當(dāng)今計算架構(gòu)市場有著一席之地。
Power架構(gòu)主打關(guān)鍵計算,面向關(guān)鍵應(yīng)用核心云承載平臺、關(guān)鍵業(yè)務(wù)主機、云原生創(chuàng)新型應(yīng)用。這也是其與x86區(qū)別客戶定位的重要特征。比如,浪潮K1 Power產(chǎn)品線就主打高可靠性、高性能、高安全和數(shù)據(jù)強實時一致性的“三高一強”特性,致力于打造關(guān)鍵應(yīng)用的高可靠和高性能的安全平臺。
浪潮商用機器有限公司總經(jīng)理胡雷鈞表示,作為一種縱向擴展系統(tǒng),在支撐核心應(yīng)用系統(tǒng)方面,K1 Power的性價比最高,是最可靠的技術(shù)選擇。同時,圍繞POWER處理器的國產(chǎn)化,浪潮商用機器提供了面向關(guān)鍵應(yīng)用系統(tǒng)的豐富產(chǎn)品。
如果說Power是高大上,那么我們對Arm架構(gòu)的認(rèn)知則是從移動終端開始的。ARM處理器架構(gòu)開啟了移動時代,而且過去五年基于Arm架構(gòu)的設(shè)備出貨量超過1000億,其影響力已經(jīng)遍布移動終端。但是現(xiàn)在Arm架構(gòu)也在“出圈”,這要從Arm v9架構(gòu)談起。
Arm v9架構(gòu)基于Arm v8,并增添了針對矢量處理的DSP、機器學(xué)習(xí)、安全等技術(shù)特性。
眾所周知,由于高能效、低功耗等特點,Arm在移動設(shè)備和物聯(lián)網(wǎng)市場得到廣泛應(yīng)用。其實在基礎(chǔ)設(shè)施領(lǐng)域,Arm已經(jīng)耕耘超過10年,并推出了專門面向數(shù)據(jù)中心的服務(wù)器芯片架構(gòu)Arm Neoverse,在HPC、云計算以及5G等市場取得了不俗的成績,不僅在AWS有Graviton以及Graviton2這樣的芯片正式投入商用,Oracle也已經(jīng)宣布計劃將Ampere Altra用于其云基礎(chǔ)設(shè)施,而在HPC領(lǐng)域,不僅有世界最快超級計算機日本富士通Fugaku這樣的用戶,而且印度也宣布研發(fā)基于Neoverse的超級計算機。
憑借合作伙伴生態(tài)系統(tǒng)和商業(yè)模式,Arm架構(gòu)已經(jīng)在云、管、邊、端等場景中無處不在。新的Arm v9架構(gòu)的推出也是Arm瞄準(zhǔn)下一個計算革命的誠信之作,必將在未來多云化的計算市場闖出更為廣闊的天地。
加速計算的“黃金時代”
雖然通用計算是主流,并會在未來相當(dāng)長一段時間內(nèi)作為一種成熟穩(wěn)定、發(fā)展緩慢的技術(shù)而存在。但是不管是GPU還是FPGA等加速芯片也正在迎來自己的黃金時代。
IDC發(fā)布的《中國半年度加速計算市場(2020下半年)跟蹤》報告顯示,2020年加速服務(wù)器市場規(guī)模達(dá)到32.0億美元,同比2019年增長52.8%。其中GPU服務(wù)器依舊占主導(dǎo)地位,擁有86.3%的市場份額,市場規(guī)模達(dá)到27.6億美元,同比增長37.3%。同時FPGA等非GPU加速服務(wù)器以434.0%的增速占有近15%的市場份額,市場規(guī)模達(dá)到4.4億美元。
在GPU市場,英偉達(dá)是毋庸置疑的王者,但是英偉達(dá)并沒有局限于GPU,宣布收購Arm之后,英偉達(dá)將自身的觸角伸向了CPU、DPU等XPU領(lǐng)域。
我們知道GPU是英偉達(dá)的“主業(yè)”,但是憑借一系列的收購,英偉達(dá)也在向其他XPU拓展,在GTC 2021大會上,英偉達(dá)推出了CPU、DPU和GPU的”組合拳“,幫助用戶打造完全可編程的單一AI計算單元。
前面我們談到在云計算、企業(yè)和邊緣數(shù)據(jù)中心、超級計算、PC等其他市場中,Arm也開始嶄露頭角。而依靠收購Arm,英偉達(dá)與Arm之間的協(xié)同有了更多想象空間,比如英偉達(dá)的DPU(Data Processing Unit,數(shù)據(jù)處理單元)就內(nèi)置了Arm核心,可實現(xiàn)具有突破性的網(wǎng)絡(luò)、存儲和安全性能。
不管是CPU還是DPU、GPU,很明顯,英偉達(dá)正在將自己業(yè)務(wù)邊界不斷延展,也就是不再局限于以GPU為中心,而是以計算為核心,覆蓋多樣化的計算工作負(fù)載。隨之而來的就是客戶選擇的靈活性,同時整個計算芯片市場也將迎來新的格局。
在加速計算市場,靈活的FPGA已然異軍突起。例如微軟通過英特爾FPGA加速Azure云服務(wù)、必應(yīng)和其它數(shù)據(jù)中心服務(wù)中的實時人工智能、網(wǎng)絡(luò)及其它應(yīng)用或基礎(chǔ)設(shè)施。
雖然國際國內(nèi)市場的FPGA廠商挺多,但是FPGA市場的主要玩家便是英特爾與賽靈思,而在AMD在宣布收購賽靈思之后,F(xiàn)PGA市場之間的格局更具看點。
英特爾和賽靈思對于FPGA市場是兩種不同的技術(shù)路線,這很大程度是取決于他們背后的技術(shù)儲備和對于FPGA的定位。對于英特爾而言,它旗下有CPU、GPU、Movidius VPU、FPGA等多種面向不同場景的計算平臺。所以在英特爾這里,“FPGA就是FPGA”,只不過是一種實現(xiàn)AI算法的途徑而已。而在Xilinx這里,F(xiàn)PGA就是它的全部。為了適應(yīng)更大的市場,Xilinx需要“FPGA不止是FPGA”。所以就誕生了ACAP這樣“超越了FPGA”的新型器件。
除了技術(shù)產(chǎn)品策略,英特爾和賽靈思之間的競爭因為AMD對賽靈思的收購有了更多故事可講。這應(yīng)該是AMD是對英特爾收購Altera的應(yīng)對,不過對應(yīng)AMD而言,這可以豐富自身產(chǎn)品線和強化競爭力,還有對FPGA芯片與CPU、GPU的技術(shù)融合嘗試探索以及未來市場的先行布局。
從加速計算市場我們可以看到加速計算其實與通用計算市場有著千絲萬縷的聯(lián)系,也就是CPU、GPU、FPGA之家具備內(nèi)在聯(lián)系,半導(dǎo)體廠商在產(chǎn)品布局方面是將這三者放到一起的,從而更好地為用戶提供充沛的算力。
專用芯片的“爭奇斗艷”
AI芯片市場隨人工智能發(fā)展持續(xù)火爆,根據(jù)Gartner的測算和預(yù)測,預(yù)計2023年全球AI芯片市場規(guī)模將達(dá)到343億美元。
雖然目前通用計算芯片和GPU加速芯片是主流,但是DPU、VPU、TPU、IPU以及各種專用芯片也在迅速崛起,面向特定應(yīng)用搶占細(xì)分市場。
在諸多“PU”中,DPU是最受關(guān)注的芯片類型之一,一方面是因為DPU巨大的市場前景,另一方面是因為有英偉達(dá)、英特爾這樣的巨頭參與?梢灶A(yù)見,未來DPU的應(yīng)用將越來越廣泛。業(yè)內(nèi)人士甚至樂觀地估計,DPU可能會成為CPU、GPU之外的第三個熱點。
簡單地說,CPU相當(dāng)于一個通才,它長處是什么都能干,但效率不高,而GPU、DPU相當(dāng)于專才,專門干一件或者一類事情,因此效率最高。對CPU、GPU和DPU的區(qū)別,DPU初創(chuàng)公司中科馭數(shù)創(chuàng)始人兼CEO鄢貴海有個形象的比喻:如果把一臺計算機或服務(wù)器比作一個團(tuán)隊,CPU相當(dāng)于這個團(tuán)隊的“大管家”,負(fù)責(zé)思考并處理各種業(yè)務(wù);GPU是“美工”,專攻圖像處理;DPU則相當(dāng)于“前臺”,負(fù)責(zé)打包、拆包“數(shù)據(jù)包”,提升整個團(tuán)隊的工作效率。
中科馭數(shù)2018年成立,今年中科馭數(shù)發(fā)布了其下一代DPU芯片計劃,將基于自研的KPU(Kernel Processing Unit)芯片架構(gòu),圍繞網(wǎng)絡(luò)協(xié)議處理、數(shù)據(jù)庫和大數(shù)據(jù)處理加速、存儲運算、安全加密運算等核心功能,推出新一代DPU芯片。
目前中科馭數(shù)提供網(wǎng)絡(luò)、數(shù)據(jù)庫、風(fēng)控等硬件加速解決方案,與上交所、金證股份、360數(shù)科等金融行業(yè)客戶一起加速DPU的應(yīng)用落地,算力的靈活組合滿足金融用戶的定制化需求。
例如金證股份已有的行情系統(tǒng)在交易繁忙階段(如開盤等情況),系統(tǒng)延遲達(dá)到51us,而且抖動非常大。而在應(yīng)用基于中科馭數(shù)KPU架構(gòu)的極速行情系統(tǒng)后,系統(tǒng)延遲降低一個數(shù)量級,并且系統(tǒng)都能保持在20ns以下,為交易客戶提供了先機。
所謂“英雄所見略同”,星云智聯(lián)CEO于勇認(rèn)為,未來的數(shù)據(jù)中心將不再以通用CPU為核心,而是解構(gòu)成GPCPU、GPU、TPU、FPGA、DSP等異構(gòu)算力資源池,以及SSD和磁盤等存儲資源池。“未來十年,全球云計算和數(shù)據(jù)中心基礎(chǔ)架構(gòu)將迎來顛覆性變革,基于DPU的統(tǒng)一通信服務(wù)平臺(CAAS)是未來架構(gòu)的核心引擎。”
除了DPU,現(xiàn)在業(yè)界的另外一個熱詞就是IPU,就在近日,英特爾推出XPU產(chǎn)品的最新成員——基礎(chǔ)設(shè)施處理器(IPU),具體來說,IPU是一種可編程網(wǎng)絡(luò)設(shè)備,擴展了智能網(wǎng)卡功能,這有點類似NVIDIA的DPU。
不過業(yè)界對于IPU的定義也不盡相同,Graphcore的IPU是指Intelligence Processing Unit,智能處理器。在Graphcore高級副總裁兼中國區(qū)總經(jīng)理盧濤看來,CPU和GPU都不是專門為AI而設(shè)計。而IPU是專為AI應(yīng)用設(shè)計,其強大的并行處理能力確保了快速訓(xùn)練模型的實現(xiàn),并能進(jìn)行實時操控。
當(dāng)計算系統(tǒng)變得更加專用化之后,分層就會顯現(xiàn),異構(gòu)的進(jìn)程就會加快。隨著工作負(fù)載類型的細(xì)分以及半導(dǎo)體產(chǎn)業(yè)鏈的變化,未來新型專用加速器會越來越多,以更好地滿足不同場景的需求。
國產(chǎn)芯片的“彎道超車”
在當(dāng)前計算產(chǎn)業(yè)面臨變革之際,我們看到中國廠商的機會也在出現(xiàn)。在新環(huán)境和新技術(shù)驅(qū)動下,國產(chǎn)CPU正處于奮力追趕的關(guān)鍵時期,以飛騰、鯤鵬、海光、龍芯、兆芯、申威等為代表的廠商正全力打造“中國芯”。
以華為為例,其聚焦鯤鵬和昇騰,構(gòu)建全場景多樣性智能計算平臺。自2019年華為發(fā)布計算戰(zhàn)略以來,鯤鵬計算產(chǎn)業(yè)生態(tài)蓬勃發(fā)展,不僅構(gòu)建了完整的生態(tài)體系,并且鯤鵬行業(yè)解決方案已在國計民生行業(yè)核心系統(tǒng)獲得了規(guī);瘧(yīng)用。
鯤鵬計算產(chǎn)業(yè)的能力輸出,離不開其“硬件開放、軟件開源、使能合作伙伴”的技術(shù)生態(tài)戰(zhàn)略。基于鯤鵬生態(tài),各行各業(yè)可快速上手基于華為鯤鵬和昇騰處理器的IT基礎(chǔ)設(shè)施及行業(yè)應(yīng)用,包括PC、服務(wù)器、存儲、操作系統(tǒng)、中間件、虛擬化、數(shù)據(jù)庫、云服務(wù)及行業(yè)應(yīng)用等,在大數(shù)據(jù)與人工智能場景,發(fā)揮其架構(gòu)優(yōu)勢,釋放多元算力。
到目前為止全國已落地24家生態(tài)創(chuàng)新中心、12家OEM整機伙伴、2700多家合作伙伴、5700多個解決方案認(rèn)證、40萬鯤鵬開發(fā)者,在各行業(yè)中已有成熟應(yīng)用案例,包括電信、互聯(lián)網(wǎng)、安平、能源、金融、交通、制造、政務(wù)等。
目前在國際環(huán)境、產(chǎn)業(yè)政策、市場需求的聯(lián)合驅(qū)動下,一大批國產(chǎn)CPU廠商奮楫前行,在工藝、性能、生態(tài)建設(shè)等多個方面不斷取得突破,產(chǎn)業(yè)布局、資金投入、技術(shù)研發(fā)、人才培養(yǎng)等各個方面都在快速進(jìn)步。
未來會有更多的中國優(yōu)秀芯片企業(yè)涌現(xiàn)出來,國產(chǎn)芯片的水平也一定會彎道超車。我們在全球芯片產(chǎn)業(yè)鏈上的話語權(quán),也一定會越來越大!
面向未來的前沿計算
既要腳踏實地,又要仰望星空。如果說前面說到的各種XPU已經(jīng)近在眼前,那么英特爾和IBM在神經(jīng)擬態(tài)計算(類腦計算)和量子計算的前沿研究給予我們的可能是希望,它們帶來的前所未有的創(chuàng)新成果,為計算的未來帶來了新的想象空間。
神經(jīng)擬態(tài)計算模擬的是大腦的計算模式,包含很多并行計算和異步計算,不需要提前進(jìn)行數(shù)據(jù)訓(xùn)練,可以在工作的過程中自我進(jìn)行學(xué)習(xí),大幅提升效率和能耗。
英特爾已經(jīng)推出由768個Loihi組成的神經(jīng)擬態(tài)計算系統(tǒng)Pohoiki Spring,擁有1億個神經(jīng)元,并成立了神經(jīng)擬態(tài)計算社區(qū),推動神經(jīng)擬態(tài)計算落地。
量子計算已經(jīng)成為全球科技領(lǐng)域關(guān)注的焦點,英特爾推出了代號為“Horse Ridge”的低溫控制芯片,實現(xiàn)了對多個量子位的控制,可以實現(xiàn)更大的量子系統(tǒng)擴展。
除了英特爾,我們看到IBM在量子計算領(lǐng)域也在積極布局——2016 年,開放量子云平臺,接入5比特的量子芯片Canary ;2019 年,IBM實現(xiàn)了27個比特的量子芯片F(xiàn)alcon;前不久,IBM 向其IBM Q Network成員發(fā)布了65個比特的量子處理器Hummingbird。
從2000年起,IBM開始探索超導(dǎo)量子位這一技術(shù)路線,2021年,IBM將突破100比特的關(guān)卡,推出127比特的Eagle處理器。在Eagle處理器上,IBM引入并發(fā)實時經(jīng)典計算能力,這將允許執(zhí)行更廣泛的量子電路和代碼。
除了量子計算,IBM近日發(fā)布了全球首個2納米芯片制造技術(shù),再次引領(lǐng)了半導(dǎo)體行業(yè)的潮流。
在英特爾、IBM等均先后投入量子運算領(lǐng)域發(fā)展, NVIDIA在GTC 2021也宣布推出名為cuQuantum的開發(fā)工具組,讓開發(fā)者能透過此開發(fā)工具組配合NVIDIA GPU進(jìn)行量子運算特性模擬加速。
困境與挑戰(zhàn)
展望未來,隨著XPU戰(zhàn)略的推進(jìn),各大半導(dǎo)體廠商以自身優(yōu)勢產(chǎn)品為依托,不斷探索算力的跨界融合,這一趨勢也將延續(xù)下來。
不過,芯片架構(gòu)五花八門,指令集不同,無法兼容,而面向芯片的編程庫又跟芯片綁定,靈活性差。小公司只做了其中一個環(huán)節(jié),這造成生態(tài)的縱向不通;大公司希望構(gòu)建封閉的系統(tǒng),這造成了生態(tài)的橫向不通。
芯片從制造出來到大規(guī)模用起來,往往還隔著一個巨大的生態(tài)鴻溝。芯片應(yīng)用一般都面臨著開發(fā)者學(xué)習(xí)成本高、用戶應(yīng)用遷移困難、芯片制造公司難以上規(guī)模的困難和挑戰(zhàn)。
在有些芯片造出來后,面向開發(fā)者的幫助文檔、調(diào)試工具或者交流問答社區(qū)建設(shè)不足,導(dǎo)致開發(fā)者學(xué)習(xí)時間長,難度大,如果學(xué)習(xí)多個芯片,難度更大,開發(fā)者的學(xué)習(xí)積極性下降。而對于芯片的最終使用者來說,由于芯片指令集或芯片架構(gòu)的差異,導(dǎo)致編程庫、編程模型、算法框架無法有效的橫向拉通,致使大量的應(yīng)用遷移困難,可能只是1%的小小的依賴,就會導(dǎo)致適配工作前功盡棄,進(jìn)一步帶來計算的復(fù)雜性。
而芯片供應(yīng)商如果想解決開發(fā)者的問題、想解決使用者的問題,則往往需要投入比芯片研發(fā)成本高數(shù)十倍的推廣費用。
不管是英特爾還是英偉達(dá),他們的硬件產(chǎn)品只是一方面,他們也在將自身定位一家軟件公司。例如英特爾內(nèi)部有超過1萬人在圍繞芯片的配套支撐、應(yīng)用適配、優(yōu)化調(diào)優(yōu)做工作。英偉達(dá)提供一系列基于NVIDIA AI以及用于仿真、協(xié)作和自主機器訓(xùn)練的軟件,尤其是公司的CUDA軟件環(huán)境更是通過長期的大規(guī)模投入,才打造了其GPU在HPC和AI方面的領(lǐng)先地位。
軟件是釋放異構(gòu)計算性能的重要一環(huán)。英特爾一直也在FPGA、ASIC、GPU和CPU的多種算力產(chǎn)品XPU基礎(chǔ)上開發(fā)適配的軟件,推出了開源的跨架構(gòu)開發(fā)模型oneAPI。
軟件開發(fā)人員可以使用oneAPI開放式跨架構(gòu)編程來優(yōu)化其應(yīng)用程序,從而避免了專有模型的技術(shù)和經(jīng)濟(jì)負(fù)擔(dān)。英特爾oneAPI工具包通過高級編譯器、庫以及分析和調(diào)試工具幫助實現(xiàn)處理器的卓越性能、人工智能和加密功能。
英特爾架構(gòu)、圖形和軟件集團(tuán)副總裁兼中國區(qū)總經(jīng)理謝曉清表示,英特爾的戰(zhàn)略是希望能夠把IA生態(tài)系統(tǒng)的開發(fā)者最大限度地?zé)o縫鏈接到oneAPI所支持的異構(gòu)計算領(lǐng)域,為英特爾的XPU戰(zhàn)略打下一個堅實的軟件基礎(chǔ)。
其實,AMD在異構(gòu)計算整合方面也早有布局,并選擇了四步走的持續(xù)性戰(zhàn)略,其中第四步是架構(gòu)和系統(tǒng)整合,從硬件到軟件完全實現(xiàn)異構(gòu)計算支持。
2012年,AMD成立了一個HSA(異構(gòu)系統(tǒng)架構(gòu))基金會,拉了ARM、Imagination、聯(lián)發(fā)科、德州儀器、三星等眾多一線大廠一同上陣,主推一個叫做OpenCL的異構(gòu)編程框架。
2015年,AMD宣布名為“Boltzmann計劃”的新款開發(fā)工具套件,協(xié)助用戶更簡單地開發(fā)兼具高性能與低耗能的異構(gòu)計算系統(tǒng)。“Boltzmann計劃”利用HSA架構(gòu)優(yōu)勢,發(fā)揮CPU與AMD FirePro GPU計算資源,通過軟件同時釋放極致計算效率。
綜上所述,XPU不能僅僅是XPU,它不是硬件簡單的物理堆砌,而要考慮到其中的互聯(lián)互通,跨架構(gòu)的軟件協(xié)同,只有軟硬件協(xié)同發(fā)展,才能更好的發(fā)揮出產(chǎn)品應(yīng)有的價值。
誰“朋友圈”大
“單兵作戰(zhàn)”的效果往往不如“軍團(tuán)作戰(zhàn)”,其中的奧秘就是“協(xié)同作用”。舉例來說,飛機作戰(zhàn),如果只是轟炸機單兵作戰(zhàn),雖然攻擊性很強,卻缺乏保護(hù)體系,需戰(zhàn)斗機協(xié)同作戰(zhàn),以保護(hù)轟炸機的安全。
產(chǎn)品組合以及解決方案才是芯片廠商競爭力的重要表現(xiàn),這一方面是廠商自身的豐富產(chǎn)品組合,例如XPU便是重要策略。另一方面,芯片廠商的生態(tài)建設(shè),積極擴大“朋友圈”。如果產(chǎn)品是一家企業(yè)的根本,那么生態(tài)活動則是“眾人拾柴火焰高”。
英特爾公司副總裁兼至強處理器與存儲事業(yè)部總經(jīng)理Lisa Spelman表示,對于英特爾來說,提供滿足客戶需求的產(chǎn)品組合,這是非常巨大的差異化的競爭優(yōu)勢,這是英特爾數(shù)據(jù)中心戰(zhàn)略的核心。
“我們的關(guān)注點是通過產(chǎn)品組合傳遞客戶價值。我們現(xiàn)在要將產(chǎn)品提升到系統(tǒng)層面的解決方案。英特爾新增加的產(chǎn)品和解決方案都是作為整個平臺的延續(xù)給客戶提供價值和解決問題。”Lisa Spelman說。
為了讓產(chǎn)品方案化,英特爾還推出了英特爾精選解決方案和英特爾市場就緒解決方案,幫助客戶加速云、人工智能、企業(yè)端、高性能計算、網(wǎng)絡(luò)、安全和邊緣應(yīng)用上的部署。其中近80%的英特爾精選解決方案將在今年年底前完成更新為搭載第三代英特爾至強可擴展處理器。
其實不光英特爾,我們看到不管是Arm還是英偉達(dá)等廠商,都在積極構(gòu)建生態(tài)圈。例如Arm生態(tài)系統(tǒng)在移動和嵌入式方面一直很強大。從Arm架構(gòu)發(fā)展歷程來看,通過社區(qū)建設(shè)增強用戶認(rèn)知度,打造成熟的生態(tài)系統(tǒng)是其取得成功的關(guān)鍵因素。
同時,Arm借助v9的推出也在向其他計算領(lǐng)域延展。通過將全面計算的設(shè)計原則應(yīng)用在包含汽車、客戶端、基礎(chǔ)設(shè)施和物聯(lián)網(wǎng)解決方案的整個IP組合中,Arm v9系統(tǒng)級技術(shù)將遍及整個IP解決方案,并改善個別IP。
英偉達(dá)也一樣,其也在積極發(fā)展軟硬件一體化的組合,并借助合作伙伴生態(tài)系統(tǒng)在HPC和AI等領(lǐng)域拓展更為廣闊的空間。例如借助英偉達(dá)企業(yè)合作伙伴計劃(NPN),英偉達(dá)在全球范圍內(nèi)擁有超1500名合作伙伴,提供加速網(wǎng)絡(luò)、分解式網(wǎng)絡(luò)以及軟件定義的網(wǎng)絡(luò),以滿足 AI、云和高性能計算快速增長的需求。
總之,借助生態(tài)系統(tǒng)將自身的XPU產(chǎn)品組合以及與合作伙伴聯(lián)合打造的解決方案觸達(dá)用戶是半導(dǎo)體廠商贏得市場的關(guān)鍵。
結(jié)語
數(shù)字時代對計算力提出了前所未有的要求,算力將成為新的生產(chǎn)力。
這反映到產(chǎn)業(yè)層面,眾多芯片廠商競相切入XPU的賽道。展望未來,通用計算市場穩(wěn)中求變,不管是x86、Power、Arm等在保持既有技術(shù)優(yōu)勢的同時,也在不斷適配和拓展新的應(yīng)用場景。
對于GPU、FPGA等加速計算芯片市場,隨著AI類工作負(fù)載成為主流,他們的發(fā)展空間巨大,但是這些加速芯片需要與通用計算芯片協(xié)同工作才能更好地發(fā)揮其自身價值,這也預(yù)示著類似英特爾、AMD、英偉達(dá)、Arm等廠商會在通用計算和加速計算兩個市場展開積極布局。
對于ASIC專用芯片市場,雖然這是一個相當(dāng)長尾的市場,但是該市場的創(chuàng)新活躍度是最高的,成為眾多創(chuàng)新創(chuàng)業(yè)公司的目標(biāo)領(lǐng)域。雖然他們現(xiàn)在還不是市場主流,但是在滿足客戶定制化的需求方面,ASIC芯片的重要性是不言而喻。
國產(chǎn)芯片的發(fā)展任重道遠(yuǎn),但是在外部環(huán)境和國家政策的驅(qū)動下,國產(chǎn)芯片的被重視程度會越來越高,但是國產(chǎn)半導(dǎo)體芯片廠商的成長之路注定是不平坦的。
雖然神經(jīng)擬態(tài)計算(類腦計算)和量子計算還處于研究探索階段,但是其展示了未來的無限可能。隨著相應(yīng)研究投入的持續(xù)增加,相關(guān)應(yīng)用也會涌現(xiàn),這點也值得我們持續(xù)關(guān)注。
在全景展現(xiàn)XPU產(chǎn)業(yè)之際,我們也看到芯片廠商需要在軟硬件協(xié)同、生態(tài)構(gòu)建等方面還有巨大的改善空間,他們需要傾聽客戶和用戶的聲音,通過需求驅(qū)動產(chǎn)品和技術(shù)的發(fā)展。
站在數(shù)字經(jīng)濟(jì)發(fā)展的新階段,算力的價值日漸凸顯。隨著大數(shù)據(jù)、人工智能、邊緣計算等技術(shù)的發(fā)展,計算架構(gòu)的“新黃金十年”已經(jīng)開啟,計算產(chǎn)業(yè)正在迎來新的發(fā)展機遇。
展望未來,XPU市場將呈現(xiàn)百花齊放的局面,各種芯片在各自的賽道發(fā)揮自身獨特的價值。同時各種計算架構(gòu)之間在聚焦自身優(yōu)勢的同時,也在相互融合協(xié)同,形成了“你中有我,我中有你”的局面。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼