谷歌第四代TPU詳細(xì)信息曝光 AI負(fù)載運(yùn)行速度大幅提升
谷歌今天分享了有關(guān)最新一代TPU芯片的早期細(xì)節(jié)。該芯片用于運(yùn)行人工智能工作負(fù)載,性能是上一代的2倍多。
谷歌的TPU(Tensor Processor Unit)是一種基于AI的、應(yīng)用特定的集成電路。今天谷歌詳細(xì)介紹的是第四代TPU的情況,第三代和第二代此前展示出了令人印象深刻的性能水平,谷歌通過 Google Cloud Platform向企業(yè)提供這兩代芯片。
谷歌稱,第四代TPU的平均性能比第三代TPU高出2.7倍。谷歌在最近MLPerf行業(yè)競賽中對比了這兩代芯片訓(xùn)練五個主流AI模型的速度。第四代TPU在運(yùn)行Mask R-CNN模型(用于自動駕駛等用例的圖像分割A(yù)I)時達(dá)到了最高性能,訓(xùn)練速度比上一代芯片快3.7倍。
性能上的大幅提升主要源自于底層的巨大改進(jìn)。谷歌工程師Naveen Kumar在博客文章中詳細(xì)介紹稱,谷歌已經(jīng)大幅提高了TPU的內(nèi)存帶寬,也就是芯片從內(nèi)存中獲取數(shù)據(jù)并進(jìn)行處理的速度,提高了執(zhí)行專有計算的性能。
Kumar在帖子中詳細(xì)介紹說:“谷歌第四代TPU ASIC在運(yùn)行矩陣乘法(AI模型用來處理數(shù)據(jù)的一種數(shù)學(xué)運(yùn)算方式)的TFLOP性能是TPU v3的2倍多。”與第四代芯片相比,第三代TPU的浮點(diǎn)運(yùn)算性能為420萬億次。
Kumar稱,客戶可以很快將會獲得有關(guān)新一代TPU的更多信息?紤]到目前Google Cloud平臺上已經(jīng)有兩個上一代TPU可供租用,所以新一代應(yīng)用很有可能最終也將落地在Google Cloud在會上。但是,客戶可能需要一段時間了,根據(jù)ExtremeTech報告稱,第四代TPU在MLPerf競賽期間被列為研究類,也就是說,這款芯片至少在六個月內(nèi)是無法商用的。
新一代芯片在速度上的提升尤其引人注目,因為它在性能上超過了第三代,在同一項比賽中打破了多個記錄。谷歌利用4090個第三代TPU打造了所謂全球最快的AI訓(xùn)練超級計算機(jī)。該系統(tǒng)在8個MLPerf基準(zhǔn)測試中創(chuàng)下了6項新的記錄,并在不到30秒的時間內(nèi)訓(xùn)練了4個測試模型。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
