大模型訓(xùn)練任務(wù)對于網(wǎng)絡(luò)要求苛刻,34%的訓(xùn)練中斷是由網(wǎng)絡(luò)引起。RDMA的丟包重傳機制將導(dǎo)致帶寬利用率快速降低,當(dāng)丟包率達(dá)到千分之1時,訓(xùn)練效率降低明顯;
在華為中國政企運維峰會2023期間,華為正式發(fā)布數(shù)字地圖使能服務(wù),面對云網(wǎng)一體化架構(gòu)下的業(yè)務(wù)看不清、拓?fù)淇床蝗、問題看不準(zhǔn)等難題,華為通過自主研發(fā)的數(shù)字地圖使能服務(wù)產(chǎn)品