在傳統(tǒng)數(shù)據(jù)傳輸方案中,內(nèi)存數(shù)據(jù)訪問和網(wǎng)絡(luò)數(shù)據(jù)傳輸分屬兩套語義集合。數(shù)據(jù)傳輸中CPU承擔(dān)了大量工作。應(yīng)用程序先申請資源,再通知Socket,內(nèi)核態(tài)驅(qū)動程序完成TCP/IP報(bào)文封裝,最后由NIC的網(wǎng)絡(luò)接口發(fā)送到對端。數(shù)據(jù)在發(fā)送節(jié)點(diǎn)需要依次經(jīng)過Application Buffer、Socket Buffer、Transfer Protocol buffer。到達(dá)接收節(jié)點(diǎn)后同樣需經(jīng)過多次反向內(nèi)存拷貝,內(nèi)核態(tài)驅(qū)動程序完成TCP/IP報(bào)文解封裝,應(yīng)用程序最終將數(shù)據(jù)寫入系統(tǒng)物理內(nèi)存。
網(wǎng)絡(luò)拓?fù)浼阂?guī)模宏大,集成了超過10,000個(gè)GPU,依托一個(gè)精心設(shè)計(jì)的三層類CLOS網(wǎng)絡(luò)架構(gòu)實(shí)現(xiàn)高效互聯(lián)。