隨著人工智能和高性能計(jì)算需求的爆炸式增長(zhǎng),圖形處理器(GPU)已成為支撐復(fù)雜計(jì)算任務(wù)的關(guān)鍵基礎(chǔ)設(shè)施。然而,傳統(tǒng)的 GPU 資源分配方式通常采用靜態(tài)分配模式,即在任務(wù)啟動(dòng)時(shí)預(yù)先分配固定的 GPU 資源。這種靜態(tài)分配方式往往導(dǎo)致資源利用率低下,尤其是在工作負(fù)載波動(dòng)較大或資源需求不確定的場(chǎng)景中,造成寶貴的計(jì)算資源閑置浪費(fèi)。