預(yù)測(cè)資源分配:馬爾可夫決策過(guò)程的無(wú)監(jiān)督學(xué)習(xí)
中國(guó)科學(xué):信息科學(xué)
頁(yè)數(shù): 18 2024-08-02
摘要: 當(dāng)已知未來(lái)的移動(dòng)軌跡等信息時(shí),面向視頻點(diǎn)播業(yè)務(wù)的預(yù)測(cè)資源分配可以在滿(mǎn)足用戶(hù)體驗(yàn)的前提下降低基站能耗或提高網(wǎng)絡(luò)吞吐量.傳統(tǒng)的預(yù)測(cè)資源分配方法采用先預(yù)測(cè)用戶(hù)軌跡等信息再優(yōu)化功率等資源分配的方法,在預(yù)測(cè)窗較長(zhǎng)時(shí)預(yù)測(cè)誤差大,導(dǎo)致預(yù)測(cè)所帶來(lái)的增益降低.為了解決這個(gè)問(wèn)題,近期已有文獻(xiàn)把預(yù)測(cè)資源分配建模為馬爾可夫決策過(guò)程,采用深度強(qiáng)化學(xué)習(xí)進(jìn)行在線(xiàn)決策.然而,對(duì)于這類(lèi)適于采用強(qiáng)化學(xué)習(xí)的馬爾可夫...