預(yù)測資源分配:馬爾可夫決策過程的無監(jiān)督學(xué)習(xí)
中國科學(xué):信息科學(xué)
頁數(shù): 18 2024-08-02
摘要: 當(dāng)已知未來的移動軌跡等信息時,面向視頻點(diǎn)播業(yè)務(wù)的預(yù)測資源分配可以在滿足用戶體驗(yàn)的前提下降低基站能耗或提高網(wǎng)絡(luò)吞吐量.傳統(tǒng)的預(yù)測資源分配方法采用先預(yù)測用戶軌跡等信息再優(yōu)化功率等資源分配的方法,在預(yù)測窗較長時預(yù)測誤差大,導(dǎo)致預(yù)測所帶來的增益降低.為了解決這個問題,近期已有文獻(xiàn)把預(yù)測資源分配建模為馬爾可夫決策過程,采用深度強(qiáng)化學(xué)習(xí)進(jìn)行在線決策.然而,對于這類適于采用強(qiáng)化學(xué)習(xí)的馬爾可夫...