基于PPO算法的攻擊路徑發(fā)現(xiàn)與尋優(yōu)方法
信息網(wǎng)絡(luò)安全
頁(yè)數(shù): 11 2023-09-10
摘要: 基于策略網(wǎng)絡(luò)選擇滲透動(dòng)作發(fā)現(xiàn)最優(yōu)攻擊路徑,是自動(dòng)化滲透測(cè)試的一項(xiàng)關(guān)鍵技術(shù)。然而,現(xiàn)有方法在訓(xùn)練過(guò)程中存在無(wú)效動(dòng)作過(guò)多、收斂速度慢等問(wèn)題。為了解決這些問(wèn)題,文章將PPO(Proximal Policy Optimization)算法用于解決攻擊路徑尋優(yōu)問(wèn)題,并提出帶有滲透動(dòng)作選擇模塊的改進(jìn)型PPO算法IPPOPAS(Improved PPO with Penetration Ac...