基于特征空間相似的隱形后門攻擊
信息網(wǎng)絡(luò)安全
頁數(shù): 10 2024-08-10
摘要: 后門攻擊指通過在深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練過程中對原模型植入特定的觸發(fā)器,導(dǎo)致模型誤判的攻擊。目前后門攻擊方案普遍面臨觸發(fā)器隱蔽性差、攻擊成功率低、投毒效率低與中毒模型易被檢測的問題。為解決上述問題,文章在監(jiān)督學(xué)習(xí)模式下,提出一種基于特征空間相似理論的模型反演隱形后門攻擊方案。該方案首先通過基于訓(xùn)練的模型反演方法和一組隨機(jī)的目標(biāo)標(biāo)簽類別樣本獲得原始觸發(fā)器。然后,通過Attention... (共10頁)