基于欠采樣和多層集成學(xué)習(xí)的惡意網(wǎng)頁識別
計(jì)算機(jī)工程與設(shè)計(jì)
頁數(shù): 7 2024-03-16
摘要: 現(xiàn)實(shí)中惡意網(wǎng)頁與良性網(wǎng)頁比重嚴(yán)重失衡,傳統(tǒng)的機(jī)器學(xué)習(xí)分類模型不能很好的應(yīng)用,為此提出一種基于欠采樣和多層集成學(xué)習(xí)的惡意網(wǎng)頁檢測模型。通過欠采樣達(dá)到局部數(shù)據(jù)平衡;通過第一層基于權(quán)重和閾值的集成學(xué)習(xí)確保模型的準(zhǔn)確度;通過第二層基于投票的集成學(xué)習(xí)保證全局信息的完整性。實(shí)驗(yàn)結(jié)果表明,所提模型在不平衡數(shù)據(jù)集上的惡意網(wǎng)頁識別性能優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)模型。 (共7頁)