基于DBSCAN聚類的不平衡數(shù)據(jù)集過采樣方法
計算機仿真
頁數(shù): 5 2023-10-15
摘要: 在網(wǎng)絡(luò)流量檢測中,經(jīng)常出現(xiàn)數(shù)據(jù)類別不平衡的情況,為改善不平衡數(shù)據(jù)集的分類效果,提出一種基于DBSCAN聚類的過采樣方法。方法首先對少數(shù)類數(shù)據(jù)進行聚類,之后根據(jù)簇的稀疏程度以及簇中少數(shù)類樣本與多數(shù)類樣本之間的距離,為每一個少數(shù)類樣本點分配過采樣比例,并生成合成樣本。為進一步檢驗該算法,選擇CIC-IDS2017數(shù)據(jù)集進行測試,并與隨機過采樣和SMOTE算法進行對比,實驗結(jié)果表明,...