基于改進(jìn)決策樹的不平衡數(shù)據(jù)集分類算法研究
計(jì)算機(jī)仿真
頁數(shù): 5 2024-08-15
摘要: 不平衡數(shù)據(jù)集中各類樣本數(shù)量不均,導(dǎo)致分類模型難以訓(xùn)練。針對不平衡數(shù)據(jù)分類模型穩(wěn)定性差,準(zhǔn)確率低的問題,提出一種基于改進(jìn)C4.5決策樹數(shù)據(jù)分類算法,通過融合SMOTE優(yōu)化采樣算法,構(gòu)建出N_C4.5-IDC不平衡數(shù)據(jù)分類模型。模型首先利用K-Means聚類對數(shù)據(jù)集進(jìn)行狀態(tài)分布分析,并使用SMOTE采樣法進(jìn)行混合采樣,通過增加人為樣本點(diǎn)提高少數(shù)類樣本數(shù),對數(shù)據(jù)集進(jìn)行平衡處理;然后對... (共5頁)