基于DBSCAN聚類的不平衡數(shù)據(jù)集過采樣方法
計(jì)算機(jī)仿真
頁(yè)數(shù): 5 2023-10-15
摘要: 在網(wǎng)絡(luò)流量檢測(cè)中,經(jīng)常出現(xiàn)數(shù)據(jù)類別不平衡的情況,為改善不平衡數(shù)據(jù)集的分類效果,提出一種基于DBSCAN聚類的過采樣方法。方法首先對(duì)少數(shù)類數(shù)據(jù)進(jìn)行聚類,之后根據(jù)簇的稀疏程度以及簇中少數(shù)類樣本與多數(shù)類樣本之間的距離,為每一個(gè)少數(shù)類樣本點(diǎn)分配過采樣比例,并生成合成樣本。為進(jìn)一步檢驗(yàn)該算法,選擇CIC-IDS2017數(shù)據(jù)集進(jìn)行測(cè)試,并與隨機(jī)過采樣和SMOTE算法進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果表明,... (共5頁(yè))