SOLUSI KLASIFIKASI DATA TIDAK SEIMBANG DENGAN PENDEKATAN BERBASIS COMBINATION OF OVERSAMPLING AND UNDERSAMPLING
Abstrak
Penelitian ini menerapkan Metode Combination of Oversampling and Undersampling untuk menanganai ketidakseimbangan kelas. Peneliti melakukan preprocessing untuk melakukan normalisasi pada atribut yang digunakan untuk prediksi, kemudian membagi data training dan data testing. Peneliti melakukan resample pada data tidak seimbang menggunakan Oversampling, Undersampling dan kombinasi Oversampling dan Undersampling. Hasil klasifikasi dengan percobaan pendekatan penyeimbang kelas data tersebut didapat kinerja klasifikasi terbaik adalah kombinasi Oversampling dan Undersampling di klasifikasikan dengan metode k-Nearest Neighbor (KNN) yakni akurasi sebesar 0,8672; sensitivitas sebesar 0,9000; spesifisitas sebesar 0,3750; dan AUC sebesar 0,6651042. Klasifikasi dengan Oversampling memiliki hasil kinerja yakni akurasi sebesar 0,875; sensitivitas sebesar 0,9250; spesifisitas sebesar 0,1250; dan AUC sebesar 0,6078125, Sedangkan klasifikasi dengan Undersampling memiliki kinerja klasifikasi yakni akurasi sebesar 0,3438; sensitivitas sebesar 0,33333; spesifisitas sebesar 0,50000; dan AUC sebesar 0,3645833.