Implementasi Nearest Neighbor pada Data Kategorik dengan Pembobotan Atribut Menggunakan Weighted Simple Matching Coefficient
Submission Date: 2017-07-24 12:50:57
Accepted Date: 2017-09-11 00:00:00
Abstract
Klasifikasi merupakan sebuah metode yang cukup sering digunakan dalam bidang statistika dan komputasi cerdas terutama dengan kaitannya untuk memprediksi sesuatu berdasarkan data yang diterima. Klasifikasi dapat dilakukan untuk berbagai macam tipe data mulai dari numerik, ordinal ataupun kategorik. Pada data kategorik perhitungan jarak perbedaan atau kesamaan tidak dapat dihitung menggunakan operasi matematik seperti yang dapat dilakukan terhadap data numerik. Salah satu metode yang dapat digunakan untuk menghitung jarak pada data kategorik adalah Simple Matching Coefficient (SMC). Namun metode ini terkesan tidak adil karena menganggap bahwa setiap atribut memiliki kotribusi yang sama terhadap tiap label kelas. Karena itu metode SMC akan dioptimasi dengan menggunakan Weighted Simple Matching Coefficient(WSMC). Dalam penelitian kali ini, diimplementasikan sebuah metode klasifikasi terhadap data kategorik yang menggunakan metode klasifikasi Nearest-Neighbor dengan pembobotan atribut menggunakan WSMC. Uji coba yang dilakukan terhadap 6 dataset dengan atribut bersifat kategorik, menunjukkan kemampuan metode dalam melakukan klasifikasi. Dengan rata-rata akurasi tertinggi didominasi oleh metode lokal. Rata-rata akurasi tertinggi untuk dataset Nursery, Cars, Gerakan tangan, Soybeans, Vote dan Dhermatology berturut-turut sebesar 77.31%, 80.35%, 97.00%, 91.64%, 92.41%, dan 95.90%.
Keywords
Nearest-Neighbor; data kategorik; pembobotan atribut