PERBANDINGAN METODE DATA MINING UNTUK PREDIKSI NILAI DAN WAKTU KELULUSAN MAHASISWA PRODI TEKNIK INFORMATIKA DENGAN ALGORITMA C4,5, NAÏVE BAYES, KNN DAN SVM

  • Sri Widaningsih Universitas Suryakancana
Kata Kunci: kelulusan, data mining, klasifikasi, naïve bayes, kNN, SVM, C4.5

Abstrak

Kelulusan mahasiswa merupakan salah satu hal yang harus diperhatikan karena termasuk ke dalam Standar Penjaminan Mutu Internal suatu perguruan tinggi. Program Studi Teknik Informatika merupakan salah satu prodi yang ada di Universitas Suryakancana. Untuk kelulusan terdapat standar yang akan dicapai oleh prodi yaitu waktu studi yaitu empat tahun dan IPK minimal 3,00. Untuk dapat mencapai mutu lulusan tersebut dibutuhkan suatu prediksi tingkat kelulusan dengan standar yang telah ditetapkan untuk mahasiswa yang masih menjalankan studi sehingga dapat dilakukan langkah antisipasi dari awal sehingga dapat menanggulangi terjadinya permasalahan dalam bidang akademik. Untuk memprediksi tingkat kelulusan dan IPK standar tersebut digunakan metode data mining dengan fungsi klasifikasi. Metodologi penerapan data mining ini menggunakan tahapan Discovery Knowledge of Databases (KDD)  dimulai dari tahap selecting, preprocessing, transformation, data mining dan evaluation/interpretation. Teknik yang akan digunakan untuk model data mining klasifikasi ini terdiri dari empat algoritma yaitu C4.5, Support vector machine (SVM), k-nearest neigbor (kNN,) dan Naïve Bayes. Metoda klasifikasi terdiri dari variabel-variabel prediktor dan satu variabel target. Variabel-variabel prediktor terdiri dari jenis kelamin dan indeks prestasi dari semester 3 hingga 6. Perangkat lunak yang digunakan untuk mengolah data yaitu software RapidMiner. Hasil akhir dari keempat algoritma tersebut diperoleh bahwa algoritma Naïve Bayes merupakan algoritma terbaik untuk memprediksi kelulusan mahasiswa yang tepat waktu dan IPK ≥ 3 dengan nilai accuracy  (76,79%), error (23,17%) , dan AUC (0,850).

Diterbitkan
2019-04-16