SKRIPSI Jurusan Teknik Elektro - Fakultas Teknik UM, 2019

Ukuran Huruf:  Kecil  Sedang  Besar

Perbandingan Algoritma naive Bayes dan C4.5 Untuk Prediksi Kelulusan Mahasiswa Dalam Ruang Belajar Virtual

Erwina Nurul Azizah

Abstrak


Data mining dalam bidang pendidikan merupakan salah satu penelitian yang penting untuk dilakukan seiring dengan berkembangnya teknologi pendidikan. Salah satunya dalam perkembangan Ruang Belajar Virtual. Dengan semakin populernya pembelajaran tanpa bertatap muka, maka evaluasi nilai siswa juga ikut berubah. Penilaian atas perilaku siswa tentu tak bisa dilakukan karena pengajar dan siswa tidak langsung bertatap muka. Oleh karena itu data pendukung untuk menentukan perilaku dan ke-aktifan siswa dalam pembelajaran di Ruang Belajar Virtual diperlukan banyaknya data pendidikan dan atribut-atribut yang ada dapat mempengaruhi komputasi data mining pendidikan. Oleh karena itu perlu adanya pengolahan data sebelum melakukan komputasi data tersebut. Salah satu teknik penting dan sering digunakan dalam preprocessing data adalah K-means Clustering yang dipakai untuk mengubah data numerik menjadi kategorial. Selain itu terdapat juga teknik Outlier yang menghilangkan baris data yang dianggap terlalu melenceng dari kumpulan data, dan teknik Undersampling yang dipakai untuk menyeimbangkan data klasifikasi.

Ada banyak algoritma klasifikasi untuk Data Mining Salah satunya adalah Algoritma Naïve Bayes. Naïve Bayes adalah algoritma klasifikasi yang sederhana dan dikenal melakukan komputasi cepat dalam jumlah data yang banyak. Ada lagi algoritma klasifikasi yang juga cepat, yaitu algoritma C4.5. Dari studi literatur yang ada, Naïve Bayes dan C4.5 memiliki tingkat akurasi yang relatif tinggi. Sehingga penelitian ini memutuskan untuk memakai dua algoritma tersebut, dan melakukan perbandingan manakah yang unggul dalam klasifikasi Ruang Belajar Virtual.

Hasil dari pengujian data yang telah dilakukan menggunakan 10 folds cross validation menunjukan bahwa urutan preprocessing yang dilakukan pada dataset, mempengaruhi tingkat akurasi klasifikasi. Dilakukan 3 preprocessing data, dan diketahui langkah melakukan Undersampling mampu memberikan Akurasi yang lebih tinggi dengan masing-masing algoritma memiliki tingkat akurasi sebesar 71 persen .