SKRIPSI Jurusan Teknik Elektro - Fakultas Teknik UM, 2019

Ukuran Huruf:  Kecil  Sedang  Besar

zx

a s

Abstrak


Abstract

Phishing is an online form of threat that defined as the art of imitating the official agency or company website that aims to obtain important data from users. According to statistical data from the coalition of Anti-Phishing Working Group (APWG), there have been reports of around 190,942 cases for phishing websites. The dataset was obtained from the UCI Machine Learning repository with 1353 total data records in nine variables. The variables will be processed to classify the website for determining class of "Phishing, Suspicious, or Legit". K-Nearest Neighbor (KNN) algorithm is used to classify the data, an algorithm with principle of finding closest data similarity to other data, which is evaluated from the value of nearest neighbor to training data. K-fold cross validation method is used to validate the KNN classification. The best accuracy of KNN classification results obtained at the value of k = 4 with 88.03% accuracy rate.

Keywords:K-fold Cross Validation, K-Nearest Neighbor, Phishing.

Abstrak

Kejahatan phishing adalah bentuk ancaman online yang didefinisikan sebagai seni meniru situs web resmi instansi atau perusahaan tertentu yang bertujuan untuk memperoleh data penting pengguna. Menurut data statistik dari koalisi Anti-Phishing Working Group (APWG) dalam buku laporannya telah mendapatkan laporan sekitar 190.942 kasus untuk situs web phishing. Dataset yang digunakan pada penelitian ini didapatkan dari repository UCI Machine Learning dengan jumlah dataset sebanyak 1353 record data dengan 9 variabel. Variabel tersebut akan diolah untuk mengklasifikasikan situs web dalam menentukan kelas “Phishing, Suspicious, dan Legit”. Metode klasifikasi yang digunakan adalah K-Nearest Neighbor (KNN) yaitu algoritma dengan prinsip mencari kemiripan data paling dekat dengan data lain, dimana dievaluasi dari nilai k tetangga terdekat pada data latih. Metode k-fold cross validation digunakan untuk memvalidasi klasifikasi KNN. Hasil klasifikasi KNN yang dilakukan diperoleh akurasi terbaik pada nilai k = 4 dengan tingkat akurasi sebesar 88,03%.

Kata kunci:K-fold Cross Validation, K-Nearest