SKRIPSI Jurusan Teknik Elektro - Fakultas Teknik UM, 2019

Ukuran Huruf:  Kecil  Sedang  Besar

Klasifikasi Situs Web dengan Menggunakan Metode K-Nearest Neighbor untuk Mendeteksi Phishing

Shobah M Annurus

Abstrak


RINGKASAN

Shobah, M Annurus, Klasifikasi Situs Web dengan Menggunakan Metode K- Nearest Neighbor untuk Mendeteksi Phishing. Skripsi, Jurusan Teknik Elektro, Fakultas Teknik, Universitas Negeri Malang, Pembimbing: (I) Dr. Eng. Siti Sendari, S.T., M.T., (II) Triyanna Widiyaningtyas, S.T., M.T.

Kata Kunci: K-nearest Neighbor, Klasifikasi, Phishing

Perkembangan ilmu teknologi dan pengetahuan memberikan kemudahan kepada manusia dalam berbagai bidang dalam kehidupan sehari-harinya, salah satunya adalah perkembangan teknologi informasi. Berkembangnya teknologi informasi juga menimbulkan dampak negatif, yaitu tindak kriminal yang dilakukan dengan alat teknologi komputasi digital dan menggunakan jaringan internet, atau yang biasa disebut Cybercrime. Salah satu kejahatan siber yang marak terjadi sekarang adalah kejahatan phishing.

Kejahatan phishing adalah bentuk ancaman online yang didefinisikan sebagai seni meniru situs web resmi instansi atau perusahaan tertentu yang bertujuan untuk memperoleh data penting pengguna, seperti nama pengguna, sandi, nomor identitas dan lain-lain. Menurut data statistik dari koalisi Anti- Phishing Working Group (APWG) dalam buku laporannya telah mendapatkan laporan sekitar 190.942 kasus untuk situs web phishing dan 296.208 kasus untuk e-mail phishing. Serangan phishing tidak hanya menimbulkan kerugian finansial saja, tindakan phishing menyebabkan masalah serius terhadap hilangnya data rahasia pengguna, dan menyebabkan nama perusahaan tercemar.

Klasifikasi situs web perlu untuk dilakukan, karena dengan pengklasifikasian situs web akan membantu mencegah terjadinya tindak kejahatan phishing. Metode klasifikasi K-Nearest Neighbor (KNN) adalah algoritma klasifikasi dengan prinsip mencari kemiripan data paling dekat dengan data lain, dimana dievaluasi dari nilai k tetangga terdekat pada data latih. Variabel yang digunakan dalam klasifikasi situs web ini yaitu: SFH, PopUpWindows, SSLfinal_State, Request_URL, URL_of_Anchor, Web_Traffic, URL_Length, Age_of_Domain, Having_IP_Address. Variabel tersebut akan diolah untuk mengklasifikasikan situs web dalam menentukan keasliannya pada kelas “Phishing, Suspicious/Mencurigakan, dan Legit/Asli”. Penelitian ini diharapkan dapat membantu mengurangi kejahatan siber khususnya mencegah kejahatan pencurian informasi penting pengguna di internet. Metode k-fold cross validation digunakan untuk memvalidasi klasifikasi KNN. Hasil penelitian yang dilakukan diperoleh kesimpulan bahwa akurasi terbaik klasifikasi KNN terdapat pada nilai k

= 4 dengan tingkat akurasi sebesar 88,03%.