SKRIPSI Jurusan Teknik Elektro - Fakultas Teknik UM, 2019

Ukuran Huruf:  Kecil  Sedang  Besar

COSINE SIMILARITY UNTUK KLASIFIKASI JUDUL DAN ABSTRAK JURNAL EKONOMI

Ristanti Putri Yuni

Abstrak


RINGKASAN

Ristanti, Putri Yuni. 2019. Cosine Similarity untuk Klasifikasi Judul dan Abstrak Jurnal Ekonomi. Skripsi. Jurusan Teknik Elektro, Fakultas Teknik, Universitas Negeri Malang. Pembimbing. (I) Aji Prasetya Wibawa, S.T., M.MT., Ph.D. (II) Utomo Pujianto, S.Kom., M.Kom.

Keywords: Kemiripan, Klasifikasi teks, Vector Space Model, Cosine Similarity, Artikel Jurnal Ekonomi

Jurnal ekonomi Universitas Negeri Malang terdiri dari 7 Pengelompokkan bidang berdasarkan judul jurnal yaitu Ekonomi Bisnis, Pendidikan Akuntansi dan Bisnis, Akuntansi Aktual, Ekonomi dan Studi Pembangunan (JESP), Pendidikan Akuntansi, Pendidikan Bisnis dan Manajemen, dan Pendidikan Bisnis dan Manajemen. Pengelompokkan bidang tersebut 4 diantaranya adalah jurnal ekonomi berbahasa Indonesia. Dasar penerimaan artikel jurnal adalah kemiripan isi artikel jurnal terhadap topik artikel jurnal. Pengelompokan topik artikel jurnal seperti Pendidikan Akuntansi, Akuntansi Aktual dan Pendidikan Akuntansi dan Bisnis memiliki topik artikel yang hampir mirip. Kemiripan topik artikel tersebut menyebabkan penulis kebingungan dalam menentukan topik artikel jurnal yang tepat sesuai artikelnya.

Tahapan penelitian pada klasifikasi artikel jurnal ekonomi berbahasa Indonesia terdiri dari 5 tahap yaitu pengambilan data artikel jurnal ekonomi berbahasa Indonesia, preprocessing, pendekatan berbasis Vector Space Model pada pembobotan TF-IDF, penerapan klasifikasi dengan Cosine Similarity, dan evaluasi. Pengumpulan data dilakukan pada website journal.um.ac.id Fakultas Ekonomi dengan 4 pengelompokkan bidang jurnal ekonomi berbahasa Indonesia. Tahap preprocessing dilakukan dengan cleansing, case folding, dan tokenisasi. Pendekatan Vector Space Model untuk merepresentasikan term dalam dimensi spasial. Metode klasifikasi Cosine Similarity untuk menghitung kemiripan antara dokumen. Evaluasi menggunakan teknik K-Fold Cross Validation, dengan pengujian terhadap 6 fold untuk setiap pengacakan data set sebanyak 6 kali, terhadap 126 instance artikel jurnal ekonomi berbahasa Indonesia dengan output accuracy, precision dan recall.

Hasil pengujian ini adalah nilai rata-rata dari 6 kali pengacakan terhadap data set dengan nilai accuracy 57,79%, precision 57,79%, dan recall 62,96%. Dari hasil pengujian dengan nilai rata-rata accuracy, precision dan recall belum maksimal. Penambahan tahapan pada preprocessing atau teknik optimasi algoritma pada penelitian selanjutnya untuk memudahkan kemiripan antar term mudah terdeteksi sehingga nilai accuracy, recall maupun precision dapat meningkat.