Deteksi Hoax pada Berita Online Bahasa Inggris Menggunakan Bernoulli Naïve Bayes dengan Ekstraksi Fitur Tf-Idf

Main Article Content

Agri Yodi Prayoga
Universitas Jenderal Achmad Yani (UNJANI) Jawa Barat, Indonesia
Asep Id Hadiana
Universitas Jenderal Achmad Yani (UNJANI) Jawa Barat, Indonesia
Fajri Rakhmat Umbara
Universitas Jenderal Achmad Yani (UNJANI) Jawa Barat, Indonesia

Fenomena yang disebut sebagai "berita palsu" saat ini mengacu pada publikasi online dari pernyataan fakta palsu yang disengaja. Tujuan pembuatan berita hoax adalah untuk mempengaruhi pembaca berita untuk mencegah tindakan yang benar. Deteksi berita hoax ini berperan penting bagi pemerintah dan masyarakat, sebab itu berita hoax harus segera dideteksi untuk menghindari efek yang dapat ditimbulkannya. Penelitian ini bertujuan untuk mengetahui performa dari penggunaan algoritma Bernoulli Naïve Bayes dengan ekstraksi fitur TF-IDF dalam mendeteksi berita hoax. Tahapan penelitian ini disusun sebagai berikut, yaitu pengumpulan data dan labeling, text preprocessing, ekstraksi fitur dengan TF-IDF, pembagian dataset, classification, Output (Klasifikasi Fake/True), evaluasi, dan kesimpulan. Hasil implementasi menunjukan model prediksi yang dibangun dengan 8800 data berita, mampu menghasilkan nilai akurasi sebesar 98,5% dari jumlah data uji sebanyak 2.200 data berita, dimana akurasi dari prediksi model untuk label 1 (Fake) sebesar 97,8%, dan akurasi untuk label 0 (True) sebesar 99,1%, diikuti dengan nilai precision 99,1%, recall 97,8%, dan f1-score 98,4%. Dari implementasi tersebut penggunaan ekstraksi fitur TF-IDF pada algoritma Bernoulli Naive Bayes mampu meningkatkan akurasi sebesar 16,08%, precision 15,7%, recall 16,22%, dan f1-score 15,92% bila dibandingkan dengan hasil penelitian sebelumnya


Keywords: tf-idf, bernoulli’s naïve bayes, text preprocessing, confusion matrix