Implementasi Algoritma Bernoulli Naïve Bayes dalam
Klasifikasi Cyberbullying pada Media Sosial Twitter
Writer(s) : Nurul Utami Rusli | Amil Ahmad Ilham | Anugrayani Bustamin
Teknik Informatika | Teknik Informatika S1
Seiring peningkatan pengguna media sosial, fenomena cyberbullying juga
semakin meningkat yang menimbulkan dampak negatif seperti gangguan mental
bahkan bunuh diri. Pemerintah Indonesia bersama POLRI telah meresmikan
beroperasinya polisi virtual untuk memantau dan memperingatkan pengguna yang
melanggar UU ITE melalui unggahan teks atau gambar. Dari sejumlah akun yang
mendapat peringatan, tercatat bahwa akun Twitter menyumbang sebanyak 79 akun
yang mendapat teguran. Analisis text mining dengan metode klasifikasi teks,
menggunakan algoritma Bernoulli Naïve Bayes, diusulkan sebagai solusi untuk
meminimalisir cyberbullying.
Tujuan dari penelitian ini adalah untuk mengimplementasikan algoritma
Bernoulli Naïve Bayes dalam melakukan klasifikasi cuitan cyberbullying dan bukan
cyberbullying pada media sosial Twitter, serta untuk mengevaluasi algoritma
tersebut.
Penelitian ini mengimplementasikan algoritma Bernoulli Naïve Bayes dan
menggunakan dataset dari Twitter dengan menggunakan kata kunci "puan". Setelah
tahap pelabelan manual, langkah berikutnya adalah melakukan tahap preprocessing
text dengan tujuan untuk menghilangkan noise pada dataset. Dataset yang
digunakan sebanyak 3.541 cuitan untuk kelas bukan cyberbullying dan 3.227 cuitan
untuk kelas cyberbullying. Proses berikutnya yaitu melakukan ekstraksi fitur
dengan metode bag of words. Selanjutnya, data dibagi menjadi 90% sebagai data
latih dan 10% sebagai data uji.
Evaluasi model menggunakan confusion matrix menghasilkan tingkat
accuracy sebesar 0.91, recall sebesar 0.96, precision sebesar 0.86, dan f-measure
sebesar 0.91. Meskipun demikian, model belum mampu mengklasifikasikan makna
kata secara pragmatik.
Keyword(s): Cyberbullying, Twitter, Bernoulli Naïve Bayes, Klasifikasi Teks, Bag of Words
Year : 2024