Implementasi Algoritma Bernoulli Naïve Bayes dalam Klasifikasi Cyberbullying pada Media Sosial Twitter

Writer(s) : Nurul Utami Rusli | Amil Ahmad Ilham | Anugrayani Bustamin

Teknik Informatika | Teknik Informatika S1

PDF
Login required to download this file
Abstract

Seiring peningkatan pengguna media sosial, fenomena cyberbullying juga semakin meningkat yang menimbulkan dampak negatif seperti gangguan mental bahkan bunuh diri. Pemerintah Indonesia bersama POLRI telah meresmikan beroperasinya polisi virtual untuk memantau dan memperingatkan pengguna yang melanggar UU ITE melalui unggahan teks atau gambar. Dari sejumlah akun yang mendapat peringatan, tercatat bahwa akun Twitter menyumbang sebanyak 79 akun yang mendapat teguran. Analisis text mining dengan metode klasifikasi teks, menggunakan algoritma Bernoulli Naïve Bayes, diusulkan sebagai solusi untuk meminimalisir cyberbullying. Tujuan dari penelitian ini adalah untuk mengimplementasikan algoritma Bernoulli Naïve Bayes dalam melakukan klasifikasi cuitan cyberbullying dan bukan cyberbullying pada media sosial Twitter, serta untuk mengevaluasi algoritma tersebut. Penelitian ini mengimplementasikan algoritma Bernoulli Naïve Bayes dan menggunakan dataset dari Twitter dengan menggunakan kata kunci "puan". Setelah tahap pelabelan manual, langkah berikutnya adalah melakukan tahap preprocessing text dengan tujuan untuk menghilangkan noise pada dataset. Dataset yang digunakan sebanyak 3.541 cuitan untuk kelas bukan cyberbullying dan 3.227 cuitan untuk kelas cyberbullying. Proses berikutnya yaitu melakukan ekstraksi fitur dengan metode bag of words. Selanjutnya, data dibagi menjadi 90% sebagai data latih dan 10% sebagai data uji. Evaluasi model menggunakan confusion matrix menghasilkan tingkat accuracy sebesar 0.91, recall sebesar 0.96, precision sebesar 0.86, dan f-measure sebesar 0.91. Meskipun demikian, model belum mampu mengklasifikasikan makna kata secara pragmatik.