IMPLEMENTASI TEXT-TO-TEXT TRANSFER TRANSFORMER BERBASIS ABSTRAKSI DAN EKSTRAKSI DALAM TEXT SUMMARIZATION BERITA ONLINE

Writer(s) : Kisana Adzan Sitorus | Elly Warni

Teknik Informatika | Teknik Informatika S1

PDF

Abstract

Di era digital, banyaknya informasi memerlukan metode efektif untuk merangkum teks secara otomatis guna membantu pembaca menyerap detail penting. Peringkasan teks adalah tugas penting dalam Natural Language Processing (NLP), yang memungkinkan pengurangan teks panjang menjadi ringkasan singkat tanpa kehilangan informasi esensial. Dengan meningkatnya konsumsi berita digital, menyediakan ringkasan yang singkat dan informatif dapat meningkatkan pengalaman pengguna dan penyebaran informasi. Penelitian ini bertujuan untuk menganalisis performa model Text-to-text transfer transformer (T5) dalam menghasilkan ringkasan artikel berita Indonesia dan membandingkan efektivitas pendekatan abstraksi dan ekstraksi. Model abstraksi menghasilkan teks baru yang koheren, sedangkan model ekstraksi memilih segmen penting dari teks asli tanpa mengubah struktur kalimat. Metodologi penelitian ini melibatkan beberapa langkah kunci. Pertama, dataset komprehensif artikel berita online berbahasa Indonesia dikumpulkan menggunakan teknik web scraping kemudian digabungkan dengan dataset Indosum. Dataset ini kemudian dibagi menjadi set pelatihan, validasi, dan uji. Langkah-langkah preprocessing mencakup tokenisasi, pembersihan, dan normalisasi data teks. Kedua model dievaluasi menggunakan metrik ROUGE dan BLEU untuk menilai performa dalam hal presisi, recall, dan kualitas keseluruhan ringkasan yang dihasilkan. Hasil penelitian menunjukkan bahwa model T5 berbasis abstraksi memiliki kinerja lebih baik dibandingkan model ekstraksi. Pada metrik ROUGE-1, model abstraksi memiliki precision 0.838, recall 0.544, dan F1-score 0.662, sedangkan model ekstraksi memiliki precision 0.757, recall 0.444, dan F1-score 0.56. Pada metrik ROUGE-2, model abstraksi memiliki precision 0.778, recall 0.509, dan F1-score 0.617, sementara model ekstraksi memiliki precision 0.889, recall 0.516, dan F1-score 0.651. Pada metrik ROUGE-L, model abstraksi memiliki precision 0.811, recall 0.526, dan F1-score 0.639, sedangkan model ekstraksi memiliki precision 0.919, recall 0.54, dan F1-score 0.679. Selain itu, model abstraksi memiliki skor BLEU 0.375, lebih tinggi dibandingkan model ekstraksi yang memiliki skor BLEU 0.338. Temuan ini menunjukkan bahwa pendekatan abstraksi lebih efektif dalam menghasilkan ringkasan yang koheren dan informatif.

Keyword(s): text summarization, abstraksi, ekstraksi, text-to-text transfer transformer (T5), ROUGE

Year : 2024