ANALISIS SENTIMEN TERHADAP VIDEO BERDASARKAN PENGENALAN EMOSI PADA DATA AUDIO

Writer(s) : Andi Muh. Rizky | Anugrayani Bustamin | Elly Warni

Teknik Informatika | Teknik Informatika S1

PDF
Login required to download this file
Abstract

YouTube menjadi salah satu platform streaming video yang populer dalam mencari suatu informasi khususnya video ulasan produk. Meskipun sebuah video ulasan semakin dicari oleh pengguna YouTube namun kebanyakan video memiliki durasi yang panjang dan terdapat perbedaan secara verbal dengan emosi suara yang disampaikan, sehingga perlu metode yang cepat dan akurat untuk memahami emosi suara pada video. Penelitian ini menggunakan data primer dan data sekunder. Data primer merupakan kumpulan rekaman suara dari 10 responden dan data sekunder merupakan kumpulan dari 60 sampel video YouTube pada kanal GadgetIn. Penelitian ini juga membangun sebuah model yang dapat mengenali dan mengklasifikasi emosi suara menggunakan arsitektur Convolutional Neural Network (CNN) serta dilakukan evaluasi performa model pengenalan emosi suara. Arsitektur CNN adalah jenis jaringan saraf yang terdiri dari lapisan konvolusi, aktivasi, pooling, dan fully connected yang mampu mengekstrak fitur-fitur penting dari data audio secara berurutan. Augmentasi data dilakukan dengan melakukan metode noise, time stretch, dan pitch shift. Pelatihan data menggunakan 6 skenario yaitu skenario pelatihan data primer sejumlah 300 data, skenario pelatihan data primer dengan augmentasi sejumlah 900 data, skenario pelatihan data sekunder sejumlah 500 data, skenario pelatihan data sekunder dengan augmentasi sejumlah 1497 data, skenario pelatihan data gabungan sejumlah 800 data, dan skenario pelatihan data gabungan dengan augmentasi sejumlah 2397 data. Hasil analisis dan pengujian performa model berdasarkan klasifikasi 3 kelas sentimen (positif, negatif, netral) menghasilkan 6 model dengan nilai akurasi yang cukup tinggi yaitu model data primer dengan augmentasi sebesar 94%, model data primer sebesar 92%, model data gabungan dengan augmentasi sebesar 90%, model data sekunder dengan augmentasi sebesar 85%, dan model data sekunder serta model data gabungan sebesar 81%.