IMPLEMENTASI ALGORITMA KNUTH-MORRIS-PRATT DALAM SISTEM PEMBUATAN KORPUS BAHASA INDONESIA DAN INTEGRASI KATEGORISASI FONEM UNTUK MENINGKATKAN AKURASI TEXT-TO-SPEECH 

Writer(s) : Arif Putera Wijaya | Indrabayu | Elly Warni

Teknik Informatika | Teknik Informatika S1

PDF
Login required to download this file
Abstract

Arif Putera Wijaya. Implementasi Algoritma Knuth-morris-pratt Dalam Sistem Pembuatan Korpus bahasa Indonesia Dan Integrasi Kategorisasi Fonem Untuk Meningkatkan Akurasi Text-to-speech (dibimbing oleh Indrabayu dan Elly Warni) Perkembangan teknologi text-to-speech (TTS) menjadi salah satu fokus perkembangan kecerdasan buatan dalam bidang natural language processing (NLP). Diantara kendala yang masih menjadi problematik adalah ketidakadaan corpus fonem bahasa Indonesia yang mengikuti kaidah bahasa, hal ini menyebabkan hambatan dalam perkembangan TTS bahasa Indonesia. Oleh karena itu, diperlukan sistem pembuatan korpus fonem bahasa Indonesia secara automatis yang berkualitas dengan beracuan pada kaidah linguistik bahasa Indonesia. Penelitian ini menggunakan metode algoritma knuth-morris-pratt yang kemudian dihubungkan dengan kategorisasi fonem untuk menghasilkan sistem pembuatan korpus fonem yang lebih baik. Hasil pengujian menunjukan tingkat keberhasilan sistem dalam mengkonversi teks menjadi suara memperoleh akurasi 100% pada keseluruhan skrenario uji, hal ini menunjukan keberhasilan sistem kategorisasi fonem dalam menambahkan korpus yang digunakan dalam konversi teks menjadi suara. Penelitian ini juga meninjau kualitas keluaran sistem menggunakan mean opinion score (MOS) dan membandingkannya dengan kualitas keluaran sistem yang menggunakan korpus diphone concatenation. Hasil perbandingan ini dilihat dari tingkat kejelasan (intelligibility), kelancaran (fluidity), maupun kealamian ucapan (naturalness) korpus yang terintegrasi kategorisasi fonem lebih unggul dengan nilai tingkat kejelasan 3,55, tingkat kelancaran 3,58 dan tingkat kealamian 3,42, sedangkan korpus diphone concatenation memiliki tingkat kejelasan 2,87, tingkat kelancaran 2,9 dan tingkat kealamian 2,82. Selain itu, hasil keluaran audio sistem TTS yang menggunakan korpus terintegrasi kategorisasi fonem memilik ukuran file yang lebih ringan 48% jika dibandingkan dengan TTS yang menggunakan korpus diphone concatenation. Oleh karena itu, dapat diputuskan sistem TTS dengan algoritma knuth-morris-pratt dan korpus terintegrasi kategorisasi fonem memiliki tingkat keberhasilan konversi dengan sangat baik dan memiliki kualitas keluaran suara yang dapat dipahami dan perangkaian ucapannya cukup jelas, pengucapan yang dihasilkan lancar, transisi antar fonem nyaman, serta memiliki tingkat intonasi yang cukup baik, yang sesuai dengan pengucapan manusia pada umumnya.