APLIKASI PEMBELAJARAN TAJWID BERBASIS SPEECH RECOGNITION MENGGUNAKAN METODE CNN-LSTM
Abstract
Penelitian ini bertujuan untuk membangun sistem deteksi bacaan tajwid dengan menggunakan pendekatan deep learning berbasis speech recognition dengan arsitektur Convolutional Neural Network dan Long Short-Term Memory (CNN-LSTM). Sistem ini dirancang untuk mendeteksi apakah bacaan yang dilakukan pengguna termasuk "benar" atau "salah" berdasarkan karakteristik fitur suara yang diperoleh melalui ekstraksi Mel-Frequency Cepstral Coefficients (MFCC). Dataset yang digunakan terdiri dari lebih dari 350 file audio bacaan ayat pendek, kemudian diperluas menjadi 700 dataset melalui teknik augmentasi dan denoise untuk meningkatkan variasi dan kualitas data. Model CNN-LSTM dilatih menggunakan data MFCC berdimensi tetap dan dievaluasi berdasarkan tingkat akurasi serta confusion matrix pada data validasi. Hasil penelitian menunjukkan bahwa model memiliki performa yang baik dalam mengklasifikasikan bacaan dengan tingkat akurasi yang cukup baik. Evaluasi menggunakan uji model memberikan hasil akurasi pelatihan sebesar 90,83% dan akurasi validasi sebesar 77,78% yang bisa dibilang cukup akurat. Sistem ini diintegrasikan ke dalam aplikasi berbasis Flask dan Flutter, sehingga pengguna dapat mendapatkan hasil klasifikasi secara real-time. Diharapkan penelitian ini dapat menjadi kontribusi dalam pengembangan media pembelajaran Al-Qur'an yang adaptif dan berbasis teknologi suara.
Downloads
References
[2] Anggraini, N., Kurniawan, A., Wardhani, L. K., & Hakiem, N. (2018). Speech recognition application for the speech impaired using the android-based google cloud speech API. Telkomnika (Telecommunication Computing Electronics and Control), 16(6), 2733–2739. https://doi.org/10.12928/TELKOMNIKA.v16i6.9638
[3] Muhamad, S. O., Akter, F., Gali, M., Sains, F., & Teknologi, D. (n.d.). klasifikasi hukum tajwid mad dalam surah al-fatihah menggunakan algoritma long short-term memory dengan ekstraksi fitur mel-frequency cepstral coefficient program studi teknik informatika.
[4] Diarsyah, M. G., & Setiawan, D. (2024). IMPLEMENTASI CNN-LSTM UNTUK MUSIC CAPTIONING. In Media Informatika (Vol. 23, Issue 1).
[5] Arham, A. Z. (2018). Klasifikasi ulasan buku menggunakan algoritma convolutional neural network-long short term memory (Doctoral dissertation, Institut Teknologi Sepuluh Nopember).

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
An author who publishes in this Journal agrees to the following terms:
- Author retains the copyright and grants the journal the right of first publication of the work simultaneously licensed under the Creative Commons Attribution-ShareAlike 4.0 License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal
- Author is able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book) with the acknowledgement of its initial publication in this journal.
- Author is permitted and encouraged to post his/her work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of the published work (See The Effect of Open Access).