Evaluasi Pengaruh Varian Daftar Stopword terhadap Kinerja Klasifikasi Teks Al-Qur'an dengan Support Vector Machine dan Backpropagation Neural Network
DOI:
https://doi.org/10.52436/1.jpti.875Kata Kunci:
Backpropagation Neural Network, Klasifikasi Teks Al-Qur'an, Penghapusan Stopword, Seleksi Fitur, Support Vector Machine, TF-IDFAbstrak
Latar belakang penelitian ini adalah tantangan dalam mengklasifikasikan teks Al-Qur'an, yang disebabkan oleh kompleksitas struktur bahasa Arab dan perbedaan antara bahasa Arab klasik dan modern. Penggunaan teknik Natural Language Processing (NLP), khususnya stopword removal, menjadi penting dalam meningkatkan akurasi klasifikasi teks. Namun, pengaruh penggunaan varian stopword terhadap performa model klasifikasi teks Al-Qur'an belum banyak dieksplorasi. Tujuannya adalah untuk mengevaluasi pengaruh penerapan varian daftar stopword yang berbeda terhadap kinerja dua algoritma klasifikasi teks, yaitu Support Vector Machine (SVM) dan Backpropagation Neural Network (BPNN), dalam mengklasifikasikan ayat-ayat Al-Qur'an. Penelitian ini juga bertujuan untuk menganalisis bagaimana teknik seleksi fitur Chi-Square dan representasi TF-IDF dapat mempengaruhi efektivitas model. Metode yang digunakan meliputi pengumpulan dataset ayat-ayat Al-Qur'an dalam Bahasa Indonesia yang melalui preprocessing seperti tokenisasi, normalisasi, dan penghapusan stopword menggunakan tiga varian stopword list: Sastrawi, NLTK, dan kombinasi keduanya. Model klasifikasi diterapkan dengan algoritma SVM dan BPNN, serta dievaluasi menggunakan metrik akurasi, presisi, recall, dan F1-score. Hasil penelitian menunjukkan bahwa algoritma SVM memberikan performa yang lebih baik dan konsisten dibandingkan BPNN. Penggunaan stopword NLTK memberikan hasil terbaik dengan akurasi tertinggi sebesar 0,5849 dan F1-score 0,5438 pada SVM. BPNN menunjukkan hasil yang kurang optimal dengan akurasi tertinggi hanya 0,4292 dan F1-score yang lebih rendah dari 0,3 pada semua varian stopword. Kontribusi penelitian ini adalah menegaskan pentingnya pemilihan daftar stopword yang tepat untuk meningkatkan kinerja klasifikasi teks Al-Qur'an serta memberikan wawasan berharga dalam pengembangan sistem klasifikasi teks keagamaan yang lebih akurat menggunakan algoritma pembelajaran mesin.
Unduhan
Referensi
M. R. Ramadhan dan N. Nasrulloh, “Pengaruh Konsep Keadilan Dalam Al Qur’an Dan Relevansinya Dalam Hukum Manusia,” Jimr, vol. 2, no. 11, hlm. 132–139, 2024, doi: 10.62504/jimr972.
D. F. A. Sakhi, P. A. I. Amin, dan K. Kurniati, “Etika Politik Islam Dalam Masyarakat Kontemporer: Perspektif Al-Mawardi,” J. Ilm. Falsafah J. Kaji. Filsafat Teol. Dan Hum., vol. 10, no. 2, hlm. 95–106, 2024, doi: 10.37567/jif.v10i2.3052.
H. Mabrur dan S. Abas, “Hermeneutik Sebagai Tawaran Metodologis Dalam Menafsirkan Al-Quran Yang Diperdebatkan,” Setyaki J. Studi Keagamaan Islam, vol. 1, no. 1, hlm. 78–89, 2023, doi: 10.59966/setyaki.v1i1.251.
Abd. Muid N. Amiril Ahmad, “Pendekatan Konstruktivis-Interpretis (Hermeneutik) Sebagai Metode Penafsiran,” Al Dhikra J. Studi Qur Dan Hadis, vol. 2, no. 2, hlm. 169–182, 2022, doi: 10.57217/aldhikra.v2i2.779.
A. Ghoni dan G. Saloom, “Idealisasi Metode Living Qur’An,” Himmah J. Kaji. Islam Kontemporer, vol. 5, no. 2, hlm. 413, 2021, doi: 10.47313/jkik.v5i2.1510.
G. Murtadlo, A. K. Khotimah, D. Alawiyah, E. Elviana, Y. C. Nugroho, dan Z. Ayuni, “Mendalami Living Qur’an: Analisis Pendidikan Dalam Memahami Dan Menghidupkan Al-Qur’An,” Pandu, vol. 1, no. 2, hlm. 112–118, 2023, doi: 10.59966/pandu.v1i2.206.
I. Irawan, “Al-Tawassut Waal-I‘tidal: Menjawab Tantangan Liberalisme Dan Konservatisme Islam,” Afkaruna, vol. 14, no. 1, 2018, doi: 10.18196/aiijis.2018.0080.49-74.
A. Fauzan, D. Muriyatmoko, dan S. N. Utama, “Penerapan Teknologi Augmented Reality Pada Media Pembelajaran Bahasa Arab: Durus Al-Lughah Jilid 1,” Elem. Sch. Educ. J. J. Pendidik. Dan Pembelajaran Sekol. Dasar, vol. 4, no. 1, hlm. 63, 2020, doi: 10.30651/else.v4i1.4379.
A. Salida dan Z. Zulpina, “Keistimewaan Bahasa Arab Sebagai Bahasa Al-Quran Dan Ijtihadiyyah,” Sathar, vol. 1, no. 1, hlm. 23–33, 2023, doi: 10.59548/js.v1i1.40.
A. Atabik, “Teori Makna Dalam Struktur Linguistik Arab Perspektif Mufasir Masa Klasik,” J. Theol., vol. 31, no. 1, hlm. 65–86, 2020, doi: 10.21580/teo.2020.31.1.5631.
I. R. A. S dan Z. Zuraidah, “Optimasi Media Pembelajaran Untuk Meningkatkan Keterampilan Menulis Huruf Hijaiyah Pada Taman Pendidikan Al-Qur’an (TPQ),” Kontribusi J. Penelit. Dan Pengabdi. Kpd. Masy., vol. 2, no. 1, hlm. 46–55, 2021, doi: 10.53624/kontribusi.v2i1.62.
E. Y. Manurung dan S. Nasution, “Penggunaan Kitab Al-Qira’atur Ar-Rasyidah Dalam Melatih Kemampuan Penerjemahan Siswa Kelas XII Agama MAS Tafhizil Qur’an Islamic Center Medan,” J. Educ. Res., vol. 4, no. 3, hlm. 1212–1221, 2023, doi: 10.37985/jer.v4i3.377.
R. Muhammad dkk., “Literasi Hukum: Pembagian Warisan Berdasarkan Kaidah Hukum Islam,” Joehr, vol. 1, no. 1, hlm. 28–36, 2024, doi: 10.34304/joehr.v1i1.207.
M. Ridwan, “Membuka Wawasan Keislaman: Kebermaknaan Bahasa Arab Dalam Pemahaman Islam,” Jazirah J. Perad. Dan Kebud., vol. 4, no. 2, hlm. 102–115, 2023, doi: 10.51190/jazirah.v4i2.100.
R. Huang, “Design and Implementation of English Writing Aids Based on Natural Language Processing,” Jes, vol. 20, no. 6s, hlm. 2178–2187, 2024, doi: 10.52783/jes.3132.
A. H. Nasution dan A. Onan, “ChatGPT Label: Comparing the Quality of Human-Generated and LLM-Generated Annotations in Low-Resource Language NLP Tasks,” Ieee Access, vol. 12, hlm. 71876–71900, 2024, doi: 10.1109/access.2024.3402809.
J. Peng, “A Comprehensive Review of the Application of NLP Technology in Language Learning,” Appl. Comput. Eng., vol. 92, no. 1, hlm. 163–168, 2024, doi: 10.54254/2755-2721/92/20241735.
Y.-X. Yu, Y. Guan, dan Y. Hu, “Natural Language Processing Applications in Social Network Analysis: A Data Mining Approach,” J. Phys. Conf. Ser., vol. 2813, no. 1, hlm. 012009, 2024, doi: 10.1088/1742-6596/2813/1/012009.
A. M. Wahid, T. Turino, K. A. Nugroho, T. S. Maharani, D. Darmono, dan F. S. Utomo, “Optimasi Logistic Regression dan Random Forest untuk Deteksi Berita Hoax Berbasis TF-IDF,” J. Pendidik. Dan Teknol. Indones., vol. 4, no. 8, Art. no. 8, 2024, doi: 10.52436/1.jpti.602.
S. Khan, I. Qasim, W. Khan, K. Aurangzeb, J. A. Khan, dan M. S. Anwar, “A Novel Transformer Attention?based Approach for Sarcasm Detection,” Expert Syst., vol. 42, no. 1, 2024, doi: 10.1111/exsy.13686.
M. Fajri, “Dynamics of the Study of the Quran in Indonesia: Language and Paradigm,” Islam Transform. J. Islam. Stud., vol. 5, no. 1, hlm. 59, 2021, doi: 10.30983/it.v5i1.4130.
D. AbuZeina dan T. M. Abdalbaset, “Exploring the Performance of Tagging for the Classical and the Modern Standard Arabic,” Adv. Fuzzy Syst., vol. 2019, hlm. 1–10, 2019, doi: 10.1155/2019/6254649.
H. M. Abdelaal, A. M. Ahmed, W. Ghribi, dan H. Youness, “Knowledge Discovery in the Hadith According to the Reliability and Memory of the Reporters Using Machine Learning Techniques,” Ieee Access, vol. 7, hlm. 157741–157755, 2019, doi: 10.1109/access.2019.2944118.
N. J. Ibrahim, M. Y. I. Idris, Z. M. Yusoff, N. N. A. Rahman, dan M. I. Dien, “Robust Feature Extraction Based on Spectral and Prosodic Features for Classical Arabic Accents Recognition,” Malays. J. Comput. Sci., hlm. 46–72, 2019, doi: 10.22452/mjcs.sp2019no3.4.
A. M. Alashqar, “A Classification of Quran Verses Using Deep Learning,” Int. J. Comput. Digit. Syst., vol. 15, no. 1, hlm. 1041–1053, 2024, doi: 10.12785/ijcds/160176.
W. Darmalaksana, “Studi Penggunaan Analisis Pendekatan Ilmu-Ilmu Sosial Dalam Penelitian Hadis Metode Syarah,” Khazanah Sos., vol. 2, no. 3, hlm. 155–166, 2020, doi: 10.15575/ks.v2i3.9599.
F. Fitriani, “Fungsi, Kategori, Dan Peran Sintaksis Bahasa Arab: Perspektif Linguistik Modern,” El-Fakhru, vol. 1, no. 1, hlm. 180–212, 2023, doi: 10.46870/iceil.v1i1.473.
A. Hadiyanto, C. Samitri, dan S. M. Ulfah, “Model Pembelajaran Bahasa Arab Multiliterasi Berbasis Kearifan Lokal Dan Moderasi Islam Di Perguruan Tinggi Negeri,” Hayula Indones. J. Multidiscip. Islam. Stud., vol. 4, no. 1, hlm. 117–140, 2020, doi: 10.21009/004.01.07.
S. Syandri, E. Halid, dan A. R. Sakka, “K.H. Lanre Said View in Takbir Zawaid (A Criticical Hadith),” Al-Risal., vol. 14, no. 1, hlm. 194–210, 2023, doi: 10.34005/alrisalah.v14i1.2437.
A. Abdullahi, N. Samsudin, A. Mustapha, dan S. Khalid, “Automating Quranic Verses Labeling Using Machine Learning Approach,” Indones. J. Electr. Eng. Comput. Sci., vol. 16, no. 2, hlm. 925, 2019, doi: 10.11591/ijeecs.v16.i2.pp925-931.
T. M. T. Sembok dan B. M. Abuata, “Arabic Stop Words for Information Retrieval Systems,” Int. J. Relig., vol. 6, no. 1, hlm. 121–127, 2025, doi: 10.61707/k7rnm813.
A. A. Badawy, “Topic Discovery in the Digital Quran: A Text Mining Approach,” J. Inf. Syst. Eng. Manag., vol. 10, no. 18s, hlm. 642–649, 2025, doi: 10.52783/jisem.v10i18s.2976.
I. Budiman, M. R. Faisal, dan D. T. Nugrahadi, “Studi Ekstraksi Fitur Berbasis Vektor Word2Vec pada Pembentukan Fitur Berdimensi Rendah,” J. Komputasi, vol. 8, no. 1, Art. no. 1, Apr 2020, doi: 10.23960/komputasi.v8i1.2517.
Y. Purwati, F. S. Utomo, N. Trinarsih, dan H. Hidayatulloh, “Feature Selection Technique to Improve the Instances Classification Framework Performance for Quran Ontology,” Int. J. Inform. Vis., vol. 7, no. 2, hlm. 615–620, 2023, doi: 10.30630/joiv.7.2.1195.
M. Hasanudin, S. Dwiasnati, dan W. Gunawan, “Pelatihan Datascience pada Pra-Pemrosesan Data untuk Siswa SMK Media Informatika - Jakarta:,” J. Pengabdi. Pada Masy., vol. 9, no. 4, Art. no. 4, Nov 2024, doi: 10.30653/jppm.v9i4.921.
P.-O. Côté, A. Nikanjam, N. Ahmed, D. Humeniuk, dan F. Khomh, “Data cleaning and machine learning: a systematic literature review,” Autom. Softw. Eng., vol. 31, no. 2, hlm. 54, 2024, doi: 10.1007/s10515-024-00453-w.
F. Deny Elfianita, O. Virgantara Putra, T. Harmini, dan A. Trisnani, “Klasifikasi Teks Terjemahan Ayat Al-Qur’an dalam Bahasa Indonesia dengan Machine Learning Classification of Translated Texts of Al-Qur’an Verses in Indonesian with Machine Learning,” Semin. Nas. Has. Penelit. Pengabdi. Masy. Bid. Ilmu Komput., hlm. 49–57, 2022.
O. Kononova, T. He, H. Huo, A. Trewartha, E. A. Olivetti, dan G. Ceder, “Opportunities and challenges of text mining in aterials research,” iScience, vol. 24, no. 3, hlm. 102155, 2021, doi: 10.1016/j.isci.2021.102155.
C. Chairunnisa, I. Ernawati, dan M. M. Santoni, “Klasifikasi Sentimen Ulasan Pengguna Aplikasi PeduliLindungi Di Google Play Menggunakan Algoritma Support Vector Machine Dengan Seleksi Fitur Chi-Square,” Inform. J. Ilmu Komput., vol. 18, no. 1, hlm. 69, 2022, doi: 10.52958/iftk.v17i4.4594.
M. Tsani, A. P. G. Rupaka, L. Asmoro, dan B. Pradana, “Analisis Sentimen Review Transportasi Menggunakan Algoritma Support Vector Machine Berbasis Chi Square,” Smart Comp Jurnalnya Orang Pint. Komput., vol. 9, no. 1, hlm. 35–39, 2020, doi: 10.30591/smartcomp.v9i1.1817.
T. A. Y. Siswa, “Komparasi Optimasi Chi-Square, CFS, Information Gain Dan ANOVA Dalam Evaluasi Peningkatan Akurasi Algoritma Klasifikasi Data Performa Akademik Mahasiswa,” Inform. Mulawarman J. Ilm. Ilmu Komput., vol. 18, no. 1, hlm. 62, 2023, doi: 10.30872/jim.v18i1.11330.
A. Rahmadeyan dan M. Mustakim, “Seleksi Fitur Pada Supervised Learning: Klasifikasi Prestasi Belajar Mahasiswa Saat Dan Pasca Pandemi COVID-19,” J. Nas. Teknol. Dan Sist. Inf., vol. 9, no. 1, hlm. 21–32, 2023, doi: 10.25077/teknosi.v9i1.2023.21-32.
J. Suntoro dan C. N. Indah, “Average Weight Information Gain Untuk Menangani Data Berdimensi Tinggi Menggunakan Algoritma C4.5,” J. Buana Inform., vol. 8, no. 3, 2017, doi: 10.24002/jbi.v8i3.1315.
C. F. Suharno, M. A. Fauzi, dan R. S. Perdana, “Klasifikasi Teks Bahasa Indonesia Pada Dokumen Pengaduan Sambat Online Menggunakan Metode K-Nearest Neighbors Dan Chi-Square,” Syst. Inf. Syst. Inform. J., vol. 3, no. 1, hlm. 25–32, 2017, doi: 10.29080/systemic.v3i1.191.
S. Mutmainah, “Kemungkinan Depresi Dari Postingan Pada Sosial Media,” Snati, vol. 1, no. 2, 2022, doi: 10.20885/snati.v1i2.11.
I. F. Yuliati, S. Wulandary, dan P. R. Sihombing, “Penerapan Metode SVM Dan BPNN Dalam Pengklasifikasian PUS Di Jawa Barat,” J. Stat. Dan Apl., vol. 4, no. 1, hlm. 23–34, 2020, doi: 10.21009/jsa.04103.
T. Sugihartono dan R. R. C. Putra, “Penerapan Metode Support Vector Machine Dalam Classifikasi Ulasan Pengguna Aplikasi Mobile Jkn,” SKANIKA Sist. Komput. Dan Tek. Inform., vol. 7, no. 2, hlm. 144–153, 2024, doi: 10.36080/skanika.v7i2.3193.
S. F. Hussain, H. Z.-U.-D. Babar, A. Khalil, R. M. Jillani, M. Hanif, dan K. Khurshid, “A Fast Non-Redundant Feature Selection Technique for Text Data,” IEEE Access, vol. 8, hlm. 181763–181781, 2020, doi: 10.1109/ACCESS.2020.3028469.
R. K. Putri dan M. Athoillah, “Support Vector Machine Untuk Identifikasi Berita Hoax Terkait Virus Corona (Covid-19),” J. Inform. J. Pengemb. It, vol. 6, no. 3, hlm. 162–167, 2021, doi: 10.30591/jpit.v6i3.2489.
S. Chukhanov dan N. Kairbekov, “The importance of a semantic approach in understanding the texts of the Holy Quran and Sunnah,” Pharos J. Theol., vol. 105, no. 3, Jun 2024, doi: 10.46222/pharosjot.105.36.