Perancangan Model Pengenalan Emosi Berbasis Teks Berbahasa Inggris Menggunakan Lima Algoritma Klasifikasi Machine Learning
DOI:
https://doi.org/10.52436/1.jpti.1084Kata Kunci:
klasifikasi teks, machine learning, text emotion recognition, TF-IDFAbstrak
Saat ini, interaksi melalui platform teks marak dilakukan seperti media sosial, layanan pelanggan daring, dan forum diskusi. Oleh karena itu analisis Text Emotion Recognition (TER) menjadi sangat krusial. Namun, emosi dalam teks bersifat kompleks, kontekstual, dan sering kali bersifat implisit, sehingga tidak dapat dengan mudah diidentifikasi menggunakan pendekatan konvensional. TER merupakan proses identifikasi dan klasifikasi emosi dalam teks secara otomatis menggunakan teknik machine learning. Penelitian ini bertujuan untuk merancang model pengklasifikasian emosi berbasis teks menggunakan berbagai algoritma classification machine learning. Data teks dikategorikan ke dalam enam emosi utama: sadness, joy, love, anger, fear, dan surprise. Tahapan preprocessing meliputi tokenisasi, stop word removal, dan lemmatization, sedangkan fitur teks direpresentasikan dalam bentuk numerik menggunakan Term Frequency-Inverse Document Frequency (TF-IDF). Lima algoritma machine learning, yaitu Support Vector Machine (SVM), K-Nearest Neighbor (KNN), Random Forest, Logistic Regression, dan Multinomial Naïve Bayes, digunakan dalam pelatihan dan evaluasi model. Hasil penelitian menunjukkan bahwa model SVM dan Random Forest memberikan performa terbaik dengan akurasi mencapai 85% pada data uji. Dengan demikian, pendekatan machine learning, khususnya SVM dan Random Forest, terbukti efektif dalam klasifikasi teks emosi dan dapat diterapkan dalam berbagai aplikasi analisis sentimen. Model TER hasil eksperimental akan dilanjutkan untuk diimplementasikan pada aplikasi penanganan psikologis korban kekerasan berbasis gender (KBG) yang telah dibangun pada penelitian sebelumnya.
Unduhan
Referensi
S. K. Bharti et al., “Text-Based Emotion Recognition Using Deep Learning Approach,” Comput. Intell. Neurosci., vol. 2022, pp. 1–8, Aug. 2022, doi: 10.1155/2022/2645381.
N. Ashraf, L. Khan, S. Butt, H.-T. Chang, G. Sidorov, and A. Gelbukh, “Multi-label emotion classification of Urdu tweets,” PeerJ Comput. Sci., vol. 8, p. e896, Apr. 2022, doi: 10.7717/peerj-cs.896.
M. J. Al Dujaili, A. Ebrahimi-Moghadam, and A. Fatlawi, “Speech emotion recognition based on SVM and KNN classifications fusion,” Int. J. Electr. Comput. Eng. IJECE, vol. 11, no. 2, p. 1259, Apr. 2021, doi: 10.11591/ijece.v11i2.pp1259-1264.
S. Hamsa, Y. Iraqi, I. Shahin, and N. Werghi, “An Enhanced Emotion Recognition Algorithm Using Pitch Correlogram, Deep Sparse Matrix Representation and Random Forest Classifier,” IEEE Access, vol. 9, pp. 87995–88010, 2021, doi: 10.1109/ACCESS.2021.3086062.
L. Efrizoni, S. Defit, M. Tajuddin, and A. Anggrawan, “Komparasi Ekstraksi Fitur dalam Klasifikasi Teks Multilabel Menggunakan Algoritma Machine Learning,” MATRIK J. Manaj. Tek. Inform. Dan Rekayasa Komput., vol. 21, no. 3, pp. 653–666, Jul. 2022, doi: 10.30812/matrik.v21i3.1851.
A. Desiani et al., “Perbandingan Klasifikasi Penyakit Kanker Paru-Paru menggunakan Support Vector Machine dan K-Nearest Neighbor,” J. Process., vol. 18, no. 1, Apr. 2023, doi: 10.33998/processor.2023.18.1.700.
M. Sari and G. Mahalisa, “Naive Bayes Classifier Untuk Deteksi Email Spam,” Technol. J. Ilm., vol. 15, no. 4, p. 675, Oct. 2024, doi: 10.31602/tji.v15i4.15944.
R. F. P. Pratama and W. Maharani, “Comparative Analysis of Naive Bayes and SVM for Improved Emotion Classification on Social Media,” Edumatic J. Pendidik. Inform., vol. 9, no. 1, pp. 11–20, Apr. 2025, doi: 10.29408/edumatic.v9i1.29087.
R. A. Nugroho and I. Cholissodin, “Implementasi Naïve Bayes Classifier untuk Klasifikasi Emosi Tweet Berbahasa Indonesia pada Spark,” J. Pengemb. Teknol. Inf. Dan Ilmu Komput., vol. 5, no. 1, pp. 301–310, Jan. 2021.
D. Septiani and I. Isabela, “ANALISIS TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) DALAM TEMU KEMBALI INFORMASI PADA DOKUMEN TEKS,” vol. 1, no. 2, pp. 81–88, 2022.
W. Agastya and Aripin, “Pemetaan Emosi Dominan pada Kalimat Majemuk Bahasa Indonesia Menggunakan Multinomial Naïve Bayes,” J. Nas. Tek. Elektro Dan Teknol. Inf., vol. 9, no. 2, pp. 171–179, May 2020, doi: 10.22146/jnteti.v9i2.157.
N. Fathirachman Mahing, A. Lazuardi Gunawan, A. Foresta Azhar Zen, F. Abdurrachman Bachtiar, and S. Agung Wicaksono, “Klasifikasi Tingkat Stress dari Data Berbentuk Teks dengan Menggunakan Algoritma Support Vector Machine (SVM) dan Random Forest,” J. Teknol. Inf. Dan Ilmu Komput., vol. 11, no. 5, pp. 1067–1076, Oct. 2024, doi: 10.25126/jtiik.1078010.
A. Zamsuri, S. Defit, and G. W. Nurcahyo, “Classification of Multiple Emotions in Indonesian Text Using The K-Nearest Neighbor Method,” J. Appl. Eng. Technol. Sci. JAETS, vol. 4, no. 2, pp. 1012–1021, Jun. 2023, doi: 10.37385/jaets.v4i2.1964.
F. Basbeth and D. H. Fudholi, “Klasifikasi Emosi Pada Data Text Bahasa Indonesia Menggunakan Algoritma BERT, RoBERTa, dan Distil-BERT,” J. MEDIA Inform. BUDIDARMA, vol. 8, no. 2, p. 1160, Apr. 2024, doi: 10.30865/mib.v8i2.7472.
R. Nanda, E. Haerani, S. K. Gusti, and S. Ramadhani, “Klasifikasi Berita Menggunakan Metode Support Vector Machine,” J. Nas. Komputasi Dan Teknol. Inf. JNKTI, vol. 5, no. 2, pp. 269–278, Apr. 2022, doi: 10.32672/jnkti.v5i2.4193.
E. I. Setiawan, S. Johanes, A. T. Hermawan, and Y. Yamasari, “Deteksi Validitas Berita pada Media Sosial Twitter dengan Algoritma Naive Bayes,” J. Intell. Syst. Comput., vol. 3, no. 2, pp. 55–60, Oct. 2021, doi: 10.52985/insyst.v3i2.164.
I. M. Karo Karo, R. Romia, S. Dewi, and P. M. Fadilah, “Hoax Detection on Indonesian Tweets using Naïve Bayes Classifier with TF-IDF,” J. Inf. Syst. Res. JOSH, vol. 4, no. 3, pp. 914–919, Apr. 2023, doi: 10.47065/josh.v4i3.3317.
D. H. Bangkalang, N. Setiyawati, R. Tanone, H. P. Chernovita, and Y. T. B. Tacoh, “A REQUIREMENT ENGINEERING IN REPORTING AND COUNSELING-BASED ASSISTANCE APPLICATION FOR VICTIMS OF VIOLENCE AGAINST WOMEN,” J. Ris. Inform., vol. 3, no. 4, pp. 311–318, Sep. 2021, doi: 10.34288/jri.v3i4.256.
“Emotion Dataset for Emotion Recognition Tasks.” Accessed: Nov. 07, 2024. [Online]. Available: https://www.kaggle.com/datasets/parulpandey/emotion-dataset
K. Ciptady, M. Harahap, J. Jonvin, Y. Ndruru, and I. Ibadurrahman, “Prediksi Kualitas Kopi Dengan Algoritma Random Forest Melalui Pendekatan Data Science,” Data Sci. Indones. DSI, vol. 2, no. 1, Sep. 2022, doi: 10.47709/dsi.v2i1.1708.
L. K. Ramasamy, S. Kadry, Y. Nam, and M. N. Meqdad, “Performance analysis of sentiments in Twitter dataset using SVM models,” Int. J. Electr. Comput. Eng. IJECE, vol. 11, no. 3, p. 2275, Jun. 2021, doi: 10.11591/ijece.v11i3.pp2275-2284.
A. B. P. Negara, H. Muhardi, and F. Sajid, “Perbandingan Algoritma Klasifikasi terhadap Emosi Tweet Berbahasa Indonesia,” J. Edukasi Dan Penelit. Inform. JEPIN, vol. 7, no. 2, p. 242, Aug. 2021, doi: 10.26418/jp.v7i2.48198.
D. N. I. Huda, C. Prianto, and R. M. Awangga, “ANALISIS SENTIMEN PERBANDINGAN LAYANAN JASA PENGIRIMAN KURIR PADA ULASAN PLAY STORE MENGGUNAKAN METODE DECISION TREE DAN RANDOM FOREST,” J. Ilm. Inform., vol. 11, no. 02, pp. 150–158, Sep. 2023, doi: 10.33884/jif.v11i02.7952.
L. Ketsbaia, B. Issac, X. Chen, and S. M. Jacob, “A Multi-Stage Machine Learning and Fuzzy Approach to Cyber-Hate Detection,” IEEE Access, vol. 11, pp. 56046–56065, 2023, doi: 10.1109/ACCESS.2023.3282834.
B. Wahyu Andrian, F. Adline Twince Tobing, I. Zuhdi Pane, and A. Kusnadi, “Implementation of Naïve Bayes Algorithm in Sentiment Analysis of Twitter Social Media Users Regarding Their Interest to Pay the Tax,” Int. J. Sci. Technol. Manag., vol. 4, no. 6, pp. 1733–1742, Nov. 2023, doi: 10.46729/ijstm.v4i6.1015.