Perbandingan Algoritma Generalized Linear Model Dan Linear Regression Untuk Prediksi Hujan Berbasis Data Kaggle
DOI:
https://doi.org/10.52436/1.jpti.967Kata Kunci:
Curah Hujan, Evaluasi Model, Generalized Linear Model, Linear Regression, Machine Learning, Prediksi Hujan, Preprocessing DataAbstrak
Prediksi curah hujan sangat penting bagi berbagai aktivitas yang dipengaruhi kondisi cuaca, khususnya di negara beriklim tropis mengalami kondisi ini secara signifikan. Prediksi curah hujan yang akurat sangat penting untuk mendukung berbagai aspek perencanaan kota, termasuk pengelolaan sumber daya air dan mitigasi risiko bencana banjir. Penelitian ini membandingkan dua algoritma machine learning, Generalized Linear Model (GLM) dan Linear Regression, dalam memprediksi curah hujan berdasarkan fitur cuaca seperti suhu, kelembaban, tekanan, angin, tutupan awan, dan data historis. Selanjutnya diproses melalui encoding yang dimana akan mengubah nilai kategorikal menjadi nilai numerik, normalisasi yang melibatkan penyesuaian ulang nilai nilai dalam dataset, dan penanganan class imbalance untuk melakukan duplikasi sample pada kelas minotitas. Setelah dibagi menjadi data latih dan uji, kedua algoritma diterapkan dan dievaluasi menggunakan akurasi, RMSE, dan MAE. Hasilnya, GLM memiliki akurasi sebesar 90.17% lalu untuk RMSE sebesar 0.3949 dan MAE 0.3836, se dangkan Linear Regression lebih baik dalam nilai MAE sebesar 0.2656 dan RMSE 0.3218 untuk akurasi sebesar 89.26%. Dengan pendekatan analisis yang tepat, pola tersebut dapat dimanfaatkan untuk mendukung keputusan dan perencanaan secara lebih terarah.
Unduhan
Referensi
D. A. H. Panggabean, F. M. Sihombing, and N. M. Aruan, “Prediksi Tinggi Curah Hujan Dan Kecepatan Angin Berdasarkan Data Cuaca Dengan Penerapan Algoritma Artificial Neural Network (Ann),” PROSIDING SEMINASTIKA, vol. 3, no. 1, pp. 1–7, 2021.
I. Farisi, J. Shadiq, W. Priyadi, D. Maulana, A. Acep, and S. F. Gusril, “Penerapan Model Recurrent Neural Network (RNN) untuk Prediksi Curah Hujan Berbasis Data Historis,” INFORMATION SYSTEM FOR EDUCATORS AND PROFESSIONALS: Journal of Information System, vol. 9, no. 2, pp. 217–226, 2024.
R. Tanjung, A. Listiani, and F. Lestari, “Prediksi Multivariate Time Series Parameter Cuaca Menggunakan Long Short-Term Memory (LSTM),” in PROSIDING SEMINAR NASIONAL SAINS DATA, 2024, pp. 445–456.
D. Safitri, S. S. Hilabi, and F. Nurapriani, “Analisis Penggunaan Algoritma Klasifikasi Dalam Prediksi Kelulusan Menggunakan Orange Data Mining,” RABIT: Jurnal Teknologi dan Sistem Informasi Univrab, vol. 8, no. 1, pp. 75–81, 2023.
T. Rohana, E. Nurlaelasari, E. E. Awal, and H. Y. Novita, “Kajian Model Jaringan Syaraf Tiruan Untuk Memprediksi Secara Dini Tingkat Kelulusan Mahasiswa,” Technologia: Jurnal Ilmiah, vol. 15, no. 4, pp. 629–640, 2024.
N. Nursobah, S. Lailiyah, B. Harpad, and M. Fahmi, “Penerapan Data Mining Untuk Prediksi Perkiraan Hujan dengan Menggunakan Algoritma K-Nearest Neighbor,” Building Of Informatics, Technology And Science (Bits), vol. 4, no. 3, pp. 1395–1400, 2022.
S. Joses, D. Yulvida, and S. Rochimah, “Pendekatan Metode Ensemble Learning untuk Prakiraan Cuaca menggunakan Soft Voting Classifier,” Journal of Applied Computer Science and Technology, vol. 5, no. 1, pp. 72–80, 2024.
B. Susilo, Mengenal Iklim dan Cuaca di Indonesia. Diva Press, 2021.
S. A. Pratiwi, A. Fauzi, S. A. P. Lestari, and Y. Cahyana, “Prediksi Persediaan Obat Pada Apotek Menggunakan Algoritma Decision Tree,” KLIK: Kajian Ilmiah Informatika dan Komputer, vol. 4, no. 4, pp. 2381–2388, 2024.
D. Kurniawan, Pengenalan machine learning dengan python. Elex Media Komputindo, 2022.
A. M. Siregar, “Klasifikasi Untuk Prediksi Cuaca Menggunakan Esemble Learning,” Petir, vol. 13, no. 2, p. 522607, 2020.
G. A. Mursianto, I. M. Falih, M. Irfan, T. Sakinah, and D. S. Prasvita, “Perbandingan Metode Klasifikasi Random Forest dan XGBoost Serta Implementasi Teknik SMOTE pada Kasus Prediksi Hujan,” J. Senamika, vol. 2, no. 2, pp. 41–50, 2021.
R. M. Putra and N. A. Rani, “Prediksi Curah Hujan Harian di Stasiun Meteorologi Kemayoran Menggunakan Artificial Neural Network (ANN),” Buletin GAW Bariri (BGB), vol. 1, no. 2, pp. 101–108, 2020.
W. Y. Ambarita, S. Dur, and S. Harleni, “ANALISIS DIAGNOSTIK VARIABEL CUACA UNTUK ESTIMASI POLA CURAH HUJAN DI MEDAN MENGGUNAKAN MODEL BAYESIAN VECTOR AUTOREGRESSIVE,” Jurnal Lebesgue: Jurnal Ilmiah Pendidikan Matematika, Matematika dan Statistika, vol. 4, no. 3, pp. 1688–1701, 2023.
A. R. Juwita, T. Al Mudzakir, A. R. Pratama, B. Nugraha, and N. Heryana, “Penerapan Algoritma Apriori untuk Memprediksi Pembayaran UKT,” Syntax: Jurnal Informatika, vol. 13, no. 01, pp. 35–43, 2024.
A. F. Istianto, A. I. Hadiana, and F. R. Umbara, “Prediksi curah hujan menggunakan metode categorical boosting (Catboost),” JATI (Jurnal Mahasiswa Teknik Informatika), vol. 7, no. 4, pp. 2930–2937, 2023.
A. Suarisman, A. Nazir, F. Syafria, and L. Afriyanti, “PERBANDNGAN JARAK METRIK PADA KLASIFIKASI JAMUR BERACUN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR (K-NN),” PERBANDNGAN JARAK METRIK PADA KLASIFIKASI JAMUR BERACUN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR (K-NN), vol. 5, no. 1, pp. 10–19, 2023.
A. R. I. Pratama, S. A. Latipah, and B. N. Sari, “Optimasi klasifikasi curah hujan menggunakan support vector machine (svm) dan recursive feature elimination (rfe),” JIPI (Jurnal Ilmiah Penelitian dan Pembelajaran Informatika), vol. 7, no. 2, pp. 314–324, 2022.
F. H. Hamdanah and D. Fitrianah, “Analisis Performansi Algoritma Linear Regression dengan Generalized Linear Model untuk Prediksi Penjualan pada Usaha Mikra, Kecil, dan Menengah,” Jurnal Nasional Pendidikan Teknik Informatika: JANAPATI, vol. 10, no. 1, pp. 23–32, 2021.
D. S. Rahayu, J. Afifah, and S. Intan, “Classification of Diabetes Mellitus Using C4. 5 Algorithm, Support Vector Machine (SVM) and Linear Regression Klasifikasi Penyakit Diabetes Melitus Menggunakan Algoritma C4. 5, Support Vector Machine (SVM) dan Regresi Linear,” SENTIMAS Semin. Nas. Penelit. dan Pengabdi. Masy, vol. 1, no. 1, pp. 56–63, 2023.
L. Fatimah, M. Martanto, A. R. Dikananda, and A. Rifa’i, “ALGORITMA REGRESI LINEAR UNTUK PREDIKSI HASIL PANEN DAN STRATEGI PRODUKSI PADI DI KABUPATEN CIREBON,” Jurnal Informatika Teknologi dan Sains (Jinteks), vol. 7, no. 2, pp. 464–472, 2025.