Deteksi Anomali Polusi Udara Menggunakan Algoritma Isolation Forest tanpa Label pada Dataset Kualitas Udara Torino

Penulis

  • Reffi Amanda Sistem Informasi, Fakultas Teknologi Informasi, Institut Sains dan Bisnis Atma Luhur, Indonesia
  • Ellya Helmud Sistem Informasi, Fakultas Teknologi Informasi, Institut Sains dan Bisnis Atma Luhur, Indonesia
  • Chandra Kirana Teknik Informatika, Fakultas Teknologi Informasi, Institut Sains dan Bisnis Atma Luhur, Indonesia

DOI:

https://doi.org/10.52436/1.jpti.950

Kata Kunci:

deteksi anomali, isolation forest, machine learning, polusi udara, unsupervised learning

Abstrak

Polusi udara merupakan masalah masalah lingkungan yang berdampak langsung pada Kesehatan dan kualitas hidup manusia. Tujuan dari penelitian ini adalah untuk menggunakan algoritma Isolation Forest berbasis Unsupervised Learning, untuk menemukan anomali dalam data kualitas udara dan mengetahui situasi yang tidak normal dengan cepat dan akurat tanpa memerlukan label. Isolation forest dipilih karena efisien dalam menangani data yang besar dan bekerja dengan cepat dalam ruang fitur tinggi dibandingkan dengan algoritma yang lain. Penelitian ini mengimplementasikan algoritma isolation forest untuk dilakukannya identifikasi outlier pada data kualitas udara, khususnya parameter karbon monoksida (CO), nitrogen dioksida (NO?), nitrogen oksida (Nox), dan benzene (C6H6) dari dataset UCI Air Quality. Penelitian ini dilakukan dengan studi literatur, pengumpulan data, preprocessing (pembersihan data dan penanganan nilai hilang), analisis eksploratif, implementasi algoritma, serta visualisasi hasil. Hasilnya, dari total 9357 data, terdeteksi 468 anomali (5%) dengan karakteristik lonjakan nilai ekstrim seperti CO 8.1 mg/m³ dan NO? 187 µg/m³. Visualisasi grafik temporal dan boxplot memperkuat penelitian ini, dengan menunjukkan distribusi anomali yang tersebar. Sehingga, pendekatan ini bisa digunakan sebagai sistem peringatan dini terhadap lonjakan polusi udara yang berbahaya, sehingga berkontribusi dalam sistem monitoring kualitas udara otomatis yang lebih adaptif dan real-time.

Unduhan

Data unduhan belum tersedia.

Biografi Penulis

Reffi Amanda, Sistem Informasi, Fakultas Teknologi Informasi, Institut Sains dan Bisnis Atma Luhur, Indonesia

Sistem Informasi, Fakultas Teknologi Informasi, Institut Sains dan Bisnis Atma Luhur

Ellya Helmud, Sistem Informasi, Fakultas Teknologi Informasi, Institut Sains dan Bisnis Atma Luhur, Indonesia

Sistem Informasi, Fakultas Teknologi Informasi, Institut Sains dan Bisnis Atma Luhur

Chandra Kirana, Teknik Informatika, Fakultas Teknologi Informasi, Institut Sains dan Bisnis Atma Luhur, Indonesia

Teknik Informatika, Fakultas Teknologi Informasi, Institut Sains dan Bisnis Atma Luhur

Referensi

F. S. M. Darmawan, I. Cholissodin, and P. P. Adikara, “Klasifikasi pengaruh polusi udara di indonesia terhadap kesehatan menggunakan algoritme lernel modified k-nearest neighbor,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 6, no. 6, pp. 2617–2624, 2022, [Online]. Available: https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/11131

R. Abrol, “AI-Powered Anomaly Detection in Air Pollution for Smart Environmental Monitoring,” Indian J. Artif. Intell. Neural Netw., vol. 7626, no. 3, pp. 1–5, 2025, doi: 10.54105/ijainn.C1098.05030425.

World Health Organization, “WHO global air quality guidelines: Particulate matter (PM2.5 and PM10), ozone, nitrogen dioxide, sulfur dioxide and carbon monoxide. Executive summary,” World Health Organization, 2021. [Online]. Available: https://apps.who.int/iris/handle/10665/345329

IPCC, “Section 4: Near-Term Responses in a Changing Climate,” 2023. doi: 10.59327/IPCC/AR6-9789291691647.

A. Durga, V. Madhav, A. Sravan Kumar, A. Gargeya, A. Vinod, and V. Ragavarthini, “EasyChair Preprint Anomaly Detection in Air Quality Monitoring Networks Anomaly Detection in Air Quality Monitoring Networks,” EasyChair Prepr., 2024, [Online]. Available: https://easychair.org/publications/preprint/ZtlC

J. Park, Y. Seo, and J. Cho, “Unsupervised outlier detection for time-series data of indoor air quality using LSTM autoencoder with ensemble method,” J. Big Data, vol. 10, no. 1, 2023, doi: 10.1186/s40537-023-00746-z.

F. Nejjari, R. Pérez, and V. Puig, “Quality monitoring,” Adv. Ind. Control, no. 9783319507507, pp. 131–152, 2023, doi: 10.1007/978-3-319-50751-4_8.

E. F. Agyemang, “Anomaly detection using unsupervised machine learning algorithms: A simulation study,” Sci. African, vol. 26, p. e02386, 2024, doi: 10.1016/j.sciaf.2024.e02386.

I. Forest and T. I. Forest, “Isolation Forest Model for Anomaly Detection in Perpetual Inventory Systems,” Int. J. Sci. Dev. Res., vol. 10, no. 2, pp. 155–170, 2025, [Online]. Available: https://ijsdr.org/papers/IJSDR2502020.pdf

A. Agung, I. Ngurah, and E. Karyawati, “Identifikasi anomali keamanan server nginx menggunakan algoritma isolation forest,” JATI (Jurnal Mhs. Tek. Inform., vol. 9, no. 2, pp. 2465–2471, 2025, doi: 10.36040/jati.v9i2.13110.

A. Zulfikar, F. A. Rahmani, N. Azizah, D. J. Perbendaharaan, K. Keuangan, and P. Pinang, “Deteksi Anomali Menggunakan Isolation Forest Belanja Barang Persediaan Konsumsi Pada Satuan Kerja Kepolisian Republik Indonesia,” J. Manaj. Perbendaharaan, vol. 4, no. 1, pp. 1–15, 2023, doi: 10.33105/jmp.v4i1.435.

P. Saeipourdizaj, P. Sarbakhsh, and A. Gholampour, “Application of imputation methods for missing values of pm10 and o3 data: Interpolation, moving average and k-nearest neighbor methods,” Environ. Heal. Eng. Manag., vol. 8, no. 3, pp. 215–226, 2021, doi: 10.34172/EHEM.2021.25.

N. Mejri, L. Lopez-Fuentes, K. Roy, P. Chernakov, E. Ghorbel, and D. Aouada, “Unsupervised anomaly detection in time-series: An extensive evaluation and analysis of state-of-the-art methods,” Expert Syst. Appl., vol. 256, no. July 2023, p. 124922, 2024, doi: 10.1016/j.eswa.2024.124922.

A. Wijayanto, A. Sugiharto, and R. Santoso, “Identifikasi Dini Curah Hujan Berpotensi Banjir Menggunakan Algoritma Long Short-Term Memory (Lstm) Dan Isolation Forest,” J. Teknol. Inf. dan Ilmu Komput., vol. 11, no. 3, pp. 637–646, 2024, doi: 10.25126/jtiik.938718.

F. Putra, H. F. Tahiyat, R. M. Ihsan, R. Rahmaddeni, and L. Efrizoni, “Penerapan Algoritma K-Nearest Neighbor Menggunakan Wrapper Sebagai Preprocessing untuk Penentuan Keterangan Berat Badan Manusia,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 4, no. 1, pp. 273–281, 2024, doi: 10.57152/malcom.v4i1.1085.

Y. Wang and L. Singh, “Analyzing the impact of missing values and selection bias on fairness,” Int. J. Data Sci. Anal., vol. 12, no. 2, pp. 101–119, 2021, doi: 10.1007/s41060-021-00259-z.

A. Fitrianto, A. Kholifatunnisa, and A. Kurnia, “Comparing Outlier Detection Methods?: An Application on Indonesian Air Quality Data,” J. Mat. Murni dan Apl., vol. 9, no. 2, pp. 341–351, 2024, doi: http://dx.doi.org/10.18860/ca.v9i2.29434.

H. Xu, G. Pang, Y. Wang, and Y. Wang, “Deep Isolation Forest for Anomaly Detection,” IEEE Trans. Knowl. Data Eng., vol. 35, no. 12, pp. 12591–12604, 2023, doi: 10.1109/TKDE.2023.3270293.

K. A. Nugroho, T. Hariguna, A. S. Barkah, M. I. Komputer, U. A. Purwokerto, and U. A. Purwokerto, “Deteksi Anomali Trafik Jaringan dan Aktivitas Pengguna Menggunakan Isolation Forest untuk Meningkatkan Keamanan Jaringan Network Traffic and User Activity Anomaly Detection Using Isolation Forest to Improve Network Security,” J. Pendidik. dan Teknol. Indones., vol. 5, no. 5, pp. 1365–1376, 2025, doi: https://doi.org/10.52436/1.jpti.790.

Y. Cao, H. Xiang, H. Zhang, Y. Zhu, and K. M. Ting, “Anomaly Detection Based on Isolation Mechanisms: A Survey,” arXiv, vol. 1, no. 1, p. 10, 2024, doi: https://doi.org/10.1007/s11633-025-1554-4.

H. Xiang et al., “OptIForest: Optimal Isolation Forest for Anomaly Detection,” IJCAI Int. Jt. Conf. Artif. Intell., vol. 2023-Augus, pp. 2379–2387, 2023, doi: 10.24963/ijcai.2023/264.

M. Almansoori and M. Telek, “Anomaly Detection using combination of Autoencoder and Isolation Forest,” ResearchGate, no. February, pp. 25–30, 2023, doi: 10.3311/wins2023-005.

G. Hannák, G. Horváth, A. Kádár, and M. D. Szalai, “Bilateral-Weighted Online Adaptive Isolation Forest for anomaly detection in streaming data,” Stat. Anal. Data Min., vol. 16, no. 3, pp. 215–223, 2023, doi: 10.1002/sam.11612.

T. F. Schindler, S. Schlicht, and K. D. Thoben, “Towards Benchmarking for Evaluating Machine Learning Methods in Detecting Outliers in Process Datasets,” Computers, vol. 12, no. 12, pp. 1–18, 2023, doi: 10.3390/computers12120253.

##submission.downloads##

Diterbitkan

2025-09-22

Cara Mengutip

Amanda, R., Helmud, E. ., & Kirana, C. . (2025). Deteksi Anomali Polusi Udara Menggunakan Algoritma Isolation Forest tanpa Label pada Dataset Kualitas Udara Torino. Jurnal Pendidikan Dan Teknologi Indonesia, 5(9), 2719-2729. https://doi.org/10.52436/1.jpti.950