Abstract
<jats:p xml:lang="tr">Hava kirliliği, günümüzde çevre ve halk sağlığı açısından önemli bir tehdit oluşturmaktadır ve özellikle iç ortamlarda maruziyetin sürekli olması riskleri artırmaktadır. Bu nedenle, iç ortam hava kalitesinin güvenilir biçimde izlenmesi ve tahmin edilmesi büyük önem taşımaktadır. Bu çalışmada, iç ortam hava kirliliğine neden olan CO, NH3, NO2 ve PM2.5 kirleticilerinin tahmini amacıyla Karar Ağaçları, Rastgele Orman, Destek Vektör Makineleri, Doğrusal Regresyon, Yapay Sinir Ağları ve bu modellerin ağırlıklandırılmasıyla oluşturulan hibrit model karşılaştırmalı olarak değerlendirilmiştir. Çalışmada, Mendeley kütüphanesinde yer alan “Dataset of Indoor Air Pollutants using Low-Cost Sensor” veri seti kullanılmıştır. Veriler, kronolojik yapı korunarak %70 eğitim ve %30 test olacak şekilde ayrılmış; tüm modellerin hiperparametreleri yalnızca eğitim verisi üzerinde uygulanan 5-katlı çapraz doğrulama ve sistematik grid arama yöntemiyle optimize edilmiştir. Model performansları RMSE, MSE, MAE ve R^2 metrikleri ile değerlendirilmiş, yöntemler arasındaki farkların istatistiksel anlamlılığı Friedman ve Wilcoxon testleri ile analiz edilmiştir. Sonuçlar, CO değişkeni için hibrit modelin en dengeli ve başarılı yöntemi sunduğunu, NH3, NO2 ve özellikle PM2.5 değişkenlerinde ise tüm yöntemlerin test seti üzerinde sınırlı başarım sergilediğini göstermektedir. Bununla birlikte, hibrit modelin tüm kirleticiler için tekil modellere kıyasla daha tutarlı hata dağılımları ürettiği ve istatistiksel olarak anlamlı performans farkları sağladığı ortaya konmuştur.</jats:p>