Bu çalışma, araç fiyat tahmini problemine odaklanarak farklı makine öğrenmesi algoritmalarının performanslarını karşılaştırmakta ve sektöre yönelik stratejik öneriler sunulması amaçlamıştır. Lineer Regresyon, Ridge Regresyon, Lasso Regresyon, Karar Ağaçları, Rastgele Orman, Gradient Boosting, SVR, XGBoost, Multi-Layer Perceptron (MLP) ve Radyal Tabanlı Fonksiyon (RBF) modelleri Ocak 2022 ile Aralık 2023 dönemini kapsayan, araçlara ait marka, model, motor hacmi, fiyat gibi teknik özellikler ile müşteri bilgileri içeren 23.900 adet veri seti üzerinde test edilmiştir. Veri ön işleme aşamasında eksik veri doldurma, kategorik verilerin dönüştürülmesi ve aykırı değer analizi uygulanmıştır. Lasso Regresyon, %99 R² değeri ve düşük hata oranları ile en başarılı model olarak öne çıkmıştır. Rastgele Orman, Gradient Boosting ve MLP algoritmaları da %97 R² değerleri ile güçlü alternatifler arasında yer almıştır. Buna karşın, Karar Ağaçları, SVR ve XGBoost algoritmaları yüksek hata oranları ve düşük R² değerleri ile zayıf bir performans sergilemiştir. Sonuçlar, veri ön işleme süreçlerinin model başarısı üzerindeki kritik rolünü vurgulamaktadır. Makroekonomik göstergelerin modele entegrasyonu ve hiperparametre optimizasyonu tekniklerinin uygulanması, modellerin doğruluk ve genelleme kabiliyetlerini artırma potansiyeline sahiptir.
Araç Fiyat Tahmini Makine Öğrenmesi Regresyon Modelleri Tahmin Performansı Veri Analizi
This study focuses on the problem of vehicle price prediction and aims to compare the performance of various machine learning algorithms while offering strategic insights for the industry. Linear Regression, Ridge Regression, Lasso Regression, Decision Trees, Random Forest, Gradient Boosting, Support Vector Regression (SVR), XGBoost, Multi-Layer Perceptron (MLP), and Radial Basis Function (RBF) models were tested on a dataset comprising 23.900 records collected between January 2022 and December 2023. The dataset includes technical specifications of vehicles—such as brand, model, engine size, and price-as well as customer-related features. During the data preprocessing phase, missing values were imputed, categorical variables were encoded, and outlier analysis was conducted. Lasso Regression emerged as the most successful model, achieving an R² value of 0,99 and low error rates. Random Forest, Gradient Boosting, and MLP also demonstrated strong performance with R² values around 0,97. In contrast, Decision Trees, SVR, and XGBoost showed weaker results, characterized by higher error rates and lower R² values. The findings highlight the critical importance of data preprocessing in model performance. Moreover, the integration of macroeconomic indicators and the application of hyperparameter optimization techniques have the potential to further enhance model accuracy and generalizability.
Vehicle Price Prediction Machine Learning Regression Models Data Analysis Prediction Performance
Birincil Dil | Türkçe |
---|---|
Konular | İş Sistemleri (Diğer) |
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Erken Görünüm Tarihi | 28 Haziran 2025 |
Yayımlanma Tarihi | |
Gönderilme Tarihi | 6 Aralık 2024 |
Kabul Tarihi | 6 Mayıs 2025 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 10 Sayı: 27 |
Bu dergide yayınlanan tüm makaleler Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır.