Research Article
BibTex RIS Cite

Veri Madenciliği Yaklaşımı ile Bankacılık Kampanya Başarısı Analizi: XGBoost ve Rastgele Orman Tabanlı Uygulamalı Bir Model

Year 2025, Volume: 11 Issue: 1, 111 - 133, 30.06.2025
https://doi.org/10.46849/guiibd.1678452

Abstract

Çalışmada, bankacılık sektöründe yürütülen doğrudan pazarlama kampanyalarının başarısını tahmin etmek için, makine öğrenmesi tabanlı iki farklı sınıflandırma modelinin karşılaştırmalı analizi yapılmıştır. UCI Machine Learning Repository’de yayımlanan “Bank Marketing” veri seti kullanılarak, müşterilerin mevduat aboneliği kararları tahmin edilmiştir. Veri seti, demografik, sosyoekonomik ve geçmiş kampanya etkileşimlerine dair çok boyutlu değişkenler içermektedir. Modelleme sürecinde, karar ağaçları tabanlı iki güçlü makine öğrenmesi modeli olan XGBoost ve Rastgele Orman kullanılmıştır. Veri setindeki sınıf dengesizliği problemi göz önünde bulundurularak doğruluk, F1 skoru, kesinlik, duyarlılık ve ROC-AUC gibi çok boyutlu performans metrikleri ile değerlendirmeler yapılmıştır. Analizlerde, XGBoost genel sınıflandırmada ve ayrıştırma açısından daha başarılı olmuştur. Rastgele Orman ise pozitif sınıfı tanımada daha iyi sonuçlar sunmuştur. Kampanya başarısını etkileyen başlıca değişkenler olarak yaş, konut ve kişisel kredi durumu ile önceki kampanya yanıtları öne çıkmıştır. Kredi yükümlülüğü olmayan bireylerin ve geçmiş dönemlerde yapılmış kampanyalara olumlu yanıt vermiş müşterilerin abonelik eğilimlerinin daha yüksek olduğu belirlenmiştir. Bilgi sızıntısı riski taşıyan “duration” değişkeni analiz dışı bırakılmış ve özellik mühendisliği süreçleriyle modelin etik ve metodolojik güvenilirliği sağlanmıştır. Elde edilen bulgular, kişiselleştirilmiş pazarlama stratejilerinin geliştirilmesi ve yapay zekâ temelli karar destek sistemlerinin bankacılık uygulamalarına entegrasyonu açısından önemli katkılar sunmaktadır. Çalışma, hem akademik literatüre hem de uygulamalı finans ve pazarlama alanlarına katkılarda bulunmaktadır.

Thanks

Teknik analizler, veri ön işleme süreçleri ve Python dili ile programlama sürecinde sağladıkları rehberlik ve geri bildirimler için C ve Sistem Programcıları Derneği çalışanlarına (https://csystem.org/) ve Dernek Başkanı Dr. Kaan ASLAN’a teşekkür ederim. Dr. Kaan ASLAN, model hiperparametre optimizasyonu ve performans değerlendirme süreçlerine katkı sağlamış olup, çalışmanın doğruluk oranlarının artırılması konusunda öneriler sunmuştur.

References

  • Abar, H. (2020). XGBoost ve Mars yöntemleriyle altın fiyatlarının kestirimi. EKEV Akademi Dergisi, 83, 427-446.
  • Aslan, K. (2025). Yapay Zekâ Makine Öğrenmesi ve Veri Bilimi Kursu, Sınıfta Yapılan Örnekler ve Özet Notlar, C ve Sistem Programcıları Derneği, İstanbul.
  • Avcu, F. M. (2022). Az Veri Setli Çalışmalarında Derin Öğrenme ve Diğer Sınıflandırma Algoritmalarının Karşılaştırılması: Agonist Ve Antagonist Ligand Örneği. İnönü Üniversitesi Sağlık Hizmetleri Meslek Yüksek Okulu Dergisi, 10(1), 356-371. https://doi.org/10.33715/inonusaglik.1022065
  • Aydın, G. & Yalçın, M. (2024). Banka Sektöründe Otomatik Makine Öğrenme Yöntemi (DataBlender) ile Vadeli Mevduat Talep Tahmini. In: Akoğul, S. & Tuna, E. (eds.), Güncel Ekonometrik ve İstatistiksel Uygulamalar ile Akademik Çalışmalar. Özgür Yayınları. DOI: https://doi.org/10.58830/ozgur.pub518.c2128
  • Calp, M. H. (2025). Predicting of Credit Card Customer Churn Using Machine Learning Methods, Gazi Journal of Engineering Sciences, vol.11, no.1, p p. 16-34, doi:10.30855/gmbd.0705N02
  • Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785–794. https://doi.org/10.1145/2939672.2939785
  • Choi, Y., & Choi, J. W. (2023). Assessing the Predictive Performance of Machine Learning in Direct Marketing Response. International Journal of E Business Research, 19(1), 1–12. https://doi.org/10.4018/IJEBR.321458
  • Davenport, T. H., & Harris, J. G. (2017). Competing on Analytics: The New Science of Winning. Harvard Business Review Press.
  • Eşidir, K. A. (2025a). Makine Öğrenimi Modelleri ile Yetişkin Eğitimi Analizi: Modellerin Karşılaştırmalı Performansı. Elektronik Sosyal Bilimler Dergisi, 24(2), 946-964. https://doi.org/10.17755/esosder.1589887
  • Eşidir, K. A. (2025b). TÜİK Mikro Verileri ile Çocuk İşgücü Tahmini: Makine Öğrenimi Modellerinin Performans Analizleri. Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 37(1), 453-466. https://doi.org/10.35234/fumbd.1607609
  • Eşidir, K. A. (2025c). Türkiye’nin Kimyasal Madde İthalatının Gelecek Tahmini: Makine Öğrenmesi ve Topluluk Öğrenme Yöntemleri Performans Analizi. Firat University Journal of Social Sciences, 35(1), 261-278. https://doi.org/10.18069/firatsbed.1580620
  • Kaufman, S., Rosset, S., Perlich, C., & Stitelman, O. (2012). Leakage in data mining: Formulation, detection, and avoidance. ACM Transactions on Knowledge Discovery from Data (TKDD), 6(4), 1-21.
  • Lemmens, A., & Croux, C. (2006). Bagging and boosting classification trees to predict churn. Journal of Marketing Research, 43(2), 276–286. https://doi.org/10.1509/jmkr.43.2.276
  • Liang, W., Luo, S., Zhao, G., & Wu, H. (2020). Predicting hard rock pillar stability using gbdt, XGBoost, and LightGBM algorithms. Mathematics, 8(5), 765. https://doi.org/10.3390/math8050765
  • Moro, S., Rita, P., & Cortez, P. (2014). Bank Marketing [Dataset]. UCI Machine Learning Repository. https://doi.org/10.24432/C5K306.
  • Ngai, E. W. T., Xiu, L., & Chau, D. C. K. (2009). Application of data mining techniques in customer relationship management: A literature review and classification. Expert Systems with Applications, 36(2), 2592–2602. https://doi.org/10.1016/j.eswa.2008.02.021
  • Oguine OC ve Oguine MB. (2021). Comparative analysis and forecasting on the death rate of COVID-19 patients in Nigeria using Random Forest and Multinomial Bayesian epidemiological models, Journal of Clinical Case Studies Reviews & Reports, 1-7.
  • Oktay, S., Bakır, H., & Tabaru, T. E. (2023). Makine öğrenmesi teknikleri kullanılarak bankalardaki potansiyel müşterilerin sınıflandırılması. Gaziosmanpaşa Bilimsel Araştırma Dergisi, 12(2), 22–41.
  • Speer AB. (2021). Empirical attrition modelling and discrimination: Balancing validity and group differences, Human Resource Management Journal, 34 (1), 1-19.
  • Tafralı, S. (2022). Veri Biliminde Özellik Ölçeklendirme (Feature Scaling). Medium. Erişildiği adres: https://serdartafrali.medium.com/veri-biliminde-%C3%B6zellik-%C3%B6l%C3%A7eklendirme-feature-scaling-e05d9f3e96ce
  • Tunca, S. (2025). Bankacılıkta Müşteri Verilerini Anlama: CRISP-DM Yaklaşımı ve Makine Öğrenimi Uygulamaları. AJIT-E: Academic Journal of Information Technology, 16(1), 68-87. https://doi.org/10.5824/ajite.2025.01.004.x
  • Wang, L., Wang, X., Chen, A., Jin, X., & Che, H. (2020). Prediction of type 2 diabetes risk and its effect evaluation based on the XGBoost model. Healthcare, 8(3), 247. https://doi.org/10.3390/healthcare8030247
  • Wu Y. (2023). Job embeddedness review: Presentation, measurement and development. Advances in Economics, Management and Political Sciences, 47 (1), 169- 174.
  • Zhu X, Sawhney R, Upreti G. (2016). Determinates of employee voluntary turnover and forecasting in departments: A case study, Studies in Engineering and Technology, 3(1):64-73.

Analyzing Banking Campaign Success through a Data Mining Approach: A Practical Model Based on XGBoost and Random Forest

Year 2025, Volume: 11 Issue: 1, 111 - 133, 30.06.2025
https://doi.org/10.46849/guiibd.1678452

Abstract

In this study, a comparative analysis of two different machine learning-based classification models is conducted to predict the success of direct marketing campaigns in the banking sector. Using the “Bank Marketing” dataset published in the UCI Machine Learning Repository, customers' deposit subscription decisions are predicted. The dataset contains multidimensional variables on demographic, socioeconomic and past campaign interactions. Two powerful machine learning models based on decision trees, XGBoost and Random Forest, are used in the modeling process. Considering the class imbalance problem in the dataset, multidimensional performance metrics such as accuracy, F1 score, precision, sensitivity and ROC-AUC were evaluated. In the analysis, XGBoost was more successful in terms of overall classification and discrimination. Random Forest provided better results in recognizing the positive class. The main variables affecting campaign success were age, housing and personal loan status, and previous campaign responses. It was found that individuals with no credit obligations and customers who responded positively to previous campaigns had a higher propensity to subscribe. The “duration” variable, which carries the risk of information leakage, was excluded from the analysis and the ethical and methodological reliability of the model was ensured through feature engineering processes. The findings make important contributions to the development of personalized marketing strategies and the integration of artificial intelligence-based decision support systems into banking applications. The study contributes to both academic literature and applied finance and marketing fields.

References

  • Abar, H. (2020). XGBoost ve Mars yöntemleriyle altın fiyatlarının kestirimi. EKEV Akademi Dergisi, 83, 427-446.
  • Aslan, K. (2025). Yapay Zekâ Makine Öğrenmesi ve Veri Bilimi Kursu, Sınıfta Yapılan Örnekler ve Özet Notlar, C ve Sistem Programcıları Derneği, İstanbul.
  • Avcu, F. M. (2022). Az Veri Setli Çalışmalarında Derin Öğrenme ve Diğer Sınıflandırma Algoritmalarının Karşılaştırılması: Agonist Ve Antagonist Ligand Örneği. İnönü Üniversitesi Sağlık Hizmetleri Meslek Yüksek Okulu Dergisi, 10(1), 356-371. https://doi.org/10.33715/inonusaglik.1022065
  • Aydın, G. & Yalçın, M. (2024). Banka Sektöründe Otomatik Makine Öğrenme Yöntemi (DataBlender) ile Vadeli Mevduat Talep Tahmini. In: Akoğul, S. & Tuna, E. (eds.), Güncel Ekonometrik ve İstatistiksel Uygulamalar ile Akademik Çalışmalar. Özgür Yayınları. DOI: https://doi.org/10.58830/ozgur.pub518.c2128
  • Calp, M. H. (2025). Predicting of Credit Card Customer Churn Using Machine Learning Methods, Gazi Journal of Engineering Sciences, vol.11, no.1, p p. 16-34, doi:10.30855/gmbd.0705N02
  • Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785–794. https://doi.org/10.1145/2939672.2939785
  • Choi, Y., & Choi, J. W. (2023). Assessing the Predictive Performance of Machine Learning in Direct Marketing Response. International Journal of E Business Research, 19(1), 1–12. https://doi.org/10.4018/IJEBR.321458
  • Davenport, T. H., & Harris, J. G. (2017). Competing on Analytics: The New Science of Winning. Harvard Business Review Press.
  • Eşidir, K. A. (2025a). Makine Öğrenimi Modelleri ile Yetişkin Eğitimi Analizi: Modellerin Karşılaştırmalı Performansı. Elektronik Sosyal Bilimler Dergisi, 24(2), 946-964. https://doi.org/10.17755/esosder.1589887
  • Eşidir, K. A. (2025b). TÜİK Mikro Verileri ile Çocuk İşgücü Tahmini: Makine Öğrenimi Modellerinin Performans Analizleri. Fırat Üniversitesi Mühendislik Bilimleri Dergisi, 37(1), 453-466. https://doi.org/10.35234/fumbd.1607609
  • Eşidir, K. A. (2025c). Türkiye’nin Kimyasal Madde İthalatının Gelecek Tahmini: Makine Öğrenmesi ve Topluluk Öğrenme Yöntemleri Performans Analizi. Firat University Journal of Social Sciences, 35(1), 261-278. https://doi.org/10.18069/firatsbed.1580620
  • Kaufman, S., Rosset, S., Perlich, C., & Stitelman, O. (2012). Leakage in data mining: Formulation, detection, and avoidance. ACM Transactions on Knowledge Discovery from Data (TKDD), 6(4), 1-21.
  • Lemmens, A., & Croux, C. (2006). Bagging and boosting classification trees to predict churn. Journal of Marketing Research, 43(2), 276–286. https://doi.org/10.1509/jmkr.43.2.276
  • Liang, W., Luo, S., Zhao, G., & Wu, H. (2020). Predicting hard rock pillar stability using gbdt, XGBoost, and LightGBM algorithms. Mathematics, 8(5), 765. https://doi.org/10.3390/math8050765
  • Moro, S., Rita, P., & Cortez, P. (2014). Bank Marketing [Dataset]. UCI Machine Learning Repository. https://doi.org/10.24432/C5K306.
  • Ngai, E. W. T., Xiu, L., & Chau, D. C. K. (2009). Application of data mining techniques in customer relationship management: A literature review and classification. Expert Systems with Applications, 36(2), 2592–2602. https://doi.org/10.1016/j.eswa.2008.02.021
  • Oguine OC ve Oguine MB. (2021). Comparative analysis and forecasting on the death rate of COVID-19 patients in Nigeria using Random Forest and Multinomial Bayesian epidemiological models, Journal of Clinical Case Studies Reviews & Reports, 1-7.
  • Oktay, S., Bakır, H., & Tabaru, T. E. (2023). Makine öğrenmesi teknikleri kullanılarak bankalardaki potansiyel müşterilerin sınıflandırılması. Gaziosmanpaşa Bilimsel Araştırma Dergisi, 12(2), 22–41.
  • Speer AB. (2021). Empirical attrition modelling and discrimination: Balancing validity and group differences, Human Resource Management Journal, 34 (1), 1-19.
  • Tafralı, S. (2022). Veri Biliminde Özellik Ölçeklendirme (Feature Scaling). Medium. Erişildiği adres: https://serdartafrali.medium.com/veri-biliminde-%C3%B6zellik-%C3%B6l%C3%A7eklendirme-feature-scaling-e05d9f3e96ce
  • Tunca, S. (2025). Bankacılıkta Müşteri Verilerini Anlama: CRISP-DM Yaklaşımı ve Makine Öğrenimi Uygulamaları. AJIT-E: Academic Journal of Information Technology, 16(1), 68-87. https://doi.org/10.5824/ajite.2025.01.004.x
  • Wang, L., Wang, X., Chen, A., Jin, X., & Che, H. (2020). Prediction of type 2 diabetes risk and its effect evaluation based on the XGBoost model. Healthcare, 8(3), 247. https://doi.org/10.3390/healthcare8030247
  • Wu Y. (2023). Job embeddedness review: Presentation, measurement and development. Advances in Economics, Management and Political Sciences, 47 (1), 169- 174.
  • Zhu X, Sawhney R, Upreti G. (2016). Determinates of employee voluntary turnover and forecasting in departments: A case study, Studies in Engineering and Technology, 3(1):64-73.
There are 24 citations in total.

Details

Primary Language Turkish
Subjects Public Administration, Policy and Administration (Other)
Journal Section Research Article
Authors

Kamil Abdullah Eşidir 0000-0002-8106-1758

Publication Date June 30, 2025
Submission Date May 10, 2025
Acceptance Date June 13, 2025
Published in Issue Year 2025 Volume: 11 Issue: 1

Cite

APA Eşidir, K. A. (2025). Veri Madenciliği Yaklaşımı ile Bankacılık Kampanya Başarısı Analizi: XGBoost ve Rastgele Orman Tabanlı Uygulamalı Bir Model. Giresun Üniversitesi İktisadi Ve İdari Bilimler Dergisi, 11(1), 111-133. https://doi.org/10.46849/guiibd.1678452
  • Journal of Economics & Administrative Sciences