Bu çalışmada, sınıflandırma algoritmalarının kalp hastalıkları verilerindeki tahmin performansını incelemek amacıyla bir veri madenciliği uygulaması gerçekleştirilmiştir. Araştırma kapsamında, belirli özelliklere sahip bireylerin kalp hastalığı taşıma olasılığı, farklı sınıflandırma algoritmaları kullanılarak değerlendirilmiştir. Kullanılan veri kümesi, İngiltere Liverpool’daki John Moore's Üniversitesi tarafından oluşturulmuş ve son olarak 6 Haziran 2020 tarihinde güncellenmiştir. Veri kümesi, 11 özellikten oluşan 1190 örneği içermektedir. Çalışmada regresyon, k-en yakın komşu (KNN), Naive Bayes, rastgele orman, karar ağaçları ve destek vektör makineleri (SVM) algoritmaları kullanılmıştır. Tüm algoritmalar Python programlama dili ve Jupyter Notebook ortamında uygulanmış ve sınıflandırma performansları karşılaştırılmıştır. Başarı değerlendirmesi doğruluk oranı, duyarlılık, özgüllük ve F1 skoru gibi ölçütler üzerinden yapılmıştır. Elde edilen sonuçlara göre, KNN, destek vektör makineleri ve rastgele orman algoritmaları %86,79 doğruluk oranıyla diğer algoritmalara kıyasla en yüksek başarıyı göstermiştir. Bu çalışma, kalp hastalıklarının erken teşhisinde sınıflandırma algoritmalarının potansiyelini ortaya koyarak, sağlık alanında yapay zekâ ve veri madenciliği uygulamalarının önemini vurgulamaktadır.
Kalp hastalıkları Yapay zekâ Veri madenciliği Performans karşılaştırması Sınıflandırma algoritmaları.
This study presents a data mining application aimed at investigating the prediction performance of classification algorithms on heart disease datasets. In this research, the likelihood of individuals having heart disease based on specific features was evaluated using various classification algorithms. The dataset used was created by John Moore's University in Liverpool, UK, and was last updated on June 6, 2020. The dataset consists of 1190 samples with 11 features. The study utilised several classification algorithms, including regression, k- nearest neighbours (KNN), Naive Bayes, random forest, decision trees, and support vector machines (SVM). All algorithms were implemented using the Python programming language and the Jupyter Notebook environment, and their classification performances were compared. The evaluation of success was based on metrics such as accuracy, sensitivity, specificity, and F1 score. According to the results, KNN, support vector machines, and random forest algorithms achieved the highest performance with an accuracy rate of 86.79%, outperforming the other algorithms. This study highlights the potential of classification algorithms in the early diagnosis of heart disease, emphasising the significance of artificial intelligence and data mining applications in the healthcare field.
Heart disease Artificial intelligence Data mining Performance comparison Classification algorithms.
Birincil Dil | İngilizce |
---|---|
Konular | Bilgi Sistemleri (Diğer) |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 27 Haziran 2025 |
Gönderilme Tarihi | 20 Ocak 2025 |
Kabul Tarihi | 7 Mayıs 2025 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 14 Sayı: 2 |
Bu eser Creative Commons Atıf-GayriTicari-Türetilemez 4.0 Uluslararası Lisansı ile lisanslanmıştır.