In the last 50 years, the effect of cancer disease on the annual number of deaths has increased significantly. This has led to an increase in research on early detection and diagnosis of cancer. Early diagnosis of cancer increases the chance of surviving the disease and reduces the possibility of recurrence of the disease. The technological advances in artificial intelligence and machine learning are used to analyse patient data, while at the same time reducing the likelihood of developing diseases. In this paper, 7 different machine learning algorithms commonly used in the literature are used for breast cancer diagnosis. These are: Logistic Regression (LR), K-Nearest Neighbours (KNN), Support Vector Machines (SVM), Radial Basis Function (RBF) Kernel, Naive Bayes, Decision Tree (DT), and Random Forest (RF) algorithms. In our study, two separate datasets were used for breast cancer diagnosis. In the first dataset, Random Forest, SVM (RBF), and SVM (Linear) algorithms had the highest accuracy value of 96.5, while the K-Nearest Neighbours algorithm had the highest sensitivity value of 98.8, and the decision tree algorithm had the highest specificity value of 98.1. The K-Nearest Neighbour algorithm was also found to be the fastest algorithm, with 1.03 seconds. In the second dataset with different data, the K-Nearest Neighbours algorithm reached the highest accuracy value of 97.7 and was observed to be the second fastest algorithm with 1.48 seconds after the Gaussian Naive Bayes algorithm with 1.14 seconds.
Machine learning classification algorithms artificial intelligence breast cancer prediction
Son 50 yılda yıllık ölüm sayısına kanser hastalığının etkisi önemli ölçüde artmıştır. Bu durum da kanserin erken teşhisi ve tanısına yönelik araştırmaların artmasına neden olmuştur. Zira kanserin erken teşhisi hastalıktan kurtulma şansını artırırken hastalığın tekrarlama ihtimalini de düşürmektedir. Yapay zeka ve makine öğreniminin içinde bulunduğumuz teknolojik ilerlemeler, hasta verilerini analiz etmeye yararken aynı zamanda hastalıklara yakalanma olasılıklarını da azaltmaktadır. Bu makalede, meme kanseri teşhisi için literatürde sık kullanılan 7 farklı makine öğrenmesi algoritması kullanılmıştır. Bunlar: Lojistik Regresyon (LR), K-En Yakın Komşular (KNN), Destek Vektör Makineleri (SVM), Radyal Tabanlı Fonksiyon (RBF) Çekirdeği, Naive Bayes, Karar Ağacı (DT) ve Rastgele Orman (RF) algoritmalarıdır. Çalışmamızda meme kanseri hastalığı teşhisi için iki ayrı veri seti kullanılmıştır. İlk veri setinde, Random Forest, SVM (RBF) ve SVM (Linear) algoritmaları 96.5'lik en yüksek accuracy değerine sahip olmakla birlikte, K-Nearest Neighbors algoritmasının 98.8 ile en yüksek sensitivity değerini ve ayrıca decision tree algoritmasının da 98.1 ile en yüksek specifity değerini aldığı görülmüştür. K-Nearest Neighbour algoritmasının 1.03 saniye ile en hızlı algoritma olduğu da saptanmıştır. Farklı verilere sahip ikinci veri setinde, K-Nearest Neighbors algoritması %97.7'lik en yüksek accuracy değerine ulaşmakla birlikte, 1.14 saniyelik Gaussian Naive Bayes algoritmasından sonra 1.48 saniye ile en hızlı ikinci algoritma olarak gözlenmiştir.
Primary Language | English |
---|---|
Subjects | Planning and Decision Making |
Journal Section | Research Articles |
Authors | |
Publication Date | April 30, 2025 |
Submission Date | April 24, 2025 |
Acceptance Date | April 30, 2025 |
Published in Issue | Year 2025 Issue: 012 |