In today's context, due to the transformation of the internet infrastructure and security into a platform where a significant amount of sensitive data is shared in personal, commercial, and military domains, ensuring data security has become vital. Encryption methods and protocols are employed to secure data. While encrypting data is beneficial for users, it can also be utilized by attackers who aim to conceal their activities on the network. This makes it challenging to analyze the traffic content without decrypting encrypted traffic. Properly analyzing and classifying encrypted traffic is a critical necessity for the detection of threats and the implementation of preventive measures. In this context, the classification of traffic using
machine learning techniques, based on variables such as packet sizes and durations, is of importance. This study employs supervised machine learning algorithms including K-Nearest Neighbor, Support Vector Machine, and Logistic Regression, as well as the community learning algorithm, Light Gradient Boosting Machine to classify encrypted network traffic. Comparisons are made between the success rates obtained and the rarely encountered algorithm speeds in the literature. The ISCXVPN2016 dataset, derived from real internet traffic data and containing commonly used classes in network traffic, is utilized in this study. This study presents an effective model proposal in terms of classification success and speed for analyzing and classifying encrypted traffic using machine learning techniques.
Machine learning Ensemble learning Encrypted network traffic Traffic classification Cybersecurity
Günümüzde, internet altyapısı ve güvenliği kişisel, ticari ve askeri alanlarda birçok hassas verinin paylaşıldığı bir platforma dönüşmesi nedeniyle hayati bir önem kazanmıştır. Veri güvenliğinin sağlanması maksadı ile şifreleme yöntemleri ve protokolleri kullanılmaktadır. Verinin şifrelenmesi kullanıcılar için yararlı olsa da aynı zamanda ağdaki faaliyetlerini gizlemek isteyen saldırganlar tarafından da kullanılabilmektedir. Bu durum, şifreli trafiği deşifreleme yapmadan trafik içeriğini analiz etmeyi zorlaştırmaktadır. Şifreli trafiği doğru bir şekilde analiz etmek ve sınıflandırmak, tehditlerin tespit edilmesi ve önleyici tedbirlerin alınması açısından kritik bir gerekliliktir. Bu bağlamda paket boyutları, süre gibi değişkenler kullanılarak makine öğrenmesi teknikleri ile trafiğin sınıflandırılması önem arz etmektedir. Bu çalışmada, denetimli makine öğrenmesi algoritmalarından K-En Yakın Komşu, Destek Vektör Makinesi ve Lojistik Regresyon algoritmaları ile topluluk öğrenmesi algoritmalarından Hafif Gradyan Artırma Makinesi algoritması kullanılarak şifreli ağ trafiğinin sınıflandırılması sağlanmıştır. Elde edilen başarı oranlarının ve literatürde nadiren karşılaşılan algoritma hızlarının karşılaştırmaları yapılmıştır. Çalışma kapsamında, ağ trafiğinde yaygın olarak kullanılan sınıfları içeren ve gerçek internet trafik verilerinden elde edilmiş olan
ISCXVPN2016 veri seti kullanılmıştır. Bu çalışma, şifreli trafiği etkili bir şekilde analiz etmek ve sınıflandırmak için makine öğrenmesi tekniklerini kullanarak sınıflandırma başarısı ve hız açısından etkin bir model önerisi sunmaktadır.
Makine öğrenmesi Topluluk öğrenmesi Şifreli ağ trafiği Trafik sınıflandırma Siber güvenlik
Birincil Dil | Türkçe |
---|---|
Konular | Bilgisayar Yazılımı |
Bölüm | Araştırma Makalesi |
Yazarlar | |
Erken Görünüm Tarihi | 14 Nisan 2025 |
Yayımlanma Tarihi | |
Gönderilme Tarihi | 4 Haziran 2024 |
Kabul Tarihi | 23 Ocak 2025 |
Yayımlandığı Sayı | Yıl 2025 Sayı: Erken Görünüm |