Complex network analysis is applied in various fields such as network-based systems, social media recommendation systems, shopping platforms, and treatment methodologies. In this context, predicting the probability of connection between two nodes has become a focal point. Another significant aspect is the prediction of connections between proteins, especially with the increase in epidemic diseases. Link prediction methods, based on graph structures, aim to predict interactions between two nodes and measure the probability of connection between them. These methods proceed by relying on similarity values and can have multiple approaches, including local, global, and algorithmic. This study has emerged from a combination of algorithmic and local network approaches. Support Vector Machines are employed to predict connections in gene-protein networks and social network structures. Data sets from multiple social media platforms and human protein-protein interaction (PPI) data were utilized. Derived data were created by calculating local index values, including the number of neighbors, Adamic Adar index, Jaccard coefficient, and label values for each node. To enhance success rates, a model was developed that applied the discretization method as a preprocessing technique across all data sets. Machine learning algorithms such as Bayesian Networks, Multilayer Perceptron (MLP), Random Forest, and k-Nearest Neighborhood (kNN) were compared and evaluated. The results indicate that the Twitch dataset, which has the highest number of edges, produced successful outcomes. The contribution of edge numbers in the network structure to performance is highlighted, and it is observed that more successful metric values were obtained for the data with applied discretization.
Link Prediction Protein-Protein Interaction Social Networks Machine Learning Algorithms Biological Networks
Karmaşık ağ analizi, ağ tabanlı sistemler, sosyal medya öneri sistemleri, alışveriş platformları ve tedavi metodları gibi çeşitli alanlarda uygulanmaktadır. Bu bağlamda, iki düğüm arasındaki bağlantı olasılığını öngörmek odak noktası haline gelmiştir. Özellikle salgın hastalıklardaki artışla birlikte, proteinler arasındaki bağlantıların tahmin edilmesi önemli bir konudur. Graf yapılarına dayalı olan bağlantı tahmini yöntemleri, iki düğüm arasındaki etkileşimleri tahmin etmeyi ve bunlar arasındaki bağlantı olasılığını ölçmeyi amaçlar. Bu yöntemler, benzerlik değerlerine dayanarak ilerler ve yerel, global ve algoritmik gibi çeşitli yaklaşımlara sahip olabilir. Bu çalışma, algoritmik ve yerel ağ yaklaşımlarının bir kombinasyonundan ortaya çıkmıştır. Gen-protein ağları ve sosyal ağ yapılarında bağlantıları tahmin etmek için Destek Vektör Makineleri kullanılmıştır. Birden çok sosyal medya platformundan ve insan protein-protein etkileşimi (PPI) verilerinden elde edilen veri setleri kullanılmıştır. Her düğüm için komşu sayısı, Adamic Adar endeksi, Jaccard katsayısı ve etiket değerleri de dahil olmak üzere yerel indeks değerlerini hesaplayarak türetilen veriler oluşturulmuştur. Başarı oranlarını artırmak için, bir model, tüm veri setlerinde ön işleme tekniği olarak kesikli yöntemi uygulayan bir model geliştirilmiştir. Bayesian Ağları, Çok Katmanlı Algılayıcı (MLP), Rastgele Orman ve k-En Yakın Komşuluk (kNN) gibi makine öğrenimi algoritmaları karşılaştırılmış ve değerlendirilmiştir. Sonuçlar, en yüksek kenar sayısına sahip olan Twitch veri setinin başarılı sonuçlar verdiğini göstermektedir. Ağ yapısındaki kenar sayısının performansa katkısı vurgulanmış ve kesikli yöntemin uygulandığı veriler için daha başarılı metrik değerler elde edildiği gözlemlenmiştir.
Bağlantı Tahmini Protein-Protein Etkileşimi Sosyal Ağlar Makine Öğrenme Algoritmaları Biyolojik Ağlar
Primary Language | Turkish |
---|---|
Subjects | Machine Learning (Other) |
Journal Section | Research Article |
Authors | |
Early Pub Date | April 12, 2025 |
Publication Date | |
Submission Date | October 8, 2024 |
Acceptance Date | March 23, 2025 |
Published in Issue | Year 2025 EARLY VIEW |
This work is licensed under Creative Commons Attribution-ShareAlike 4.0 International.