X (eski adıyla Twitter) gibi çevrimiçi platformlardaki kullanıcı görüşlerinin duygu analizi için, genellikle sözlük tabanlı yaklaşımlar ve makine öğrenmesi yöntemleri kullanılır. Son çalışmalar, bu yaklaşımların hibrit kullanımının model performansını iyileştirdiğini vurgulamaktadır. Bu çalışmada, yemek siparişi ile ilgili metinlerin duygu analizi için hibrit bir sınıflandırma modeli öneriyoruz. Ayrıca, metin sınıflandırmanın yüksek boyutluluk problemi için kelimeleri toplulaştırmaya dayalı bir özellik seçim yöntemi öneriyoruz. Bu alandaki temel sorunlar, ayırt edici özelliklere sahip kelime sayısının düşük olması, yemek siparişi ile ilgili cümlelerin yorumlanmasının karmaşıklığı, metin sınıflandırmanın alan bağımlılığıdır. Sınıflandırma algoritmalarının ve alan sözlüğü tabanlı bir yaklaşımın birlikte kullanılması, bu zorlukların üstesinden gelinmesine katkıda bulunacaktır. Bu amaçla, çevrimiçi kullanıcıların görüşlerinden elde edilen veriler kullanılarak, biri duygu analizi için diğeri ise temel sözlükler olarak adlandırılan ürün-hizmet sistemleri sınıflandırması için olmak üzere iki alana özgü sözlük geliştirilmiştir. Temel sözlükler, bu sözlüklerdeki kelimelerin gruplandırılması ve sözkonusu gruplardan grubu temsil edecek bir kelimenin seçilmesiyle, daha az sayıda kelime içeren ve güçlendirilmiş sözlük olarak adlandırılan yeni sözlüklere dönüştürülmüştür. Duygu analizi için hibrit yaklaşımla, altı sınıflandırma algoritması, üç terim ağırlıklandırma yöntemi ve sözlüklerin kombinasyonlarından oluşan 144 model oluşturulmuştur. Çalışmada, 1 Ocak - 31 Aralık 2020 tarih aralığında X’ten paylaşılmış, 21 039 ve 14 389 tweetten oluşan iki veri seti kullanılmıştır. Modeller eğitilmiş, ilk veri seti üzerinde test edilmiş ve bunların arasından en iyi model seçimi yapılmıştır. İkinci veri seti seçilen modellerle analiz edilmiş ve sektör için öneriler sunulmuştur.
X (Twitter) duygu analizi sözlük tabanlı sınıflandırma çevrimiçi yemek siparişi doğal dil işleme özellik seçimi
For sentiment analysis of user opinions on online platforms such as X (formerly known as Twitter), dictionary-based approaches and machine learning methods are generally used. Recent studies emphasize that hybridizing these approaches improves model performance. In this study, we propose a hybrid classification model for sentiment analysis of texts on food ordering. In addition, we suggest a feature selection method based on aggregating words for the high-dimensionality problem of text classification. The main problems in that domain are low number of words with distinctive features, complexity of interpretation of food ordering field, domain dependency of text classification. The use of classification algorithms and a domain lexicon-based approach will contribute to overcoming these difficulties. For this purpose, two domain-specific lexicons are developed using data from online users' opinions, one for sentiment analysis and the other for product-service systems classification, referred to as basic lexicons. Basic lexicons have been transformed into new lexicons with fewer words, referred to as boosted lexicons, by grouping the words in basic lexicons and representing the groups with a single word in boosted lexicons. 144 models of combinations of six classification algorithms, three term weighting methods, and the lexicons are created in a hybrid approach for sentiment analysis. The study used two datasets of 21 039 and 14 389 tweets obtained from X between January 1 and December 31, 2020. The models were trained, tested on the first dataset, and the best models were selected. The second dataset is analyzed with the selected models, we present proposals for the industry.
X (twitter) sentiment analysis lexicon-based classification online food order natural language process feature selection
Birincil Dil | İngilizce |
---|---|
Konular | Makine Öğrenme (Diğer), Veri Madenciliği ve Bilgi Keşfi, Doğal Dil İşleme |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 30 Nisan 2025 |
Gönderilme Tarihi | 9 Ocak 2025 |
Kabul Tarihi | 27 Şubat 2025 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 18 Sayı: 2 |