Topluluk öğrenme yöntemini kullanarak twitter verisi üzerinde duygu algılama ve tanıma
Yükleniyor...
Dosyalar
Tarih
2019
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Ege Üniversitesi, Fen Bilimleri Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Son yıllarda teknolojinin gelişmesi ile forumlar, bloglar ve sosyal medya insanlar tarafından çok fazla kullanılır hale gelmiştir. İnsanların görüş, fikir ve hislerini sosyal medya aracılığı ile paylaşmak istemesi sosyal medyayı önemli bir bilgi kaynağı haline getirmiştir. Özellikle twitter, üzerinde çalışılan önemli bir veri kaynağıdır. Sosyal medya üzerindeki fikir paylaşımlarının artması nedeniyle son yıllarda, insan duygularını anlama konusunda araştırmalar artmıştır. Bu tez çalışmasında, İngilizce bir metin içeriğindeki neşe, korku, öfke, üzüntü, tiksinti ve şaşkınlık duygularının otomatik olarak sınıflandırılmasında Topluluk Öğrenmesi yöntemlerinin etkileri ölçülmüştür. Bu amaçla Twitterdan elde edilen veri seti yanında International Survey on Emotion Antecedents and Reactions (ISEAR) veriseti üzerinde de deneysel çalışmalar yapılmıştır. Ayrıca duyguların üç sınıf şeklinde olumlu, olumsuz ve nötr olarak ifade edildiği Havayolu veri seti için de sonuçlar alınarak sunulmuştur. Temel sınıflandırıcılar olarak Multinomial Naive Bayes (MNB), Destek Vektör Makineleri (DVM) ve Karar Ağacı sınıflandırıcıları kullanılmıştır. Temel sınıflandırıcıların birleştirilmesi ile meta sınıflandırıcılar oluşturulmuştur. ISEAR veri seti üzerinde Bagging, Boosting ve Voting Topluluk Öğrenmesi yöntemleri kullanılarak beş duygu için sınıflandırma sonuçları ilk olarak bu çalışmada kapsamlı bir şekilde elde edilmiştir. Topluluk Öğrenmesi yöntemleri kullanımının temel sınıflandırıcıların başarı oranlarını arttırdığı, denenenler içerisinde en başarılı yöntemin de oylama (voting) olduğu gözlemlenmiştir.
With the development of technology in recent years forums, blogs and social media have become used by much of the people. The fact that people want to share their opinions, ideas and feelings through social media has made social media an important source of information. Especially twitter, is an important data source being studied. In recent years, research on understanding human emotions has increased due to the increasing share of ideas on social media. In this thesis, the effects of Ensemble Learning methods on automatic classification of emotions which are joy, fear, anger, sadness, disgust and surprise in an English text content were measured. For this purpose, experimental studies have been conducted on International Survey on Emotion Antecedents and Reactions (ISEAR) dataset in addition to the dataset from Twitter. In addition, the results are presented for the Airline dataset in which emotions are expressed as three classes which are positive, nagative and neutral. Multinomial Naive Bayes (MNB), Support Vector Machines (SVM) and Decision Tree classifiers were used as the main classifiers. Meta classifiers were formed by combining the basic classifiers. The classification results which are created by using Bagging, Boosting and Voting Ensemble Learning methods on the ISEAR dataset for five emotions were firstly obtained in this study in a comprehensive manner. It has been observed that the use of Ensemble Learning methods increases the success rates of the main classifiers and voting is the most successful method among those tried.
With the development of technology in recent years forums, blogs and social media have become used by much of the people. The fact that people want to share their opinions, ideas and feelings through social media has made social media an important source of information. Especially twitter, is an important data source being studied. In recent years, research on understanding human emotions has increased due to the increasing share of ideas on social media. In this thesis, the effects of Ensemble Learning methods on automatic classification of emotions which are joy, fear, anger, sadness, disgust and surprise in an English text content were measured. For this purpose, experimental studies have been conducted on International Survey on Emotion Antecedents and Reactions (ISEAR) dataset in addition to the dataset from Twitter. In addition, the results are presented for the Airline dataset in which emotions are expressed as three classes which are positive, nagative and neutral. Multinomial Naive Bayes (MNB), Support Vector Machines (SVM) and Decision Tree classifiers were used as the main classifiers. Meta classifiers were formed by combining the basic classifiers. The classification results which are created by using Bagging, Boosting and Voting Ensemble Learning methods on the ISEAR dataset for five emotions were firstly obtained in this study in a comprehensive manner. It has been observed that the use of Ensemble Learning methods increases the success rates of the main classifiers and voting is the most successful method among those tried.
Açıklama
Anahtar Kelimeler
Duygu Tanıma, Topluluk Öğrenme, Makine Öğrenmesi, Multinomial Naive Bayes, Destek Vektör Makinesi, Karar Ağacı, ISEAR Veri Seti, Twitter, Emotion Recognition, Ensemble Learning, Machine Learning, Multinomial Naive Bayes, Support Vector Machines, ISEAR dataset, Twitter