Görüş sınıflandırma için makine öğrenmesi algoritmalarına dayalı bir yöntem tasarımı ve gerçekleştirimi
Yükleniyor...
Dosyalar
Tarih
2016
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Ege üniversitesi, Fen Bilimleri Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Görüş sınıflandırma, doğal dil işleme, makine öğrenmesi ve istatistik disiplinlerinden, yöntem, teknik ve araçların kullanılması ile metin belgelerinde yer alan öznel bilgilerin belirlenmesine yönelik bir araştırma alanıdır. Bu tez çalışması kapsamında, görüş madenciliği, bir metin sınıflandırma problemi olarak ele alınarak makine öğrenmesi yöntemleri aracılığıyla etkin görüş sınıflandırma yöntemleri geliştirilmiştir. Geliştirilen yöntemler üç temel çatı altında incelenebilir. Birincisi, metin sınıflandırmada karşılaşılan en önemli problemlerden biri olan yüksek boyutluluk ve seyrekliği ortadan kaldırmak amacıyla temel filtre tabanlı öznitelik seçim yöntemlerini etkin bir şekilde birleştiren genetik algoritma ile sıra birleştirmeye dayalı öznitelik seçimi yöntemidir. İkinci olarak, sınıflandırıcı topluluğunda yer alan temel öğrenme algoritmalarının, topluluk çıktısına, doğru sınıflandırma başarımlarına göre katkı koymalarına yönelik, çok amaçlı diferansiyel gelişim algoritmasına dayalı ağırlıklı oylama sınıflandırıcı topluluğu birleştirme kuralıdır. Üçüncü olarak ise, topluluk öğrenmesi sürecinin, topluluk budama aşamasında, uygun öğrenme algoritmalarının seçilmesine yönelik yöntem geliştirilmesidir. Geliştirilen sınıflandırıcı topluluğu budama yönteminde, ortak kümeleme ve metasezgisel aramadan yararlanılmıştır. Geliştirilen yöntemlere dayalı yeni bir sınıflandırma mimarisi önerilmiştir. Bu mimari ile geliştirilen yöntemler etkin bir şekilde birleştirilerek mevcut ve geliştirilen yöntemlerin bireysel performanslarına kıyasla daha iyi başarım elde edilmiştir.
Opinion classification, which utilizes methods, techniques and tools from natural language processing, machine learning and statistics, is a research field to determine subjective information in the text documents. In this thesis, opinion mining is regarded as a text classification problem to build an efficient opinion classification scheme based on machine learning methods. The developed methods can be grouped into three categories. First, a feature selection method based on genetic rank aggregation, which integrates individual filter-based feature selection methods in an effective way, is presented to overcome the high dimensionality and sparsity problems encountered in text classification. Secondly, a classifier ensemble combination rule based on multi-objective differential evolution algorithm is presented so that the base learning algorithms of the classifier ensemble can contribute to the final outcome of the ensemble according to their predictive performance. Thirdly, an ensemble pruning scheme is presented to obtain an appropriate subset of classifiers from the ensemble. In the proposed pruning scheme, consensus clustering and metaheuristic search are utilized. A novel classification architecture is proposed based on the developed methods. With this framework, developed methods are combined in an effective way and the predictive performance of the framework is enhanced compared to the individual performances of the standard and the developed methods.
Opinion classification, which utilizes methods, techniques and tools from natural language processing, machine learning and statistics, is a research field to determine subjective information in the text documents. In this thesis, opinion mining is regarded as a text classification problem to build an efficient opinion classification scheme based on machine learning methods. The developed methods can be grouped into three categories. First, a feature selection method based on genetic rank aggregation, which integrates individual filter-based feature selection methods in an effective way, is presented to overcome the high dimensionality and sparsity problems encountered in text classification. Secondly, a classifier ensemble combination rule based on multi-objective differential evolution algorithm is presented so that the base learning algorithms of the classifier ensemble can contribute to the final outcome of the ensemble according to their predictive performance. Thirdly, an ensemble pruning scheme is presented to obtain an appropriate subset of classifiers from the ensemble. In the proposed pruning scheme, consensus clustering and metaheuristic search are utilized. A novel classification architecture is proposed based on the developed methods. With this framework, developed methods are combined in an effective way and the predictive performance of the framework is enhanced compared to the individual performances of the standard and the developed methods.
Açıklama
Anahtar Kelimeler
Görüş Sınıflandırma, Sınıflandırıcı Topluluğu, Çoğunluk Oylaması, Çok Amaçlı Eniyileme, Öznitelik Seçimi, Topluluk Budama, Sıra Birleştirme