Bilgi geri getirimi için geliştirilebilir bir yazılım altyapısının gerçekleştirilmesi
Küçük Resim Yok
Tarih
2011
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Ege Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu tezde, doğal dil işleme ve bilgi geri getirimi çalışmaları için geliştirilebilir bir yazılım altyapısı oluşturulması hedeflenmiştir. Bu altyapı oluşturulurken Java tabanlı, yüksek performanslı, ölçeklenebilir, açık kaynak kodlu bir bilgi erişim kütüphanesi olan Lucene' den yararlanılmış; Lucene analiz sürecinin kullanıcı ihtiyacına odaklı özelleştirilmesi, belgeler ve sorgular arasındaki benzerliği bulan modülün yeni bir modül eklenmiştir.Analiz süreci özelleştirilmesi ile Lucene' in doğal dil işleme araçları seçimli yapılarak farklı araştırmalarda farklı amaçlarla kullanılmaya hazır hale getirilmiş; bilgi geri getiriminde farklı ağırlıklandırma yöntemlerinin denenebileceği bir ortam oluşturulmuştur.Anahtar sözcükler: Bilgi geri getirimi, Lucene, doğal dil işleme, belge dizinleme ve arama
In this thesis, the goal is to develop a modifiable software infrastructure for natural language processing and information retrieval. Lucene, an open source information retrieval library, is used for its high performance and scalability during the constitution of this infrastructure. Customization of some analysis procedures according to user needs and integration of a new formula that finds the similarity between queries and documents are realized. Thus, the users are able to select tools and similarity function that best fit their purposes of research.
In this thesis, the goal is to develop a modifiable software infrastructure for natural language processing and information retrieval. Lucene, an open source information retrieval library, is used for its high performance and scalability during the constitution of this infrastructure. Customization of some analysis procedures according to user needs and integration of a new formula that finds the similarity between queries and documents are realized. Thus, the users are able to select tools and similarity function that best fit their purposes of research.
Açıklama
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control, Belge erişimi, Document arrival, Belge işleme, Document processing, Yazılım, Software