Bilgi erişim sistemlerinde istatistiksel bağımsızlık esasında indeks terim ağırlıklandırma

dc.contributor.advisorKaraoğlan, Bahar
dc.contributor.advisorDinçer, Bekir Taner
dc.contributor.authorKocabas, İlker
dc.date.accessioned2018-11-23T12:18:21Z
dc.date.available2018-11-23T12:18:21Z
dc.date.issued2011
dc.departmentEge Üniversitesi, Fen Bilimleri Enstitüsüen_US
dc.description.abstractBu tezde bilgi erişim (kıs. BE) sistemlerinde indeks terim ağırlıklandırma (kıs. ITA) işlemi için iki farklı yaklaşımda özgün modeller geliştirilmiştir. Bağımsızlıktan sapma (Ing. Divergence From Independence, kıs. DFI) ve Luhntabanlı modeller olarak adlandırılan bu iki yaklaşım, sırasıyla: ‘istatistiksel bağımsızlık fikri’ ve ‘Luhn’un kelime frekansı ile kelime önemi ilişkisi hakkındaki iddiasını’ temel almaktadır. Luhn’un iddiasının BE açısından geçerliliği detaylıca incelenmiş ve destekleyici bulgulara ulaşılmıştır. Luhn’un iddiasını nicel olarak gösteren ve ‘Terim Frekansı x Ters Belge Frekansı’ (Ing. Term Frequency x Inverse Document Frequency, kıs. TFxIDF) semasınını temel alan ITA formülleri: z puanları tabanlı ve medyan tabanlı olmak üzere iki farklı yöntemle oluşturulmuştur. Ortaya konulan modellere uygun ITA formüllerinin BE başarımları TREC (Ing. Text Retrieval Conference) 6, 7 ve 8 anlık sorgu izi veri kümelerinde test edilmiştir. Bu testlerde elde edilen BE başarımları ile sunulan istatistiksel yaklaşımların indeks terim ağırlıklandırma probleminin çözümü için kullanılabileceği sonucuna varılmıştır. Bu tez kapsamında geliştirilen DFI ile ağırlıklandırma kullanan BE sistemi ile aktif olarak TREC-2009 ve TREC-2010’a katılınmıştır. Türkiye’den ilk defa katılınan 2009 yılındaki TREC’te yalnızca ağırlıklandırma ile bile ortalama bir basarım elde edilmiştir. BE işlemindeki temel bazı yöntemlerin DFI üzerine eklenmesi ile gerçekleştirilen yürütümler ile TREC-2010 web izi anlık sorgu görevinde en iyi sistemler arasına girilmiştir.en_US
dc.identifier.urihttps://hdl.handle.net/11454/5387
dc.language.isotren_US
dc.publisherEge Üniversitesien_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectİndeks terim ağırlıklandırma, bilgi erişim, Luhn’un iddiası, bağımsızlıktan sapma, TFxIDF.en_US
dc.subjectIndex term weighting, information retrieval, Luhn’s claim, divergence from independence, TFxIDFen_US
dc.subjectUluslararası Bilgisayar A.B.D.en_US
dc.titleBilgi erişim sistemlerinde istatistiksel bağımsızlık esasında indeks terim ağırlıklandırmaen_US
dc.typeDoctoral Thesisen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
ilkerkocabas2011.pdf
Boyut:
1.66 MB
Biçim:
Adobe Portable Document Format
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.74 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: