Güncel Türkçe metinlerde kalıplaşmış söz birliklerinin tespiti

dc.contributor.advisorKaraoğlan, Bahar
dc.contributor.authorHınçalan, Sinem
dc.date.accessioned2018-11-20T07:15:00Z
dc.date.available2018-11-20T07:15:00Z
dc.date.issued2011
dc.departmentEge Üniversitesi, Fen Bilimleri Enstitüsüen_US
dc.description.abstractTez çalışmasında, güncel Türkçe metinlerde geçen kalıplaşmış söz birliklerinin bir alt grubu olan ikilemelerin dilbilimsel özellikleri dikkate alınarak tespit edilmesi amaçlanmaktadır. İki sözcüğün birleşmesiyle bir anlam bütünü olan söz birliklerine "ikileme" denir. Kelime türü tespiti, bilgi çıkarsama, makine çevirisi vb. doğal dil işleme çalışmalarında ikilemeler önemli yere sahiptirler. Tez çalışmasında kural tabanlı yaklaşım uygulanarak metin içinde geçen ikilemelerin tespiti yapılmıştır. Kuralların oluşturulması için “Deyimler ve Atasözleri” sözlüğündeki ikilemelerin özellikleri çıkarılmıştır. Bu kurallar, metinde geçen ikilemeleri bulmak amacıyla yapı ve ses benzerliklerine göre ayrılmıştır. Benzerlikler de; kelimenin türüne, uzunluğuna ve harflerin benzerlik oranlarına yani biçimsel özelliklere bakılmış ve kurallar yazılmıştır. Yazılan kurallar “Orta Doğu Teknik” ve “Sabancı” üniversitelerinin ortaklaşa çalışmaları sonucu geliştirmiş oldukları OSTAD derleminin gövdelenmiş ve yüzeysel formunda çalıştırılıp, yakalanan ikilemelerin duyarlılık (precision) ve anma (recall) değerleri hesaplanarak kıyaslanmıştır. Elde edilen sonuçlara göre kelime uzunluğu, sözcük türü, benzer harf sayısı ve sesli-sessiz harf benzerlik oranının ikilemelerin tespitinde önemli etkisi olduğu görülmüştür. Aynı zamanda ikilemelerin tespitinde gövdelenmiş derlem kullanımının yüzeysel forma göre daha fazla başarılı olduğu saptanmıştır.en_US
dc.identifier.urihttps://hdl.handle.net/11454/5304
dc.language.isotren_US
dc.publisherEge Üniversitesien_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectDoğal dil işleme, ikilemelerin tespiti, kural tabanlı yöntemler, duyarlılık ve anma.en_US
dc.subjectNatural Language Processing, Rule-based Methods, Determination of Reiteratives, Precision and Recall.en_US
dc.subjectUluslararası Bilgisayar A.B.D.en_US
dc.titleGüncel Türkçe metinlerde kalıplaşmış söz birliklerinin tespitien_US
dc.typeMaster Thesisen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
sinemhincalan2011.pdf
Boyut:
7.71 MB
Biçim:
Adobe Portable Document Format
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.71 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: