Güncel Türkçe metinlerde kalıplaşmış söz birliklerinin tespiti

Yükleniyor...
Küçük Resim

Tarih

2011

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Ege Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Tez çalışmasında, güncel Türkçe metinlerde geçen kalıplaşmış söz birliklerinin bir alt grubu olan ikilemelerin dilbilimsel özellikleri dikkate alınarak tespit edilmesi amaçlanmaktadır. İki sözcüğün birleşmesiyle bir anlam bütünü olan söz birliklerine "ikileme" denir. Kelime türü tespiti, bilgi çıkarsama, makine çevirisi vb. doğal dil işleme çalışmalarında ikilemeler önemli yere sahiptirler. Tez çalışmasında kural tabanlı yaklaşım uygulanarak metin içinde geçen ikilemelerin tespiti yapılmıştır. Kuralların oluşturulması için “Deyimler ve Atasözleri” sözlüğündeki ikilemelerin özellikleri çıkarılmıştır. Bu kurallar, metinde geçen ikilemeleri bulmak amacıyla yapı ve ses benzerliklerine göre ayrılmıştır. Benzerlikler de; kelimenin türüne, uzunluğuna ve harflerin benzerlik oranlarına yani biçimsel özelliklere bakılmış ve kurallar yazılmıştır. Yazılan kurallar “Orta Doğu Teknik” ve “Sabancı” üniversitelerinin ortaklaşa çalışmaları sonucu geliştirmiş oldukları OSTAD derleminin gövdelenmiş ve yüzeysel formunda çalıştırılıp, yakalanan ikilemelerin duyarlılık (precision) ve anma (recall) değerleri hesaplanarak kıyaslanmıştır. Elde edilen sonuçlara göre kelime uzunluğu, sözcük türü, benzer harf sayısı ve sesli-sessiz harf benzerlik oranının ikilemelerin tespitinde önemli etkisi olduğu görülmüştür. Aynı zamanda ikilemelerin tespitinde gövdelenmiş derlem kullanımının yüzeysel forma göre daha fazla başarılı olduğu saptanmıştır.

Açıklama

Anahtar Kelimeler

Doğal dil işleme, ikilemelerin tespiti, kural tabanlı yöntemler, duyarlılık ve anma., Natural Language Processing, Rule-based Methods, Determination of Reiteratives, Precision and Recall., Uluslararası Bilgisayar A.B.D.

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye