İngilizce-Türkçe çeviri araçlarının söz dizimsel performans analizi

Yükleniyor...
Küçük Resim

Tarih

2016

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Ege Üniversitesi, Fen Bilimleri Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Bu tezde otomatik tercüme araçları arasında en yaygın kullanılan "Google Translate" ve "Bing Translator" araçlarının İngilizce-Türkçe çevirilerinin birbirlerine ve insan tercümesine sintaktik mesafeleri incelenmiştir. Çalışmada, Microsoft Research firmasının oluşturmuş olduğu "MSR Paraphrase Corpus" ve İnternette bulunan Tatoeba cümle sözlüğünden alınmış cümleler kullanılmıştır. İngilizce dilindeki kaynak cümleler önce profesyonel tercüme firması tarafından çevrilmiştir. Sonra aynı cümleler Google Translate ve Bing Translator araçları kullanılarak Türkçe diline çevrilmiştir. Bu makine tercümeleri, birbirleriyle ve insan tercümesi ile söz dizimsel metin benzerlik yöntemleri (Minimum Düzeltim Uzaklığı, Eşleşen Kelime Oranı, Cümle Uzunluğu Oranı, Sıralama Oranı, Ortak Kelime Kümesi Oranı, BLEU ve METEOR) kullanılarak karşılaştırılmıştır. Sonrasında cümlelere gövdeleme işlemi yapılmış ve gövdelenmiş cümleler tekrar karşılaştırılmıştır. Son olarak seçilen 100 adet cümleye insan değerlendirmesi yapılmıştır.
In this thesis, the syntactic distance between English-Turkish human translation and the most commonly used automatic translation tools, "Google Translate" and "Bing Translator", have been examined using the text similarity methods. In the study, source sentences are used taken from "MSR Paraphrase Corpus" which was created by the Microsoft Research company and from Tatoeba sentence dictionary which is on the Internet. Source sentences which are in English language are first translated to Turkish by professional translation firm. After that, same sentences are translated to Turkish by Google Translate and Bing Translator tools. These machine translations are compared with the human translation using the syntactic text similarity methods. (Minimum Edit Distance, Matching Words Ratio, Text Length Ratio, Sequence Ratio, Common Word Set Ratio, BLEU and METEOR). Then, stemming is applied to all sentences and they are compared again after stemming. Finally, 100 selected sentences are evaluated by human judgement.

Açıklama

Anahtar Kelimeler

Otomatik Tercüme, Google Translate, Bing Translator, Söz Dizimsel Metin Benzerlik, Minimum Düzeltim Uzaklığı, Eşleşen Kelime Oranı, Cümle Uzunluğu Oranı, Sıralama Oranı, Ortak Kelime Kümesi Oranı, BLEU, METEOR, Automatic Translation, SyntacticText Similarity, Minimum Edit Distance, Matching Words Ratio, Text Length Ratio, Sequence Ratio, Common Word Set Ratio

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye