İngilizce-Türkçe çeviri araçlarının söz dizimsel performans analizi
Yükleniyor...
Dosyalar
Tarih
2016
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Ege Üniversitesi, Fen Bilimleri Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu tezde otomatik tercüme araçları arasında en yaygın kullanılan "Google Translate" ve "Bing Translator" araçlarının İngilizce-Türkçe çevirilerinin birbirlerine ve insan tercümesine sintaktik mesafeleri incelenmiştir. Çalışmada, Microsoft Research firmasının oluşturmuş olduğu "MSR Paraphrase Corpus" ve İnternette bulunan Tatoeba cümle sözlüğünden alınmış cümleler kullanılmıştır. İngilizce dilindeki kaynak cümleler önce profesyonel tercüme firması tarafından çevrilmiştir. Sonra aynı cümleler Google Translate ve Bing Translator araçları kullanılarak Türkçe diline çevrilmiştir. Bu makine tercümeleri, birbirleriyle ve insan tercümesi ile söz dizimsel metin benzerlik yöntemleri (Minimum Düzeltim Uzaklığı, Eşleşen Kelime Oranı, Cümle Uzunluğu Oranı, Sıralama Oranı, Ortak Kelime Kümesi Oranı, BLEU ve METEOR) kullanılarak karşılaştırılmıştır. Sonrasında cümlelere gövdeleme işlemi yapılmış ve gövdelenmiş cümleler tekrar karşılaştırılmıştır. Son olarak seçilen 100 adet cümleye insan değerlendirmesi yapılmıştır.
In this thesis, the syntactic distance between English-Turkish human translation and the most commonly used automatic translation tools, "Google Translate" and "Bing Translator", have been examined using the text similarity methods. In the study, source sentences are used taken from "MSR Paraphrase Corpus" which was created by the Microsoft Research company and from Tatoeba sentence dictionary which is on the Internet. Source sentences which are in English language are first translated to Turkish by professional translation firm. After that, same sentences are translated to Turkish by Google Translate and Bing Translator tools. These machine translations are compared with the human translation using the syntactic text similarity methods. (Minimum Edit Distance, Matching Words Ratio, Text Length Ratio, Sequence Ratio, Common Word Set Ratio, BLEU and METEOR). Then, stemming is applied to all sentences and they are compared again after stemming. Finally, 100 selected sentences are evaluated by human judgement.
In this thesis, the syntactic distance between English-Turkish human translation and the most commonly used automatic translation tools, "Google Translate" and "Bing Translator", have been examined using the text similarity methods. In the study, source sentences are used taken from "MSR Paraphrase Corpus" which was created by the Microsoft Research company and from Tatoeba sentence dictionary which is on the Internet. Source sentences which are in English language are first translated to Turkish by professional translation firm. After that, same sentences are translated to Turkish by Google Translate and Bing Translator tools. These machine translations are compared with the human translation using the syntactic text similarity methods. (Minimum Edit Distance, Matching Words Ratio, Text Length Ratio, Sequence Ratio, Common Word Set Ratio, BLEU and METEOR). Then, stemming is applied to all sentences and they are compared again after stemming. Finally, 100 selected sentences are evaluated by human judgement.
Açıklama
Anahtar Kelimeler
Otomatik Tercüme, Google Translate, Bing Translator, Söz Dizimsel Metin Benzerlik, Minimum Düzeltim Uzaklığı, Eşleşen Kelime Oranı, Cümle Uzunluğu Oranı, Sıralama Oranı, Ortak Kelime Kümesi Oranı, BLEU, METEOR, Automatic Translation, SyntacticText Similarity, Minimum Edit Distance, Matching Words Ratio, Text Length Ratio, Sequence Ratio, Common Word Set Ratio