Yapısal olmayan Türkçe verilerin bağlı veri kaynaklarıyla etiketlenmesİ
Yükleniyor...
Dosyalar
Tarih
2015
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Ege Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu tezde yapısal olmayan Türkçe öz geçmişler ve LinkedIn profesyonel sosyal ağ sitesinden sağlanan yarı yapısal Türkçe veriler bağlı veri kaynaklarıyla etiketlenerek anlamsallaştırılmıştır. Verilerin etiketlenmesinde kullanılan Türkçe doğal dil işleme aracının geliştirilmesinde kullanılabilecek kütüphaneler incelenmiş ve bu kütüphanelerden Zemberek kütüphanesi kullanılmıştır. Etiketlenmiş verilerin ve çalışma kapsamında kullanılan diğer verilerin saklanmasında kullanılabilecek veri depolama altyapıları incelenmiştir. Verilerin saklanacağı en etkin veri depolama altyapısını belirlemek için anlamsal verilerin saklandığı üçlü depolama altyapıları ile NoSQL veritabanları incelenmiştir. Çalışmada melez veri altyapısını destekleyen Polyglot Persistence yaklaşımı benimsenmiştir.
Açıklama
Anahtar Kelimeler
Doğal dil işleme, melez veri, polyglot persistence, anlamsal ağ, bağlı veri, yarı yapısal veri, yapısal olmayan veri., Natural language process, hybrid data, ployglot persistence, semantic web, linked data, semi-structured data, unstructured data.