Çoklu modelli üst veri yönetimi temelli anlamsal arama altyapısının geliştirilmesi
Küçük Resim Yok
Tarih
2024
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Ege Üniversitesi, Fen Bilimleri Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/closedAccess
Özet
Verinin değerinin sürekli arttığı, büyük miktarda veri üretme, depolama ve paylaşma kapasitesine sahip bir çağdayız. Verinin yoğunluğu ve etkili bir şekilde yönetilememesi, istenen kalitede veriye ulaşamamak şirketlerde kötü içgörüye, dolayısıyla üretim ve planlamada verimsizliğe neden olur. Etkili üst veri yönetimi, veri keşfini, erişilebilirliğini ve kullanılabilirliğini artırma açısından önemlidir. Başka bir deyişle, üst veri, veri kümesinin nereden geldiği, ne tür veriler içerdiği, sahipliği ve diğer veri kümeleriyle nasıl ilişkilendiği gibi bilgileri içerir, bu da veri kümesinin neyle ilgili olduğunun anlaşılmasına yardımcı olarak, nasıl kullanılması gerektiğine dair yol gösterir. Anlamsal arama ise kullanıcıların yalnızca anahtar kelime eşleme yoluyla değil, verilerin bağlamını ve anlamını anlayarak ilgili bilgileri bulmasını sağlar. Bu tez çalışmasında çeşitli veri kaynaklarından elde edilen verilerin üst veri yönetimi yardımı ile anlamsal arama yapılmasına olanak sağlayan bir sistem altyapısı oluşturulması amaçlanmıştır. Temel hedef, farklı türden veri kaynakları arasında anlamlı bağlantılar kurarak, bilgiye hızlı ve etkili bir şekilde erişimi mümkün kılan bir sistem tasarlamaktır. Bahsedilen altyapının gerçekleştirimi için çizge, anahtar-değer, döküman ve ilişkisel veritabanları birlikte kullanılmıştır. Çizge veritabanları veri kaynaklarının birbirleriyle olan ilişkilerini modellemede ve yeni ilişkilerin keşfedilip modelin genişletilmesinde kullanılmıştır. Anahtar-değer veritabanı sistemdeki tüm eşsiz veri ve üst veri varlıklarını depolamaya ve hızlı bir şekilde erişilmesine imkan sağlamıştır. Döküman veritabanı farklı veri kaynaklarından gelen farklı yapıdaki verilerin ortak bir veri havuzunda birleştirilmesini sağlamıştır. İlişkisel veritabanının ters dizin ve trigram (üçlü karakter dizisi) özelikleri ile bulanık arama yapılarak benzer isimde varlıkların keşfedilmesi sağlanmıştır. Sistem altyapısının geliştirilme süresinde veri bütünleştirme önemli bir rol oynamıştır, veriler üst veri yönetimi sayesinde tutarlı bir şekilde bütünleştirilerek doğru ve güvenilir veriye erişim sağlanması hedeflenmiştir. Bu tezin en büyük katkılarından biri farklı veritabanlarının güçlü yönlerinden yararlanılarak en uygun depolama ve erişim yöntemlerinin birbirini tamamlayarak kullanılmasıdır. Bu çalışma özellikle veri yönetimi ve keşfi alanında önemli bir adım olup, şirketlerin ve kurumların karmaşık, benzer karakterlere ve yapıya sahip olmayan veri kümelerinin ortak bağlamda bütünleştirilmesini ve bunlardan değerli içgörüler elde etmesini, daha verimli ve bilinçli kararlar alabilmesini sağlamayı hedeflemektedir. Bağlamsal açıdan zengin veri varlıklarının tüm potansiyeli açığa çıkartılarak veriye dayalı kararların güvenle alınması, veri yönetimine yönelik standartların ve politikaların uygulanması kolaylaşır. Yapay zeka ve makine öğreniminde üst veriler, veri hazırlama, özellik seçimi, model yorumlama ve zaman içindeki model performansını izleme konularında yardımcı olabilir. Veri profesyonellerinin veri uzayına istediği bir noktadan giriş yaparak gezinmesi, veri kümelerini kıyaslaması, amaca yönelik en kaliteli ve doğru veriye ulaşması amaçlanmaktadır. Tezin bulgularının veri yönetimi ve keşfi alanlarında mevcut literatüre önemli katkılar sunması ve gelecekteki çalışmalara katkı sağlaması beklenmektedir.
Açıklama
Anahtar Kelimeler
Veri yönetimi metamodeli, Çoklu modelli veri mimarisi, Veri bütünleştirme, Üst veri, Anlamsal arama., Data management metamodel, Polyglot data architecture, Data integration, Metadata, Semantic search.