Çoklu modelli üst veri yönetimi temelli anlamsal arama altyapısının geliştirilmesi

Küçük Resim Yok

Tarih

2024

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Ege Üniversitesi, Fen Bilimleri Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/closedAccess

Özet

Verinin değerinin sürekli arttığı, büyük miktarda veri üretme, depolama ve paylaşma kapasitesine sahip bir çağdayız. Verinin yoğunluğu ve etkili bir şekilde yönetilememesi, istenen kalitede veriye ulaşamamak şirketlerde kötü içgörüye, dolayısıyla üretim ve planlamada verimsizliğe neden olur. Etkili üst veri yönetimi, veri keşfini, erişilebilirliğini ve kullanılabilirliğini artırma açısından önemlidir. Başka bir deyişle, üst veri, veri kümesinin nereden geldiği, ne tür veriler içerdiği, sahipliği ve diğer veri kümeleriyle nasıl ilişkilendiği gibi bilgileri içerir, bu da veri kümesinin neyle ilgili olduğunun anlaşılmasına yardımcı olarak, nasıl kullanılması gerektiğine dair yol gösterir. Anlamsal arama ise kullanıcıların yalnızca anahtar kelime eşleme yoluyla değil, verilerin bağlamını ve anlamını anlayarak ilgili bilgileri bulmasını sağlar. Bu tez çalışmasında çeşitli veri kaynaklarından elde edilen verilerin üst veri yönetimi yardımı ile anlamsal arama yapılmasına olanak sağlayan bir sistem altyapısı oluşturulması amaçlanmıştır. Temel hedef, farklı türden veri kaynakları arasında anlamlı bağlantılar kurarak, bilgiye hızlı ve etkili bir şekilde erişimi mümkün kılan bir sistem tasarlamaktır. Bahsedilen altyapının gerçekleştirimi için çizge, anahtar-değer, döküman ve ilişkisel veritabanları birlikte kullanılmıştır. Çizge veritabanları veri kaynaklarının birbirleriyle olan ilişkilerini modellemede ve yeni ilişkilerin keşfedilip modelin genişletilmesinde kullanılmıştır. Anahtar-değer veritabanı sistemdeki tüm eşsiz veri ve üst veri varlıklarını depolamaya ve hızlı bir şekilde erişilmesine imkan sağlamıştır. Döküman veritabanı farklı veri kaynaklarından gelen farklı yapıdaki verilerin ortak bir veri havuzunda birleştirilmesini sağlamıştır. İlişkisel veritabanının ters dizin ve trigram (üçlü karakter dizisi) özelikleri ile bulanık arama yapılarak benzer isimde varlıkların keşfedilmesi sağlanmıştır. Sistem altyapısının geliştirilme süresinde veri bütünleştirme önemli bir rol oynamıştır, veriler üst veri yönetimi sayesinde tutarlı bir şekilde bütünleştirilerek doğru ve güvenilir veriye erişim sağlanması hedeflenmiştir. Bu tezin en büyük katkılarından biri farklı veritabanlarının güçlü yönlerinden yararlanılarak en uygun depolama ve erişim yöntemlerinin birbirini tamamlayarak kullanılmasıdır. Bu çalışma özellikle veri yönetimi ve keşfi alanında önemli bir adım olup, şirketlerin ve kurumların karmaşık, benzer karakterlere ve yapıya sahip olmayan veri kümelerinin ortak bağlamda bütünleştirilmesini ve bunlardan değerli içgörüler elde etmesini, daha verimli ve bilinçli kararlar alabilmesini sağlamayı hedeflemektedir. Bağlamsal açıdan zengin veri varlıklarının tüm potansiyeli açığa çıkartılarak veriye dayalı kararların güvenle alınması, veri yönetimine yönelik standartların ve politikaların uygulanması kolaylaşır. Yapay zeka ve makine öğreniminde üst veriler, veri hazırlama, özellik seçimi, model yorumlama ve zaman içindeki model performansını izleme konularında yardımcı olabilir. Veri profesyonellerinin veri uzayına istediği bir noktadan giriş yaparak gezinmesi, veri kümelerini kıyaslaması, amaca yönelik en kaliteli ve doğru veriye ulaşması amaçlanmaktadır. Tezin bulgularının veri yönetimi ve keşfi alanlarında mevcut literatüre önemli katkılar sunması ve gelecekteki çalışmalara katkı sağlaması beklenmektedir.

Açıklama

Anahtar Kelimeler

Veri yönetimi metamodeli, Çoklu modelli veri mimarisi, Veri bütünleştirme, Üst veri, Anlamsal arama., Data management metamodel, Polyglot data architecture, Data integration, Metadata, Semantic search.

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye