Büyük veri ve büyük verinin bir uygulaması

Küçük Resim Yok

Tarih

2024

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Ege Üniversitesi, Fen Bilimleri Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

2005 yılında O'Reilly Media'da pazar araştırma müdürü olarak çalışan Roger Magoulas tarafından bilgisayar dünyasına tanıtılan 'Büyük Veri', boyutu ve karmaşıklığı nedeniyle geleneksel veri yönetimi teknikleriyle ele alınamayan büyük ölçekli verilerin yönetimini tanımlamak için kullanılan bir terimdir. Büyük Veri üzerine yapılan bazı araştırmalar, bu konudaki çalışmaların 1970'li yıllardan itibaren başladığını göstermiş olsa da, konunun tarihsel detayları göz önüne alındığında, bu konudaki asıl çalışmaların 2008 yılında başladığı görülmektedir. Birçok diğer alan ve konuda olduğu gibi, Büyük Veri, bugüne kadar yapılan çalışmalar boyunca değişim geçirmiş ve günümüzde çeşitli uygulamalarda farklı yaklaşımlarla ele alınmıştır. Büyük Veri'nin günümüzde bu kadar önem kazanmasının birçok farklı nedeni bulunmaktadır. Büyük Veri, gerçek ve güncel verilerin analizine odaklandığından, üretimde maliyeti azaltma, reklam harcamalarını doğru yönlendirme, işgücü açısından tasarruf sağlama ve pazara uygun ürünler geliştirme/üretme gibi çeşitli süreçlerde doğru kararlar alınmasında önemli bir rol oynamaktadır. Büyük Veri, bugün birçok alanda önemli bir kavram haline gelmiştir. Veri analizleri ve veri üzerinde yoğun çalışmalar artık üretim ve pazar gibi, sosyal yaşantımızda sıklıkla içerisinde bulunduğumuz alanları da etkilemeye başlamıştır. Büyük Veri üzerine yapılan araştırmalar ve çalışmalar, genellikle müşteri memnuniyetini artırma, kitle analizi yapma, reklam trendlerini belirleme, erken hastalık teşhisi koyma, kolluk kuvvetlerine stratejik karar alma desteği sağlama, doğal afetlerin öngörülmesi ve yeni felaketlerin tahmin edilmesi gibi konularla ilişkilendirilir. Yapısal bir sıralamaya sahip olmayan ve büyük boyutlara ulaşan verilerin toplanması ve işlenmesi, günümüzde önemli bir değer haline gelmiştir. Bu nedenle, bu görevlerin tümünde verilerin depolanması, analiz edilmesi, yorumlanması ve kullanılması büyük önem kazanmış, bu süreçlerde yazılım dilleri kritik rol oynamaya başlamıştır. Bu tez çalışmasında, büyük veri kavramı üzerine literatür taraması yapılarak, Python programlama dili ile bir büyük veri uygulamasına odaklanılmıştır. Kullanılan bilgisayarın kapasitesi ölçüsünde seçilen verisetleri üzerinde büyük veri analizi kavramı simüle bir biçimde incelenmiştir. K-en Yakın Komşu (KNN) algoritması kullanılarak farklı metrikler ve farklı k değerlerinin algoritmanın performansı ve doğruluğu üzerindeki etkileri incelenmiştir. Elde edilen sonuçlar analiz edilerek, bu parametrelerin modelin başarısına katkıları yorumlanmıştır.

Açıklama

Anahtar Kelimeler

Büyük Veri, Veri Analizi, Kümeleme, Sınıflandırma., Big Data, Data Analysis, Clustering, Classification.

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye