Büyük veri ve büyük verinin bir uygulaması
Küçük Resim Yok
Tarih
2024
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Ege Üniversitesi, Fen Bilimleri Enstitüsü
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
2005 yılında O'Reilly Media'da pazar araştırma müdürü olarak çalışan Roger Magoulas tarafından bilgisayar dünyasına tanıtılan 'Büyük Veri', boyutu ve karmaşıklığı nedeniyle geleneksel veri yönetimi teknikleriyle ele alınamayan büyük ölçekli verilerin yönetimini tanımlamak için kullanılan bir terimdir. Büyük Veri üzerine yapılan bazı araştırmalar, bu konudaki çalışmaların 1970'li yıllardan itibaren başladığını göstermiş olsa da, konunun tarihsel detayları göz önüne alındığında, bu konudaki asıl çalışmaların 2008 yılında başladığı görülmektedir. Birçok diğer alan ve konuda olduğu gibi, Büyük Veri, bugüne kadar yapılan çalışmalar boyunca değişim geçirmiş ve günümüzde çeşitli uygulamalarda farklı yaklaşımlarla ele alınmıştır. Büyük Veri'nin günümüzde bu kadar önem kazanmasının birçok farklı nedeni bulunmaktadır. Büyük Veri, gerçek ve güncel verilerin analizine odaklandığından, üretimde maliyeti azaltma, reklam harcamalarını doğru yönlendirme, işgücü açısından tasarruf sağlama ve pazara uygun ürünler geliştirme/üretme gibi çeşitli süreçlerde doğru kararlar alınmasında önemli bir rol oynamaktadır. Büyük Veri, bugün birçok alanda önemli bir kavram haline gelmiştir. Veri analizleri ve veri üzerinde yoğun çalışmalar artık üretim ve pazar gibi, sosyal yaşantımızda sıklıkla içerisinde bulunduğumuz alanları da etkilemeye başlamıştır. Büyük Veri üzerine yapılan araştırmalar ve çalışmalar, genellikle müşteri memnuniyetini artırma, kitle analizi yapma, reklam trendlerini belirleme, erken hastalık teşhisi koyma, kolluk kuvvetlerine stratejik karar alma desteği sağlama, doğal afetlerin öngörülmesi ve yeni felaketlerin tahmin edilmesi gibi konularla ilişkilendirilir. Yapısal bir sıralamaya sahip olmayan ve büyük boyutlara ulaşan verilerin toplanması ve işlenmesi, günümüzde önemli bir değer haline gelmiştir. Bu nedenle, bu görevlerin tümünde verilerin depolanması, analiz edilmesi, yorumlanması ve kullanılması büyük önem kazanmış, bu süreçlerde yazılım dilleri kritik rol oynamaya başlamıştır. Bu tez çalışmasında, büyük veri kavramı üzerine literatür taraması yapılarak, Python programlama dili ile bir büyük veri uygulamasına odaklanılmıştır. Kullanılan bilgisayarın kapasitesi ölçüsünde seçilen verisetleri üzerinde büyük veri analizi kavramı simüle bir biçimde incelenmiştir. K-en Yakın Komşu (KNN) algoritması kullanılarak farklı metrikler ve farklı k değerlerinin algoritmanın performansı ve doğruluğu üzerindeki etkileri incelenmiştir. Elde edilen sonuçlar analiz edilerek, bu parametrelerin modelin başarısına katkıları yorumlanmıştır.
Açıklama
Anahtar Kelimeler
Büyük Veri, Veri Analizi, Kümeleme, Sınıflandırma., Big Data, Data Analysis, Clustering, Classification.