Kümeleme algoritmaları ve pararlelleştirilmeleri
Dosyalar
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Kümeleme (veya Küme Analizi), verilerin belirli bir benzerlik ölçütüne göre kümelere ayrılmasını amaçlayan bir veri analizi tekniğidir. Diğer bir deyişle, birbirine benzer verilerin bir arada yer aldığı homojen grupları belirleme işidir. Kümelemede ele alınan veri setleri genellikle çok büyüktür. Bu yüzden, geliştirilen yöntemlerin hızı, kümelemedeki başarısı kadar -kimi zaman daha fazla- öneme sahiptir. Her iki yönden de başarılı yöntemler var olsa da, işin doğası nedeniyle potansiyel işlem yükü hala ağırdır. Temel kümeleme algoritmaları seri bir makine modeliyle geliştirilmiştir ve modern bir bilgisayardan kapasitesinin altında verim sağlayabilirler. Bu handikapı aşmanın yolu, yöntemleri paralel hesaplamaya uygun hale getirmektir. Bu tezde, kümeleme yöntemleri ve paralel hesaplama araçları çeşitli açılardan incelenmiş, kümeleme başarısı yüksek iki algoritmanın paralel versiyonları önerilmiştir. Bu algoritmalar, C programlama dili ve OpenMP uygulama programlama arayüzü kullanılarak programlanmış ve alt programları barındıran bir kütüphane oluşturulmuştur. Önerilen yöntemler, teorik ve deneysel olarak analiz edilerek paralelleştirmenin etkisi gösterilmiştir.