Çizge madenciliği ve algoritmaları
Yükleniyor...
Dosyalar
Tarih
2015
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Ege Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Çizge madenciliği, veri madenciliği ve makine öğrenmesi alanında verileri modelleyerek çalışan yeni bir alandır. Çizge madenciliği ilk kez ortaya çıktığından beri kimyasal bileşikler, DNA yapıları, ilaç etkileşimleri, sosyal ağlar ve bilgisayar ağları gibi birçok alanda uygulama olarak çalışılmıştır. Günümüzde de gittikçe artan ve karmaşık olan yapıları çizge olarak temsil etmek uygulama açısından daha kolaydır. Çizge madenciliğinin önemli kavramlarından biri verilen çizgede sık geçen alt çizgeleri bulmaktır. Sık alt çizgeler ortak protein yapıları, nesne tanımada paylaşılan örüntüler, sahtekarlık tespiti vb. etkin bilgiler sunar. Sık alt çizge bulmak mevcut temel verileri işleme zamanını azaltmak ve anlamlı çizge parçalarını bulabilmektir. Bu tez çalışmasında öncelikle veri madenciliği ile ilgili genel bilgiler sunulmuştur. Sonrasında algoritmalarda kullanılan çizge teorilerinin bilgileri verilmiştir. Daha sonra çizge madenciliği anlatılmış ve bu madenciliğin önemli problemlerinden olan sık alt çizge bulma algoritmaları sınıflandırılmıştır. Çalışmanın son bölümünde ise sık alt çizge algoritmalarından Subdue algoritması terörist ağ verisinde, gSpan algoritması ise Chemical_340 veri seti üzerinde uygulanmıştır. Bu algoritmaların girdi parametreleri değiştirilip çalışma zamanları verilmiş ve yorumlanmıştır.
Açıklama
Anahtar Kelimeler
Veri madenciliği, çizge madenciliği, alt çizge bulma, Subdue, gSpan., Data mining, graph mining, finding frequent subgraph, Subdue, gSpan.