Genomik veritabanlarında indeksleme ve arama yöntemleri üzerine
Yükleniyor...
Dosyalar
Tarih
2018
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Biyoenformatiğin en önemli konularından iki tanesi büyük genomik veritabanlarında gen dizilimleri arama ve genomik verilerin kümelenmesidir. Genomik veri tabanlarında milyarlarca nükleotit yer almaktadır ve bu veritabanlarında hızlı arama yapabilmek ve elde edilen sonuçları doğru analiz edebilmek araştırmacılar için çok önemlidir. Bu konuda yapılan çalışmalar verilerin etkin şekilde indekslenmesi gerekliliğini ortaya koymaktadır. Ayrıca gen dizilerinin fonksiyonel işlevlerinin belirlenmesi, genetik hastalıkların anlaşılması ve tedavi yöntemlerinin geliştirilmesi için bu verilerin kümelenmesi gen analizlerinde büyük kolaylık sağlamaktadır. Genomik verilerin kümelenmesi için de literatürde yapılan birçok çalışma mevcuttur.
Bu proje çalışmasında, genomik veriler için geliştirilen arama, indeksleme ve kümeleme yöntemleri araştırılmıştır. Genomik verilerin kümelenmesi için yeni kümeleme yöntemleri önerilmiştir. Önerilen yöntemlerin sonuçları literatürdeki diğer kümeleme algoritmaları ile karşılaştırılmıştır. Elde edilen sonuçlar önerilen yöntemin literatürdeki diğer algoritmalardan daha iyi kümeleme yaptığını göstermiştir.
Son olarak bu proje çalışmasında arama ve indeksleme teknolojilerinden yararlanan yazılım programları geliştirilmiştir.
Two of the most important subjects of bioinformatics are searching gene sequences in large genomic databases and clustering genomic data. There are billions of nucleotides in genomic databases, and it is very important that researchers search the databases quickly and analyze the results accurately. Studies in this area shows that data should be efficiently indexed. In addition, clustering of these sequences provides great advantage in gene analysis which are the identification of functional sequences of gene sequences, understanding of genetic diseases and development of treatment methods. There are many studies in the literature for the clustering of genomic data. In this thesis, searching, indexing and clustering methods have been researched. New clustering methods have been proposed. The results of the proposed methods are compared with other clustering algorithms in the literature. The results show that the proposed methods performs better than other algorithms in the literature. Finally, in this thesis software programs have been developed using searching and indexing technologies.
Two of the most important subjects of bioinformatics are searching gene sequences in large genomic databases and clustering genomic data. There are billions of nucleotides in genomic databases, and it is very important that researchers search the databases quickly and analyze the results accurately. Studies in this area shows that data should be efficiently indexed. In addition, clustering of these sequences provides great advantage in gene analysis which are the identification of functional sequences of gene sequences, understanding of genetic diseases and development of treatment methods. There are many studies in the literature for the clustering of genomic data. In this thesis, searching, indexing and clustering methods have been researched. New clustering methods have been proposed. The results of the proposed methods are compared with other clustering algorithms in the literature. The results show that the proposed methods performs better than other algorithms in the literature. Finally, in this thesis software programs have been developed using searching and indexing technologies.
Açıklama
Anahtar Kelimeler
Biyoenformatik, Genomik Veritabanları, Arama, İndeksleme, Kümeleme, Bilgisayar Yazılımı, Veri Madenciliği, Hizalama, Dinamik Programlama, Bioinformatics, Genomic Databases, Searching, Indexing, Clustering, Computer Software, Data Mining, Alignment, Dynamic Programming