Sınıf Dengesizliği Varlığında Hastalık Tanısı içinKolektif Öğrenme Yöntemlerinin Karşılaştırılması:Diyabet Tanısı Örneği

dc.contributor.authorYürekli, Banu Şarer
dc.contributor.authorTurhan, Sultan
dc.contributor.authorÖzkan, Yüksel
dc.contributor.authorSuner, Aslı
dc.contributor.authorDoğu, Eralp
dc.date.accessioned2023-01-12T20:32:50Z
dc.date.available2023-01-12T20:32:50Z
dc.date.issued2020
dc.departmentN/A/Departmenten_US
dc.description.abstractAmaç: Günümüzde makine öğrenmesi yöntemleri hastalık tanısının konulmasında yaygın olarak kullanılmaktadır. Ancak sağlık verisinin büyük hacimli, çok boyutlu ve karmaşık olması nedeniyle dengesiz sınıf problemi ile karşılaşılması durumunda bu yöntemlerin doğrudan kullanımı performans düşüşüne neden olmaktadır. Bu çalışmada diyabet hastalarına ilişkin dengesiz yapıdaki bir veri seti kullanılarak çeşitli yeniden örnekleme yöntemleri dengesizlik probleminin giderilmesinde kullanılmış ve kolektif (ensemble) öğrenme algoritmalarına entegre edilerek diyabet tanısı üzerinden sınıflandırma performansları karşılaştırılmıştır. Gereç Yöntemler: Kullanılan veriler Haziran – Eylül 2013 tarihleri arasında, İzmir Bozkaya Eğitim ve Araştırma Hastanesi, Endokrinoloji ve Metabolizma Hastalıkları polikliniğine başvuran, 18 yaşından büyük 185 hastadan elde edilmiştir. Diyabet tanısının sınıflandırmasına yönelik sınıf dengesizliği problemini gidermek amacıyla alt örnekleme (under sampling), aşırı örnekleme (over sampling) ve sentetik azınlık aşırı örnekleme (SMOTE) yöntemleri kullanılmıştır. Sınıflandırma performansı üzerindeki etkiler, torbalama (bagging) ve arttırma (boosting) temelli kolektif öğrenme yöntemlerine entegre edilmesiyle karşılaştırılmıştır. Algoritmaların doğru sınıflandırma performanslarının karşılaştırılmasında doğruluk, Kappa istatistiği, duyarlılık ve seçicilik ölçütleri kullanılmıştır. Tüm istatistiksel analizler, açık kaynak kodlu bir yazılım olan R programlama dilinde yapılmıştır. Bulgular: Dengesiz veri setinde ham veri ile yapılan diyabet tanısı sınıflandırma başarısı oldukça düşüktür. Aşırı örnekleme yöntemi ile yapılan sınıflandırmaların, orijinal dengesiz veri seti, alt örnekleme ve sentetik azınlık aşırı örnekleme yöntemi ile yapılan sınıflandırmalardan çok daha başarılı tahmin gücüne sahip olduğu tespit edilmiştir. Sonuç: Sınıf dengesizliği varlığında veri setlerini yeniden örnekleme yöntemlerine tabi tutarak veriyi dengeledikten sonra sınıflandırma algoritmalarının kullanılması önerilmektedir.en_US
dc.identifier.doi10.5336/biostatic.2019-66816
dc.identifier.endpage26en_US
dc.identifier.issn2146-8877
dc.identifier.issue1en_US
dc.identifier.startpage16en_US
dc.identifier.trdizinid426921en_US
dc.identifier.urihttps://doi.org/10.5336/biostatic.2019-66816
dc.identifier.urihttps://search.trdizin.gov.tr/yayin/detay/426921
dc.identifier.urihttps://hdl.handle.net/11454/81230
dc.identifier.volume12en_US
dc.indekslendigikaynakTR-Dizinen_US
dc.language.isotren_US
dc.relation.ispartofTürkiye Klinikleri Biyoistatistik Dergisien_US
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanıen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.titleSınıf Dengesizliği Varlığında Hastalık Tanısı içinKolektif Öğrenme Yöntemlerinin Karşılaştırılması:Diyabet Tanısı Örneğien_US
dc.typeArticleen_US

Dosyalar