Diyabet tanısının tahminlenmesinde denetimli makine öğrenme algoritmalarının performans karşılaştırması

dc.contributor.authorÖzkan, Yüksel
dc.contributor.authorYürekli, Banu Şarer
dc.contributor.authorSuner, Aslı
dc.date.accessioned2024-08-25T18:53:21Z
dc.date.available2024-08-25T18:53:21Z
dc.date.issued2022
dc.departmentEge Üniversitesien_US
dc.description.abstractHastalık tanısının doğru sınıflandırılmasında, hangi değişkenlerin analize alınacağı ve sonuçların nasıl değerlendirileceği klinik karar verme sürecinin yanı sıra istatistiksel yaklaşımda da doğru bir şekilde tanımlanmalıdır. Bu çalışmada en iyi sınıflandırma performansına sahip algoritmaya iki farklı yaklaşımla karar verilmesi amaçlanmıştır. Kullanılan veri seti, Haziran–Eylül 2013 arasında bir devlet hastanesinin endokrinoloji polikliniğine gelen yaşı 18 ve üstü olan toplam 232 hastadan elde edilmiştir. Diyabet tanısının sınıflandırılması için iki farklı yaklaşım kullanılmıştır. İlk yaklaşımda çokterimli lojistik regresyon yönteminde istatistiksel olarak anlamlı bulunan 18 değişken, ikinci yaklaşımda ise endokrinoloji uzmanı tarafından belirlenen ve klinik olarak önemli bulunan 21 değişkenle modeller kurulmuştur. Diyabet tanısı, denetimli makine öğrenme algoritmalarından Naïve Bayes, Bayes ağları, rastgele orman, karar ağaçları, destek vektör makinaları, k-en yakın komşuluk, yapay sinir ağları ve çokterimli lojistik regresyon yöntemleri ile sınıflandırılmıştır. Model performansları, doğrulukları, Kappa istatistikleri, ortalama mutlak hataları, hata kareler ortalamalarının karekökleri, göreceli mutlak hataları, duyarlılıkları, seçicilikleri, kesinlikleri, F-ölçütleri, Matthews korelasyon katsayıları, ROC eğrileri ve Youden indeksleri kriterlerine göre karşılaştırılmıştır. Model performanslarının test edilmesinde 10-katlı çapraz geçerlilik yöntemi uygulanmış, her algoritmanın çalışma süreleri hesaplanmıştır. Tüm analizler, WEKA 3.8.2 ve R Studio 1.1.383 ile yapılmıştır. Genel anlamda en iyi performansa sahip algoritma, rastgele orman algoritması olarak belirlenmiş, model doğrulukları sırasıyla %84.48 ve %81.90 olarak bulunmuştur. Diyabet hastalığının tanısının konulmasında, doğru sınıflandırma yapabilen modelin seçiminde klinik anlamlılığın yanı sıra istatistiksel anlamlılığa da önem verilmelidir.en_US
dc.identifier.doi10.17714/gumusfenbil.820882
dc.identifier.endpage226en_US
dc.identifier.issn2146-538X
dc.identifier.issue1en_US
dc.identifier.startpage211en_US
dc.identifier.trdizinid1139806en_US
dc.identifier.urihttps://doi.org/10.17714/gumusfenbil.820882
dc.identifier.urihttps://search.trdizin.gov.tr/tr/yayin/detay/1139806
dc.identifier.urihttps://hdl.handle.net/11454/103062
dc.identifier.volume12en_US
dc.indekslendigikaynakTR-Dizinen_US
dc.language.isotren_US
dc.relation.ispartofGümüşhane Üniversitesi Fen Bilimleri Dergisien_US
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanıen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.snmz20240825_Gen_US
dc.subjectDenetimli öğrenmeen_US
dc.subjectDiyabet tanısıen_US
dc.subjectMakina öğrenme algoritmalarıen_US
dc.subjectPrediyabeten_US
dc.subjectSınıflandırma[Supervised learningen_US
dc.subjectDiabetes mellitus diagnosisen_US
dc.subjectMachine learning algorithmsen_US
dc.subjectPrediabetesen_US
dc.subjectClassificationen_US
dc.titleDiyabet tanısının tahminlenmesinde denetimli makine öğrenme algoritmalarının performans karşılaştırmasıen_US
dc.typeArticleen_US

Dosyalar