Diyabet dünya genelinde görülme oranı giderek artan, yaygın sağlık sorunlarından biridir. Kronik bir hastalık olan diyabet kontrol altına alınmadığı takdirde göz, kalp, böbrek gibi birçok organda tahribata ve ölümlere neden olabilmektedir. Diyabetin erken teşhisi oluşabilecek komplikasyonları önleme ve yaşam kalitesini arttırma açısından önemlidir. Medikal alanda yaygın kullanılan makine öğrenmesi teknikleri farklı hastalıkların teşhisinde uzmanlar için zeki birer karar destek sistemi rolü üstlenmektedir. Bu çalışma, diyabetin erken teşhisine yönelik olarak 6 farklı makine öğrenmesi tekniği ile PIMA diyabet veri seti üzerinde gerçekleştirilen sınıflama çalışmalarını içermektedir. Sınıflama çalışmalarındaki temel amaç tahmin doğruluğunu arttırmaktır. Bu çalışmada sınıflandırıcıların başarıları arttırmak için veri seti üzerinde 14 farklı yeniden örnekleme yöntemi kullanılmıştır. Her bir makine öğrenmesi modeli için örnekleme olmaksızın ve yeniden örnekleme yapılarak, 90 sınıflama işlemi gerçekleştirilmiştir. Her bir sınıflandırma işleminin başarısı 5 farklı performans metriği ile raporlanmıştır. En başarılı sonuç %96,296 doğrulukla, InstanceHardnessThreshold az örnekleme tekniği ile birlikte Rastgele Orman modelinin kullanıldığı sınıflandırma işleminde elde edilmiştir. Yeniden örnekleme tekniklerinin genel olarak sınıflandırıcıların başarılarını arttırdığı ve kolektif öğrenme yöntemleri ile birlikte kullanıldığında daha başarılı sonuç verdiği görülmüştür. Literatürde aynı veri seti üzerinde, çeşitli makine öğrenmesi yöntemleri kullanılarak yapılan en son çalışmalar ile kıyaslandığında, bu çalışmada elde edilen başarının diğerlerinden daha yüksek ortaya konmuştur.
Diabetes is one of the increasing, common health problems worldwide. Diabetes, a chronic disease that is not controlled, can cause destruction and death in many organs, such as eyes, heart, kidneys. Early diagnosis of diabetes is important in order to prevent complications that may occur and improve the quality of life. The machine learning techniques commonly used in the medical field take the role of a smart decision support system for specialists in the diagnosis of different diseases. This study includes classification studies carried out on the PIMA diabetes data set with 6 different machine learning techniques for early diagnosis of diabetes. The main objective in classwork studies is to increase the accuracy of predictions. In this study, 14 different sampling methods were used on the data set to increase the success of classifiers. 90 classification processes have been carried out without sampling and re-sampleing for each machine learning model. The success of each classification process is
Alan : Mimarlık, Planlama ve Tasarım; Mühendislik
Dergi Türü : Uluslararası
Benzer Makaleler | Yazar | # |
---|
Makale | Yazar | # |
---|