Günümüzde tıpta hastalıklarla ilgili veri miktarı artmakta ve bu verilerden hastalığın sınıfı hakkında tahminler yapılmaktadır. Bu tahminlere için olumlu sonuç sağlayabilecek teknikler üzerinde çalışmalar geliştirilmektedir. Bu tahminler için kullanılacak olan sınıflandırma algoritmaları bu tekniklerle daha doğru sınıflandırma başarısı gösterebilmektedir. Bu çalışmada karaciğer ve kalp hastalığı veri setleri ondalık ölçekleme, minimum maksimum, z-skor ve norm normalizasyon yöntemleriyle normalize edilmiştir. Daha sonra bu normalize edilen veriler ve ham verilere, 4 farklı k-kat çapraz değerlendirmede (2,5,10,20) yapay sinir ağları, Naive Bayes, destek vektör makinesi, k-NN ve karar ağacı gibi çeşitli sınıflandırma algoritmalarıyla ORANGE programı kullanılarak sınıflandırma işlemine tabi tutulmuştur. Verilerin sınıflama doğrulukları değerlendirilmiş ve normalizasyon yöntemlerinin sınıflandırma performansını artırdığı gözlemlenmiştir.
Today, the amount of data related to diseases in medicine is increasing, and from these data, predictions about the class of the disease are made. Studies are developed on techniques that can provide positive results for these predictions. Classification algorithms that will be used for these predictions can show success in more accurate classification with these techniques. In this study, data sets of liver and heart disease were normalized with decimal measurement, minimum maximum, z-score and norm normalization methods. Later, these normalized data and raw data were submitted to the classification process using the ORANGE program with various classification algorithms such as artificial nerve networks (2,5,10,20) in 4 different k-cat cross assessments, Naive Bayes, support vector machine, k-NN and decision tree. The classification accuracy of the data has been evaluated and the normalization methods have been observed to improve the classification performance.
Nowadays, the amount of data about diseases in medicine is increasing and predictions about the class of the disease are made from these data. Studies are being developed on techniques that can provide positive results for these predictions. Classification algorithms that will make these predictions can show more accurate classification success with these techniques. In this study, liver and heart disease data sets were normalized using decimal scaling, minimum maximum, z-score and norm normalization methods. Then, these normalized datas and raw datas are classified using the ORANGE program with various classification algorithms such as artificial neural networks, decision tree, support vector machine, k-NN and Naive Bayes in 4 different k-fold cross validation (2,5,10,20) has been processed. The classification accuracies of the data were evaluated and were observed that normalization methods increased the classification performance.
Field : Fen Bilimleri ve Matematik; Mühendislik
Journal Type : Uluslararası
Relevant Articles | Author | # |
---|
Article | Author | # |
---|