Sobiad Atıf Dizini

İndirme 2

Makale Detay

Benzer Makaleler

PDF Görüntüle

Dergi Bilgisi

Eseri Dinleyin

Alıntı Yap

Bu Sayfayı Yazdırın

Paylaş

Tıbbi Verilerde Heinz Ortalamasına Dayalı Yeni Sentetik Veriler Üreterek Veri Kümesini Dengeleme

2022

Dergi:

Afyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi

Yazar:

DOI:

Özet:

Bilim ve teknolojideki ilerlemeler veri boyutlarının büyük hızda artmasına neden olmuştur. Böylece dengesiz veriler ortaya çıkmıştır. Sınıflar neredeyse eşit olarak temsil edilmiyorsa, bir veri kümesi dengesizdir. Bu durumda sınıflandırma algoritmaları veri setlerinin dengeli olduğu varsayımı ile geliştirildiği için verilerin sınıflandırılması performans değerlerinin düşmesine neden olur. Sınıflandırmanın doğruluğu çoğunluk sınıfını desteklediğinden, azınlık sınıfı genellikle yanlış sınıflandırılır. Özellikle tıp alanında kullanılan veri kümelerinin çoğu dengesiz bir dağılıma sahiptir. Bu dağılımı dengelemek için son zamanlarda çeşitli çalışmalar yapılmıştır. Bu çalışmalar, eksik örnekleme ve aşırı örnekleme süreçleridir. Bu çalışmada, azınlık sınıfı kullanılarak sentetik örnekler üretmek için uzaklık ve ortalama tabanlı yeniden örnekleme yöntemi kullanıldı. Yeniden örnekleme işlemi için, azınlık sınıfına ait tüm veri noktaları için en yakın komşular Öklid uzaklığı kullanılarak belirlendi. Bu komşulara dayalı olarak ve Heinz Ortalaması kullanılarak veri setini dengeye getirmek için her numune arasında istenilen sayıda yeni sentetik numuneler oluşturuldu. Ham ve dengeli veri setlerini sınıflandırmak için Rassal Orman (RF) ve Destek Vektör Makinesi (SVM) algoritmaları kullanıldı ve sonuçlar karşılaştırıldı. Ayrıca, iyi bilinen diğer yöntemler (ROS, RUS ve SMOTE) önerilen yöntemle karşılaştırılmıştır. Önerilen yeniden örnekleme yöntemini kullanan dengeli veri kümesinin, ham veri kümesi ve diğer yöntemlere kıyasla sınıflandırma verimliliğini artırdığı gösterilmiştir. Sırasıyla ham veriler ve yeniden örneklenmiş veriler için RF'nin doğruluk ölçümleri 0.751 ve 0.799'dur ve SVM'nin doğruluk ölçümleri 0.762 ve 0.781'dir. Aynı şekilde Kesinlik, Hassasiyet ve F1 Skoru gibi diğer metriklerde de iyileştirmeler vardır.

Anahtar Kelimeler:

Balancing The Dataset By Generating New Synthetic Data Based On Heinz Mean In Medical Data

2022

Dergi:

Afyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi

Yazar:

DOI:

10.35414/akufemubid.1011058

Özet:

Advances in science and technology have caused data sizes to increase at a great rate. Thus, unbalanced data has arisen. A dataset is unbalanced if the classes are not nearly equally represented. In this case, classifying the data causes performance values to decrease because the classification algorithms are developed on the assumption that the datasets are balanced. As the accuracy of the classification favors the majority class, the minority class is often misclassified. The majority of datasets, especially those used in the medical field, have an unbalanced distribution. To balance this distribution, several studies have been performed recently. These studies are undersampling and oversampling processes. In this study, distance and mean based resampling method is used to produce synthetic samples using minority class. For the resampling process, the closest neighbors for all data points belonging to the minority class were determined by using the Euclidean distance. Based on these neighbors and using the Heinz Mean, the desired number of new synthetic samples were formed between each sample to obtain balance. The Random Forest (RF) and Support Vector Machine (SVM) algorithms are used to classify the raw and balanced datasets, and the results were compared. Additionally, the other well known methods (Random Over Sampling-ROS, Random Under Sampling-RUS, and Synthetic Minority Oversampling TEchnique-SMOTE) are compared with the proposed method. It was shown that the balanced dataset using the proposed resampling method increases classification efficiency as compared to the raw dataset and other methods. Accuracy measurements of RF are 0.751 and 0.799 and, accuracy measurements of SVM are 0.762 and 0.781 for raw data and resampled data respectively. Likewise, there are improvements in the other metrics such as Precision, Recall, and F1 Score.

Anahtar Kelimeler:

Atıf Yapanlar

Bilgi: Bu yayına herhangi bir atıf yapılmamıştır.

Benzer Makaleler

1. Improving Machine Learning Performance of Imbalanced Data by Resampling: DBSCAN and Weighted Arithmetic Mean

2021

Bitlis Eren Üniversitesi Fen Bilimleri Dergisi

2. DENGESİZ VERİLER İÇİN AĞIRLIKLI GEOMETRİK ORTALAMA TABANLI YENİ BİR YENİDEN ÖRNEKLEME YAKLAŞIMI

2021

Adıyaman Üniversitesi Mühendislik Bilimleri Dergisi

3. Görüntü artırma tekniklerinin cilt kanseri türleri üzerinde evrişimsel sinir ağları ile sınıflandırma başarılarının karşılaştırılması

2023

Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi

4. Müşteri Kaybı Tahmininde Sınıf Dengesizliği Problemi

2022

Politeknik Dergisi

5. Suç Veri Setini Analiz Etmek İçin Makine Öğreniminde Örnekleme Teknikleri ve Uygulaması

2022

Avrupa Bilim ve Teknoloji Dergisi

6. Örneklem Arttırma ve Örneklem Azaltma Algoritmalarının Kombinasyonuna Dayalı Bir Saldırı Tespit Yaklaşımı

2023

Acta Infologica

Afyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi

Alan : Fen Bilimleri ve Matematik; Mühendislik

Dergi Türü : Ulusal

Metrikler

Makale : 1.428

Atıf : 2.854

2023 Impact/Etki : 0.161

Detaylı İncele

Afyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi

Özet
Eseri Dinleyin

Yazar : --

Dergi :

Sayı

Yıl

Tür

Atıf Sayısı

PDF Görüntüle

Benzer Makaleler
Bu Yayına Atıf Yapanlar

Benzer Makaleler	Yazar	#

Makale	Yazar	#

Kullanım Kılavuzu

Menü

Mendeley

Endnote

Tıbbi Verilerde Heinz Ortalamasına Dayalı Yeni Sentetik Veriler Üreterek Veri Kümesini Dengeleme

2022

Dergi:

Afyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi

Yazar:

DOI:

10.35414/akufemubid.1011058

Özet:

Anahtar Kelimeler:

Balancing The Dataset By Generating New Synthetic Data Based On Heinz Mean In Medical Data

2022

Dergi:

Afyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi

Yazar:

DOI:

10.35414/akufemubid.1011058

Özet:

Anahtar Kelimeler:

Atıf Yapanlar

Bilgi: Bu yayına herhangi bir atıf yapılmamıştır.

Benzer Makaleler

Afyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi

Metrikler