Makine öğrenimi içinde yer alan sınıflandırma ve regresyon, veri sınıflarını ortaya koyan ve değişkenler arasındaki ilişkileri modelleyen yöntemlerdir. Sınıflama ve regresyon yöntemlerinden karar ağaçları, eğitim verisini kullanarak sınıflandırma kurallarını oluşturup test verisinde bu kuralları dener ve algoritma başarısını belirler. Lojistik regresyonda kurulan model ile sınıflandırma yapılıp performanslar bulunur. Bu yöntemler, kolay yorumlanması, büyük veri setlerine uygulanması ve varsayım gerektirmemesinden dolayı son zamanlarda birçok farklı disiplinlerde kullanılmaktadır. Yaşam memnuniyeti kavramı, günümüzde birçok farklı disiplinlerin ilgi alanına giren bir konudur. Yaşam memnuniyeti, bireyin sürdürmekte olduğu yaşamdan ne kadar zevk aldığının bir bütün olarak ele alınmasıdır. Bu çalışmanın amacı, karar ağacı yöntemlerinden olan CART ve lojistik regresyon çözümlemelerinin performanslarının Türkiye İstatistik Kurumuna ait (TÜİK) 2017 dönemini kapsayan yaşam memnuniyeti verilerini (n=8430) kullanarak yapılmasıdır. Bu amaçla yapılan çalışmada, yaşam memnuniyetini açıklayan en iyi modelin performans kriterlerine (doğruluk, duyarlılık, seçicilik, kesinlik, F-skor, ROC eğrisi R2) bağlı olarak lojistik regresyon modeli olduğuna karar verilmiştir. Bu modelde yaşam memnuniyeti cinsiyet, medeni durum, okul durumu, gelir, sosyal hayat, sağlık ve ulaşım değişkenleri ile açıklanmıştır.
Classification and regression included in machine learning are methods that reveal the data classes and model the relationships between the variables. Decision trees on classification and regression methods use training data to create classification rules and test these rules in the test data and determine the success of the algorithm. The logistic regression is based on the logistic regression model. These methods have been used in many different disciplines recently because they are easy to interpret, they are applied to large data sets and they do not require assumption. The concept of life satisfaction is a topic that enters the area of interest of many different disciplines today. The satisfaction of life is to be considered as a whole of how much a person enjoys the life he is continuing. The aim of this study is to make the performance of the CART and logistics regression solutions, which are of the decision-making methods, using the life satisfaction data (n=8430) covering the period 2017 of the Turkish Statistical Bureau (TÜIK). In the study for this purpose, it was determined that the best model that describes life satisfaction is a logistical regression model depending on performance criteria (precision, sensitivity, selectivity, accuracy, F-score, ROC curve R2). In this model, life satisfaction is explained by gender, civil status, school status, income, social life, health and transport variables.
Classification and regression in machine learning are methods that reveal data classes and model the relationships between variables. Decision trees, one of the classification and regression methods, create the classification rules by using the training data, test these rules in the test data and determine the algorithm success. Classification is made with the model established in logistic regression and performances are found. These methods have been used in many different disciplines recently due to their easy interpretation, application to large data sets and no assumptions. The concept of life satisfaction is an issue of many different disciplines today. Life satisfaction is a consideration of how much the individual enjoys the life the individual lives. The purpose of this study, the performance of the CART and logistic regression analysis of the decision tree method of Turkey Statistical Institute (TSI), covering the period 2017 to life satisfaction data (n = 8430) is made using. In this study, it was decided that the best model that explains life satisfaction is the logistic regression model based on performance criteria (accuracy, sensitivity, selectivity, precision, F-score, ROC curve R2). In this model, life satisfaction; It is explained by variables of gender, marital status, school status, income, social life, health and transportation.
Alan : Fen Bilimleri ve Matematik; Mühendislik
Dergi Türü : Uluslararası
Benzer Makaleler | Yazar | # |
---|
Makale | Yazar | # |
---|