Amaç: Bu makale a) Küresel Yetişkin Tütün Araştırması (KYTA) verilerinin tütün kullanım davranışları hakkındaki değerli bilgileri ortaya çıkarmada nasıl kullanılabileceğini ve b)KYTA verileri üzerinde uygulanan sınıflandırma algoritmalarının performanslarını sunmaktadır.Yöntem: Üç iyi bilinen sınıflandırma yöntemi olan K -en yakın komşu algoritması, C4.5 algoritması ve çok katmanlı algılayıcısı KYTA katılımcılarının sosyo-demografik özellikleri (yaş grubu, cinsiyet, yerleşim yeri, eğitim düzeyi ve çalışma durumu) temel alınarak, sigara içme durumunu (önceden tanımlanmış sınıflar: sigara içen ve içmeyen) doğru sınıflandırma performansı değerlendirilmiştir. İlk analiz KYTA Türkiye verileri üzerinde gerçekleştirilmiştir. Daha sonra Türkiye için en iyi performansı üreten model altı farklı Avrupa ülkesi: Yunanistan, Kazakistan, Polonya, Romanya, Rusya ve Ukrayna verileri için de uygulanmıştır.Bulgular: Bütün ağaç algoritmaları sigara içmeyenleri tespit etmekte daha doğru sonuçlar vermektedir. C4.5 algoritmasının doğru sınıflandırma oranı, Türkiye için en yüksek olandır. Ülkeler için yapılan karşılaştırmalı analiz, C4.5 algoritmasının Ukrayna’daki katılımcıların sigara içme durumunu %80’in üzerinde doğru bir şekilde sınıflandırabildiğini ancak Yunanistan için bu oranını %70’in altında kaldığını göstermektedir.Sonuç: Bu makale, demografik veriler gibi KYTA tarafından sağlanan bilgilerin, bir bireyin gelecekte sigara içmesi olasılığının hesaplanmasına yardımcı olabileceğini ortaya koymaktadır
Purpose: This article provides a) how the Global Adult Tobacco Research (KYTA) data can be used to reveal valuable information about the use of tobacco behaviors and b)the performance of the classification algorithms applied to the KYTA data.Method: The three well-known classification methods of K -the closest neighboring algorithm, the C4.5 algorithm and the multi-layer detector of the KYTA participants, based on the socio-demographic characteristics (age group, gender, settlement, education level and work status), the proper classification of the state of smoking (pre-defined classes: smoking and non-smoking) was assessed. The first analysis was carried out on the data of KYTA Turkey. The model that produced the best performance for Turkey was also applied to the data from six different European countries: Greece, Kazakhstan, Poland, Romania, Russia and Ukraine.The findings: All tree algorithms give more accurate results in identifying those who do not smoke. The correct classification rate of the C4.5 algorithm is the highest for Turkey. Comparative analysis for countries shows that the C4.5 algorithm can accurately classify the status of participants smoking in Ukraine above 80%, but for Greece this rate remains below 70%.Result: This article shows that the information provided by KYTA, such as demographic data, can help calculate the possibility of a individual to smoke in the future.
Alan : Sağlık Bilimleri
Dergi Türü : Uluslararası
Benzer Makaleler | Yazar | # |
---|
Makale | Yazar | # |
---|