Bütünsel genom ilişkilendirme çalışmalarında (BGİÇ) ortaya çıkan verilerin yüksek miktarda ve çok boyutlu olması, profillerin hastalıklarla ilişkilendirilmesi ve buradan teşhise gidilmesi sırasında farklı veri madenciliği yöntemlerinin kullanılması ile mümkün olmaktadır. Yapılan çalışmada 1025 vaka ve 531 kontrolden oluşan melonom veri kümesi ile farklı etnik kökenli 2325 vaka ve 2350 kontrolden oluşan ve prostat kanseri veri kümesi kullanılmıştır. Bu hastalıklarla ilgili profiller Karar Ağacı, Naive Bayes, Destek Vektör Makinası gibi farklı veri madenciliği yöntemleri ile incelenmiştir. Her iki hastalık için de destek vektör makinası kullanılan yöntemler arasında en iyi başarımı sağlamıştır. İlgili yöntem prostat kanseri veri kümesinde %75.68’lık bir kesinlik değeri sunarken, melonom veri kümesi için %78,6’lik bir kesinlik değeri yakalamıştır.
It is possible that the data that appears in the studies of integrated genom linking (GNR) is high and multi-dimensional, with the use of different data mining methods during the linking of profiles to diseases and from here to diagnosis. The study consisted of 1025 cases and 531 controls and a melonomic data set consisting of 2325 cases and 2350 controls of different ethnic origins and a prostate cancer data set used. Profiles related to these diseases have been studied with different data mining methods such as Decision Tree, Naive Bayes, Support Vector Machine. For both diseases, the support vector machine has achieved the best success among the methods used. The relevant method of prostate cancer in the data set is 75. While providing a precision value of 68, the melonomy captured a precision value of 78.6% for the data set.
Dergi Türü : Uluslararası
Benzer Makaleler | Yazar | # |
---|
Makale | Yazar | # |
---|