Veri madenciliği ve makine öğrenmesi çözümlerinin en önemli ön aşamalarından biri yapılacak analizde kullanılacak verinin özniteliklerinin uygun bir alt kümesini belirlemektir. Sınıflandırma yöntemleri için bu işlem, bir özniteliğin sınıf niteliği ile ne oranda ilişkili olduğuna bakılarak yapılır. Kişisel gizliliği koruyan pek çok sınıflandırma çözümü bulunmaktadır. Ancak bu yöntemler için öznitelik seçimi yapan çözümler geliştirilmemiştir. Bu çalışmada, istatistiksel veritabanı güvenliğinde bilinen en kapsamlı ve güvenli çözüm olan diferansiyel mahremiyete dayalı özgün öznitelik seçimi yöntemleri sunulmaktadır. Önerilen bu yöntemler, yaygın olarak kullanılan bir veri madenciliği kütüphanesi olan WEKA ile entegre edilmiş ve deney sonuçları ile önerilen çözümlerin sınıflandırma başarımına olumlu etkileri gösterilmiştir.
One of the most important advantages of data mining and machine learning solutions is to determine a suitable subset of the properties of the data to be used in the analysis to be carried out. For classification methods, this process is done considering how much a subjectivity is associated with the class nature. There are many classification solutions that protect personal privacy. However, there are no solutions for the selection of these methods. This study provides the most comprehensive and secure solution known in statistical database security, differential privacy-based original identity selection methods. These recommended methods have been integrated with WEKA, a widely used data mining library, and have shown positive effects on the success of classification of the recommended solutions with experimental results.
Alan : Mimarlık, Planlama ve Tasarım; Mühendislik
Dergi Türü : Uluslararası
Benzer Makaleler | Yazar | # |
---|
Makale | Yazar | # |
---|