Günümüz veritabanları hızlı bir şekilde büyümektedir. Örneğin Youtube’a her dakikada ortalama 300 saatlik video yüklenmektedir. Veri boyutuyla orantılı bir şekilde, işleme, depolama ve transfer maliyetleri artmaktadır. Buna karşılık, özellikle video ve imge gibi yüksek boyutlu veri içeriklerinin büyük oranda benzer olduğu bilinmektedir. Bu tür yüksek boyutlu ham verilerin, düşük boyutlara indirgenmesi, imge sınıflandırma, algılama ve anlamlı bilgi çıkarım prosesleri için hayati öneme sahiptir. Veri boyutunu indirgeyen çok sayıda teknik mevcuttur. Klasik yapay öğrenme tekniklerinden; PCA (Temel Bileşenler Analizi) ve LDA (Doğrusal Ayıraç Analizi), probleme matematiksel bir çözüm zemini kazandırdıkları için ön plana çıkarken, doğrusal olmayan tekniklerden, derin öğrenme yaklaşımlarından olan Oto-Kodlayıcı (Auto-Encoding), büyük verilerin indirgenmesine izin vermesi bakımından araştırmacıların ilgisini çekmektedir. Bu çalışmada, gerçek ve sentetik veriler (doğrusal ve doğrusal olmayan) kullanılarak PCA, LDA ve Auto-Encoding (AE) yöntemlerinin boyut indirgeme performansları incelenmiştir. Belirli kıstaslarda (harcanan zaman, yeniden inşa etme doğruluğu vb.) alınan sonuçlar karşılaştırmalı bir şekilde sunulmuştur.
Today’s databases are growing rapidly. For example, YouTube uploads an average of 300 hours of video per minute. In proportion to the data size, processing, storage and transfer costs are increasing. On the contrary, it is known that high-dimensional data content, especially video and image, is largely similar. This type of high-dimensional raw data is vital for low-dimensional reduction, image classification, detection and meaningful information extraction processes. There are many techniques available to reduce the data size. From classical artificial learning techniques; PCA (Basic Components Analysis) and LDA (Natural Separation Analysis), the researchers are interested in providing a mathematical solution ground, while from nonlinear techniques, from deep learning approaches, the Auto-Encoding (Auto-Encoding) is interested in allowing big data to be reduced. In this study, we studied the scale reduction performance of PCA, LDA and Auto-Encoding (AE) methods using real and synthetic data (oral and non-linear). In certain shortspaces (the time spent, the correctness of rebuilding, etc.) The results are comparable.
Alan : Fen Bilimleri ve Matematik; Mühendislik; Sağlık Bilimleri; Ziraat, Orman ve Su Ürünleri
Dergi Türü : Ulusal
Benzer Makaleler | Yazar | # |
---|
Makale | Yazar | # |
---|