Bu çalışmada Kısa-zaman Ortalama ve Değişinti Normalizasyonu (Short-time Mean and Variance Normalization - STMVN), Kısa-zaman Sepstral Ortalama ve Ölçeklendirme Normalizasyonu (Short-time Cepstral Mean and Scale Normalization - STMSN), Asgari – Azami (Min-Max) Normalizasyonu, Z-Skor (Z-Score) Normalizasyonu ve Standart Sapma (Standard Deviation) Normalizasyon tekniklerinin, konuşmacı cinsiyetinin tespitinde sınıflandırma başarımına etkisi araştırılmıştır. Çalışmada veri seti olarak TIMIT veri setindeki 192 erkek ve 192 kadın konuşmacıya ait ses kayıtları kullanılmıştır. Ses kayıtlarından Mel Frekansı Sepstral Katsayısı (Mel Frequency Cepstral Coefficient – MFCC) tekniği ile öznitelik çıkarılmış ve çıkarılan özniteliklerin boyutu Temel Bileşen Analizi (Principal component analysis – PCA) ile indirgenerek, değişik teknikler ile normalize edilmiştir. Sınıflandırıcı olarak Destek Vektör Makinesi (Support Vector Machine – SVM) kullanılmıştır. Çalışma sonucunda konuşmacı cinsiyeti tahmininde en yüksek başarımın %98.18 ile Standart Sapma Normalizasyon Tekniği ile normalize edilmiş özniteliklerden elde edildiği gözlemlenmiş olup diğer tekniklerin başarımı düşürdüğü gözlemlenmiştir.
Alan : Sosyal, Beşeri ve İdari Bilimler
Dergi Türü : Ulusal
Benzer Makaleler | Yazar | # |
---|
Makale | Yazar | # |
---|