Kullanım Kılavuzu
Neden sadece 3 sonuç görüntüleyebiliyorum?
Sadece üye olan kurumların ağından bağlandığınız da tüm sonuçları görüntüleyebilirsiniz. Üye olmayan kurumlar için kurum yetkililerinin başvurması durumunda 1 aylık ücretsiz deneme sürümü açmaktayız.
Benim olmayan çok sonuç geliyor?
Birçok kaynakça da atıflar "Soyad, İ" olarak gösterildiği için özellikle Soyad ve isminin baş harfi aynı olan akademisyenlerin atıfları zaman zaman karışabilmektedir. Bu sorun tüm dünyadaki atıf dizinlerinin sıkça karşılaştığı bir sorundur.
Sadece ilgili makaleme yapılan atıfları nasıl görebilirim?
Makalenizin ismini arattıktan sonra detaylar kısmına bastığınız anda seçtiğiniz makaleye yapılan atıfları görebilirsiniz.
  Atıf Sayısı 2
 Görüntüleme 21
 İndirme 1
Yeni Bir Türkçe Sesli Kitap Veri Seti Üzerinde Convolutional RNN+CTC, LSTM+CTC ve GRU+CTC Modellerinin Karşılaştırılması
2022
Dergi:  
Avrupa Bilim ve Teknoloji Dergisi
Yazar:  
Özet:

Konuşma tanıma insanların çıkardığı ses dalgalarının yazıya dönüştürülmesi işlemidir. Geçmişten günümüze birçok konuşma tanıma modeli ve veri seti üretilmekle beraber ülkemizde bu konuda bir eksiklik olduğu yadsınamaz bir gerçektir. Bu çalışmada, Türkçe konuşma tanıma sistemleri için sesli kitaplardan oluşan özgün bir veri seti geliştirilmiştir. Bu veri seti halihazırda oluşturulmuş olan sesli kitapların bölümlenmesi yoluyla hazırlanmıştır. Bu veri seti üzerinde Evrişimli Sinir Ağları (CNN) ve Bağlantıcı Zamansal Sınıflandırma (CTC) ile birlikte Yinelemeli Sinir Ağı (RNN), Uzun Kısa Süreli Hafıza (LSTM), Geçitli Tekrarlayan Birimler (GRU) modellerinin performansı incelenmiş ve karşılaştırması yapılmıştır. Bu çalışmanın sonuçlarına göre performansı en yüksek olan model LSTM olması ile birlikte daha az parametre kullanan GRU modelinin konuşma tanıma oranı LSTM modelinin konuşma tanıma oranına yakın çıkmıştır.

Anahtar Kelimeler:

Comparison Of Convolutional Rnn+ctc, Lstm+ctc and Gru+ctc Models On A New Turkish Audiobook Dataset
2022
Yazar:  
Özet:

Speech recognition is the process of converting sound waves produced by humans into text. Although many Speech recognition models and data sets have been produced from the past to the present, it is an undeniable fact that there is a deficiency in this regard in our country. In this study, a unique data set consisting of audio books was developed for Turkish speech recognition systems. This dataset has been prepared by partitioning the audiobooks that have already been prepared. On this dataset, Recurrent Neural Network (RNN), Long Short Term Memory (LSTM), Gated Recurrent Units (GRU) models were examined and compared together with Convolutional Neural Networks (CNN) and Connectionist Temporal Classification (CTC). According to the results of this study, although the model with the highest performance is LSTM, the speech recognition rate of the GRU model, which uses fewer parameters, is close to the speech recognition rate of the LSTM model.

Anahtar Kelimeler:

Atıf Yapanlar
Dikkat!
Yayınların atıflarını görmek için Sobiad'a Üye Bir Üniversite Ağından erişim sağlamalısınız. Kurumuzun Sobiad'a üye olması için Kütüphane ve Dokümantasyon Daire Başkanlığı ile iletişim kurabilirsiniz.
Kampüs Dışı Erişim
Eğer Sobiad Abonesi bir kuruma bağlıysanız kurum dışı erişim için Giriş Yap Panelini kullanabilirsiniz. Kurumsal E-Mail adresiniz ile kolayca üye olup giriş yapabilirsiniz.
Benzer Makaleler






Avrupa Bilim ve Teknoloji Dergisi

Alan :   Fen Bilimleri ve Matematik; Mühendislik

Dergi Türü :   Uluslararası

Metrikler
Makale : 3.175
Atıf : 5.652
2023 Impact/Etki : 0.178
Avrupa Bilim ve Teknoloji Dergisi