Kullanım Kılavuzu
Neden sadece 3 sonuç görüntüleyebiliyorum?
Sadece üye olan kurumların ağından bağlandığınız da tüm sonuçları görüntüleyebilirsiniz. Üye olmayan kurumlar için kurum yetkililerinin başvurması durumunda 1 aylık ücretsiz deneme sürümü açmaktayız.
Benim olmayan çok sonuç geliyor?
Birçok kaynakça da atıflar "Soyad, İ" olarak gösterildiği için özellikle Soyad ve isminin baş harfi aynı olan akademisyenlerin atıfları zaman zaman karışabilmektedir. Bu sorun tüm dünyadaki atıf dizinlerinin sıkça karşılaştığı bir sorundur.
Sadece ilgili makaleme yapılan atıfları nasıl görebilirim?
Makalenizin ismini arattıktan sonra detaylar kısmına bastığınız anda seçtiğiniz makaleye yapılan atıfları görebilirsiniz.
  Atıf Sayısı 3
 Görüntüleme 1
Gözetimli Makine Öğrenmesiyle Noktalama ve Etkisiz Kelime Sıklıkları Kullanarak Yazar Tanıma
2021
Dergi:  
Bilişim Teknolojileri Dergisi
Yazar:  
Özet:

Bu çalışmada köşe yazısı uzunluğundaki yazılarda noktalama ve etkisiz kelime kullanım sıklığı gibi basit özniteliklerin yazar tanımada yeterli olduğu ortaya konmuştur. Cumhuriyet gazetesi yazarlarından sıkça köşe yazan 6 adedi seçilerek her birinin çalışmanın başladığı tarihten geriye doğru son 120 köşe yazıları alınmış, her bir yazı için bir takım etkisiz kelime ve noktalama işaretlerinin kullanım sıklıklarına dayanan dokuz adet öznitelik elde edilmiştir. Sekiz gözetimli yapay öğrenme algoritması eğitildikten sonra yazının yazarını tanıma başarısı önişlemsiz ve önişlemden geçirilmiş veri kümelerinde ayrı ayrı ölçülmüş, asgari %82 ve azami %92 olmak üzere yüksek isabetli sonuçlar elde edilmiştir. Ölçeklemenin ve temel bileşen analizinin (PCA) başarıyı anlamlı miktarda değiştirmediği, ancak ölçekleme ve boyut azaltma yöntemi olarak doğrusal ayırtaç çözümlemenin (LDA) birlikte kullanılmasının en yakın komşu (kNN) ve Gaussian Naive Bayes (GNB) algoritmalarının yöntemlerin başarılarında yüksek anlamlı (p<0.001), destek vektör makineleri (SVM) algoritmasının başarısında ise anlamlı (p<0.05) bir fark yarattığı görülmüştür. Ayrıca karar ağacı temelli rasgele orman algoritmasında (RF) öznitelik önem analizi yapılarak cümle başına ortalama kelime sayısının ve virgül kullanma sıklığının en ayırıcı öznitelikler olduğu tespit edilmiştir.

Anahtar Kelimeler:

Identify the author by using pointing and ineffective word frequencies with monitored machine learning
2021
Yazar:  
Özet:

This study found that simple properties such as pointing and the frequency of ineffective word use in texts of the length of the corner writing were sufficient in the author's recognition. The Republic newspaper writers have selected 6 pieces that are frequently cornered, each of which has taken the last 120 cornered texts back to the date of the work, and for each text a set of uneffective words and nine pieces of characteristics have been obtained based on the frequency of use of pointing signs. After eight supervised artificial learning algorithms were trained, the success of recognizing the author of the article was individually measured in unprecedented and unprecedented datasets, with a minimum of 82% and a maximum of 92% high-performance results. The success of measurement and basic component analysis (PCA) has not changed significantly, but the use of linear distinctive analysis (LDA) as a measurement and measurement reduction method together (kNN) and the Gaussian Naive Bayes (GNB) algorithms have made a significant difference in the success of methods (p<0.001), while the success of support vector machines (SVM) algorithms (p<0.05) has made a significant difference. In the decision tree-based random forest algorithm (RF) the analysis of the importance of the characteristics has also been found to be the most distinctive characteristics of the average number of words per phrase and the frequency of virgular use.

Anahtar Kelimeler:

Columnist Identification With Supervised Machine Learning Using Punctuation and Stop Word Frequencies
2021
Yazar:  
Özet:

This research asserts that such features as the frequency of stop words and punctuation marks are sufficient for author identification of the texts that are column-long. Six of Cumhuriyet columnists who periodically write in the newspaper were selected and 120 columns were collected from each. Nine features based on the frequency of particular stop words and punctuation marks were extracted. Eight supervised machine learning algorithms were trained with extracted feature set. Author identification performance of each algorithm was measured. The effect of dimension reduction and scaling on each algorithm were also examined. Following these procedures, minimum 82% and maximum 92% accuracy were obtained. It is also found that scaling or dimension reduction with principal component analysis (PCA) do not create significant difference alone on accuracy scores, while scaling and linear discriminant analysis significantly increases the validation scores of some of algorithms such as support vector machines (p<0.05), Gaussian Naïve Bayes, and k-nearest neighbour (p<0.001). Moreover, when feature importance of random forest algorithm is analysed, average word count in a sentence and comma frequency are found as the most important features for detecting the authors.

Anahtar Kelimeler:

Atıf Yapanlar
Dikkat!
Yayınların atıflarını görmek için Sobiad'a Üye Bir Üniversite Ağından erişim sağlamalısınız. Kurumuzun Sobiad'a üye olması için Kütüphane ve Dokümantasyon Daire Başkanlığı ile iletişim kurabilirsiniz.
Kampüs Dışı Erişim
Eğer Sobiad Abonesi bir kuruma bağlıysanız kurum dışı erişim için Giriş Yap Panelini kullanabilirsiniz. Kurumsal E-Mail adresiniz ile kolayca üye olup giriş yapabilirsiniz.
Benzer Makaleler








Bilişim Teknolojileri Dergisi

Alan :   Eğitim Bilimleri; Fen Bilimleri ve Matematik

Dergi Türü :   Uluslararası

Metrikler
Makale : 443
Atıf : 3.276
2023 Impact/Etki : 0.458
Bilişim Teknolojileri Dergisi