İnternetin günlük hayatımızdaki artan kullanımı ile beraber sosyal medya organlarının gelişimi de paralellik göstermektedir. Mikroblog adı verilen facebook ve twitter benzeri uygulamaları ile anlık duyguları ve düşünceleri ifade etmek son derece yaygın bir hale gelmiştir. Mikroblog sitelerinin en yaygın kullanıma sahip olanlarından birisi de Twitter uygulamasıdır. Twitter üzerinden paylaşılan mesajlar bir ürün ya da hizmet hakkında olabileceği gibi bir kişiyle ilgili bir yorumda olabilmektedir. Yapılan yorumun belirtmek istediği anlamı ve duyguyu belirleyebilmek son dönemdeki gözde konulardan biridir. Bir ürün ya da hizmet hakkında yapılan binlerce yorumun tek tek okunup anlamlandırılması ve yorumlayanların fikirlerinin sınıflandırılması geleneksel yöntemlerde oldukça zaman ve emek alan bir alandır. Gerek makine öğrenmesi ve derin öğrenme algoritmalarındaki gelişmeler gerekse de bunları işleyip yorumlayacak bilgisayar sistemlerinin gelişimine parallel olarak milyonlarca veri üzerinde duygu sınıflandırılması mümkün hale gelmiştir. Gerçekleştirdiğimiz çalışmada Türkçe ve İngilizce tivitler üzerinde duygusal sınıflandırma çalışması gerçekleştirilmiştir. Döküman vektörleri (Doc2Vec) kullanılarak yapılan çalışmada hem DBoW ve DM gibi iki farklı döküman vektörü yönteminin çalışması hemde Yarı Danışmanlı ve Danışmanlı öğrenmenin etkileri araştırılmıştır. Çalışma sonuçları doğruluk, kesinlik, anma, özgünlük ve F-ölçütü metrikleri ile raporlanmıştır. Gerçekleştirilen çalışma sonucunda Yarı Danışmanlı öğrenme yöntemi hem Türkçe hemde İngilizce veri kümesinde Danışmanlı öğrenmeye göre daha başarılı sonuçlar elde etmiştir.
With the increasing use of the Internet in our daily lives, the development of social media organs is also parallel. Microblogging has become extremely common to express instant emotions and thoughts with apps like Facebook and Twitter. One of the most commonly used microblogging sites is the Twitter app. Messages shared via Twitter may be in a comment on a person, such as it may be about a product or service. The meaning and feeling of the commenting is one of the favourite subjects of the last period. The reading and understanding of thousands of comments on a product or service and the classification of the ideas of the interpreters in traditional methods is a space of time and effort. Although it is necessary to develop machine learning and deep learning algorithms, it has become possible to classify emotions on millions of data parallel to the development of computer systems that will process and interpret them. In the study we conducted, a study of emotional classification on Turkish and English tivit was carried out. In the study using document vectors (Doc2Vec), the study of two different document vectors methods such as both DBoW and DM has studied the effects of half-consulting and consulting learning. The results of the study are
The increasing presence of the Internet in the daily life leads to proliferation of social media. Microblogging applications such as Facebook and Twitter let their users to express their feelings and emotions in a short form of digital content including text, picture, and video. Twitter is one of the most popular microblogging applications. Tweets posted on twitter may contain positive or negative comments on a product, service or an individual. The analysis of the sentiments behind the tweets has been a popular research topic recently. Considering the time required to read and analyze a vast amount of tweets regarding a given product or service, manual classification of tweets is a complex and time consuming process. Recent machine learning and deep learning algorithms and the developments in the computer systems enable classification of the huge amount of data according to their sentiments in parallel. In this study, we have carried out sentiment analysis on tweets with both Turkish and English content. We have employed Document Vectors (Doc2Vec) along with DBoW and DM and analyzed the performance of semi-supervised and supervised learning methods. We have reported the performance in terms of accuracy, precision, recall, specificity and F-score metrics. We have concluded that semi-supervised learning outperforms supervised learning for both Turkish and English datasets.
Alan : Eğitim Bilimleri; Fen Bilimleri ve Matematik; Mühendislik
Dergi Türü : Ulusal
Benzer Makaleler | Yazar | # |
---|
Makale | Yazar | # |
---|