Sobiad Atıf Dizini

Makale Detay

Benzer Makaleler

PDF Görüntüle

Dergi Bilgisi

Eseri Dinleyin

Alıntı Yap

Bu Sayfayı Yazdırın

Paylaş

TF-IDF, Word2vec ve Fasttext Vektör Model Yöntemleri ile Türkçe Haber Metinlerinin Sınıflandırılması

2021

Dergi:

Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi

Yazar:

DOI:

Özet:

Bilgisayar ve internetin hayatımıza girmesi ile bilgiye erişmek daha kolay hale gelmiştir. İnternete ulaşımın kolaylaşması ve internet kullanıcılarının artması sonucu veri miktarı da her geçen saniye büyümektedir. Ancak doğru bilgiye erişebilmek için verilerin sınıflandırılması gereklidir. Sınıflandırma, verilerin belirli bir anlamsal kategoriye göre ayrılması işlemidir. Dijital belgelerin anlamsal kategorilere ayrılması, metnin ulaşılabilirliğini önemli ölçüde etkilemektedir. Bu çalışmada, farklı Türkçe haber kaynaklarından elde edilen veri kümesi üzerinde metin sınıflandırma çalışması yapılmıştır. Öncelikli olarak haber metinleri ön işlemeden geçirilmiş ve gövdelenmiştir. Ön işlemeden geçirilen metinler Tfidfvectorizer, Word2Vec ve FastText yöntemleri ile ayrı ayrı vektörize edildikten sonra Destek Vektör Makinesi (Support Vector Machine, SVM), Naive Bayes, Logistic Regression, Random Forest ve Yapay Sinir Ağı (Artificial Neural Network, ANN) yöntemleri ile sınıflandırılmıştır. Yapılan çalışma sonucuna göre en yüksek başarı oranı %95,75 ile FastText yöntemi ve vektör modeli ile elde edilen metnin SVM ile sınıflandırılmasından elde edilmiştir.

Anahtar Kelimeler:

TF-IDF, Word2vec and Fasttext Vector Model Methods

2021

Dergi:

Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi

Yazar:

DOI:

10.21205/deufmd.2021236710

Özet:

It has become easier to access information with the entrance of the computer and the internet into our lives. As a result of the ease of internet traffic and the increase in the number of internet users, the amount of data is increasing every second. However, it is necessary to classify the data in order to access the correct information. Classification is the process of separating data according to a specific meaning category. The division of digital documents into meaningful categories significantly affects the accessibility of the text. In this study, a text classification work was carried out on the data set obtained from different Turkish news sources. First of all, the news was passed out of pre-work and embedded. The pre-processed texts are classified by the support vector machine (SVM), Naive Bayes, Logistic Regression, Random Forest and Artificial Neural Network (ANN) methods after being separate by Tfidfvectorizer, Word2Vec and FastText methods. According to the results of the study, the highest success rate is 95.75% from the classification of the text obtained by the FastText method and the vector model by SVM.

Anahtar Kelimeler:

Classification Of Turkish News Text By Tf-idf, Word2vec and Fasttext Vector Model Methods

2021

Dergi:

Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi

Yazar:

DOI:

10.21205/deufmd.2021236710

Özet:

Accessing information has become very simple with computers and internet. As the internet access is easier and the internet users increase, the amount of data is growing every second. However, in order to access correct information, data must be classified. Classification is the process of separating data according to a certain semantic category. Dividing digital documents into semantic categories significantly affects the availability of the text. In this study, a text classification study was carried out on a data set obtained from different Turkish news sources. After the pre-processed texts are separately vectorized with Tfidfvectorizer, Word2Vec and FastText methods, they are classified with Support Vector Machine (SVM), Naive Bayes, Logistic Regression, Random Forest and Artificial Neural Network (ANN) methods. According to the results of the study, the highest success rate was obtained from the classification of the text gained with FastText method and vector model with 95.75% by SVM.

Anahtar Kelimeler:

Atıf Yapanlar

Bilgi: Bu yayına herhangi bir atıf yapılmamıştır.

Benzer Makaleler

1. Türkçe Haber Metinlerinin Çok Terimli Naive Bayes Algoritması Kullanılarak Sınıflandırılması

2021

Fırat Üniversitesi Mühendislik Bilimleri Dergisi

2. Doğal Dil İşleme ile Akademik Metin Kümeleme

2022

Konya Mühendislik Bilimleri Dergisi

3. Üretken Rakip Ağ ile Türkçe Metin Üretimi

2021

Avrupa Bilim ve Teknoloji Dergisi

4. İş Tatmini Faktörlerini Belirlemeye Ve Analiz Etmeye Yönelik Olarak Çalışanların Çevrimiçi Değerlendirmelerinin Sınıflandırıcı Topluluklarına Dayalı Analizi

2021

Avrupa Bilim ve Teknoloji Dergisi

5. Borsa tahmini için Derin Topluluk Modellleri (DTM) ile finansal duygu analizi

2020

Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi

6. Veri madenciliği yöntemleri ile bir melez sınıflandırma yaklaşımı ve uygulaması

2023

İstatistikçiler Dergisi:İstatistik ve Aktüerya

Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi

Alan : Mühendislik; Fen Bilimleri ve Matematik

Dergi Türü : Ulusal

Metrikler

Makale : 441

Atıf : 332

Detaylı İncele

Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi

Özet
Eseri Dinleyin

Yazar : --

Dergi :

Sayı

Yıl

Tür

Atıf Sayısı

PDF Görüntüle

Benzer Makaleler
Bu Yayına Atıf Yapanlar

Benzer Makaleler	Yazar	#

Makale	Yazar	#

Kullanım Kılavuzu

Menü

Mendeley

Endnote

TF-IDF, Word2vec ve Fasttext Vektör Model Yöntemleri ile Türkçe Haber Metinlerinin Sınıflandırılması

2021

Dergi:

Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi

Yazar:

DOI:

10.21205/deufmd.2021236710

Özet:

Anahtar Kelimeler:

TF-IDF, Word2vec and Fasttext Vector Model Methods

2021

Dergi:

Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi

Yazar:

DOI:

10.21205/deufmd.2021236710

Özet:

Anahtar Kelimeler:

Classification Of Turkish News Text By Tf-idf, Word2vec and Fasttext Vector Model Methods

2021

Dergi:

Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi

Yazar:

DOI:

10.21205/deufmd.2021236710

Özet:

Anahtar Kelimeler:

Atıf Yapanlar

Bilgi: Bu yayına herhangi bir atıf yapılmamıştır.

Benzer Makaleler

Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi

Metrikler