Amaç – Çalışmada, makine öğrenmesi algoritmalarından bazılarının, web madenciliği ile elde edilen büyük veri kullanılarak, analiz edilmesi ve otel oda fiyatlarını açıklama performanslarının test edilmesi amaçlanmaktadır. Böylelikle otel oda fiyatlarını en doğru açıklayan modelin belirlenmesidir. Yöntem – Verinin elde edilmesinde web madenciliği/web kazıma yöntemi kullanılmıştır. Hedef web sitesi geliştirilen bir algoritma yardımıyla yaklaşık altı ay boyunca taranmış ve elde edilen 6558 konaklama tesisine ait veriler, analizlerde kullanılmıştır. Araştırmanın ikinci kısmı istatistiksel analizlerden ve makine öğrenmesi algoritmalarının uygulanmasından oluşmaktadır. Analizlerin yapılması ve algoritmaların uygulanması için Python programlama dili kullanılmıştır. Bu dile ait kütüphaneler, pandas, numpy veri işleme için, seaborn, matplotlib grafikler ve görselleştirme için, scikit-learn ise makine öğrenmesi algoritmaları için kullanılmıştır. Analizlerden sonra veri için en uygun olduğu düşünülen lojistik regresyon ile bir model oluşturulmuştur. Bulgular – Karşılaştırılan Rassal Orman ve Karar Ağacı algoritmalarının her ikisinin de yaklaşık %99,89 oranında veri setini açıkladığı dolayısıyla ağaç/dallanmaların başarı ile gerçekleştiği görülmektedir. KNN algoritması ise en yüksek performansı üç kümeli bir sınıflandırma ile %62,12 oranında gerçekleştirmiştir. Doğrusal sınıflandırma yöntemini kullanan Lojistik Regresyon, Olasılıksal Dereceli Azalma ve Destek Vektör Makineleri algoritmalarından en yüksek skoru %39,13 ile lojistik regresyon yöntemi elde etmiştir. Lojistik regresyon ile oluşturulan modelde, konukların tesise verdikleri puan, tesisin bölgede diğer tesisler arasındaki sırası, tesisin türü ve bulunduğu şehir istatistiki olarak anlamlı bulunmuştur (p<0,05). Tartışma – Araştırma sonucunda, elde edilen makine öğrenmesi performans skorlarının yanı sıra, Türkiye’de otel oda fiyatları hakkında önemli bilgiler elde edilmiştir. Oluşturulan regresyon modeli ile 44 bağımsız değişkenden hangilerinin otel oda fiyatlarını açıklamada anlamlı olduğu ortaya konulmuştur.
Purpose - The study aims to analyze and test the performance of some of the machine learning algorithms, using big data obtained by web mining, and describing hotel rooms prices. This is the best way to determine the hotel room prices. Method - Web mining/web mining method has been used to obtain data. Data from the 6558 accommodation facility scaned and obtained for about six months with the help of a target website developed algorithm, were used in the analysis. The second part of the study consists of statistical analysis and the application of machine learning algorithms. Python programming language has been used for the analysis and the implementation of algorithms. This language is used for libraries, pandas, numpy data processing, seaborn, matplotlib graphics and visualization, while scikit-learn is used for machine learning algorithms. A model with logistical regression, which is considered to be the most suitable for data after the analyses, was created. Results - The compared Rassal Forest and Decision Tree algorithms both revealed the data set of approximately 99.89 percent, so the trees/dallings occurred successfully. The KNN algorithm has achieved the highest performance with a three-set classification of 62.12%. The logistical regression method, using the correct classification method, has achieved the highest score from the algorithms of Logistical Regression, Probability Degree Reduction and Support Vector Machines, with 39.13% logistical regression method. In the model created by logistical regression, the points guests gave to the facility, the order of the facility between other facilities in the area, the type of the facility and the city where it was statistically meaningful (p<0,05). Discussions - The research resulted in the achieved machine learning performance scores as well as important information about hotel rooms prices in Turkey. With the created regression model, it is revealed which of the 44 independent variables is meaningful in the hotel room prices.
Alan : Sosyal, Beşeri ve İdari Bilimler
Dergi Türü : Uluslararası
Benzer Makaleler | Yazar | # |
---|
Makale | Yazar | # |
---|