Yaşadığımız dünya ve bizim hakkımızda bilgiye (insanlar neyi sever/sevmez, ister/istemez?, insanlar/nesneler nerelerde bulunur?, hangi eylemler nerede/hangi amaçla yapılır? vb.) sahip bilgisayarlar, hayatlarımızı daha fazla kolaylaştıracaklardır. Örneğin böyle sisteme, kullanıcısı kedisinin hasta olduğunu söylediğinde sistem ona en yakındaki veterinerin telefonunu verecek, bilgisayarlara yapacakları her şeyi en ince ayrıntılarına kadar anlatma gereksinimimiz ortadan kalkacaktır. Ancak böyle uygulamaları mümkün kılacak anlamsal veritabanlarının elle oluşturulması oldukça zor ve zaman alıcı bir süreçtir. Bu tür bilgilerin Türkçe toplanması için başlattığımız projede birçok metin koleksiyonundan ve birçok otomatik bilgi çıkarımı yönteminden yararlanılması düşünülmektedir. Bu çalışmada, bu tür bilgilerin tümcelerin öğe ikililerinden üretilebileceği fikri ve bunun uygulaması sunulmuştur. Çok sayıda tümcenin öğe çözümlemelerinden bu tür bilgiler (hayat bilgisi) otomatik olarak üretilmiştir. Örneğin özne - dolaylı tümleç öğe ikililerinden bir şeyin nerelerde bulunduğu, özne-yüklem öğe ikililerinden bir şeyin yapabildiği şeylerin neler olduğu bilgileri çıkarılmıştır. Yapılan çalışma sayesinde Türkçe için oluşturduğumuz hayat bilgisi veri tabanı için 13 farklı ilişki türüne ait 26.877 adet kavram ikilisi bulunmuştur.
The world where we live and the knowledge about us (what people like, don’t like, don’t like, where people/what are found, what actions are done for what purpose? by VB) Computers will make our lives easier. For example, when a user says his cat is sick, the system will give him the phone of the nearest veterinarian, and our need to tell the computers everything they’re going to do to the finest details will disappear. However, man-made creation of meaningful databases that will make such applications possible is quite difficult and time-consuming process. In the project we started to collect such information in Turkish, many text collections and many methods of automatic information extraction are considered to be used. In this study, the idea that such information can be produced from the two elements of the whole and its application is presented. Many of these information (life information) is produced automatically from the element solutions of the whole. For instance, the substance - indirect allocated item is extracted information of where something is located from the two, the substance-loaded item is extracted information of what things can be done from the two. Through the study we have found 26,877 concepts of 13 different types of relationships for the life information database we have created for Turkey.
Field : Mühendislik
Journal Type : Ulusal
Relevant Articles | Author | # |
---|
Article | Author | # |
---|