Akademik makaleler için yarı otomatik döküman sınıflandırma ve kod organizasyon sistemi

dc.contributor.advisor Albayrak, Raif Serkan
dc.contributor.advisor Karabulut, Korhan
dc.contributor.author Öztürk, Alican
dc.date.accessioned 2026-04-07T11:36:29Z
dc.date.available 2026-04-07T11:36:29Z
dc.date.issued 2015
dc.description.abstract In this thesis, the aim is to use the locally entered 'codes' (keywords in the document) to determine what the users' associated topic with that document corresponds to via WordNet's connections, synsets and hypernyms. WordNet has a neatly arranged structure that not only includes meaning for each sense of the word but also all the other words associated with it, in forms of hyponyms, hypernyms, synonyms, holonyms and meronyms. All of these words are connected in a network structure with appropriate links in between. By using the distance between the words to calculate the similarities between each pair of words inside a code cluster and enriching them with the hypernyms of high value nodes, it is possible to obtain a list of possible words that can be associated as topic keywords for the document itself. Since the codes entered into the system differ by the users' preferences and point of view on the document, it is highly possible for two instances to have completely different topics derived from the same document. The purpose of this is to personalize the topic according to the users' interest in the document instead of the presenting a generic topic about it. The project uses the Java library JWS to find the similarity between words and RitaWordNet from RitaCore to extract meanings and hypernyms of the words to select proper senses. en_US
dc.description.abstract Bu tezde, yerel olarak girilmiş 'kodlar'ı (belgedeki anahtar kelimeler) kullanarak, belgeye, kullanıcıya ait bir başlığın atanması için WordNet'in bağlantılarının (synsetlerini ve hypernymlerini) kullanılması amaçlanmıştır. WordNet veritabanı; kelimelerin anlamlarını içermesinin yanı sıra, bu kelime ile alakalı olan alt kelimeleri, kapsayıcı kelimeleri, eş anlamlı sözleri, eşsesli sözleri ve meronimleri içeren zekice bir araya getirilmiş bir sözlüktür. Bütün bu kelimeler birbirine bir ağ yapısı aracılığı ile, aralarında yukarıda belirtilmiş ilişkiler ile bağlıdır. Bir 'kod' kümesinin içindeki kelimelerin, ikililer halinde WordNet üzerinde aralarındaki mesafeyi ölçerek ve buradan yüksek değer olarak sınıflandırılanların da kapsayıcı kelimelerini zenginleştirme amaçlı kullanarak, sonuçta bütün dokümanın konusunu kapsayabilecek potansiyel başlık olabilen anahtar kelimeler elde edilebilmektedir. Sisteme girilen kodlar kişinin tercihleri ve belgeye bakış açısına göre değişmektedir, bu nedenle aynı belgeden elde edilen iki sonucun birbirinden tamamen farklı olması mümkündür. Bunun amacı, genel bir başlık sunmak yerine, başlığı kullanıcının ilgilendiği konuya göre kişiselleştirmektir. Bu projede kelimeler arası benzerliği bulmak için JWS ve kelimelerin anlamlarının seçimi, hypernymlerin elde edilmesi için RitaCore'dan Rita WordNet Java kütüphaneleri kullanılmıştır. tr
dc.identifier.uri https://hdl.handle.net/123456789/13761
dc.identifier.uri https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=Br_XTptK8CZ70f0JGX9xEoWDtodTxtVZ_ID2NV1xXXLvor9AHgmAw0Xc1KkmExNR
dc.language.iso en
dc.subject Linguistics en_US
dc.subject Computer Engineering and Computer Science and Control en_US
dc.subject Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol tr
dc.subject Dilbilim tr
dc.title Akademik makaleler için yarı otomatik döküman sınıflandırma ve kod organizasyon sistemi tr
dc.title A Semi-Automated Text Classification and Code Organization System for Academic Papers en_US
dc.type Master Thesis
dspace.entity.type Publication
gdc.description.department
gdc.description.department FEN BİLİMLERİ ENSTİTÜSÜ / Bilgisayar Mühendisliği Ana Bilim Dalı
gdc.description.endpage 54
gdc.identifier.yoktezid 423953
gdc.virtual.author Öztürk, Alican
gdc.virtual.author Albayrak, Raif Serkan
gdc.virtual.author Karabulut, Korhan
relation.isAuthorOfPublication 802b0136-ee5d-45d4-ae30-617b5f2b14fd
relation.isAuthorOfPublication e0da5713-0c1d-432e-87ca-d3e2362b9ef1
relation.isAuthorOfPublication 6f535418-5b20-42d0-aaa2-779a559a8f63
relation.isAuthorOfPublication.latestForDiscovery 802b0136-ee5d-45d4-ae30-617b5f2b14fd
relation.isOrgUnitOfPublication ac5ddece-c76d-476d-ab30-e4d3029dee37
relation.isOrgUnitOfPublication.latestForDiscovery ac5ddece-c76d-476d-ab30-e4d3029dee37

Files