Developing a recommender system for academic papers

Yükleniyor...
Küçük Resim

Tarih

2020

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Ege Üniversitesi, Fen Bilimleri Enstitüsü

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Hundreds of thousands of scientific papers are being published every year. Every passing year, it becomes harder for researchers to find scientific papers that they are interested in. Researchers might want to find related scientific papers to the papers that they have already read. Traditional information retrieval systems such as search engines do not always solve this problem. One way to overcome this problem is to use recommender systems. In this thesis, we study efficient ways to build a scientific paper recommender. To achieve that, we built a content-based paper recommender system by leveraging the rigid structure of scientific papers. We made experiments to determine which parts of a scientific paper provide the optimal content for content-based recommenders. We determined the parts of papers as title, abstract, keywords, noun phrases extracted from the abstract, and reference titles. We convert the various combinations of these parts into feature vectors using a TF-IDF based approach. We generate recommendations based on the cosine similarity of the feature vectors. We measure the quality of the recommendations with several metrics. Consequently, we observed that contents made of title, noun phrases, reference titles, and keywords result in better recommendations.
Her sene yüzbinlerce bilimsel makale yayınlanmaktadır. Gün geçtikçe, araştırmacıların kendi ilgileriyle alakalı makaleleri bulması zorlaşmaktadır. Araştırmacılar, okumuş oldukları makaleler ile alakalı farklı makaleler bulmayı isteyebilirler. Ancak arama motoru gibi alışagelmiş bilgi getirim sistemleri bu isteğe yeterli bir yanıt verememektedir. Bu sorunu çözmenin yollarından biri de öneri sistemleridir. Bu tezde, etkili bir bilimsel makale öneri sistemi geliştirmenin yolları üzerinde çalışılmıştır. Bilimsel makalelerin kendine has formatı göz önünde bulundurularak içerik tabanlı bir makale öneri sistemi geliştirilmiştir. Bilimsel makalelerin hangi parçalarının içerik tabanlı akademik öneri sistemlerine en iyi içeriği sağlayacağının belirlenmesi için deneyler gerçekleştirilmiştir. Makalelerin başlığı, özeti, anahtar kelimeleri, özetinden çıkarılan isim tamlamaları ve referanslarının başlıkları içeriği oluşturabilecek parçalar olarak belirlenmiştir. Bu olası parçaların çeşitli kombinasyonları TF-IDF kullanılarak öznitelik vektörlerine dönüştürülmüştür. Öznitelik vektörlerinin yakınlığına göre oluşturulan önerilerin kalitesi, geliştirilen çeşitli metrikler ile değerlendirilmiştir. Sonuç olarak başlık, özetten çıkarılan isim tamlamaları, referans başlıkları ve anahtar kelimelerin bir arada kullanılmasının en iyi içeriği oluşturduğu gözlemlenmiştir.

Açıklama

Anahtar Kelimeler

Recommender Systems, Content-Based Filtering, Scholarly Data, Document Similarity, Öneri Sistemleri, İçerik Tabanlı Filtreleme, Bilimsel Makale Verisi, TF-IDF, Belge Benzerliği

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye