Система рекомендации статей на основе машинного обучения

В докладе будет рассказано о разработанной авторами системе, позволяющей получить перечень научных статей, схожих с заданной по ряду признаков. Система рекомендации статей основана на алгоритмах машинного обучения без учителя, а именно с помощью кластеризации рёбер в графе цитирования. В качестве параметров для обучения используются аннотации статей и граф цитирования. В работе использовались такие алгоритмы, как k-medoids и кластеризация сдвига среднего значения. Модель была обучена на графе цитирования arXiv HEP-TH (теория физики высоких напряжений), который взят из электронного архива научных статей arxiv.org и содержит 27770 вершин (статей) и 352807 рёбер (цитирований).

Презентация