Построение иерархических тематических моделей коллекции документов. С. В. Цыганова
Компьютеры: прочее. Прикладная информатика. Научные статьи- Название
- Построение иерархических тематических моделей коллекции документов
- Автор:
- С. В. Цыганова
- Серия:
- Прикладная информатика. Научные статьи
- Жанр:
- Компьютеры: прочее
- Год выпуска:
- 2013
- isbn:
- Аннотация:
- Для решения поставленной задачи предлагается использование вероятностных тематических моделей. Особое внимание уделяется иерархическим тематическим моделям и, в частности, обсуждению свойств алгоритмов PLSA и LDA. Особенность построения иерархической модели заключается в переходе от понятия «мешка слов» к «мешку документов» в реализации плоских алгоритмов кластеризации. Работа алгоритмов иллюстрируется на текстах тезисов конференции Euro-2012 и на синтетических данных.