Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration. Т. В. Какатунова

Техническая литература. Прикладная информатика. Научные статьи

Название
Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration
Автор:
Т. В. Какатунова
Серия:
Прикладная информатика. Научные статьи
Жанр:
Техническая литература
Год выпуска:
2019
isbn:
Аннотация:
В статье предложен новый подход к автоматическому анализу коротких сообщений, поступающих на Интернет-порталы и электронную почту органов государственной власти. Разработанная модель позволяет выполнять классификацию коротких неструктурированных текстовых документов при недостатке статистической информации и слабой степени пересечения тематических рубрик. Входными данными для алгоритма построения модели является множество рубрик и обучающая выборка, а его результатом являются нечеткие весовые коэффициенты значимых слов тезаурусов рубрик, что обеспечивает корректное представление характеристик документа и работу алгоритма рубрицирования (классификации).