Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration. Т. В. Какатунова
Техническая литература. Прикладная информатика. Научные статьи- Название
- Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration
- Автор:
- Т. В. Какатунова
- Серия:
- Прикладная информатика. Научные статьи
- Жанр:
- Техническая литература
- Год выпуска:
- 2019
- isbn:
- Аннотация:
- В статье предложен новый подход к автоматическому анализу коротких сообщений, поступающих на Интернет-порталы и электронную почту органов государственной власти. Разработанная модель позволяет выполнять классификацию коротких неструктурированных текстовых документов при недостатке статистической информации и слабой степени пересечения тематических рубрик. Входными данными для алгоритма построения модели является множество рубрик и обучающая выборка, а его результатом являются нечеткие весовые коэффициенты значимых слов тезаурусов рубрик, что обеспечивает корректное представление характеристик документа и работу алгоритма рубрицирования (классификации).