Применение нечетких деревьев решений для рубрицирования неструктурированных текстовых документов небольшого размера. М. И. Дли

Техническая литература. Прикладная информатика. Научные статьи

Название
Применение нечетких деревьев решений для рубрицирования неструктурированных текстовых документов небольшого размера
Автор:
М. И. Дли
Серия:
Прикладная информатика. Научные статьи
Жанр:
Техническая литература
Год выпуска:
2019
isbn:
Аннотация:
Ежедневно на Интернет-порталы органов государственной власти поступает большое количество электронных обращений (заявлений, предложений или жалоб), представленных в неструктурированном текстовом виде. Качество и скорость автоматической обработки указанных сообщений напрямую зависит от правильности их классификации (отнесения к конкретной предметной области), в основе которой лежат их отличительные особенности. Однако специфика таких сообщений (небольшой размер, наличие ошибок, отсутствие четкой структуры и т.д.) не позволяет использовать известные методы рубрицирования текстовых документов. Авторами разработана модель рубрицирования электронных неструктурированных текстовых документов с учетом синтаксических связей и ролей слов в предложениях на основе нечеткого дерева решений. Построение дерева решений основано на анализе степени пересечений словарей рубрик, а также расстояний между рубриками в n-мерном пространстве признаков. Данная модель позволяет более точно рубрицировать электронные неструктурированные текстовые документы в условиях взаимосвязанных рубрик, а также повысить оперативность обработки поступивших документов.