Состоялось очередное заседание общемосковского научного семинара "МАТЕМАТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА РЕШЕНИЙ В ЭКОНОМИКЕ, БИЗНЕСЕ И ПОЛИТИКЕ"
Докладчик: М.Г. Крейнес (ООО «Базисные технологии»)
Тема: Оценка качества научных публикаций и вычислительные модели анализа текстов
Авторы работы: М.Г. Крейнес, Е.М. Крейнес, А.А. Афонин (ООО «БАЗИСНЫЕ ТЕХНОЛОГИИ»)Краткое описание докладаРассмотрено использование вычислительных методов поиска и анализа неструктурированных текстов на естественных языках для решения задач оценки качества научных публикаций и коллекций научных публикаций. Предложены решения для двух типов задач:- задач формирования коллекций научных публикаций, адекватных для определения референтных (сопоставимых) значений библиометрических и наукометрических показателей для конкретной публикации или конкретной коллекции публикаций,- задач количественного определения информативности и содержательной независимости конкретной публикации.Решение этих задач основано на- вычислительном построении моделей научных текстов на естественных языках,- вычислительном построении моделей коллекций научных текстов на естественных языках,- поиске с использованием моделей содержательно и тематически близких статей (на поиске содержательного контекста анализируемой статьи),- выделении среди тематически и содержательно близких текстов множества статей, адекватных для формирования референтных значений,- поиске с использованием моделей коллекций текстов научных изданий, научных коллективов и организаций, порождающих тематически близкие коллекции текстов.Рассматриваемые в докладе модели и методы, развитые и используемые в информационной технологии поиска и анализа текстовой информации КЛЮЧИ К ТЕКСТАМ
, позволяют решать для масштабных коллекций неструктурированной текстовой информации следующие задачи:- вычислительное выделение в коллекции тематических групп,- отнесение текстов к выделенным тематическим группам,- определение тематического сходства текстовых коллекций.