Результаты исследований: Научные публикации в периодических изданиях › статья › Рецензирование
Извлечение информации из текстов на основе онтологии и больших языковых моделей. / Сидорова, Елена Анатольевна; Иванов, Александр Иванович; Овчинникова, Кристина Алексеевна.
в: Онтология проектирования, Том 15, № 1 (55), 2025, стр. 114-129.Результаты исследований: Научные публикации в периодических изданиях › статья › Рецензирование
}
TY - JOUR
T1 - Извлечение информации из текстов на основе онтологии и больших языковых моделей
AU - Сидорова, Елена Анатольевна
AU - Иванов, Александр Иванович
AU - Овчинникова, Кристина Алексеевна
N1 - Сидорова, Е. А. Извлечение информации из текстов на основе онтологии и больших языковых моделей / Е. А. Сидорова, А. И. Иванов, К. А. Овчинникова // Онтология проектирования. – 2025. – Т. 15, № 1(55). – С. 114-129. – DOI 10.18287/2223-9537-2025-15-1-114-129. – EDN OEEAEH.
PY - 2025
Y1 - 2025
N2 - Рассматривается извлечение информации из текстов на основе онтологии предметной области и нейросетевых методов анализа текста с привлечением больших языковых моделей. Обсуждается роль эксперта при разработке и сопровождении систем на примере задачи извлечения информации из аналитических статей и при построении онтологий по компьютерной лингвистике, описывающих основные понятия, интересующие пользователя/заказчика системы. Создание онтологии сопровождается созданием словаря - терминологического ядра онтологии с дальнейшей разработкой методов извлечения новых терминов данной предметной области. Данная задача рассматривается как задача извлечения именованных сущностей, для решения которой стандартом является обучение нейросетевой модели на представительном наборе данных. Этот подход сравнивается с подходом на основе больших языковых моделей, для реализации которого разработаны лексико-синтаксические шаблоны, шаблоны инструкций для проверки гипотез относительно новых терминов-словосочетаний, инструкции для верификации результатов. Разработанные инструкции для решения задачи извлечения отношений включают вопросы оценки компетенций на естественном языке, генерируемые автоматически для каждого отношения онтологии. Новизна предлагаемого подхода заключается в интеграции онтологических, лингвистических и нейросетевых подходов для извлечения информации из текстов. Показана возможность решать задачи анализа текста и извлечения информации путём выстраивания цепочки больших языковых моделей, инструкции для которых динамически формируются на основе результатов предыдущих этапов анализа. В эксперименте достигнуты следующие оценки F1-меры: для извлечения и классификации терминов F1=0.8, для извлечения отношений F1=0.87.
AB - Рассматривается извлечение информации из текстов на основе онтологии предметной области и нейросетевых методов анализа текста с привлечением больших языковых моделей. Обсуждается роль эксперта при разработке и сопровождении систем на примере задачи извлечения информации из аналитических статей и при построении онтологий по компьютерной лингвистике, описывающих основные понятия, интересующие пользователя/заказчика системы. Создание онтологии сопровождается созданием словаря - терминологического ядра онтологии с дальнейшей разработкой методов извлечения новых терминов данной предметной области. Данная задача рассматривается как задача извлечения именованных сущностей, для решения которой стандартом является обучение нейросетевой модели на представительном наборе данных. Этот подход сравнивается с подходом на основе больших языковых моделей, для реализации которого разработаны лексико-синтаксические шаблоны, шаблоны инструкций для проверки гипотез относительно новых терминов-словосочетаний, инструкции для верификации результатов. Разработанные инструкции для решения задачи извлечения отношений включают вопросы оценки компетенций на естественном языке, генерируемые автоматически для каждого отношения онтологии. Новизна предлагаемого подхода заключается в интеграции онтологических, лингвистических и нейросетевых подходов для извлечения информации из текстов. Показана возможность решать задачи анализа текста и извлечения информации путём выстраивания цепочки больших языковых моделей, инструкции для которых динамически формируются на основе результатов предыдущих этапов анализа. В эксперименте достигнуты следующие оценки F1-меры: для извлечения и классификации терминов F1=0.8, для извлечения отношений F1=0.87.
KW - ИЗВЛЕЧЕНИЕ ИНФОРМАЦИИ
KW - ОНТОЛОГИЯ ПРЕДМЕТНОЙ ОБЛАСТИ
KW - БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ
KW - НЕЙРОСЕТЕВЫЕ МОДЕЛИ
KW - РАЗРАБОТКА ИНСТРУКЦИЙ
UR - https://elibrary.ru/item.asp?id=80257256
U2 - 10.18287/2223-9537-2025-15-1-114-129
DO - 10.18287/2223-9537-2025-15-1-114-129
M3 - статья
VL - 15
SP - 114
EP - 129
JO - Онтология проектирования
JF - Онтология проектирования
SN - 2223-9537
IS - 1 (55)
ER -
ID: 74320831