Standard

Извлечение информации из текстов на основе онтологии и больших языковых моделей. / Сидорова, Елена Анатольевна; Иванов, Александр Иванович; Овчинникова, Кристина Алексеевна.

In: Онтология проектирования, Vol. 15, No. 1 (55), 2025, p. 114-129.

Research output: Contribution to journalArticlepeer-review

Harvard

APA

Vancouver

Сидорова ЕА, Иванов АИ, Овчинникова КА. Извлечение информации из текстов на основе онтологии и больших языковых моделей. Онтология проектирования. 2025;15(1 (55)):114-129. doi: 10.18287/2223-9537-2025-15-1-114-129

Author

Сидорова, Елена Анатольевна ; Иванов, Александр Иванович ; Овчинникова, Кристина Алексеевна. / Извлечение информации из текстов на основе онтологии и больших языковых моделей. In: Онтология проектирования. 2025 ; Vol. 15, No. 1 (55). pp. 114-129.

BibTeX

@article{26f9a9cd66054d1ab7b2af1ffe36b642,
title = "Извлечение информации из текстов на основе онтологии и больших языковых моделей",
abstract = "Рассматривается извлечение информации из текстов на основе онтологии предметной области и нейросетевых методов анализа текста с привлечением больших языковых моделей. Обсуждается роль эксперта при разработке и сопровождении систем на примере задачи извлечения информации из аналитических статей и при построении онтологий по компьютерной лингвистике, описывающих основные понятия, интересующие пользователя/заказчика системы. Создание онтологии сопровождается созданием словаря - терминологического ядра онтологии с дальнейшей разработкой методов извлечения новых терминов данной предметной области. Данная задача рассматривается как задача извлечения именованных сущностей, для решения которой стандартом является обучение нейросетевой модели на представительном наборе данных. Этот подход сравнивается с подходом на основе больших языковых моделей, для реализации которого разработаны лексико-синтаксические шаблоны, шаблоны инструкций для проверки гипотез относительно новых терминов-словосочетаний, инструкции для верификации результатов. Разработанные инструкции для решения задачи извлечения отношений включают вопросы оценки компетенций на естественном языке, генерируемые автоматически для каждого отношения онтологии. Новизна предлагаемого подхода заключается в интеграции онтологических, лингвистических и нейросетевых подходов для извлечения информации из текстов. Показана возможность решать задачи анализа текста и извлечения информации путём выстраивания цепочки больших языковых моделей, инструкции для которых динамически формируются на основе результатов предыдущих этапов анализа. В эксперименте достигнуты следующие оценки F1-меры: для извлечения и классификации терминов F1=0.8, для извлечения отношений F1=0.87.",
keywords = "ИЗВЛЕЧЕНИЕ ИНФОРМАЦИИ, ОНТОЛОГИЯ ПРЕДМЕТНОЙ ОБЛАСТИ, БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ, НЕЙРОСЕТЕВЫЕ МОДЕЛИ, РАЗРАБОТКА ИНСТРУКЦИЙ",
author = "Сидорова, {Елена Анатольевна} and Иванов, {Александр Иванович} and Овчинникова, {Кристина Алексеевна}",
note = "Сидорова, Е. А. Извлечение информации из текстов на основе онтологии и больших языковых моделей / Е. А. Сидорова, А. И. Иванов, К. А. Овчинникова // Онтология проектирования. – 2025. – Т. 15, № 1(55). – С. 114-129. – DOI 10.18287/2223-9537-2025-15-1-114-129. – EDN OEEAEH.",
year = "2025",
doi = "10.18287/2223-9537-2025-15-1-114-129",
language = "русский",
volume = "15",
pages = "114--129",
journal = "Онтология проектирования",
issn = "2223-9537",
number = "1 (55)",

}

RIS

TY - JOUR

T1 - Извлечение информации из текстов на основе онтологии и больших языковых моделей

AU - Сидорова, Елена Анатольевна

AU - Иванов, Александр Иванович

AU - Овчинникова, Кристина Алексеевна

N1 - Сидорова, Е. А. Извлечение информации из текстов на основе онтологии и больших языковых моделей / Е. А. Сидорова, А. И. Иванов, К. А. Овчинникова // Онтология проектирования. – 2025. – Т. 15, № 1(55). – С. 114-129. – DOI 10.18287/2223-9537-2025-15-1-114-129. – EDN OEEAEH.

PY - 2025

Y1 - 2025

N2 - Рассматривается извлечение информации из текстов на основе онтологии предметной области и нейросетевых методов анализа текста с привлечением больших языковых моделей. Обсуждается роль эксперта при разработке и сопровождении систем на примере задачи извлечения информации из аналитических статей и при построении онтологий по компьютерной лингвистике, описывающих основные понятия, интересующие пользователя/заказчика системы. Создание онтологии сопровождается созданием словаря - терминологического ядра онтологии с дальнейшей разработкой методов извлечения новых терминов данной предметной области. Данная задача рассматривается как задача извлечения именованных сущностей, для решения которой стандартом является обучение нейросетевой модели на представительном наборе данных. Этот подход сравнивается с подходом на основе больших языковых моделей, для реализации которого разработаны лексико-синтаксические шаблоны, шаблоны инструкций для проверки гипотез относительно новых терминов-словосочетаний, инструкции для верификации результатов. Разработанные инструкции для решения задачи извлечения отношений включают вопросы оценки компетенций на естественном языке, генерируемые автоматически для каждого отношения онтологии. Новизна предлагаемого подхода заключается в интеграции онтологических, лингвистических и нейросетевых подходов для извлечения информации из текстов. Показана возможность решать задачи анализа текста и извлечения информации путём выстраивания цепочки больших языковых моделей, инструкции для которых динамически формируются на основе результатов предыдущих этапов анализа. В эксперименте достигнуты следующие оценки F1-меры: для извлечения и классификации терминов F1=0.8, для извлечения отношений F1=0.87.

AB - Рассматривается извлечение информации из текстов на основе онтологии предметной области и нейросетевых методов анализа текста с привлечением больших языковых моделей. Обсуждается роль эксперта при разработке и сопровождении систем на примере задачи извлечения информации из аналитических статей и при построении онтологий по компьютерной лингвистике, описывающих основные понятия, интересующие пользователя/заказчика системы. Создание онтологии сопровождается созданием словаря - терминологического ядра онтологии с дальнейшей разработкой методов извлечения новых терминов данной предметной области. Данная задача рассматривается как задача извлечения именованных сущностей, для решения которой стандартом является обучение нейросетевой модели на представительном наборе данных. Этот подход сравнивается с подходом на основе больших языковых моделей, для реализации которого разработаны лексико-синтаксические шаблоны, шаблоны инструкций для проверки гипотез относительно новых терминов-словосочетаний, инструкции для верификации результатов. Разработанные инструкции для решения задачи извлечения отношений включают вопросы оценки компетенций на естественном языке, генерируемые автоматически для каждого отношения онтологии. Новизна предлагаемого подхода заключается в интеграции онтологических, лингвистических и нейросетевых подходов для извлечения информации из текстов. Показана возможность решать задачи анализа текста и извлечения информации путём выстраивания цепочки больших языковых моделей, инструкции для которых динамически формируются на основе результатов предыдущих этапов анализа. В эксперименте достигнуты следующие оценки F1-меры: для извлечения и классификации терминов F1=0.8, для извлечения отношений F1=0.87.

KW - ИЗВЛЕЧЕНИЕ ИНФОРМАЦИИ

KW - ОНТОЛОГИЯ ПРЕДМЕТНОЙ ОБЛАСТИ

KW - БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ

KW - НЕЙРОСЕТЕВЫЕ МОДЕЛИ

KW - РАЗРАБОТКА ИНСТРУКЦИЙ

UR - https://elibrary.ru/item.asp?id=80257256

U2 - 10.18287/2223-9537-2025-15-1-114-129

DO - 10.18287/2223-9537-2025-15-1-114-129

M3 - статья

VL - 15

SP - 114

EP - 129

JO - Онтология проектирования

JF - Онтология проектирования

SN - 2223-9537

IS - 1 (55)

ER -

ID: 74320831