Research output: Contribution to journal › Article › peer-review
Автономный ИИ-исследователь в коммерческом применении: практические задачи в области text-to-SQL. / Федоров, Вячеслав Васильевич; Лавитская, Дарья Ивановна; Ибрагимов , Д. М. et al.
In: Доклады Российской академии наук. Математика, информатика, процессы управления, 2025, p. 471-484.Research output: Contribution to journal › Article › peer-review
}
TY - JOUR
T1 - Автономный ИИ-исследователь в коммерческом применении: практические задачи в области text-to-SQL
AU - Федоров, Вячеслав Васильевич
AU - Лавитская, Дарья Ивановна
AU - Ибрагимов , Д. М.
AU - Сафронов, Д. А.
AU - Баллес, А.
AU - Грибанова, А. Ю.
AU - Радионов, М. С.
N1 - Автономный ИИ-исследователь в коммерческом применении: практические задачи в области text-to-SQL / В. Федоров, Д. Лавитская, Д. М. Ибрагимов [и др.] // Доклады Российской академии наук. Математика, информатика, процессы управления. – 2025. – Т. 527, № S. – С. 471-484. – DOI 10.7868/S2686954325070409. – EDN QDGSRI.
PY - 2025
Y1 - 2025
N2 - Одной из фундаментальных проблем современного искусственного интеллекта остается автоматизация задач, требующих сложных многоэтапных рассуждений и глубокого понимания как естественного языка, так и структурированных данных. Несмотря на впечатляющие успехи больших языковых моделей в генерации кода и обработке естественного языка, их способность к автономному проведению комплексных исследований в специализированных областях по-прежнему ограничена. Это порождает ключевой вопрос: может ли искусственный интеллект надежно решать реальные бизнес-задачи? В данной работе представлена полностью автоматизированная платформа для ИИ-исследований, примененная к проблеме Text-to-SQL. Наша система позволяет передовым языковым моделям самостоятельно генерировать новые идеи, разрабатывать экспериментальные планы, реализовывать решения и документировать полученные результаты. В рамках исследования мы адаптировали The AI Scientist [1] - комплексного ИИ-агента для автономной научной деятельности - к области семантического разбора. Агент демонстрирует способность формулировать гипотезы по улучшению точности Text-to-SQL, создавать исполняемый код, проводить эксперименты на эталонных наборах данных, визуализировать динамику производительности и формировать полноценные научные статьи с обобщением результатов. Важнейшей характеристикой нашего подхода является его экономическая эффективность: полный цикл исследования стоит менее $5, что создает масштабируемую основу для быстрого инновационного развития. Наша работа прокладывает путь к созданию самосовершенствующихся ИИ-систем в области обработки естественного языка, демонстрируя стабильную производительность как на проприетарных, так и на публичных бенчмарках. Предлагаемое решение представляет качественно новый уровень автоматизации, где ИИ-агенты не просто выполняют задачи, но и вносят вклад в развитие области, проводя независимые исследования. Код платформы и сгенерированные статьи доступны в открытом доступе по адресу https://gitverse.ru/tr1ggers/AIScientist_Text2SQL.git.
AB - Одной из фундаментальных проблем современного искусственного интеллекта остается автоматизация задач, требующих сложных многоэтапных рассуждений и глубокого понимания как естественного языка, так и структурированных данных. Несмотря на впечатляющие успехи больших языковых моделей в генерации кода и обработке естественного языка, их способность к автономному проведению комплексных исследований в специализированных областях по-прежнему ограничена. Это порождает ключевой вопрос: может ли искусственный интеллект надежно решать реальные бизнес-задачи? В данной работе представлена полностью автоматизированная платформа для ИИ-исследований, примененная к проблеме Text-to-SQL. Наша система позволяет передовым языковым моделям самостоятельно генерировать новые идеи, разрабатывать экспериментальные планы, реализовывать решения и документировать полученные результаты. В рамках исследования мы адаптировали The AI Scientist [1] - комплексного ИИ-агента для автономной научной деятельности - к области семантического разбора. Агент демонстрирует способность формулировать гипотезы по улучшению точности Text-to-SQL, создавать исполняемый код, проводить эксперименты на эталонных наборах данных, визуализировать динамику производительности и формировать полноценные научные статьи с обобщением результатов. Важнейшей характеристикой нашего подхода является его экономическая эффективность: полный цикл исследования стоит менее $5, что создает масштабируемую основу для быстрого инновационного развития. Наша работа прокладывает путь к созданию самосовершенствующихся ИИ-систем в области обработки естественного языка, демонстрируя стабильную производительность как на проприетарных, так и на публичных бенчмарках. Предлагаемое решение представляет качественно новый уровень автоматизации, где ИИ-агенты не просто выполняют задачи, но и вносят вклад в развитие области, проводя независимые исследования. Код платформы и сгенерированные статьи доступны в открытом доступе по адресу https://gitverse.ru/tr1ggers/AIScientist_Text2SQL.git.
KW - СЕМАНТИЧЕСКОЕ ПАРСИНГ
KW - БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ
KW - АВТОМАТИЧЕСКОЕ НАУЧНОЕ ОТКРЫТИЕ
KW - AI-АГЕНТ
KW - TEXT-TO-SQL
KW - NL2SQL
KW - ОТВЕТ НА ВОПРОСЫ ПО БАЗЕ ДАННЫХ
KW - АВТОНОМНЫЕ ИССЛЕДОВАНИЯ
KW - АВТОМАТИЗАЦИЯ МАШИННОГО ОБУЧЕНИЯ
KW - ГЕНЕРАЦИЯ КОДА
KW - САМОУЛУЧШАЮЩИЙСЯ AI
KW - СИНТЕЗ ПРОГРАММ
UR - https://elibrary.ru/item.asp?id=83189227
U2 - 10.7868/S2686954325070409
DO - 10.7868/S2686954325070409
M3 - статья
SP - 471
EP - 484
JO - Доклады Российской академии наук. Математика, информатика, процессы управления
JF - Доклады Российской академии наук. Математика, информатика, процессы управления
SN - 2686-9543
ER -
ID: 74614279