Research output: Contribution to journal › Article › peer-review
Методы автоматического конструирования признаков в машинном обучении на табличных данных. / Радеев, Никита Андреевич.
In: Программная инженерия, Vol. 16, No. 6, 2025, p. 300-310.Research output: Contribution to journal › Article › peer-review
}
TY - JOUR
T1 - Методы автоматического конструирования признаков в машинном обучении на табличных данных
AU - Радеев, Никита Андреевич
N1 - Радеев, Н. А. Методы автоматического конструирования признаков в машинном обучении на табличных данных / Н. А. Радеев // Программная инженерия. – 2025. – Т. 16, № 6. – С. 300-310. – DOI 10.17587/prin.16.300-310. – EDN VWTPDY.
PY - 2025
Y1 - 2025
N2 - Рассмотрены современные методы автоматического конструирования признаков для задач машинного обучения на табличных данных. Проанализированы различные подходы: от классических алгоритмов, основанных на заранее определенных преобразованиях (DFS, FCTree, ExploreKit, AutoLearn, FICUS, FEADIS, COGNITO), до эволюционных методов (GP-DR, GP-MaL-MO, DIFER). Представлено сравнение методов по их ключевым особенностям и ограничениям применения. Показано, что современные автоматизированные подходы способны эффективно находить нелинейные зависимости и создавать информативные признаки без участия эксперта предметной области, однако при использовании данных подходов возникают проблемы масштабируемости вследствие роста объема данных. В совокупности рассмотренные методы позволяют существенно упростить процесс подготовки данных для машинного обучения и повысить качество получаемых моделей.
AB - Рассмотрены современные методы автоматического конструирования признаков для задач машинного обучения на табличных данных. Проанализированы различные подходы: от классических алгоритмов, основанных на заранее определенных преобразованиях (DFS, FCTree, ExploreKit, AutoLearn, FICUS, FEADIS, COGNITO), до эволюционных методов (GP-DR, GP-MaL-MO, DIFER). Представлено сравнение методов по их ключевым особенностям и ограничениям применения. Показано, что современные автоматизированные подходы способны эффективно находить нелинейные зависимости и создавать информативные признаки без участия эксперта предметной области, однако при использовании данных подходов возникают проблемы масштабируемости вследствие роста объема данных. В совокупности рассмотренные методы позволяют существенно упростить процесс подготовки данных для машинного обучения и повысить качество получаемых моделей.
KW - МАШИННОЕ ОБУЧЕНИЕ
KW - КОНСТРУИРОВАНИЕ ПРИЗНАКОВ
KW - ТАБЛИЧНЫЕ ДАННЫЕ
KW - ПРИЗНАКОВОЕ ПРОСТРАНСТВО
KW - ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ
KW - СНИЖЕНИЕ РАЗМЕРНОСТИ
KW - ЭВОЛЮЦИОННЫЕ АЛГОРИТМЫ
UR - https://www.elibrary.ru/item.asp?id=82473782
U2 - 10.17587/prin.16.300-310
DO - 10.17587/prin.16.300-310
M3 - статья
VL - 16
SP - 300
EP - 310
JO - Программная инженерия
JF - Программная инженерия
SN - 2220-3397
IS - 6
ER -
ID: 74490433