Research output: Contribution to journal › Article › peer-review
Определение количественного содержания хлорофиллов в листьях по спектрам отражения алгоритмом случайного леса. / Urbanovich, E. A.; Afonnikov, D. A.; Nikolaev, S. V.
In: Vavilovskii Zhurnal Genetiki i Selektsii, Vol. 25, No. 1, 7, 2021, p. 64-70.Research output: Contribution to journal › Article › peer-review
}
TY - JOUR
T1 - Определение количественного содержания хлорофиллов в листьях по спектрам отражения алгоритмом случайного леса
AU - Urbanovich, E. A.
AU - Afonnikov, D. A.
AU - Nikolaev, S. V.
N1 - Урбанович Е.А., Афонников Д.А., Николаев С.В. Определение количественного содержания хлорофиллов в листьях по спектрам отражения алгоритмом случайного леса // Вавиловский журнал генетики и селекции. - 2021. - Т. 25. - № 1. - С. 64-70
PY - 2021
Y1 - 2021
N2 - Определение количественного содержания хлорофиллов в листьях растений по их спектрам отражения - важная задача как при мониторинге состояния естественных и промышленных фитоценозов, так и в лабораторных исследованиях нормальных и патологических процессов в ходе роста растения. Применение для этих целей методов машинного обучения является перспективным, поскольку они позволяют «автоматически» строить решающие правила для получения результата (модель предсказания), а исследователю (для повышения качества предсказания) остаются модификация предикторов и выбор множества параметров метода. В статье приведены результаты построения решающих правил алгоритмом случайного леса (random forest) для предсказания суммарной концентрации хлорофиллов a и b по спектрам отражения листьев растений в видимом и инфракрасном (ИК) диапазонах длин волн. Набор данных взят из открытых источников. Они включали 276 образцов листьев 39 видов растений. При этом 181 образец получен при анализе листьев белого клена ( Acer pseudoplatanus L.). Спектр отражения представлен в диапазоне 400-2500 нм с шагом 1 нм. Обучение происходило на 85 % образцов A. pseudoplatanus L., оценка качества предсказания - на оставшихся 15 % образцов этого вида (валидационная выборка). Построено шесть моделей на основе алгоритма случайного леса с разными предикторами. Подбор управляющих параметров осуществляли при помощи перекрестной проверки на пяти разбиениях. Предикторами первой модели выступали имеющиеся значения по спектру отражения без какой-либо обработки с нашей стороны. После проведения анализа этой модели были выбраны диапазоны длин волн предикторов для оставшихся пяти моделей. Лучшие предсказания имеют модели с разностной производной спектра отражения в видимом диапазоне длин волн. Модель с первой производной спектра отражения в диапазоне 400-800 нм с шагом 1 нм брали для сравнения с моделью других авторов. Этой моделью выступает функциональная зависимость с двумя неизвестными параметрами, подбираемыми методом наименьших квадратов и двумя коэффициентами отражения, выбор которых описывается в настоящей статье. Сравнение результатов предсказаний модели с применением алгоритма случайного леса проводили как на валидационной выборке клена, так и на выборке из других видов растений. В первом случае предсказания метода на основе случайного леса имели меньшую оценку среднеквадратического отклонения. Во втором случае предсказания этого метода были с большой ошибкой при малых значениях хлорофилла, в то время как сторонний метод имел приемлемые предсказания. В статье приводятся анализ результатов и рекомендации по применению этого метода машинного обучения для оценки количественного содержания хлорофиллов в листьях.
AB - Определение количественного содержания хлорофиллов в листьях растений по их спектрам отражения - важная задача как при мониторинге состояния естественных и промышленных фитоценозов, так и в лабораторных исследованиях нормальных и патологических процессов в ходе роста растения. Применение для этих целей методов машинного обучения является перспективным, поскольку они позволяют «автоматически» строить решающие правила для получения результата (модель предсказания), а исследователю (для повышения качества предсказания) остаются модификация предикторов и выбор множества параметров метода. В статье приведены результаты построения решающих правил алгоритмом случайного леса (random forest) для предсказания суммарной концентрации хлорофиллов a и b по спектрам отражения листьев растений в видимом и инфракрасном (ИК) диапазонах длин волн. Набор данных взят из открытых источников. Они включали 276 образцов листьев 39 видов растений. При этом 181 образец получен при анализе листьев белого клена ( Acer pseudoplatanus L.). Спектр отражения представлен в диапазоне 400-2500 нм с шагом 1 нм. Обучение происходило на 85 % образцов A. pseudoplatanus L., оценка качества предсказания - на оставшихся 15 % образцов этого вида (валидационная выборка). Построено шесть моделей на основе алгоритма случайного леса с разными предикторами. Подбор управляющих параметров осуществляли при помощи перекрестной проверки на пяти разбиениях. Предикторами первой модели выступали имеющиеся значения по спектру отражения без какой-либо обработки с нашей стороны. После проведения анализа этой модели были выбраны диапазоны длин волн предикторов для оставшихся пяти моделей. Лучшие предсказания имеют модели с разностной производной спектра отражения в видимом диапазоне длин волн. Модель с первой производной спектра отражения в диапазоне 400-800 нм с шагом 1 нм брали для сравнения с моделью других авторов. Этой моделью выступает функциональная зависимость с двумя неизвестными параметрами, подбираемыми методом наименьших квадратов и двумя коэффициентами отражения, выбор которых описывается в настоящей статье. Сравнение результатов предсказаний модели с применением алгоритма случайного леса проводили как на валидационной выборке клена, так и на выборке из других видов растений. В первом случае предсказания метода на основе случайного леса имели меньшую оценку среднеквадратического отклонения. Во втором случае предсказания этого метода были с большой ошибкой при малых значениях хлорофилла, в то время как сторонний метод имел приемлемые предсказания. В статье приводятся анализ результатов и рекомендации по применению этого метода машинного обучения для оценки количественного содержания хлорофиллов в листьях.
KW - Leaf optics
KW - Pigments
KW - Random forest
KW - Remote methods
UR - http://www.scopus.com/inward/record.url?scp=85103756078&partnerID=8YFLogxK
UR - https://elibrary.ru/item.asp?id=44831859
U2 - 10.18699/VJ21.008
DO - 10.18699/VJ21.008
M3 - статья
C2 - 34901704
AN - SCOPUS:85103756078
VL - 25
SP - 64
EP - 70
JO - Вавиловский журнал генетики и селекции
JF - Вавиловский журнал генетики и селекции
SN - 2500-0462
IS - 1
M1 - 7
ER -
ID: 28289606