Details

Title Регрессионная модель описания фенотипа растений с помощью генетического программирования: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_04 «Биоинформатика»
Creators Якубов Марк Расулович
Scientific adviser Козлов Константин Николаевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint Санкт-Петербург, 2024
Collection Выпускные квалификационные работы; Общая коллекция
Subjects символьная регрессия; регрессионные модели; ансамбли деревьев; генетическое программирование; грамматическая эволюция; python; symbolic regression; regression models; trees ensembles; genetic programming; grammatical evolution
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 01.03.02
Speciality group (FGOS) 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2024/vr/vr24-6189
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\31555
Record create date 8/6/2024

Allowed Actions

Action 'Download' will be available if administrator prepare required files

Group Anonymous
Network Internet

Тема выпускной квалификационной работы: «Регрессионная модель описания фенотипа растений с помощью генетического программирования». В ходе выполнения данной работы производилась разработка методов построения моделей на основе ансамблей алгоритмов грамматической эволюции для предсказания фенотипических признаков ржи по данным генотипических маркеров. Цели данной работы - разработка и сравнение ансамблевых методов символьной регрессии на основе разностной эволюции и генетического программирования для построение модели предсказание фенотипических признаков ржи. После реализации, полученные модели были применены к реальным данным генетических факторов образцов ржи. Были получены численные результаты, сведетельствующие о состоятельности градиентного бустинга как подхода к комбинированию моделей генетичекого программирования. После чего была проведена оценка важности генотипических маркеров методами значений Шапли и невязки суммы квадратов. Подходу случайного леса же, возможно, в силу специфики данных и задачи в целом, показать достойные результаты не удалось. Разработанные модели могут быть использованы и для задач других наук, в которых требуется приближенное восстановление функциональной зависимости в явном, символьном виде. Тем более, что ансамблирование моделей генетического программирования в символьной регрессии оказалось эффективной модификацией для улучшения предсказательной точности генетических алгоритмов, которая может быть востребована и в других областях.

The subject of the graduate qualification work is «A regression model for describing plant phenotype using genetic programming». In the course of this work, methods of model building based on ensembles of grammatical evolution algorithms for predicting phenotypic traits of rye from genotypic marker data were developed. The objectives of this paper are to develop and compare ensemble-based symbolic regression methods based on difference evolution and genetic programming for model building prediction of rye phenotypic traits. After implementation, the obtained models were applied to real data of genetic factors of rye samples. Numerical results were obtained, indicating the validity of gradient boosting as an approach to combining genetic programming models. The random forest approach, perhaps due to the specificity of the data and the problem as a whole, failed to show decent results. The importance of genotypic markers was then assessed using the methods of Shapley values and residual sum of squares. The developed models can also be used for problems of other sciences, where approximate restoration of functional dependence in explicit, symbolic form is required. The more so that the ensemble of genetic programming models in symbolic regression proved to be an effective modification for improving the predictive accuracy of genetic algorithms, which may be in demand in other fields as well.

Network User group Action
ILC SPbPU Local Network All
Internet Authorized users SPbPU
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics