Details

Title Модели геномной селекции нескольких признаков у полиплойдных растений с использованием искусственных изображений: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_01 «Прикладная математика и биоинформатика»
Creators Тырыкин Ярослав Алексеевич
Scientific adviser Козлов Константин Николаевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint Санкт-Петербург, 2024
Collection Выпускные квалификационные работы; Общая коллекция
Subjects глубокое обучение; машинное обучение; карты активации; сверточные нейронные сети; регрессионные модели; язык программирования R; язык программирования Python; machine learning; deep learning; convolution neural network; activation maps; regression models; R programming language; Python programming language
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 01.04.02
Speciality group (FGOS) 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2024/vr/vr24-6295
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\31577
Record create date 8/6/2024

Allowed Actions

Action 'Download' will be available if administrator prepare required files

Group Anonymous
Network Internet

В рамках данной работы производилась разработка модели прогнозирования пар количественных признаков пшеницы на основании данных, содержащих информацию о генетических маркерах и фенотипических показателях растений. Модель предствляла собой сверточную нейронную сеть с возможностью выделения наиболее значимых генетических признаков и обучалась при помощи измененного представления об ОНП. Главной целью работы является разработка модели прогнозирования двух фенотипических признаков по генетическим данным гексаплоидной пшеницы, представленным в виде искусственных изображений. Для достижения поставленной цели необходимо реализовать архитектуру сверточной нейронной сети, адаптировать алгоритм кодирования генетических данных об однонуклеотидных полиморфизмах в искусственные изображения с учетом особенностей растительной культуры, доработать алгоритм построения карт важности признаков для вычисления наиболее влияющих на прогноз фенотипа  маркеров, применить разработанную модель для предсказания нескольких количественных показателей пшеницы, а также выделить наиболее значимые маркеры, после чего проанализировать результаты. При проведении численных экспериментов были получены модели, прогнозирующие три пары фенотипических признаков, некоторые из которых оказались сравнимы по качеству прогноза с существующими моделями, примененными на тех же данных. Предложенная архитектура модели, как и алгоритм перевода табличных данных в визуальное представление с алгоритмом построения карт важности, в дальнейшем могут быть применены в других научных областях, никак не связанных с биологией и генетикой.

In this work, we developed a model for predicting pairs of quantitative traits in wheat based on data containing information on genetic markers and phenotypic indices of plants. The models were convolutional neural networks with the ability to select the most significant genetic traits and were trained using a modified representation of SNPs. The main goal of this work is to develop a model for predicting two phenotypic traits from genetic data of hexaploid wheat represented in the form of artificial images. To achieve this goal, it is necessary to implement the architecture of a convolutional neural network, adapt the algorithm for encoding genetic data on single-nucleotide polymorphisms into artificial images taking into account the peculiarities of the crop, refine the algorithm for constructing maps of trait importance to calculate the most important markers for phenotype prediction, and apply the developed model to predict several quantitative indicators of wheat and select the most important markers, and then analyze the results. Numerical experiments produced models predicting three pairs of phenotypic traits, some of which were comparable in prediction quality to existing models used on the same data. The proposed model architecture, as well as the algorithm for translating tabular data into a visual representation with an algorithm for constructing importance maps, can be further applied in other scientific fields unrelated to biology and genetics.

Network User group Action
ILC SPbPU Local Network All
Internet Authorized users SPbPU
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics