Details
Title | Модели геномной селекции нескольких признаков у полиплойдных растений с использованием искусственных изображений: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_01 «Прикладная математика и биоинформатика» |
---|---|
Creators | Тырыкин Ярослав Алексеевич |
Scientific adviser | Козлов Константин Николаевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Imprint | Санкт-Петербург, 2024 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | глубокое обучение; машинное обучение; карты активации; сверточные нейронные сети; регрессионные модели; язык программирования R; язык программирования Python; machine learning; deep learning; convolution neural network; activation maps; regression models; R programming language; Python programming language |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 01.04.02 |
Speciality group (FGOS) | 010000 - Математика и механика |
DOI | 10.18720/SPBPU/3/2024/vr/vr24-6295 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\31577 |
Record create date | 8/6/2024 |
Allowed Actions
–
Action 'Download' will be available if administrator prepare required files
Group | Anonymous |
---|---|
Network | Internet |
В рамках данной работы производилась разработка модели прогнозирования пар количественных признаков пшеницы на основании данных, содержащих информацию о генетических маркерах и фенотипических показателях растений. Модель предствляла собой сверточную нейронную сеть с возможностью выделения наиболее значимых генетических признаков и обучалась при помощи измененного представления об ОНП. Главной целью работы является разработка модели прогнозирования двух фенотипических признаков по генетическим данным гексаплоидной пшеницы, представленным в виде искусственных изображений. Для достижения поставленной цели необходимо реализовать архитектуру сверточной нейронной сети, адаптировать алгоритм кодирования генетических данных об однонуклеотидных полиморфизмах в искусственные изображения с учетом особенностей растительной культуры, доработать алгоритм построения карт важности признаков для вычисления наиболее влияющих на прогноз фенотипа маркеров, применить разработанную модель для предсказания нескольких количественных показателей пшеницы, а также выделить наиболее значимые маркеры, после чего проанализировать результаты. При проведении численных экспериментов были получены модели, прогнозирующие три пары фенотипических признаков, некоторые из которых оказались сравнимы по качеству прогноза с существующими моделями, примененными на тех же данных. Предложенная архитектура модели, как и алгоритм перевода табличных данных в визуальное представление с алгоритмом построения карт важности, в дальнейшем могут быть применены в других научных областях, никак не связанных с биологией и генетикой.
In this work, we developed a model for predicting pairs of quantitative traits in wheat based on data containing information on genetic markers and phenotypic indices of plants. The models were convolutional neural networks with the ability to select the most significant genetic traits and were trained using a modified representation of SNPs. The main goal of this work is to develop a model for predicting two phenotypic traits from genetic data of hexaploid wheat represented in the form of artificial images. To achieve this goal, it is necessary to implement the architecture of a convolutional neural network, adapt the algorithm for encoding genetic data on single-nucleotide polymorphisms into artificial images taking into account the peculiarities of the crop, refine the algorithm for constructing maps of trait importance to calculate the most important markers for phenotype prediction, and apply the developed model to predict several quantitative indicators of wheat and select the most important markers, and then analyze the results. Numerical experiments produced models predicting three pairs of phenotypic traits, some of which were comparable in prediction quality to existing models used on the same data. The proposed model architecture, as well as the algorithm for translating tabular data into a visual representation with an algorithm for constructing importance maps, can be further applied in other scientific fields unrelated to biology and genetics.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0