Details
Title | Разработка модели машинного обучения прогнозирования признаков нута с учетом генов: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_01 «Прикладная математика и биоинформатика» |
---|---|
Creators | Реутов Александр Сергеевич |
Scientific adviser | Козлов Константин Николаевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | нейронные сети ; нут ; машинное обучение ; трансформеры ; ОНП ; гены ; фенотип ; аугментация ; межгенные взаимодействия ; neural networks ; chickpeas ; machine learning ; transformers ; SNP ; genes ; phenotype ; augmentation ; intergenic interactions |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 01.04.02 |
Speciality group (FGOS) | 010000 - Математика и механика |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-2203 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\34986 |
Record create date | 7/3/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
В данной работе была разработана модель прогнозирования пар количественных признаков нута по данным однонуклеотидных полиморфизмов и соответствующим им фенотипическим признакам. В качестве признаков были выбраны следующие фенотипы: масса тысячи семян (TSW), высота растений (Ptht) и масса всего растения (Byld). Модель, реализованная в данной работе, состоит из трех основных блоков: кодирования с вычислением скрытого слоя генов, трансформеров и предсказания. Ключевым объектом является архитектура трансформеров, которая обрабатывает векторные представления генов для выявления нелинейных взаимосвязей. Для оценки важности влияния предикторов и межгенных взаимодействий на решение модели использованы значения Шепли. Главной целью работы является не только повышение точности предсказания фенотипов по генетическим данным, но и выявление значимых генов и их взаимодействий. Также была проведена оценка эффективности различных подходов к расширению данных и выбор наиболее подходящей из них. Разработанный подход может быть применен селекционных исследованиях для выбора ключевых маркеров, влияющих на продуктивность растений и их устойчивость к неблагоприятным условиям окружающей среды.
In this work, a model was developed for predicting pairs of quantitative chickpea traits based on single-nucleotide polymorphisms and their corresponding phenotypic traits. The following phenotypes were selected as traits: thousand seed mass (TSW), plant height (Ptht) and whole plant mass (Byld). The model implemented in this paper consists of three main blocks: coding with calculation of the hidden layer of genes, transformers and prediction. The key object is the transformer architecture, which processes vector representations of genes to identify nonlinear relationships. The Shapley values were used to assess the importance of the influence of predictors and intergenic interactions on the decision of the model. The main goal of the work is not only to increase the accuracy of predicting phenotypes based on genetic data, but also to identify significant genes and their interactions. The effectiveness of various approaches to data expansion was also evaluated and the most appropriate one was selected. The developed approach can be applied in breeding research to select key markers that affect plant productivity and resistance.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
- Разработка модели машинного обучения прогнозирования признаков нута с учетом генов
- Введение
- 1. Постановка задачи и описание исходных данных
- 2. Разработка архитектуры модели и описание используемых методов
- 3. Применение построенной модели прогнозирования. Результаты исследований
- Выводы
- Заключение
- Список сокращений и условных обозначений
- Словарь терминов
- Список использованных источников
Access count: 0
Last 30 days: 0