Details

Title Разработка модели машинного обучения прогнозирования признаков нута с учетом генов: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_01 «Прикладная математика и биоинформатика»
Creators Реутов Александр Сергеевич
Scientific adviser Козлов Константин Николаевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects нейронные сети ; нут ; машинное обучение ; трансформеры ; ОНП ; гены ; фенотип ; аугментация ; межгенные взаимодействия ; neural networks ; chickpeas ; machine learning ; transformers ; SNP ; genes ; phenotype ; augmentation ; intergenic interactions
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 01.04.02
Speciality group (FGOS) 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2025/vr/vr25-2203
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\34986
Record create date 7/3/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

В данной работе была разработана модель прогнозирования пар количественных признаков нута по данным однонуклеотидных полиморфизмов и соответствующим им фенотипическим признакам. В качестве признаков были выбраны следующие фенотипы: масса тысячи семян (TSW), высота растений (Ptht) и масса всего растения (Byld). Модель, реализованная в данной работе, состоит из трех основных блоков: кодирования с вычислением скрытого слоя генов, трансформеров и предсказания. Ключевым объектом является архитектура трансформеров, которая обрабатывает векторные представления генов для выявления нелинейных взаимосвязей. Для оценки важности влияния предикторов и межгенных взаимодействий на решение модели использованы значения Шепли. Главной целью работы является не только повышение точности предсказания фенотипов по генетическим данным, но и выявление значимых генов и их взаимодействий. Также была проведена оценка эффективности различных подходов к расширению данных и выбор наиболее подходящей из них. Разработанный подход может быть применен селекционных исследованиях для выбора ключевых маркеров, влияющих на продуктивность растений и их устойчивость к неблагоприятным условиям окружающей среды.

In this work, a model was developed for predicting pairs of quantitative chickpea traits based on single-nucleotide polymorphisms and their corresponding phenotypic traits. The following phenotypes were selected as traits: thousand seed mass (TSW), plant height (Ptht) and whole plant mass (Byld). The model implemented in this paper consists of three main blocks: coding with calculation of the hidden layer of genes, transformers and prediction. The key object is the transformer architecture, which processes vector representations of genes to identify nonlinear relationships. The Shapley values were used to assess the importance of the influence of predictors and intergenic interactions on the decision of the model. The main goal of the work is not only to increase the accuracy of predicting phenotypes based on genetic data, but also to identify significant genes and their interactions. The effectiveness of various approaches to data expansion was also evaluated and the most appropriate one was selected. The developed approach can be applied in breeding research to select key markers that affect plant productivity and resistance.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous
  • Разработка модели машинного обучения прогнозирования признаков нута с учетом генов
    • Введение
    • 1. Постановка задачи и описание исходных данных
    • 2. Разработка архитектуры модели и описание используемых методов
    • 3. Применение построенной модели прогнозирования. Результаты исследований
    • Выводы
    • Заключение
    • Список сокращений и условных обозначений
    • Словарь терминов
    • Список использованных источников

Access count: 0 
Last 30 days: 0

Detailed usage statistics