Детальная информация
Название | Разработка модели машинного обучения прогнозирования признаков нута с учетом генов: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_01 «Прикладная математика и биоинформатика» |
---|---|
Авторы | Реутов Александр Сергеевич |
Научный руководитель | Козлов Константин Николаевич |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Выходные сведения | Санкт-Петербург, 2025 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | нейронные сети ; нут ; машинное обучение ; трансформеры ; ОНП ; гены ; фенотип ; аугментация ; межгенные взаимодействия ; neural networks ; chickpeas ; machine learning ; transformers ; SNP ; genes ; phenotype ; augmentation ; intergenic interactions |
Тип документа | Выпускная квалификационная работа магистра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Магистратура |
Код специальности ФГОС | 01.04.02 |
Группа специальностей ФГОС | 010000 - Математика и механика |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-2203 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\34986 |
Дата создания записи | 03.07.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
В данной работе была разработана модель прогнозирования пар количественных признаков нута по данным однонуклеотидных полиморфизмов и соответствующим им фенотипическим признакам. В качестве признаков были выбраны следующие фенотипы: масса тысячи семян (TSW), высота растений (Ptht) и масса всего растения (Byld). Модель, реализованная в данной работе, состоит из трех основных блоков: кодирования с вычислением скрытого слоя генов, трансформеров и предсказания. Ключевым объектом является архитектура трансформеров, которая обрабатывает векторные представления генов для выявления нелинейных взаимосвязей. Для оценки важности влияния предикторов и межгенных взаимодействий на решение модели использованы значения Шепли. Главной целью работы является не только повышение точности предсказания фенотипов по генетическим данным, но и выявление значимых генов и их взаимодействий. Также была проведена оценка эффективности различных подходов к расширению данных и выбор наиболее подходящей из них. Разработанный подход может быть применен селекционных исследованиях для выбора ключевых маркеров, влияющих на продуктивность растений и их устойчивость к неблагоприятным условиям окружающей среды.
In this work, a model was developed for predicting pairs of quantitative chickpea traits based on single-nucleotide polymorphisms and their corresponding phenotypic traits. The following phenotypes were selected as traits: thousand seed mass (TSW), plant height (Ptht) and whole plant mass (Byld). The model implemented in this paper consists of three main blocks: coding with calculation of the hidden layer of genes, transformers and prediction. The key object is the transformer architecture, which processes vector representations of genes to identify nonlinear relationships. The Shapley values were used to assess the importance of the influence of predictors and intergenic interactions on the decision of the model. The main goal of the work is not only to increase the accuracy of predicting phenotypes based on genetic data, but also to identify significant genes and their interactions. The effectiveness of various approaches to data expansion was also evaluated and the most appropriate one was selected. The developed approach can be applied in breeding research to select key markers that affect plant productivity and resistance.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
- Разработка модели машинного обучения прогнозирования признаков нута с учетом генов
- Введение
- 1. Постановка задачи и описание исходных данных
- 2. Разработка архитектуры модели и описание используемых методов
- 3. Применение построенной модели прогнозирования. Результаты исследований
- Выводы
- Заключение
- Список сокращений и условных обозначений
- Словарь терминов
- Список использованных источников
Количество обращений: 0
За последние 30 дней: 0