Детальная информация

Название Использование синтетических изображений и признаков, выделенных прямыми методами, для решения задач биоинформатики: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_04 «Биоинформатика»
Авторы Губриенко Денис Дмитриевич
Научный руководитель Козлов Константин Николаевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Выходные сведения Санкт-Петербург, 2024
Коллекция Выпускные квалификационные работы; Общая коллекция
Тематика синтетические изображения; машинное обучение; ОНП; нут; фенотип; Gradient Boost; Random Forest; XGBoost; Catboost; synthetic images; machine learning; phenotyping; peanuts; phenotype
Тип документа Выпускная квалификационная работа бакалавра
Тип файла PDF
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 01.03.02
Группа специальностей ФГОС 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2024/vr/vr24-5305
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\29998
Дата создания записи 10.07.2024

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Тема выпускной квалификационной работы: «Использование синтетических изображений и признаков, выделенных прямыми методами, для решения задач биоинформатики». Работа посвящена проблеме поиска эффективного решения задачи фенотипирования, в условиях растущего спроса создавать сорта сельскохозяйственных культур с более высоким потенциалом урожайности и устойчивости к абиотическим стрессам. Одним из ключевых вызовов является преодоление "проклятия размерности", связанного с анализом данных, характеризующихся небольшим количеством образцов и большим числом признаков. Целью работы является исследование современных подходов к обучению моделей с такими данными с целью достижения высокой точности прогнозирования при существенном ускорении процесса обучения. В рамках исследования изучаются современные методы обучения ансамблевых регрессионных моделей, с особым вниманием к эффективности использования синтетических изображений для улучшения обучаемости модели. В результате исследования удалось обучить регрессионные модели, способные предсказывать фенотипические признаки для нута на основе его генетической информации. Полученные модели демонстрируют высокую точность предсказания при значительном сокращении времени обучения, что делает их перспективными инструментами для селекции сельскохозяйственных культур.

Topic of final qualifying work: "Utilization of Synthetic Images and Direct Feature Extraction Methods for Addressing Bioinformatics Challenges". The thesis focuses on tackling the problem of effectively solving the phenotype prediction task in light of the growing demand to develop agricultural crop varieties with higher yield potential and resilience to abiotic stresses. One of the key challenges is overcoming the "curse of dimensionality" associated with analyzing data characterized by a small number of samples and a large number of features. The aim of the thesis is to investigate modern approaches to training models with such data to achieve high prediction accuracy while significantly speeding up the training process. The study explores contemporary methods of training ensemble regression models, with particular emphasis on assessing the effectiveness of using synthetic images to enhance model training. Additionally, an analysis of metrics characterizing model improvement is conducted. As a result of the research, regression models capable of predicting phenotypic traits for peanuts based on their genetic information have been trained. These models demonstrate high prediction accuracy with a significant reduction in training time, making them promising tools for crop breeding selection.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать Загрузить
Интернет Анонимные пользователи

Количество обращений: 3 
За последние 30 дней: 0

Подробная статистика