Детальная информация
Название | Использование синтетических изображений и признаков, выделенных прямыми методами, для решения задач биоинформатики: выпускная квалификационная работа бакалавра: направление 01.03.02 «Прикладная математика и информатика» ; образовательная программа 01.03.02_04 «Биоинформатика» |
---|---|
Авторы | Губриенко Денис Дмитриевич |
Научный руководитель | Козлов Константин Николаевич |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Выходные сведения | Санкт-Петербург, 2024 |
Коллекция | Выпускные квалификационные работы; Общая коллекция |
Тематика | синтетические изображения; машинное обучение; ОНП; нут; фенотип; Gradient Boost; Random Forest; XGBoost; Catboost; synthetic images; machine learning; phenotyping; peanuts; phenotype |
Тип документа | Выпускная квалификационная работа бакалавра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Бакалавриат |
Код специальности ФГОС | 01.03.02 |
Группа специальностей ФГОС | 010000 - Математика и механика |
DOI | 10.18720/SPBPU/3/2024/vr/vr24-5305 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\29998 |
Дата создания записи | 10.07.2024 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
Тема выпускной квалификационной работы: «Использование синтетических изображений и признаков, выделенных прямыми методами, для решения задач биоинформатики». Работа посвящена проблеме поиска эффективного решения задачи фенотипирования, в условиях растущего спроса создавать сорта сельскохозяйственных культур с более высоким потенциалом урожайности и устойчивости к абиотическим стрессам. Одним из ключевых вызовов является преодоление "проклятия размерности", связанного с анализом данных, характеризующихся небольшим количеством образцов и большим числом признаков. Целью работы является исследование современных подходов к обучению моделей с такими данными с целью достижения высокой точности прогнозирования при существенном ускорении процесса обучения. В рамках исследования изучаются современные методы обучения ансамблевых регрессионных моделей, с особым вниманием к эффективности использования синтетических изображений для улучшения обучаемости модели. В результате исследования удалось обучить регрессионные модели, способные предсказывать фенотипические признаки для нута на основе его генетической информации. Полученные модели демонстрируют высокую точность предсказания при значительном сокращении времени обучения, что делает их перспективными инструментами для селекции сельскохозяйственных культур.
Topic of final qualifying work: "Utilization of Synthetic Images and Direct Feature Extraction Methods for Addressing Bioinformatics Challenges". The thesis focuses on tackling the problem of effectively solving the phenotype prediction task in light of the growing demand to develop agricultural crop varieties with higher yield potential and resilience to abiotic stresses. One of the key challenges is overcoming the "curse of dimensionality" associated with analyzing data characterized by a small number of samples and a large number of features. The aim of the thesis is to investigate modern approaches to training models with such data to achieve high prediction accuracy while significantly speeding up the training process. The study explores contemporary methods of training ensemble regression models, with particular emphasis on assessing the effectiveness of using synthetic images to enhance model training. Additionally, an analysis of metrics characterizing model improvement is conducted. As a result of the research, regression models capable of predicting phenotypic traits for peanuts based on their genetic information have been trained. These models demonstrate high prediction accuracy with a significant reduction in training time, making them promising tools for crop breeding selection.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
Количество обращений: 3
За последние 30 дней: 0