Детальная информация

Название Применение методов машинного обучения для предсказания влияния небольших молекул на экспрессию генов: выпускная квалификационная работа бакалавра: направление 01.03.03 «Механика и математическое моделирование» ; образовательная программа 01.03.03_01 «Механика и математическое моделирование сред с микроструктурой»
Авторы Сазыкин Георгий Андреевич
Научный руководитель Мешков Вадим Ростиславович
Организация Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Выходные сведения Санкт-Петербург, 2024
Коллекция Выпускные квалификационные работы; Общая коллекция
Тематика экспрессия генов; машинное обучение; методы снижения размерности; статистические тесты; метод главных компонент; регрессия; градиентный бустинг; gene expression; machine learning; dimensionality reduction methods; statistical tests; principal component method; regression; gradient boosting
Тип документа Выпускная квалификационная работа бакалавра
Тип файла PDF
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 01.03.03
Группа специальностей ФГОС 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2024/vr/vr24-2939
Права доступа Доступ по паролю из сети Интернет (чтение)
Ключ записи ru\spstu\vkr\30083
Дата создания записи 10.07.2024

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

В данной работе проводится исследование данных об экспрессии генов в отдельных клетках периферической крови человека. Проведен разведочный анализ данных; проведено сравнение методов снижения размерности и визуализации, а также статистических критериев сравнения групп, описано решение задачи регрессии для предсказания экспрессии генов на тестовых данных и сравнение различных методов. Описан процесс извлечения новых данных из свойств молекул, масштабирования и кодирования категориальных переменных, подбора гиперпараметров для алгоритма градиентного бустинга.

In this paper,  data on gene expression in individual cells of human peripheral blood are studied. An exploratory analysis of the data was carried out; methods of dimensionality reduction and visualization were compared, as well as statistical criteria for comparing groups, a solution to the regression problem for predicting gene expression on test data was described and various methods were compared. The process of extracting new data from the properties of molecules, scaling and encoding categorical variables, and selecting hyperparameters for the gradient boosting algorithm is describe.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика