Детальная информация
Название | Применение методов машинного обучения для предсказания влияния небольших молекул на экспрессию генов: выпускная квалификационная работа бакалавра: направление 01.03.03 «Механика и математическое моделирование» ; образовательная программа 01.03.03_01 «Механика и математическое моделирование сред с микроструктурой» |
---|---|
Авторы | Сазыкин Георгий Андреевич |
Научный руководитель | Мешков Вадим Ростиславович |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт |
Выходные сведения | Санкт-Петербург, 2024 |
Коллекция | Выпускные квалификационные работы; Общая коллекция |
Тематика | экспрессия генов; машинное обучение; методы снижения размерности; статистические тесты; метод главных компонент; регрессия; градиентный бустинг; gene expression; machine learning; dimensionality reduction methods; statistical tests; principal component method; regression; gradient boosting |
Тип документа | Выпускная квалификационная работа бакалавра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Бакалавриат |
Код специальности ФГОС | 01.03.03 |
Группа специальностей ФГОС | 010000 - Математика и механика |
DOI | 10.18720/SPBPU/3/2024/vr/vr24-2939 |
Права доступа | Доступ по паролю из сети Интернет (чтение) |
Ключ записи | ru\spstu\vkr\30083 |
Дата создания записи | 10.07.2024 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
В данной работе проводится исследование данных об экспрессии генов в отдельных клетках периферической крови человека. Проведен разведочный анализ данных; проведено сравнение методов снижения размерности и визуализации, а также статистических критериев сравнения групп, описано решение задачи регрессии для предсказания экспрессии генов на тестовых данных и сравнение различных методов. Описан процесс извлечения новых данных из свойств молекул, масштабирования и кодирования категориальных переменных, подбора гиперпараметров для алгоритма градиентного бустинга.
In this paper, data on gene expression in individual cells of human peripheral blood are studied. An exploratory analysis of the data was carried out; methods of dimensionality reduction and visualization were compared, as well as statistical criteria for comparing groups, a solution to the regression problem for predicting gene expression on test data was described and various methods were compared. The process of extracting new data from the properties of molecules, scaling and encoding categorical variables, and selecting hyperparameters for the gradient boosting algorithm is describe.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0