Details

Title Применение методов машинного обучения для предсказания влияния небольших молекул на экспрессию генов: выпускная квалификационная работа бакалавра: направление 01.03.03 «Механика и математическое моделирование» ; образовательная программа 01.03.03_01 «Механика и математическое моделирование сред с микроструктурой»
Creators Сазыкин Георгий Андреевич
Scientific adviser Мешков Вадим Ростиславович
Organization Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint Санкт-Петербург, 2024
Collection Выпускные квалификационные работы; Общая коллекция
Subjects экспрессия генов; машинное обучение; методы снижения размерности; статистические тесты; метод главных компонент; регрессия; градиентный бустинг; gene expression; machine learning; dimensionality reduction methods; statistical tests; principal component method; regression; gradient boosting
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 01.03.03
Speciality group (FGOS) 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2024/vr/vr24-2939
Rights Доступ по паролю из сети Интернет (чтение)
Record key ru\spstu\vkr\30083
Record create date 7/10/2024

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

В данной работе проводится исследование данных об экспрессии генов в отдельных клетках периферической крови человека. Проведен разведочный анализ данных; проведено сравнение методов снижения размерности и визуализации, а также статистических критериев сравнения групп, описано решение задачи регрессии для предсказания экспрессии генов на тестовых данных и сравнение различных методов. Описан процесс извлечения новых данных из свойств молекул, масштабирования и кодирования категориальных переменных, подбора гиперпараметров для алгоритма градиентного бустинга.

In this paper,  data on gene expression in individual cells of human peripheral blood are studied. An exploratory analysis of the data was carried out; methods of dimensionality reduction and visualization were compared, as well as statistical criteria for comparing groups, a solution to the regression problem for predicting gene expression on test data was described and various methods were compared. The process of extracting new data from the properties of molecules, scaling and encoding categorical variables, and selecting hyperparameters for the gradient boosting algorithm is describe.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics