Details

Title: Пайплайн изучения вариабельности сплайсинга при разработке лекарственных препаратов: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_01 «Математическое моделирование в науке и индустрии»
Creators: Моторный Никита Евгеньевич
Scientific adviser: Беляев Сергей Юрьевич; Alejandro Reyes
Other creators: Арефьева Людмила Анатольевна; Савчук Даниил Александрович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт прикладной математики и механики
Imprint: Санкт-Петербург, 2021
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Программирования языки; Вычислительные машины электронные — Программы; Информация — Обработка; альтернативный сплайсинг; статистическое тестирование; alternative splicing; statistical testing
UDC: 004.438; 004.422.8; 621.391
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 01.04.02
Speciality group (FGOS): 010000 - Математика и механика
Links: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2021/vr/vr21-4805
Rights: Доступ по паролю из сети Интернет (чтение)
Record key: ru\spstu\vkr\14008

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Альтернативный сплайсинг возникает в более чем 90% генах человека и влияет на развитие различных генетических заболеваний. Широко используемое РНК секвенирование короткими фрагментами не позволяет явно распознать события альтернативного сплайсинга, так как данные транскриптов полной длины недоступны. Это привело к развитию разнообразия программных методов для приближенного анализа альтернативного сплайсинга. Работа посвящена созданию пайплайна обработки данных на языке WDL для подсчета и статистического тестирования эффектов сплайсинга в группах биологических образцов. Пайплайн адаптирован к работе с геномами с неполной аннотацией и позволяет значительно упростить автоматическую параллельную обработку больших экспериментов инструментами с различными подходами. В работе исследуются особенности и точность включенных инструментов, общие характеристики производительности пайплайна. Работа демонстрирует универсальность решения и потенциальные перспективы для разработки лекарств на анализе 3х общедоступных экспериментов. Кроме того, описывается разработанное для визуализации результатов приложение Shiny app.

Alternative splicing occurs in more than 90% of human genes and reported to influence various diseases. Commonly used short-read RNA-sequencing does not allow explicitly identify splicing events because full-length transcript data is not available. To overcome that, different approaches of alternative splicing analysis were developed. We present a WDL language pipeline based on published tools to quantify and test for differences in splicing between bulk RNA-seq sample groups. The pipeline is constructed to work well with no well-annotated genomes and to facilitate unsupervised processing of huge experiments by tools of different approaches. We evaluate features and precision of these tools and overall performance of the pipeline, we demonstrate versatility and possible outcome for drug discovery process by analyzing 3 public experiments. Additionally, we describe a developed Shiny application that is designed to gather insights from the pipeline outcomes.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read
Internet Authorized users SPbPU Read
-> Internet Anonymous

Usage statistics

stat Access count: 5
Last 30 days: 0
Detailed usage statistics