Details

Title Разработка методов идентификации регионов нестабильности сигнала покрытия методами распознавания разладок: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_01 «Прикладная математика и биоинформатика»
Creators Шарко Полина Алексеевна
Scientific adviser Малов Сергей Васильевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects методы идентификации разладок ; CUSUM ; структурные варианты генома ; глубина прочтения генома ; disruption identification methods ; structural variants ; of the genome ; genome coverage depth
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 01.04.02
Speciality group (FGOS) 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2025/vr/vr25-3979
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\37800
Record create date 9/23/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Целью данной работы является разработка алгоритма идентификации регионов нестабильности сигнала покрытия генома методами распознавания разладок. Задачи, решенные в ходе работы: 1) Изучение покрытия стабильных регионов генома и моделирование покрытия; 2) Разработка и реализация методов обнаружения нарушений сигнала покрытия; 3) Классификация регионов нестабильности. В ходе работы при изучении покрытия стабильных регионов генома и моделировании покрытия на основании подготовленных модельных данных с использованием непараметрических методов было оценено распределение покрытия генома человека. Были изучены известные консервативные регионы генома, проведено сравнение распределений покрытия в консервативных регионах и по всему геному. Проведен подбор параметрической модели базового покрытия с использованием классических семейств распределений на базе модельных данных покрытий генома различной глубины. Изучено изменение распределения базового покрытия внутри хромосом и между хромосомами. С применением результатов анализа покрытия стабильных регионов генома разработан и реализован алгоритм обнаружения нарушений сигнала покрытия. Реализован алгоритм М-оценивания. Разработанный алгоритм применен для классификации регионов нестабильности. Было проведено теоретическое исследование с целью получения моделей процесса покрытия при наличии перестроек того или иного вида, обнаружение и классификация регионов нестабильности другими методами. Создан классификатор регионов нестабильности на базе процесса покрытия генома. Проведено сравнение свойств разработанного алгоритма с другими алгоритмами поиска перестроек генома. Представленные результаты могут быть применены при идентификации регионов нестабильности сигнала покрытия методами распознавания разладок, позволяя прогнозировать позиции генетических перестроек и их типов. Предложенный алгоритм при использовании с другими инструментами для обнаружения регионов нестабильности позволит повысить эффективность проведения исследований генотипа человека. Разработанные инструменты могут быть адаптированы для использования при изучении генотипов иных организмов.

The aim of this work is to develop an algorithm for identifying regions of genome coverage signal instability using change-point detection methods. Objectives completed in the course of the work: 1) Study of coverage in stable genome regions and modeling of genome coverage; 2) Development and implementation of methods for detecting genome coverage signal disruptions; 3) Classification of signal instability regions. During the study, stable genome regions were analyzed and genome coverage was modeled based on prepared simulated data using non-parametric methods to estimate the human genome coverage distribution. Well-known conserved regions of the genome were examined, and coverage distributions in conserved regions were compared with those across the whole genome. A parametric model of baseline coverage was selected using classical distribution families based on simulated coverage data at various depths. Variations in baseline coverage distribution within and between chromosomes were also analyzed. Based on the analysis of stable genome region coverage, an algorithm for detecting coverage signal disruptions was developed and implemented. A sequential M-estimation algorithm was realized. The developed algorithm was used to classify instability regions. A theoretical study was conducted to create models of genome coverage processes in the presence of various types of structural rearrangements, as well as for detection and classification of instability regions using other methods. A classifier of instability regions was created based on the genome coverage process. The properties of the developed algorithm were compared with those of other genome rearrangement detection algorithms. The presented results can be applied to identify regions of genome coverage signal instability using change-point detection methods, allowing for the prediction of the positions and types of genetic rearrangements. When used alongside other tools for instability region detection, the proposed algorithm can improve the effectiveness of human genotype research. The developed tools can also be adapted for use in the study of other organisms genotypes.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics