Детальная информация

Название Поиск больших структурных вариантов по данным Hi-C и оптического картирования генома: выпускная квалификационная работа магистра: направление 01.04.02 «Прикладная математика и информатика» ; образовательная программа 01.04.02_01 «Прикладная математика и биоинформатика»
Авторы Зуев Валерий Александрович
Научный руководитель Козлов Константин Николаевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Физико-механический институт
Выходные сведения Санкт-Петербург, 2024
Коллекция Выпускные квалификационные работы; Общая коллекция
Тематика структурные варианты; контакты хроматина; оптические карты генома; structural variants; chromatin contacts; optical genome maps
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 01.04.02
Группа специальностей ФГОС 010000 - Математика и механика
DOI 10.18720/SPBPU/3/2024/vr/vr24-5537
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\31356
Дата создания записи 06.08.2024

Разрешенные действия

Действие 'Загрузить' будет возможно после подготовки администраторами необходимых файлов

Группа Анонимные пользователи
Сеть Интернет

В работе описываются способы поиска структурных вариантов в гено- ме. Разработана модификация существующего метода поиска структурных вариантов по картам частот попарных контактов между участками хроматина, полученных с помощью технологии Hi-C. Предложенная модификация существующего алгоритма использует, помимо карт Hi-C, данные о наличии модификаций гистонов вдоль генома (профили ChIP-Seq): найденные по картам контактов возможные структурные варианты дополнительно проходят фильтрацию, которая опирается на признаки, полученные из данных ChIP-Seq. На примере клеточной линии U2OS было показано, что этот метод обладает повышенной специфичностью по сравнению с базовым алгоритмом, то есть лучше отличает истинные структурные варианты от прочих аномалий на картах контактов. Также представлен метод обнаружения структурных вариантов с помощью оптического картирования генома. Центральный элемент метода – модель машинного обучения для поиска соответствия изображения молекулы ДНК с флюоресцентными метками, полученного оптическим сканером, и референсной последовательности. В работе была использована модификация модели машинного обучения, основанной на двух нейросетях-энкодерах, проецирующих фрагменты референсной последовательности и изображения молекул в общее скрытое пространство. Модификация позволила улучшить точность выравнивания и, как следствие, повысить качество поиска структурных вариантов клеточной линии U2OS.

The paper describes methods for searching for structural variants in the genome. A modification of the existing method for searching for structural variants using frequency maps of pairwise contacts between chromatin regions obtained using Hi-C technology has been developed. The proposed modification of the existing algorithm uses, in addition to Hi-C maps, data on the presence of histone modifications along the genome (ChIP-Seq profiles): possible structural variants found from contact maps are additionally filtered, which is based on features obtained from ChIP-Seq data. Using the U2OS cell line as an example, it was shown that this method has increased specificity compared to the basic algorithm, that is, it better distinguishes true structural variants from other anomalies in contact maps. A method for detecting structural variants using optical genome mapping is also presented. The central element of the method is a machine learning model for searching for a match between an image of a DNA molecule with fluorescent tags obtained by an optical scanner and a reference sequence. The work used a modification of a machine learning model based on two encoder neural networks that project fragments of the reference sequence and images of molecules into a common latent space. The modification made it possible to improve the accuracy of the alignment and, as a result, improve the quality of the search for structural variants of the U2OS cell line.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Интернет Авторизованные пользователи СПбПУ
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика