Details

Title: Разработка алгоритма распознавания рекомбинантных сегментов в Т-клеточных рецепторах: выпускная квалификационная работа бакалавра: направление 02.03.01 «Математика и компьютерные науки» ; образовательная программа 02.03.01_01 «Системы искусственного интеллекта и суперкомпьютерные технологии»
Creators: Башарина Екатерина Александровна
Scientific adviser: Востров Алексей Владимирович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2023
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: формальные языки; поиск паттернов; Т-клеточные рецепторы; трансляция; formal languages; pattern search; T-cell receptors; translation
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 02.03.01
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
DOI: 10.18720/SPBPU/3/2023/vr/vr23-3513
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\22896

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Анализ иммунного репертуара Т-клеточных рецепторов -- одна из важнейших задач современной иммуногеномики. Целью данной работы являлась разработка алгоритма поиска паттернов в нуклеотидных последовательностях участка CDR3. В работе рассмотрены существующие подходы к распознаванию сегментов рекомбинации, а также алгоритмов, использующихся при поиске регулярных структур в тексте. Посредством инструмента для анализа репертуара Т-клеточных рецепторов MiXCR и пакета Immunarch языка R произведена предварительная обработка результатов секвенирования для запуска разработанного алгоритма. Проведено исследование полученных результатов. Алгоритм разработан на языке программирования Python 3.9.2.

Analysis of the T-cell receptor immune repertoire is one of the most important tasks in modern immunogenomics. The aim of this work was to develop an algorithm for searching patterns in nucleotide sequences of the CDR3 region. Existing approaches to recognize the recombination segments and algorithms used in search of regular structures in text were considered. In order to run the developed algorithm, sequencing data was preprocessed using the MiXCR T-cell receptor repertoire analysis tool and the Immunarch package of the R language. The obtained results were analyzed. The algorithm was developed in the Python 3.9.2 programming language.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Table of Contents

  • ВВЕДЕНИЕ
  • ГЛАВА 1. ОПИСАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ
    • Генетический код
    • Т-клеточные рецепторы
  • ГЛАВА 2. ОБЗОР МЕТОДОВ РЕШЕНИЯ ЗАДАЧИ
    • Инструменты для распознавания сегментов
      • MiXCR
      • TCRklass
      • IgBlast
      • Сравнение инструментов
    • Методы обнаружения паттернов в строках
      • Использование машинного обучения для поиска паттернов
  • ГЛАВА 3. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ
    • Первый этап трансляции: генерация шаблонов
    • Второй этап трансляции: поиск паттернов
    • Третий этап трансляции: генерация аминокислотных последовательностей
    • Метрики качества
  • ГЛАВА 4. РЕАЛИЗАЦИЯ АЛГОРИТМА ПОИСКА ПАТТЕРНОВ
    • Выбор программных средств
      • Инструменты для выделения участка CDR3
      • Язык программирования
      • Среда разработки
    • Подготовка данных
      • Предварительная обработка данных
    • Описание реализованного алгоритма
      • Этап 1: генерация шаблонов
      • Этап 2: поиск шаблонов
      • Этап 3: генерация аминокислотных последовательностей
    • Схема эксперимента
  • ГЛАВА 5. АНАЛИЗ РЕЗУЛЬТАТОВ ПОИСКА ПАТТЕРНОВ
    • Результаты работы алгоритма
    • Анализ результатов
    • Оценка эффективности алгоритма
    • Точность и полнота
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ЛИТЕРАТУРЫ

Usage statistics

stat Access count: 2
Last 30 days: 0
Detailed usage statistics