Детальная информация

Название: Разработка алгоритма распознавания рекомбинантных сегментов в Т-клеточных рецепторах: выпускная квалификационная работа бакалавра: направление 02.03.01 «Математика и компьютерные науки» ; образовательная программа 02.03.01_01 «Системы искусственного интеллекта и суперкомпьютерные технологии»
Авторы: Башарина Екатерина Александровна
Научный руководитель: Востров Алексей Владимирович
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2023
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: формальные языки; поиск паттернов; Т-клеточные рецепторы; трансляция; formal languages; pattern search; T-cell receptors; translation
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 02.03.01
Группа специальностей ФГОС: 020000 - Компьютерные и информационные науки
DOI: 10.18720/SPBPU/3/2023/vr/vr23-3513
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\22896

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Анализ иммунного репертуара Т-клеточных рецепторов -- одна из важнейших задач современной иммуногеномики. Целью данной работы являлась разработка алгоритма поиска паттернов в нуклеотидных последовательностях участка CDR3. В работе рассмотрены существующие подходы к распознаванию сегментов рекомбинации, а также алгоритмов, использующихся при поиске регулярных структур в тексте. Посредством инструмента для анализа репертуара Т-клеточных рецепторов MiXCR и пакета Immunarch языка R произведена предварительная обработка результатов секвенирования для запуска разработанного алгоритма. Проведено исследование полученных результатов. Алгоритм разработан на языке программирования Python 3.9.2.

Analysis of the T-cell receptor immune repertoire is one of the most important tasks in modern immunogenomics. The aim of this work was to develop an algorithm for searching patterns in nucleotide sequences of the CDR3 region. Existing approaches to recognize the recombination segments and algorithms used in search of regular structures in text were considered. In order to run the developed algorithm, sequencing data was preprocessed using the MiXCR T-cell receptor repertoire analysis tool and the Immunarch package of the R language. The obtained results were analyzed. The algorithm was developed in the Python 3.9.2 programming language.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Оглавление

  • ВВЕДЕНИЕ
  • ГЛАВА 1. ОПИСАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ
    • Генетический код
    • Т-клеточные рецепторы
  • ГЛАВА 2. ОБЗОР МЕТОДОВ РЕШЕНИЯ ЗАДАЧИ
    • Инструменты для распознавания сегментов
      • MiXCR
      • TCRklass
      • IgBlast
      • Сравнение инструментов
    • Методы обнаружения паттернов в строках
      • Использование машинного обучения для поиска паттернов
  • ГЛАВА 3. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ
    • Первый этап трансляции: генерация шаблонов
    • Второй этап трансляции: поиск паттернов
    • Третий этап трансляции: генерация аминокислотных последовательностей
    • Метрики качества
  • ГЛАВА 4. РЕАЛИЗАЦИЯ АЛГОРИТМА ПОИСКА ПАТТЕРНОВ
    • Выбор программных средств
      • Инструменты для выделения участка CDR3
      • Язык программирования
      • Среда разработки
    • Подготовка данных
      • Предварительная обработка данных
    • Описание реализованного алгоритма
      • Этап 1: генерация шаблонов
      • Этап 2: поиск шаблонов
      • Этап 3: генерация аминокислотных последовательностей
    • Схема эксперимента
  • ГЛАВА 5. АНАЛИЗ РЕЗУЛЬТАТОВ ПОИСКА ПАТТЕРНОВ
    • Результаты работы алгоритма
    • Анализ результатов
    • Оценка эффективности алгоритма
    • Точность и полнота
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ЛИТЕРАТУРЫ

Статистика использования

stat Количество обращений: 2
За последние 30 дней: 0
Подробная статистика