Details

Title: Создание инструмента оценки качества геномного материала на платформе для работы с Big Data: магистерская диссертация: 09.04.01
Creators: Янушевский Александр Андреевич
Scientific adviser: Дробинцев Павел Дмитриевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2016
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Вычислительные машины электронные — Применение в биологии и медицине; биоинформатика; геномика; оценка качества; bioinformatics; genomics; quality control
UDC: 004.9:57(043.3)
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 09.04.01
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/2/v16-2303
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: RU\SPSTU\edoc\35132

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Диссертация состоит из 5 разделов и посвящена разработке инструмента оценки качества геномного материала на платформе для работы с Big Data. В работе дано общее описание процесса секвенирования геномных данных. Проведен обзор существующих инструментов оценки качества секвенированных данных и обзор платформ для работы с Big Data. Поставлена задача реализации алгоритмов инструмента оценки качества FastQC на платформе Apache Spark для работы с Big Data. Для решения поставленной задачи описана архитектура приложения. По архитектуре реализовано приложение, выполняющее поставленную задачу. Приведены результаты замеров производительности разработанного приложения.

The dissertation consists of five sections and dedicated to creating a tool for genomic material quality control on the platform for work with Big Data. This paper gives a general description of sequencing process of genome material. Perform review of existing tools for genome material quality control and review of platforms for work with Big Data. Posed task of realization algorithms from quality control tool FastQC on platform Apache Spark for work with Big Data. For solving problem described architecture of program. Based on described architecture created application for solve problem. Report the results of the performance measurements of the developed application.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Usage statistics

stat Access count: 839
Last 30 days: 0
Detailed usage statistics