Детальная информация

Название: Прототип сервиса по извлечению данных из графовой базы данных и их обогащению: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии»
Авторы: Филимонова Александра Петровна
Научный руководитель: Нестеров Сергей Александрович
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения: Санкт-Петербург, 2024
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Janusgraph; графовые базы данных; сервис по извлечению данных; NoSQL; СУБД; graph database; data extraction service; DBMS
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 09.03.02
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2024/vr/vr24-2628
Права доступа: Доступ по паролю из сети Интернет (чтение)
Дополнительно: Новинка
Ключ записи: ru\spstu\vkr\30310

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Цель выпускной квалификационной работы – разработать прототип сервиса по извлечению данных из графовой базы данных и их обогащению. В ходе работы был разработан прототип сервиса, отправляющий запросы к графовой базе данных и обогащающий полученные данные из внешнего сервиса. В ходе работы были решены следующие задачи: 1) Проанализировать предметную область и выполнить постановку задачи. 2) Проанализировать производительность и составить сравнительную таблицу характеристик графовых СУБД. 3) Проанализировать возможности выбранной СУБД. 4) Создать прототип сервиса. 5) Разработать методы сервиса. Первая глава посвящена обзору графовых систем управления базами данных (СУБД) и их сравнительному анализу с упором на функциональные возможности, архитектурные особенности и производительность. В рамках главы рассматриваются три основные графовые СУБД: Neo4j, ArangoDB и JanusGraph, с подробным изучением их характеристик и применимости для миграции реляционных баз данных. Во второй главе рассматриваются возможности графовой СУБД JanusGraph, рассмотрены основные концепции языка запросов Gremlin, включая операции навигации, фильтрации, манипуляции данными и агрегации, а также примеры их использования. В третьей главе разрабатывается архитектура сервиса, предназначенного для работы с графовой базой данных. Описывается структура данных, методы извлечения и обогащения информации. В четвертой главе описывается процесс создания прототипа сервиса на базе выбранных технологий. Представлены этапы выбора инструментов, проектирования интерфейсов, создания основных модулей, включая контроллеры и сервисы, а также проведена проверка эффективности сервиса, путем сравнения времени выполнения запросов к реляционной и графовой базам данных.

The purpose of the final qualification work is to develop a prototype of a service for extracting data from a graph database and enriching it. During the work, a prototype of the service was developed that sends requests to a graph database and enriches the data received from an external service. In the course of the work, the following tasks were solved: 1) Analyze the subject area and complete the task statement. 2) Analyze the performance and compile a comparative table of graph DBMS characteristics. 3) Analyze the capabilities of the selected DBMS. 4) Create a prototype of the service. 5) Develop service methods. The first chapter is devoted to an overview of graph database management systems (DBMS) and their comparative analysis, focusing on functionality, architectural features and performance. The chapter examines three main graph databases: Neo4j, ArangoDB and JanusGraph, with a detailed study of their characteristics and applicability for relational database migration. The second chapter examines the capabilities of the JanusGraph graph database, discusses the basic concepts of the Gremlin query language, including navigation, filtering, data manipulation and aggregation operations, as well as examples of their use. The third chapter develops the architecture of a service designed to work with a graph database. The data structure, methods of information extraction and enrichment are described. The fourth chapter describes the process of creating a prototype service based on selected technologies. The stages of selecting tools, designing interfaces, creating basic modules, including controllers and services, are presented, and the effectiveness of the service is checked by comparing the execution time of queries to relational and graph databases.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать
Интернет Авторизованные пользователи СПбПУ Прочитать
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 0
За последние 30 дней: 0
Подробная статистика