Details

Title Разработка и оптимизация алгоритмов работы с большими данными с использованием кластера Hadoop и фреймворка Java Spark: выпускная квалификационная работа бакалавра: направление 09.03.04 «Программная инженерия» ; образовательная программа 09.03.04_03 «Разработка программного обеспечения»
Creators Никитин Андрей Юрьевич
Scientific adviser Маслаков Алексей Павлович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2024
Collection Выпускные квалификационные работы; Общая коллекция
Subjects PL/SQL; Apache Hadoop; Apache Spark; Java; большие данные; распределенные базы данных; оптимизация работы с большими данными; миграция; big data; distributed databases; optimization of working with big data; migration
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 09.03.04
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2024/vr/vr24-3510
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\30489
Record create date 7/11/2024

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Данная работа посвящена разработке методов переноса алгоритмов, написанных на процедурном языке PL/SQL на фреймворк для Java Apache Spark, а также оптимизация данных алгоритмов для работы с большими данными. Задачи, которые решались в ходе выполнения работы: 1. Проведение обзора средств разработки 2. Анализ исходных алгоритмов, и разработка методики переноса исходных алгоритмов на Apache Spark 3. Разработка методов оптимизации работы с большими данными 4. Анализ методов оптимизации с различным объёмом данных 5. Демонстрация результатов работы программ без использования разработанных методов оптимизаций и результатов работы программы с использованием данных методов. В результате выполнения работы было разработано и оптимизированно программное обеспечение для ПАО «Сбербанк», полностью повторяющее функциональность написанных алгоритмов на PL/SQL, но работающее быстрее.

This work is devoted to the development of methods for transferring algorithms written in the procedural language PL/SQL to the Java framework Apache Spark, as well as optimizing these algorithms for working with big data. Tasks that were solved during the work: 1. Review of development tools 2. Analysis of source algorithms, and development of a methodology for migrating source algorithms to Apache Spark 3. Development of methods for optimizing work with big data 4. Analysis of optimization methods with different amounts of data 5. Demonstration of the results of the programs without using the developed optimization methods and the results of the program using these methods. As a result of the work, software was developed and optimized for Sberbank PJSC, completely migrating the functionality of the algorithms written in PL/SQL to Apache Spark with enhanced time performance.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics