Детальная информация

Название Реализация программной системы анализа данных на основе ELK-стека: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных»
Авторы Пантюхин Андрей Максимович
Научный руководитель Молодяков Сергей Александрович
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2024
Коллекция Выпускные квалификационные работы; Общая коллекция
Тематика анализ данных; стек; BI система; data analysis; stack; BI system
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 09.04.04
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2024/vr/vr24-3969
Права доступа Доступ по паролю из сети Интернет (чтение)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\33188
Дата создания записи 29.08.2024

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Представленная работа посвящена разработке и внедрению программной системы для анализа данных о продаже товаров с использованием ELK-стека (Elasticsearch, Logstash, Kibana). В рамках работы решались следующие задачи: 1. Создание и настройка компонентов системы: 1. Реализация загрузки конфигурации и чтения переменных окружения. 2. Настройка Kafka для создания и управления топиками. 3. Создание фильтров для обработки данных в Logstash. 4. Обработка различных сценариев, включая негативные, для корректной работы системы. 2. Реализация модуля предобработки данных: 1. Распознавание и заполнение недостающих данных из описаний объявлений. 2. Обработка случаев с отсутствующими или некорректными параметрами. 3. Обработка пустых и невалидных записей. 3. Разработка модуля анализа данных: 1. Обработка корректных запросов на анализ и взаимодействие с Elasticsearch и Spark. 2. Управление ошибочными запросами и отправка соответствующих кодов ошибок. 3. Загрузка обработанных данных обратно в Elasticsearch для дальнейшего использования. Таким образом, была создана и внедрена работоспособная BI-система, предоставляющая мощные инструменты для сбора, предобработки, анализа и визуализации данных о продаже товаров. Система позволяет организациям более эффективно анализировать рыночные данные, выявлять тенденции и принимать обоснованные управленческие решения, что является важным условием для успешного функционирования и развития в условиях современной цифровой экономики.

This work is dedicated to the development and implementation of a software system for analyzing sales data using the ELK stack (Elasticsearch, Logstash, Kibana). The following tasks were addressed within the scope of this work: 1. Creation and configuration of system components: 1. Implementation of configuration loading and reading of environment variables. 2. Setup of Kafka for creating and managing topics. 3. Creation of filters for data processing in Logstash. 4. Handling various scenarios, including negative ones, for the correct operation of the system. 2. Implementation of the data preprocessing module: 1. Recognition and filling of missing data from advertisement descriptions. 2. Handling cases with missing or incorrect parameters. 3. Processing of empty and invalid records. 3. Development of the data analysis module: 1. Processing of correct analysis requests and interaction with Elasticsearch and Spark. 2. Handling erroneous requests and sending appropriate error codes. 3. Uploading processed data back to Elasticsearch for further use. Thus, a functional BI system was created and implemented, providing powerful tools for collecting, preprocessing, analyzing, and visualizing sales data. The system enables organizations to more effectively analyze market data, identify trends, and make informed managerial decisions, which is a crucial condition for successful operation and development in the modern digital economy.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика