Детальная информация

Название: Создание распределенной системы сбора, обработки и анализа геопространственных данных с использованием технологий интеграции данных: выпускная квалификационная работа магистра: направление 09.04.03 «Прикладная информатика» ; образовательная программа 09.04.03_04 «Интеллектуальные технологии управления знаниями и данными»
Авторы: Курашкина Мария Анатольевна
Научный руководитель: Хахина Анна Михайловна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения: Санкт-Петербург, 2024
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: технологии интеграции данных; геопространственные данные; Apache NiFi; обработка данных; data integration technologies; geospatial data; data processing
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 09.04.03
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2024/vr/vr24-2086
Права доступа: Доступ по паролю из сети Интернет (чтение)
Дополнительно: Новинка
Ключ записи: ru\spstu\vkr\29075

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Объектом исследования является область интеграции данных. Предмет исследования - распределенная система сбора, обработки и анализа геопространственных данных. Целью данной работы является создание распределенной системы, способной эффективно собирать, обрабатывать и анализировать геопространственные данные с использованием передовых технологий интеграции данных. Задачи, которые решались в ходе выполнения работы: – Установить требования к создаваемой системе и выполнить обзор предметной области. – Выбрать инструмент интеграции данных для реализации системы. – Реализовать распределенную систему сбора, обработки и анализа геопространсвтенных данных с использованием выбранного инструмента. – Провести тестирование и апробацию реализованной системы. Использовались методы сравнительного анализа различных инструментов интеграции данных, а так же полевого исследования разработанной системы. Были изучены предметная область геопространственных данных, понятия интеграции и ETL, а так же концепция инструмента интеграции Apache NiFi. Областью применения результатов работы является автоматизация процесса сбора, обработки анализа данных. Результатом работы является качественно реализованная система, которая была протестирована и внедрена в ААНИИ. Внедрение показало практическую значимость работы: система продемонстрировала высокую эффективность в ускорении процесса сбора и обработки данных, существенно сократила время обработки данных благодаря автоматизации рутинных операций.

The object of the study is the field of data integration. The subject of the study is a distributed system for collecting, processing and analyzing geospatial data. The purpose of this work is to create a distributed system capable of efficiently collecting, processing and analyzing geospatial data using advanced data integration technologies. Tasks that were solved during the course of the work: – Set the requirements for the system being created and perform a review of the subject area. – Select the data integration tool to implement the system. – Implement a distributed system for collecting, processing and analyzing geospatial data using the selected tool. – Conduct testing and approbation of the implemented system. – Methods of comparative analysis of various data integration tools, as well as field research of the developed system were used. The subject area of geospatial data, the concepts of integration and ETL, as well as the concept of the Apache NiFi integration tool were studied. The scope of application of the results of the work is the automation of the process of data collection, processing and analysis. The result of the work is a qualitatively implemented system that has been tested and implemented in AARI. The implementation showed the practical significance of the work: the system demonstrated high efficiency in accelerating the process of data collection and processing, significantly reduced data processing time due to automation of routine operations.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать
Интернет Авторизованные пользователи СПбПУ Прочитать
-> Интернет Анонимные пользователи

Оглавление

  • Создание распределенной системы сбора, обработки и анализа геопространственных данных с использованием технологий интеграции данных
    • Введение
    • 1. Исследование предметной области
    • 2. Технологии интеграции данных
    • 3. Проектирование и реализация системы
    • 4. Тестирование реализованной системы
    • 5. Апробация
    • Заключение
    • Список сокращений и условных обозначений
    • Словарь терминов
    • Список использованных источников
    • Приложение 1. Настройки процессоров NiFi
    • Приложение 2. python-скрипты, запускаемые в NiFi
    • Приложение 3. Тестирование отдельных функциональных блоков
    • Приложение 4. python-скрипт для поиска региона
    • Приложение 5. Результаты работы команд библиотеки GDAL
    • Приложение 6. Акт о внедрении

Статистика использования

stat Количество обращений: 1
За последние 30 дней: 1
Подробная статистика