Реализация системы распределенного анализа потоковых данных для непрерывного производства: магистерская диссертация: 27.04.04

Шереметова, Евгения Ивановна

Детальная информация

Название	Реализация системы распределенного анализа потоковых данных для непрерывного производства: магистерская диссертация: 27.04.04
Авторы	Шереметова Евгения Ивановна
Научный руководитель	Потехин Вячеслав Витальевич
Организация	Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения	Санкт-Петербург, 2017
Коллекция	Выпускные квалификационные работы ; Общая коллекция
Тематика	Информационные системы с распределенными параметрами ; непрерывное производство ; выявление паттернов ; потоковые данные ; кластерные вычисления
УДК	681.5.013:519.224(043.3)
Тип документа	Выпускная квалификационная работа магистра
Язык	Русский
Уровень высшего образования	Магистратура
Код специальности ФГОС	27.04.04
Группа специальностей ФГОС	270000 - Управление в технических системах
DOI	10.18720/SPBPU/2/v17-2588
Права доступа	Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи	RU\SPSTU\edoc\43641
Дата создания записи	06.10.2017

Разрешенные действия

–

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа	Анонимные пользователи
Сеть	Интернет

Данная работа посвящена разработке подхода к выявлению паттернов в последовательностях категориальных данных для непрерывного производства. Исследование последних тенденций развития производственной сферы подтверждает необходимость разработки подходов, применимых для анализа значительных объемов данных в потоке. Представленный в работе подход включает в себя методы распределенной обработки, которые дают возможность проводить анализ данных в потоке для обеспечения адекватного времени отклика.

Место доступа	Группа пользователей	Действие
Локальная сеть ИБК СПбПУ	Все
Интернет	Авторизованные пользователи СПбПУ
Интернет	Анонимные пользователи

ВВЕДЕНИЕ
ГЛАВА 1 ПОСТАНОВКА ЗАДАЧИ
- 1.1 Цели и задачи исследования
- 1.2 Исходные данные
- 1.3 Выводы по главе 1
ГЛАВА 2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ РАССМАТРИВАЕМЫХ СИСТЕМ И ПОДХОДОВ
- 2.1 Требования, предъявляемые к системам анализа потоковых данных
- 2.2 Существующие подходы к анализу потоковых данных
  - 2.2.1 Закон Амдала
  - 2.2.2 Результаты исследования масштабируемости методов анализа данных в последовательностях
- 2.3 Алгоритм анализа категориальных последовательностей PrefixSpan
- 2.4 Модель параллельных вычислений MapReduce
- 2.5 Выводы по главе 2
ГЛАВА 3 РЕАЛИЗАЦИЯ СИСТЕМЫ С ИСПОЛЬЗОВАНИЕМ СТЕКА ПРОМЫШЛЕННЫХ ТЕХНОЛОГИЙ
- 3.1 Сравнение технологий для реализации компонентов системы
  - 3.1.1 Настройка кластеров. Облачные вычисления в Amazon EMR
  - 3.1.2 Распределенные вычисления на кластерах. Технология Apache Spark
- 3.3 Выводы по главе 3
ГЛАВА 4 АРХИТЕКТУРА СИСТЕМЫ РАСПРЕДЕЛЕННОГО АНАЛИЗА ПОТОКОВЫХ ДАННЫХ
- 4.1 Реализация потоковой обработки данных на распределенной платформе Apache Spark
- 4.2 Описание архитектуры разработанной системы
- 4.3 Оценка производительности работы системы
- 4.4 Выводы по главе 4
ЗАКЛЮЧЕНИЕ
СПИСОК ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ 1 ЛИСТИНГ ПРОГРАММЫ РАСПРЕДЕЛЕННОГО АНАЛИЗА

...