Детальная информация

Название: Реализация системы распределенного анализа потоковых данных для непрерывного производства: магистерская диссертация: 27.04.04
Авторы: Шереметова Евгения Ивановна
Научный руководитель: Потехин Вячеслав Витальевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2017
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Информационные системы с распределенными параметрами; непрерывное производство; выявление паттернов; потоковые данные; кластерные вычисления
УДК: 681.5.013:519.224(043.3)
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 27.04.04
Группа специальностей ФГОС: 270000 - Управление в технических системах
DOI: 10.18720/SPBPU/2/v17-2588
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: RU\SPSTU\edoc\43641

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Данная работа посвящена разработке подхода к выявлению паттернов в последовательностях категориальных данных для непрерывного производства. Исследование последних тенденций развития производственной сферы подтверждает необходимость разработки подходов, применимых для анализа значительных объемов данных в потоке. Представленный в работе подход включает в себя методы распределенной обработки, которые дают возможность проводить анализ данных в потоке для обеспечения адекватного времени отклика.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Оглавление

  • ВВЕДЕНИЕ
  • ГЛАВА 1 ПОСТАНОВКА ЗАДАЧИ
    • 1.1 Цели и задачи исследования
    • 1.2 Исходные данные
    • 1.3 Выводы по главе 1
  • ГЛАВА 2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ РАССМАТРИВАЕМЫХ СИСТЕМ И ПОДХОДОВ
    • 2.1 Требования, предъявляемые к системам анализа потоковых данных
    • 2.2 Существующие подходы к анализу потоковых данных
      • 2.2.1 Закон Амдала
      • 2.2.2 Результаты исследования масштабируемости методов анализа данных в последовательностях
    • 2.3 Алгоритм анализа категориальных последовательностей PrefixSpan
    • 2.4 Модель параллельных вычислений MapReduce
    • 2.5 Выводы по главе 2
  • ГЛАВА 3 РЕАЛИЗАЦИЯ СИСТЕМЫ С ИСПОЛЬЗОВАНИЕМ СТЕКА ПРОМЫШЛЕННЫХ ТЕХНОЛОГИЙ
    • 3.1 Сравнение технологий для реализации компонентов системы
      • 3.1.1 Настройка кластеров. Облачные вычисления в Amazon EMR
      • 3.1.2 Распределенные вычисления на кластерах. Технология Apache Spark
    • 3.3 Выводы по главе 3
  • ГЛАВА 4 АРХИТЕКТУРА СИСТЕМЫ РАСПРЕДЕЛЕННОГО АНАЛИЗА ПОТОКОВЫХ ДАННЫХ
    • 4.1 Реализация потоковой обработки данных на распределенной платформе Apache Spark
    • 4.2 Описание архитектуры разработанной системы
    • 4.3 Оценка производительности работы системы
    • 4.4 Выводы по главе 4
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСТОЧНИКОВ
  • ПРИЛОЖЕНИЕ 1 ЛИСТИНГ ПРОГРАММЫ РАСПРЕДЕЛЕННОГО АНАЛИЗА

Статистика использования

stat Количество обращений: 515
За последние 30 дней: 0
Подробная статистика