Детальная информация

Название Реализация системы распределенного анализа потоковых данных для непрерывного производства: магистерская диссертация: 27.04.04
Авторы Шереметова Евгения Ивановна
Научный руководитель Потехин Вячеслав Витальевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения Санкт-Петербург, 2017
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика Информационные системы с распределенными параметрами ; непрерывное производство ; выявление паттернов ; потоковые данные ; кластерные вычисления
УДК 681.5.013:519.224(043.3)
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 27.04.04
Группа специальностей ФГОС 270000 - Управление в технических системах
DOI 10.18720/SPBPU/2/v17-2588
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи RU\SPSTU\edoc\43641
Дата создания записи 06.10.2017

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Данная работа посвящена разработке подхода к выявлению паттернов в последовательностях категориальных данных для непрерывного производства. Исследование последних тенденций развития производственной сферы подтверждает необходимость разработки подходов, применимых для анализа значительных объемов данных в потоке. Представленный в работе подход включает в себя методы распределенной обработки, которые дают возможность проводить анализ данных в потоке для обеспечения адекватного времени отклика.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать Загрузить
Интернет Анонимные пользователи
  • ВВЕДЕНИЕ
  • ГЛАВА 1 ПОСТАНОВКА ЗАДАЧИ
    • 1.1 Цели и задачи исследования
    • 1.2 Исходные данные
    • 1.3 Выводы по главе 1
  • ГЛАВА 2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ РАССМАТРИВАЕМЫХ СИСТЕМ И ПОДХОДОВ
    • 2.1 Требования, предъявляемые к системам анализа потоковых данных
    • 2.2 Существующие подходы к анализу потоковых данных
      • 2.2.1 Закон Амдала
      • 2.2.2 Результаты исследования масштабируемости методов анализа данных в последовательностях
    • 2.3 Алгоритм анализа категориальных последовательностей PrefixSpan
    • 2.4 Модель параллельных вычислений MapReduce
    • 2.5 Выводы по главе 2
  • ГЛАВА 3 РЕАЛИЗАЦИЯ СИСТЕМЫ С ИСПОЛЬЗОВАНИЕМ СТЕКА ПРОМЫШЛЕННЫХ ТЕХНОЛОГИЙ
    • 3.1 Сравнение технологий для реализации компонентов системы
      • 3.1.1 Настройка кластеров. Облачные вычисления в Amazon EMR
      • 3.1.2 Распределенные вычисления на кластерах. Технология Apache Spark
    • 3.3 Выводы по главе 3
  • ГЛАВА 4 АРХИТЕКТУРА СИСТЕМЫ РАСПРЕДЕЛЕННОГО АНАЛИЗА ПОТОКОВЫХ ДАННЫХ
    • 4.1 Реализация потоковой обработки данных на распределенной платформе Apache Spark
    • 4.2 Описание архитектуры разработанной системы
    • 4.3 Оценка производительности работы системы
    • 4.4 Выводы по главе 4
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСТОЧНИКОВ
  • ПРИЛОЖЕНИЕ 1 ЛИСТИНГ ПРОГРАММЫ РАСПРЕДЕЛЕННОГО АНАЛИЗА

Количество обращений: 516 
За последние 30 дней: 0

Подробная статистика