Детальная информация
| Название | Реализация системы распределенного анализа потоковых данных для непрерывного производства: магистерская диссертация: 27.04.04 |
|---|---|
| Авторы | Шереметова Евгения Ивановна |
| Научный руководитель | Потехин Вячеслав Витальевич |
| Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий |
| Выходные сведения | Санкт-Петербург, 2017 |
| Коллекция | Выпускные квалификационные работы ; Общая коллекция |
| Тематика | Информационные системы с распределенными параметрами ; непрерывное производство ; выявление паттернов ; потоковые данные ; кластерные вычисления |
| УДК | 681.5.013:519.224(043.3) |
| Тип документа | Выпускная квалификационная работа магистра |
| Язык | Русский |
| Уровень высшего образования | Магистратура |
| Код специальности ФГОС | 27.04.04 |
| Группа специальностей ФГОС | 270000 - Управление в технических системах |
| DOI | 10.18720/SPBPU/2/v17-2588 |
| Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Ключ записи | RU\SPSTU\edoc\43641 |
| Дата создания записи | 06.10.2017 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
| Группа | Анонимные пользователи |
|---|---|
| Сеть | Интернет |
Данная работа посвящена разработке подхода к выявлению паттернов в последовательностях категориальных данных для непрерывного производства. Исследование последних тенденций развития производственной сферы подтверждает необходимость разработки подходов, применимых для анализа значительных объемов данных в потоке. Представленный в работе подход включает в себя методы распределенной обработки, которые дают возможность проводить анализ данных в потоке для обеспечения адекватного времени отклика.
| Место доступа | Группа пользователей | Действие |
|---|---|---|
| Локальная сеть ИБК СПбПУ | Все |
|
| Интернет | Авторизованные пользователи СПбПУ |
|
| Интернет | Анонимные пользователи |
|
- ВВЕДЕНИЕ
- ГЛАВА 1 ПОСТАНОВКА ЗАДАЧИ
- 1.1 Цели и задачи исследования
- 1.2 Исходные данные
- 1.3 Выводы по главе 1
- ГЛАВА 2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ РАССМАТРИВАЕМЫХ СИСТЕМ И ПОДХОДОВ
- 2.1 Требования, предъявляемые к системам анализа потоковых данных
- 2.2 Существующие подходы к анализу потоковых данных
- 2.2.1 Закон Амдала
- 2.2.2 Результаты исследования масштабируемости методов анализа данных в последовательностях
- 2.3 Алгоритм анализа категориальных последовательностей PrefixSpan
- 2.4 Модель параллельных вычислений MapReduce
- 2.5 Выводы по главе 2
- ГЛАВА 3 РЕАЛИЗАЦИЯ СИСТЕМЫ С ИСПОЛЬЗОВАНИЕМ СТЕКА ПРОМЫШЛЕННЫХ ТЕХНОЛОГИЙ
- 3.1 Сравнение технологий для реализации компонентов системы
- 3.1.1 Настройка кластеров. Облачные вычисления в Amazon EMR
- 3.1.2 Распределенные вычисления на кластерах. Технология Apache Spark
- 3.3 Выводы по главе 3
- 3.1 Сравнение технологий для реализации компонентов системы
- ГЛАВА 4 АРХИТЕКТУРА СИСТЕМЫ РАСПРЕДЕЛЕННОГО АНАЛИЗА ПОТОКОВЫХ ДАННЫХ
- 4.1 Реализация потоковой обработки данных на распределенной платформе Apache Spark
- 4.2 Описание архитектуры разработанной системы
- 4.3 Оценка производительности работы системы
- 4.4 Выводы по главе 4
- ЗАКЛЮЧЕНИЕ
- СПИСОК ИСТОЧНИКОВ
- ПРИЛОЖЕНИЕ 1 ЛИСТИНГ ПРОГРАММЫ РАСПРЕДЕЛЕННОГО АНАЛИЗА
Количество обращений: 519
За последние 30 дней: 1