Детальная информация

Лунев, Владимир Сергеевич. Проектирование, реализация, применение распределенных систем машинного обучения [Электронный ресурс]: бакалаврская работа: 09.03.04 / В. С. Лунев; Санкт-Петербургский политехнический университет Петра Великого, Институт компьютерных наук и технологий ; науч. рук. И.В. Никифоров. — Электрон. текстовые дан. (1 файл : 1,07 МБ). — Санкт-Петербург, 2017. — Загл. с титул. экрана. — Свободный доступ из сети Интернет (чтение, печать, копирование). — Adobe Acrobat Reader 7.0. — <URL:http://elib.spbstu.ru/dl/2/v17-3720.pdf>. — <URL:http://doi.org/10.18720/SPBPU/2/v17-3720>.

Дата создания записи: 27.09.2017

Тематика: распределенные системы; стемминг; программная реализация

Коллекции: Выпускные квалификационные работы; Общая коллекция

Ссылки: DOI

Разрешенные действия: Прочитать Загрузить (1,1 Мб) Для чтения документа необходим Flash Player

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Данная работа посвящена исследованию актуальности использования распределенных систем при использовании машинном обучении. В качестве примеров систем рассмотрены такие фреймворки как: Apache Spark, Apache Storm, Apache Hadoop MapReduce. Рассмотрены методы распределения вычислений этих систем, произведено сравнение и анализ систем. Рассмотрены некоторые методы машинного обучения такие как: наивный Байесовский классификатор, метод к-средних, дерево принятия решений, случайный лес. Представлено краткое описание работы методов, их особенности. Предложена методика приведения текста к вектору чисел, для дальнейшего анализа методами машинного обучения. Так же приведено краткое описание некоторых методов стемминга слов. Произведено сравнение некоторых систем анализа данных на уязвимости, сделано сравнение этих систем. На основе всех вышеперечисленных данных выдвинуты требования к реализации системы анализа данных на уязвимости (frauddetection). Для системы frauddetection описан детальный дизайн: общая схема взаимодействия модулей, подробно описана внутренняя работа модулей. Описана реализация прототипа системы с использованием Apache Camel, Apache Spark. Описана работа каждого класса системы. Для системы предложены сценарии использования. На тестовых данных успешно протестирована работа системы.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
-> Интернет Все Прочитать Печать Загрузить

Статистика использования документа

stat Количество обращений: 275
За последние 30 дней: 5
Подробная статистика