Детальная информация

Название: Разработка и автоматизация модели машинного обучения для предсказания выживаемости клиентов коммерческого предприятия: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_02 «Основы анализа и разработки приложений с большими объемами распределенных данных»
Авторы: Гнатюк Игорь Владимирович
Научный руководитель: Молодяков Сергей Александрович
Другие авторы: Локшина Екатерина Геннадиевна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2020
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Вычислительные машины электронные — Программы прикладные; распределенная обработка; большие данные; машинное обучение; глубокое обучение
УДК: 004.422.8:004.9
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 09.04.04
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
Ссылки: Отзыв руководителя; Рецензия; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2020/vr/vr20-927
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\6475

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Выпускная квалификационная работа магистра посвящена разработке и автоматизации модели машинного обучения для предсказания выживаемости клиента коммерческого предприятия. В ходе проведения работы была обучена и автоматизирована модель машинного обучения при использовании современных передовых технологий больших данных, машинного обучения и глубокого обучения. К тому же, были использованы современные алгоритмы построения векторного представления данных для улучшения качества модели. На основе обзора других современных методов и сравнения результатов на практике был выбран алгоритм Node2Vec. Обученная модель передается на кластере Apache Hadoop, где вычисляются предсказаний в больших объемах при помощи Apache Spark. В результате, модель была обучена и протестирована, продемонстрировав хорошее качество предсказаний. Автоматизация происходила с использованием Apache Airflow на кластере Hadoop.

The master thesis is devoted to development and automation of the machine learning model for predicting business customer survival. In the course of the work, the machine learning model was fitted and automated using modern technologies of big data, machine learning and deep learning. In addition, modern algorithms for constructing a vector representation of data were used to improve the quality of the model. Based on the comparative analysis, the Node2Vec algorithm was chosen. The fitted model is sent to the Apache Hadoop cluster, where large- scale predictions are calculated using Apache Spark. As a result, the model was fitted and tested, demonstrating the good quality of the predictions. Automation took place using Apache Airflow on a Hadoop cluster.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 7
За последние 30 дней: 0
Подробная статистика