Детальная информация

Название: Определение заявок, имеющих склонность к пропаже в системе, при помощи алгоритмов машинного обучения: выпускная квалификационная работа бакалавра: направление 09.03.04 «Программная инженерия» ; образовательная программа 09.03.04_01 «Технология разработки и сопровождения качественного программного продукта»
Авторы: Борисов Илья Вячеславович
Научный руководитель: Фёдоров Станислав Алексеевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2022
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: машинное обучение; глубинный анализ данных; кластеризация; классификация; machine learning; data mining; clustering; classification
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 09.03.04
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2022/vr/vr22-2061
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: ru\spstu\vkr\19823

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Тема выпускной квалификационной работы: «Определение заявок, имеющих склонность к пропаже в системе, при помощи алгоритмов машинного обучения». Данная работа посвящена анализу и сравнению различных алгоритмов классификации данных в рамках задачи нахождения шаблонов аномалий в больших наборах данных. Задачи, которые решались в ходе исследования: 1. Анализ различных алгоритмов машинного обучения. 2. Обзор архитектуры системы для внедряемого алгоритма. 3. Анализ и предварительная обработка входных данных. 4. Выделение кластеров для разметки данных. 5. Проведение классификации при помощи различных алгоритмов МО6. Анализ результатов и выбор оптимального алгоритма. В ходе работы были проанализированы различные алгоритмы машинного обучения, применяемые для задач классификации. Также был проведён анализ входного набора данных с последующей обработкой показателей. Данные были размечены в соответствии с кластерами, выделенными в ходе выполнения задачи сегментации, а затем разделены на классы с помощью моделей, отобранных на этапе анализа алгоритмов машинного обучения. Путём сравнения полученных классификаторов была отобрана оптимальная модель классификации, показавшая хорошую точность предсказания классов как на тестовой выборке, так и на реальных данных.

The subject of the graduate qualification work: "Identification of applications that have a tendency to be lost in the system using machine learning algorithms". This work is devoted to the analysis and comparison of various algorithms for data classification in the scope of the problem of finding anomaly patterns in large data sets. Tasks that were solved during the study: 1. Analysis of various machine learning algorithms. 2. Overview of the system architecture for the implemented algorithm. 3. Input data analysis and preprocessing. 4. Data clustering. 5. Classification using various ML algorithms. 6. Analysis of the results and selection of the optimal algorithmIn the course of the work, various classification algorithms were analyzed. The analysis of the input data set with subsequent processing of indicators was also carried out. The data was marked up according to the clusters identified during the segmentation task, and then divided into classes using models selected at the stage of analysis of machine learning algorithms. By comparing the obtained classifiers, an optimal classification model was selected. This model showed good accuracy in predicting classes both on the test sample and real data.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Оглавление

  • Введение
  • Глава 1. Анализ существующих алгоритмов классификации
  • Глава 2. Обзор архитектуры системы заявок
  • Глава 3. Реализация системы
    • 3.1 Подтверждение концепции
    • 3.2 Работа с реальными данными
  • Глава 4. Анализ результатов работы
  • Заключение
  • Список использованных источников

Статистика использования

stat Количество обращений: 5
За последние 30 дней: 0
Подробная статистика