Детальная информация

Название: Отбор и подготовка данных для использования алгоритмов машинного обучения в бизнес-аналитике: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_03 «Машинное обучение в управлении бизнесом»
Авторы: Ли Ицин
Научный руководитель: Гейда Александр Сергеевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли
Выходные сведения: Санкт-Петербург, 2024
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: машинное обучение; анализ данных; нейронные сети; корреляционный анализ; прогнозирование; machine learning; data analysis; neural networks; correlation analysis; prediction
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 09.04.04
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2024/vr/vr24-4479
Права доступа: Доступ по паролю из сети Интернет (чтение, печать)
Дополнительно: Новинка
Ключ записи: ru\spstu\vkr\29982

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Целью работы является формирование четкого, универсального подхода к отбору данных и формированию обучающей выборки для решения задач с использованием алгоритмов машинного обучения, а также в исследовании и применении на практике нового коэффициента согласия в динамике, использующегося при проведении корреляционного анализа. Были решены следующие задачи:  сформировать проблемное поле, описать влияние факторов, возникающих в результате использования неподготовленных или непроверенных данных при решении задач с использованием ИИ;  обосновать важность проблемы, описать положительные эффекты от применения универсального подхода по пред подготовке данных;  оценить степень изученности проблемы посредством анализа научных работ по тематике;  провести исследование подхода к отбору данных и формированию обучающей выборки, а также исследовать новый механизм оценки взаимосвязей между временными рядами;  смоделировать решение задачи прогнозирования товарного спроса с использованием алгоритмов машинного обучения, опираясь на методы, полученные в результате исследования;  сформировать выводы о дальнейшем развитии изученного подхода. Предложен подход к формированию качественной обучающей выборки для машинного обучения, а также практическое применение нового инструмента оценки корреляционных взаимосвязей.

The aim of the work is to form a clear, universal approach to data selection and the formation of a training sample for solving problems using machine learning algorithms, as well as in the study and practical application of a new coefficient of agreement in dynamics used in correlation analysis. The following tasks were solved: to form a problem field, to describe the influence of factors arising from the use of unprepared or unverified data in solving problems using AI; to substantiate the importance of the problem, to describe the positive effects of applying a universal approach to data preparation; to assess the degree of study of the problem by analyzing scientific papers on the subject; to conduct a study of the approach to data selection and the formation of a training sample, as well as to explore a new mechanism for assessing the relationships between time series; to simulate the solution of the problem of forecasting commodity demand using machine learning algorithms, based on the methods obtained as a result of the study; to form conclusions about the further development of the studied approach. An approach to the formation of a high-quality training sample for machine learning is proposed, as well as the practical application of a new tool for evaluating correlation relationships.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать
Интернет Авторизованные пользователи СПбПУ Прочитать Печать
-> Интернет Анонимные пользователи

Оглавление

  • ЗАДАНИЕ
  • ВВЕДЕНИЕ
  • 1. ПОСТАНОВКА ЗАДАЧИ ОТБОРА И ПОДГОТОВКИ ДАННЫХ ДЛЯ ИСПОЛЬЗОВАНИЯ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ В БИЗНЕС-АНАЛИТИКЕ
  • 1.1. Использование машинного обучения при принятии бизнес-решений
  • 1.2. Проблема качества входных данных. Анализ и влияние.
  • 1.3. Мировой опыт решения проблемы качества данных
    • 2. МЕТОДЫ ОТБОРА И ПОДГОТОВКИ ДАННЫХ ДЛЯ ИСПОЛЬЗОВАНИЯ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ В БИЗНЕС-АНАЛИТИКЕ
  • 2.1. Предварительная подготовка обучающей выборки
  • 2.2. Корреляционный анализ признаков модели
  • 2.3. Основные инструменты и методы прогнозной аналитики
    • 3. МЕТОДИКА ОТБОРА И ПОДГОТОВКИ ДАННЫХ ДЛЯ ИСПОЛЬЗОВАНИЯ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ В БИЗНЕС-АНАЛИТИКЕ
  • 3.1. Подбор разметка и анализ данных
  • 3.2. Формирование обучающей выборки для прогнозирования товарного спроса
  • 3.3. Построение прогностической модели
  • 3.4. Коммерческая эффективность подхода
    • ЗАКЛЮЧЕНИЕ
    • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

Статистика использования

stat Количество обращений: 0
За последние 30 дней: 0
Подробная статистика