Details

Title: Отбор и подготовка данных для использования алгоритмов машинного обучения в бизнес-аналитике: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_03 «Машинное обучение в управлении бизнесом»
Creators: Ли Ицин
Scientific adviser: Гейда Александр Сергеевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли
Imprint: Санкт-Петербург, 2024
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: машинное обучение; анализ данных; нейронные сети; корреляционный анализ; прогнозирование; machine learning; data analysis; neural networks; correlation analysis; prediction
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 09.04.04
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2024/vr/vr24-4479
Rights: Доступ по паролю из сети Интернет (чтение, печать)
Additionally: New arrival
Record key: ru\spstu\vkr\29982

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Целью работы является формирование четкого, универсального подхода к отбору данных и формированию обучающей выборки для решения задач с использованием алгоритмов машинного обучения, а также в исследовании и применении на практике нового коэффициента согласия в динамике, использующегося при проведении корреляционного анализа. Были решены следующие задачи:  сформировать проблемное поле, описать влияние факторов, возникающих в результате использования неподготовленных или непроверенных данных при решении задач с использованием ИИ;  обосновать важность проблемы, описать положительные эффекты от применения универсального подхода по пред подготовке данных;  оценить степень изученности проблемы посредством анализа научных работ по тематике;  провести исследование подхода к отбору данных и формированию обучающей выборки, а также исследовать новый механизм оценки взаимосвязей между временными рядами;  смоделировать решение задачи прогнозирования товарного спроса с использованием алгоритмов машинного обучения, опираясь на методы, полученные в результате исследования;  сформировать выводы о дальнейшем развитии изученного подхода. Предложен подход к формированию качественной обучающей выборки для машинного обучения, а также практическое применение нового инструмента оценки корреляционных взаимосвязей.

The aim of the work is to form a clear, universal approach to data selection and the formation of a training sample for solving problems using machine learning algorithms, as well as in the study and practical application of a new coefficient of agreement in dynamics used in correlation analysis. The following tasks were solved: to form a problem field, to describe the influence of factors arising from the use of unprepared or unverified data in solving problems using AI; to substantiate the importance of the problem, to describe the positive effects of applying a universal approach to data preparation; to assess the degree of study of the problem by analyzing scientific papers on the subject; to conduct a study of the approach to data selection and the formation of a training sample, as well as to explore a new mechanism for assessing the relationships between time series; to simulate the solution of the problem of forecasting commodity demand using machine learning algorithms, based on the methods obtained as a result of the study; to form conclusions about the further development of the studied approach. An approach to the formation of a high-quality training sample for machine learning is proposed, as well as the practical application of a new tool for evaluating correlation relationships.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print
Internet Authorized users SPbPU Read Print
-> Internet Anonymous

Table of Contents

  • ЗАДАНИЕ
  • ВВЕДЕНИЕ
  • 1. ПОСТАНОВКА ЗАДАЧИ ОТБОРА И ПОДГОТОВКИ ДАННЫХ ДЛЯ ИСПОЛЬЗОВАНИЯ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ В БИЗНЕС-АНАЛИТИКЕ
  • 1.1. Использование машинного обучения при принятии бизнес-решений
  • 1.2. Проблема качества входных данных. Анализ и влияние.
  • 1.3. Мировой опыт решения проблемы качества данных
    • 2. МЕТОДЫ ОТБОРА И ПОДГОТОВКИ ДАННЫХ ДЛЯ ИСПОЛЬЗОВАНИЯ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ В БИЗНЕС-АНАЛИТИКЕ
  • 2.1. Предварительная подготовка обучающей выборки
  • 2.2. Корреляционный анализ признаков модели
  • 2.3. Основные инструменты и методы прогнозной аналитики
    • 3. МЕТОДИКА ОТБОРА И ПОДГОТОВКИ ДАННЫХ ДЛЯ ИСПОЛЬЗОВАНИЯ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ В БИЗНЕС-АНАЛИТИКЕ
  • 3.1. Подбор разметка и анализ данных
  • 3.2. Формирование обучающей выборки для прогнозирования товарного спроса
  • 3.3. Построение прогностической модели
  • 3.4. Коммерческая эффективность подхода
    • ЗАКЛЮЧЕНИЕ
    • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

Usage statistics

stat Access count: 0
Last 30 days: 0
Detailed usage statistics