Детальная информация

Название: Использование алгоритмов машинного обучения для отбора и подготовки данных в бизнес-аналитике: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_03 «Машинное обучение в управлении бизнесом»
Авторы: Питухин Николай Николаевич
Научный руководитель: Светуньков Сергей Геннадьевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли
Выходные сведения: Санкт-Петербург, 2023
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: машинное обучение; анализ данных; нейронные сети; корреляционный анализ; прогнозирование; machine learning; data analysis; neural networks; correlation analysis; prediction
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 09.04.04
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2023/vr/vr23-2851
Права доступа: Доступ по паролю из сети Интернет (чтение)
Ключ записи: ru\spstu\vkr\24835

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Целью работы является формирование четкого, универсального подхода к отбору данных и формированию обучающей выборки для решения задач с использованием алгоритмов машинного обучения, а также в исследовании и применении на практике нового коэффициента согласия в динамике, использующегося при проведении корреляционного анализа. Были решены следующие задачи: ― сформировать проблемное поле, описать влияние факторов, возникающих в результате использования неподготовленных или непроверенных данных при решении задач с использованием ИИ; ― обосновать важность проблемы, описать положительные эффекты от применения универсального подхода по предподготовке данных; ― оценить степень изученности проблемы посредством анализа научных работ по тематике; ― провести исследование подхода к отбору данных и формированию обучающей выборки, а также исследовать новый механизм оценки взаимосвязей между временными рядами; ― смоделировать решение задачи прогнозирования товарного спроса с использованием алгоритмов машинного обучения, опираясь на методы, полученные в результате исследования; ― сформировать выводы о дальнейшем развитии изученного подхода. Актуальность темы обусловлена тем, что применение алгоритмов машинного обучения сегодня популярностью и проблемы качества входных данных для обучения решающих алгоритмов. Источниками информации выступили данные отечественной и зарубежной научно-исследовательской литературы и официальных Интернет-ресурсов. Предложен подход к формированию качественной обучающей выборки для машинного обучения, а также практическое применение нового инструмента оценки корреляционных взаимосвязей.

The given work is devoted to form a clear, universal approach to data selection and the formation of a training sample for solving problems using machine learning algorithms, as well as to study and put into practice a new coefficient of agreement in dynamics, which is used in correlation analysis. The research set the following goals: — form a problem field, describe the influence of factors arising from the use of unprepared or unverified data in solving problems using AI; — substantiate the importance of the problem, describe the positive effects of applying a universal approach to data preparation; — assess the degree of knowledge of the problem by analyzing scientific papers on the subject; — conduct a study of the approach to data selection and formation of a training sample, as well as to study a new mechanism for estimating relationships between time series; — to simulate the solution of the problem of forecasting commodity demand using machine learning algorithms based on the methods obtained as a result of the study; — form conclusions about the further development of the studied approach. The work was fulfilled on the premises of popularity of applications of machine learning algorithms and insufficient coverage of the problem of the quality of input data for learning the decision algorithms. The sources of information were data from domestic and foreign research literature and official Internet resources. An approach to the formation of a high-quality training sample for machine learning is proposed, as well as the practical application of a new tool for assessing correlation relationships.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать
Интернет Авторизованные пользователи СПбПУ Прочитать
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 9
За последние 30 дней: 0
Подробная статистика