Details

Title Использование алгоритмов машинного обучения для отбора и подготовки данных в бизнес-аналитике: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_03 «Машинное обучение в управлении бизнесом»
Creators Питухин Николай Николаевич
Scientific adviser Светуньков Сергей Геннадьевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли
Imprint Санкт-Петербург, 2023
Collection Выпускные квалификационные работы; Общая коллекция
Subjects машинное обучение; анализ данных; нейронные сети; корреляционный анализ; прогнозирование; machine learning; data analysis; neural networks; correlation analysis; prediction
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 09.04.04
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2023/vr/vr23-2851
Rights Доступ по паролю из сети Интернет (чтение)
Record key ru\spstu\vkr\24835
Record create date 8/2/2023

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Целью работы является формирование четкого, универсального подхода к отбору данных и формированию обучающей выборки для решения задач с использованием алгоритмов машинного обучения, а также в исследовании и применении на практике нового коэффициента согласия в динамике, использующегося при проведении корреляционного анализа. Были решены следующие задачи: ― сформировать проблемное поле, описать влияние факторов, возникающих в результате использования неподготовленных или непроверенных данных при решении задач с использованием ИИ; ― обосновать важность проблемы, описать положительные эффекты от применения универсального подхода по предподготовке данных; ― оценить степень изученности проблемы посредством анализа научных работ по тематике; ― провести исследование подхода к отбору данных и формированию обучающей выборки, а также исследовать новый механизм оценки взаимосвязей между временными рядами; ― смоделировать решение задачи прогнозирования товарного спроса с использованием алгоритмов машинного обучения, опираясь на методы, полученные в результате исследования; ― сформировать выводы о дальнейшем развитии изученного подхода. Актуальность темы обусловлена тем, что применение алгоритмов машинного обучения сегодня популярностью и проблемы качества входных данных для обучения решающих алгоритмов. Источниками информации выступили данные отечественной и зарубежной научно-исследовательской литературы и официальных Интернет-ресурсов. Предложен подход к формированию качественной обучающей выборки для машинного обучения, а также практическое применение нового инструмента оценки корреляционных взаимосвязей.

The given work is devoted to form a clear, universal approach to data selection and the formation of a training sample for solving problems using machine learning algorithms, as well as to study and put into practice a new coefficient of agreement in dynamics, which is used in correlation analysis. The research set the following goals: — form a problem field, describe the influence of factors arising from the use of unprepared or unverified data in solving problems using AI; — substantiate the importance of the problem, describe the positive effects of applying a universal approach to data preparation; — assess the degree of knowledge of the problem by analyzing scientific papers on the subject; — conduct a study of the approach to data selection and formation of a training sample, as well as to study a new mechanism for estimating relationships between time series; — to simulate the solution of the problem of forecasting commodity demand using machine learning algorithms based on the methods obtained as a result of the study; — form conclusions about the further development of the studied approach. The work was fulfilled on the premises of popularity of applications of machine learning algorithms and insufficient coverage of the problem of the quality of input data for learning the decision algorithms. The sources of information were data from domestic and foreign research literature and official Internet resources. An approach to the formation of a high-quality training sample for machine learning is proposed, as well as the practical application of a new tool for assessing correlation relationships.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 13 
Last 30 days: 1

Detailed usage statistics