Details
Title | Использование алгоритмов машинного обучения для отбора и подготовки данных в бизнес-аналитике: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_03 «Машинное обучение в управлении бизнесом» |
---|---|
Creators | Питухин Николай Николаевич |
Scientific adviser | Светуньков Сергей Геннадьевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли |
Imprint | Санкт-Петербург, 2023 |
Collection | Выпускные квалификационные работы; Общая коллекция |
Subjects | машинное обучение; анализ данных; нейронные сети; корреляционный анализ; прогнозирование; machine learning; data analysis; neural networks; correlation analysis; prediction |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 09.04.04 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2023/vr/vr23-2851 |
Rights | Доступ по паролю из сети Интернет (чтение) |
Record key | ru\spstu\vkr\24835 |
Record create date | 8/2/2023 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Целью работы является формирование четкого, универсального подхода к отбору данных и формированию обучающей выборки для решения задач с использованием алгоритмов машинного обучения, а также в исследовании и применении на практике нового коэффициента согласия в динамике, использующегося при проведении корреляционного анализа. Были решены следующие задачи: ― сформировать проблемное поле, описать влияние факторов, возникающих в результате использования неподготовленных или непроверенных данных при решении задач с использованием ИИ; ― обосновать важность проблемы, описать положительные эффекты от применения универсального подхода по предподготовке данных; ― оценить степень изученности проблемы посредством анализа научных работ по тематике; ― провести исследование подхода к отбору данных и формированию обучающей выборки, а также исследовать новый механизм оценки взаимосвязей между временными рядами; ― смоделировать решение задачи прогнозирования товарного спроса с использованием алгоритмов машинного обучения, опираясь на методы, полученные в результате исследования; ― сформировать выводы о дальнейшем развитии изученного подхода. Актуальность темы обусловлена тем, что применение алгоритмов машинного обучения сегодня популярностью и проблемы качества входных данных для обучения решающих алгоритмов. Источниками информации выступили данные отечественной и зарубежной научно-исследовательской литературы и официальных Интернет-ресурсов. Предложен подход к формированию качественной обучающей выборки для машинного обучения, а также практическое применение нового инструмента оценки корреляционных взаимосвязей.
The given work is devoted to form a clear, universal approach to data selection and the formation of a training sample for solving problems using machine learning algorithms, as well as to study and put into practice a new coefficient of agreement in dynamics, which is used in correlation analysis. The research set the following goals: — form a problem field, describe the influence of factors arising from the use of unprepared or unverified data in solving problems using AI; — substantiate the importance of the problem, describe the positive effects of applying a universal approach to data preparation; — assess the degree of knowledge of the problem by analyzing scientific papers on the subject; — conduct a study of the approach to data selection and formation of a training sample, as well as to study a new mechanism for estimating relationships between time series; — to simulate the solution of the problem of forecasting commodity demand using machine learning algorithms based on the methods obtained as a result of the study; — form conclusions about the further development of the studied approach. The work was fulfilled on the premises of popularity of applications of machine learning algorithms and insufficient coverage of the problem of the quality of input data for learning the decision algorithms. The sources of information were data from domestic and foreign research literature and official Internet resources. An approach to the formation of a high-quality training sample for machine learning is proposed, as well as the practical application of a new tool for assessing correlation relationships.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 13
Last 30 days: 1