Детальная информация
Название | Использование алгоритмов машинного обучения для отбора и подготовки данных в бизнес-аналитике: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_03 «Машинное обучение в управлении бизнесом» |
---|---|
Авторы | Питухин Николай Николаевич |
Научный руководитель | Светуньков Сергей Геннадьевич |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли |
Выходные сведения | Санкт-Петербург, 2023 |
Коллекция | Выпускные квалификационные работы; Общая коллекция |
Тематика | машинное обучение; анализ данных; нейронные сети; корреляционный анализ; прогнозирование; machine learning; data analysis; neural networks; correlation analysis; prediction |
Тип документа | Выпускная квалификационная работа магистра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Магистратура |
Код специальности ФГОС | 09.04.04 |
Группа специальностей ФГОС | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2023/vr/vr23-2851 |
Права доступа | Доступ по паролю из сети Интернет (чтение) |
Ключ записи | ru\spstu\vkr\24835 |
Дата создания записи | 02.08.2023 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
Целью работы является формирование четкого, универсального подхода к отбору данных и формированию обучающей выборки для решения задач с использованием алгоритмов машинного обучения, а также в исследовании и применении на практике нового коэффициента согласия в динамике, использующегося при проведении корреляционного анализа. Были решены следующие задачи: ― сформировать проблемное поле, описать влияние факторов, возникающих в результате использования неподготовленных или непроверенных данных при решении задач с использованием ИИ; ― обосновать важность проблемы, описать положительные эффекты от применения универсального подхода по предподготовке данных; ― оценить степень изученности проблемы посредством анализа научных работ по тематике; ― провести исследование подхода к отбору данных и формированию обучающей выборки, а также исследовать новый механизм оценки взаимосвязей между временными рядами; ― смоделировать решение задачи прогнозирования товарного спроса с использованием алгоритмов машинного обучения, опираясь на методы, полученные в результате исследования; ― сформировать выводы о дальнейшем развитии изученного подхода. Актуальность темы обусловлена тем, что применение алгоритмов машинного обучения сегодня популярностью и проблемы качества входных данных для обучения решающих алгоритмов. Источниками информации выступили данные отечественной и зарубежной научно-исследовательской литературы и официальных Интернет-ресурсов. Предложен подход к формированию качественной обучающей выборки для машинного обучения, а также практическое применение нового инструмента оценки корреляционных взаимосвязей.
The given work is devoted to form a clear, universal approach to data selection and the formation of a training sample for solving problems using machine learning algorithms, as well as to study and put into practice a new coefficient of agreement in dynamics, which is used in correlation analysis. The research set the following goals: — form a problem field, describe the influence of factors arising from the use of unprepared or unverified data in solving problems using AI; — substantiate the importance of the problem, describe the positive effects of applying a universal approach to data preparation; — assess the degree of knowledge of the problem by analyzing scientific papers on the subject; — conduct a study of the approach to data selection and formation of a training sample, as well as to study a new mechanism for estimating relationships between time series; — to simulate the solution of the problem of forecasting commodity demand using machine learning algorithms based on the methods obtained as a result of the study; — form conclusions about the further development of the studied approach. The work was fulfilled on the premises of popularity of applications of machine learning algorithms and insufficient coverage of the problem of the quality of input data for learning the decision algorithms. The sources of information were data from domestic and foreign research literature and official Internet resources. An approach to the formation of a high-quality training sample for machine learning is proposed, as well as the practical application of a new tool for assessing correlation relationships.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
Количество обращений: 25
За последние 30 дней: 0