Details

Title: Разработка аналитического веб-сервиса прогнозирования отмены заказа для интернет-магазина: выпускная квалификационная работа магистра: направление 09.04.04 «Программная инженерия» ; образовательная программа 09.04.04_03 «Машинное обучение в управлении бизнесом»
Creators: Ма Цзясин
Scientific adviser: Паклин Николай Борисович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли
Imprint: Санкт-Петербург, 2023
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: машинное обучение; предсказательные модели; электронный бизнес; оптимизация бизнес-процессов; machine learning; predictive models; e-business; business process optimization
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Level of education: Master
Speciality code (FGOS): 09.04.04
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2023/vr/vr23-2988
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: ru\spstu\vkr\24955

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Целью работы является важность решения проблемы отмененных заказов. Были решены следующие задачи: —Изучить современные подходы к анализу клиентских баз данных. —Описать объект анализа (интернет-гипермаркет «Утконос») и сформировать процессы AS-IS и TO-BE по доставке товаров. —Провести анализ рынка аналитических инструментов для выбора программного инструмента для выполнения работы. —Решить проблемы отмененных заказов при помощи построения предсказательной модели оценки вероятности и описанию процесса TO-BE. —Описать модель как аналитический веб-сервис. Актуальность темы обусловлена тем, что необходима оптимизация бизнес-процессов интернет-магазинов, занимающихся доставкой продуктов питания, на основе моделей машинного обучения, для снижения убытков, связанных с отменами клинттских заказов. Источника информации выступили являются источники учебной, монографической и периодической литературы по выбранной теме, а также источники на веб-сайтах. Объектом являются заказы клиентов интернет-магазина «Утконос» за период в несколько месяцев (9 млн. транзакций). Данные взяты из открытого конкурса по анализу данных SAS Data Hack Platypus, проводимого компанией SAS и «Утконос» осенью 2019 года (https://sascompetitions.ru). В работе произведен сравнительный анализ подходов, методов и инструментальных средств анализа данных. Обосновывается возможность и эффективность решения задачи анализа данных на платформе Loginom. Описываются бизнес-процессы AS-IS и TO-BE  в нотации BPMN. Строятся несколько моделей машинного обучения и выбирается лучшая. Модель оформлена в качестве аналитического веб-сервиса. Произведен расчет экономической эффективности от внедрения модели при условии снижения поздних отмен заказов в два раза.

The purpose of the research is  the importance of solving the problem of cancelled orders. The subject of the thesis: —To study modern approaches to the analysis of customer databases. —Describe the object of analysis (online hypermarket "Utkonos") and form AS-IS and TO-BE processes for goods delivery. —To analyze the market of analytical tools to select a software tool to do the job. —Solve the problems of cancelled orders by building a predictive probability estimation model and describing the TO-BE process. —Describe the model as an analytical web service. The relevance of the topic stems from the fact that it is necessary to optimize the business processes of online stores involved in food delivery, based on machine learning models, to reduce losses associated with the cancellation of customer orders. The sources of information are the sources of educational, monographic and periodical literature on the chosen topic, as well as sources on websites. The object is the customer orders of the Utkonos online store for a period of several months (9 million transactions). The data are taken from SAS Data Hack Platypus, an open data analysis competition conducted by SAS and Utkonos in fall 2019 (https://sascompetitions.ru). The paper makes a comparative analysis of approaches, methods and tools for data analysis. It substantiates the possibility and effectiveness of solving the data analysis problem on the Loginom platform. AS-IS and TO-BE business processes are described in BPMN notation. Several machine learning models are built and the best one is selected. The model is designed as an analytical web service. Calculated the cost-effectiveness of the implementation of the model on the condition of reducing late order cancellations by half.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Table of Contents

  • ВВЕДЕНИЕ
  • 1. ЭКОНОМИЧЕСКАЯ ХАРАКТЕРИСТИКА КОМПАНИЙ E-GROCERY
    • 1.1. Компания формата E-grocery
    • 1.2. Рынок систем E-grocery в России
    • 1.3. Типовая схема работы интернет-магазина по дос
    • 1.4. Схема TO-BE при наличии модели оценки вероятн
  • 2. АНАЛИЗ РЫНКА АНАЛИТИЧЕСКИХ ПЛАТФОРМ
  • Аналитические платформы играют ключевую роль в со
  • Машинное обучение аналитические платформы представ
  • Использование машинного обучения аналитической пла
  • 1. Обработка и анализ больших объемов данных: Маши
  • 2. Создание прогностических моделей: Машинное обуч
  • 3. Автоматизация процесса анализа данных: Машинное
  • Использование машинного обучения аналитических пла
  • Более точные прогнозы и решения: Машинное обучение
  • Эффективное использование данных: Машинное обучени
  • Улучшенная производительность: Аналитические платф
  • Цель данного исследования — провести анализ рынка
    • 2.1 KNIME
    • 2.2. Anaconda (Python)
    • 2.3. Loginom
    • 2.4. Сравнительные характеристики аналитических пл
    • 2.5. Постановка задачи и исходные данные
  • 3. РАЗРАБОТКА МОДЕЛИ ОЦЕНКИ ВЕРОЯТНОСТИ ОТКАЗА ОТ
    • 3.1. Сбор данных
    • 3.2. Подготовка данных
    • 3.3. Формирование обучающего и тестового множеств
    • 3.4. Отбор значимых переменных
    • 3.5. Построение модели логистической регрессии
    • 3.6. Построение модели градиентого бустинга
    • 3.7. Оценка качества моделей и выбор лучшей
    • 3.8. Внедрение модели. Модель как веб-сервис
    • 3.9. Контрольный пример
    • 3.10 Расчеты по эффективности модели
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

Usage statistics

stat Access count: 3
Last 30 days: 1
Detailed usage statistics