Details

Title Разработка модуля расчета производных признаков для оптимизации ранжирования товаров маркетплейса в реальном времени: выпускная квалификационная работа бакалавра: направление 09.03.03 «Прикладная информатика» ; образовательная программа 09.03.03_03 «Интеллектуальные инфокоммуникационные технологии»
Creators Польшин Владимир Владимирович
Scientific adviser Гринберг Эльвира Яковлевна
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects маркетплейс ; ранжирование товаров ; поисковая система ; marketplace ; product ranking ; search engine
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 09.03.03
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr25-1129
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\35672
Record create date 7/30/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Основная цель данного исследования – разработка и интеграция модуля для расчета производных признаков в реальном времени, который позволит повысить качество ранжирования товаров на маркетплейсе и снизить накладные расходы на обработку данных. В ходе исследования решались следующие задачи: 1) Обзор современных подходов к реализации динамических вычислений, их сравнительный анализ и выбор оптимального варианта; 2) Разработка эффективного модуля для расчета производных признаков; 3) Интеграция разработанного решения в существующую систему ранжирования. В работе были рассмотрены подходы к написанию модуля расчета математических выражений на Java: интеграция интерпретатора JavaScript и разработка предметно-ориентированного языка (DSL, domain-specific language) на основе описаний контрактов через Protocol Buffers. Для сравнительного анализа производительности реализованных прототипов применялся фреймворк Java Microbenchmark Harness (JMH). По итогам анализа был выбран DSL-подход, показавший преимущество по скорости работы. Проведено нагрузочное тестирование с использованием Yandex.Tank. Разработанный модуль успешно выдержал нагрузку в 20 000 RPS: 99-й перцентиль времени отклика увеличился менее чем на 1%. В промышленном A/B-тесте подтверждено повышение качества ранжирования – конверсия из поисковой сессии в заказ выросла на 0.46%. Дополнительно удалось снизить нагрузку на инфраструктуру: сокращено использование ресурсов Redis и Hadoop Distributed File System (HDFS) на 30%.

The main goal of this research is to develop and integrate a real-time module for calculating derived features, aimed at improving product ranking quality on a marketplace while reducing data processing overhead. The study addressed the following objectives: 1) Review of modern approaches to implementing dynamic computations, their comparative analysis, and selection of the optimal solution; 2) Development of an efficient module for calculating derived features; 3) Integration of the developed solution into the existing ranking system. The work explored approaches to implementing a mathematical expression evaluation module in Java: integration of a JavaScript interpreter and development of a domain-specific language (DSL) based on contract definitions using Protocol Buffers. To compare the performance of the implemented prototypes, the Java Microbenchmark Harness (JMH) framework was used. Based on the benchmark results, the DSL-based approach demonstrated superior execution speed and was selected for further development. Load testing was conducted using Yandex.Tank. The developed module successfully handled a load of 20,000 RPS: the 99th percentile response time increased by less than 1%. An industrial A/B test confirmed an improvement in ranking quality – the conversion rate from a search session to a completed order increased by 0.46%. Additionally, the system infrastructure load was reduced: Redis and Hadoop Distributed File System (HDFS) resource usage decreased by 30%.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics