Details
Title | Разработка модуля расчета производных признаков для оптимизации ранжирования товаров маркетплейса в реальном времени: выпускная квалификационная работа бакалавра: направление 09.03.03 «Прикладная информатика» ; образовательная программа 09.03.03_03 «Интеллектуальные инфокоммуникационные технологии» |
---|---|
Creators | Польшин Владимир Владимирович |
Scientific adviser | Гринберг Эльвира Яковлевна |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | маркетплейс ; ранжирование товаров ; поисковая система ; marketplace ; product ranking ; search engine |
Document type | Bachelor graduation qualification work |
File type | |
Language | Russian |
Level of education | Bachelor |
Speciality code (FGOS) | 09.03.03 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-1129 |
Rights | Доступ по паролю из сети Интернет (чтение) |
Additionally | New arrival |
Record key | ru\spstu\vkr\35672 |
Record create date | 7/30/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Основная цель данного исследования – разработка и интеграция модуля для расчета производных признаков в реальном времени, который позволит повысить качество ранжирования товаров на маркетплейсе и снизить накладные расходы на обработку данных. В ходе исследования решались следующие задачи: 1) Обзор современных подходов к реализации динамических вычислений, их сравнительный анализ и выбор оптимального варианта; 2) Разработка эффективного модуля для расчета производных признаков; 3) Интеграция разработанного решения в существующую систему ранжирования. В работе были рассмотрены подходы к написанию модуля расчета математических выражений на Java: интеграция интерпретатора JavaScript и разработка предметно-ориентированного языка (DSL, domain-specific language) на основе описаний контрактов через Protocol Buffers. Для сравнительного анализа производительности реализованных прототипов применялся фреймворк Java Microbenchmark Harness (JMH). По итогам анализа был выбран DSL-подход, показавший преимущество по скорости работы. Проведено нагрузочное тестирование с использованием Yandex.Tank. Разработанный модуль успешно выдержал нагрузку в 20 000 RPS: 99-й перцентиль времени отклика увеличился менее чем на 1%. В промышленном A/B-тесте подтверждено повышение качества ранжирования – конверсия из поисковой сессии в заказ выросла на 0.46%. Дополнительно удалось снизить нагрузку на инфраструктуру: сокращено использование ресурсов Redis и Hadoop Distributed File System (HDFS) на 30%.
The main goal of this research is to develop and integrate a real-time module for calculating derived features, aimed at improving product ranking quality on a marketplace while reducing data processing overhead. The study addressed the following objectives: 1) Review of modern approaches to implementing dynamic computations, their comparative analysis, and selection of the optimal solution; 2) Development of an efficient module for calculating derived features; 3) Integration of the developed solution into the existing ranking system. The work explored approaches to implementing a mathematical expression evaluation module in Java: integration of a JavaScript interpreter and development of a domain-specific language (DSL) based on contract definitions using Protocol Buffers. To compare the performance of the implemented prototypes, the Java Microbenchmark Harness (JMH) framework was used. Based on the benchmark results, the DSL-based approach demonstrated superior execution speed and was selected for further development. Load testing was conducted using Yandex.Tank. The developed module successfully handled a load of 20,000 RPS: the 99th percentile response time increased by less than 1%. An industrial A/B test confirmed an improvement in ranking quality – the conversion rate from a search session to a completed order increased by 0.46%. Additionally, the system infrastructure load was reduced: Redis and Hadoop Distributed File System (HDFS) resource usage decreased by 30%.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0