Details

Title Метод детекции синтетических изображений товаров в e-commerce с использованием искусственного интеллекта: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии» = Method for Detection of Synthetic Product Images in E-commerce Using Artificial Intelligence
Creators Филин Максим Юрьевич
Scientific adviser Косторнова Александра Сергеевна
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects синтетические изображения ; e-commerce ; искусственный интеллект ; машинное обучение ; логистическая регрессия ; генеративные модели ; детекция синтетических изображений ; synthetic images ; artificial intelligence ; machine learning ; logistic regression ; generative models ; synthetic image detection
Document type Bachelor graduation qualification work
Language Russian
Level of education Bachelor
Speciality code (FGOS) 09.03.02
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr26-674
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\40052
Record create date 4/20/2026

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Данная работа посвящена исследованию методов детекции синтетических изображений товаров в системах электронной коммерции и разработке эффективного подхода к их классификации с использованием искусственного интеллекта. Задачи, которые решались в ходе исследования: 1) Анализ существующих архитектур нейросетей и методов генерации синтетических изображений для понимания характерных артефактов синтеза. 2) Создание специализированного датасета товарных изображений с использованием современных генеративных моделей (Stable Diffusion XL и FLUX.1 Kontext). 3) Разработка двухуровневой архитектуры ансамбля на основе разделения анализа товарного изображения на компоненты переднего плана и фона. 4) Обучение и оценка предложенного метода, сравнение его производительности с базовыми архитектурами нейросетей. Работа проведена с использованием открытого датасета Amazon Berkeley Objects, содержащего 147 702 товарных изображения. Были синтезированы 18 000 изображений товаров с применением методов Text-to-Image и Image-to-Image, что обеспечило репрезентативность датасета в контексте e-commerce. Анализ проводился с помощью глубоких нейросетевых архитектур (ResNet-50, EfficientNet-B4, Vision Transformer) и методов машинного обучения. В результате была разработана двухуровневая архитектура ансамбля с использованием логистической регрессии в качестве мета-модели для синтеза предсказаний специализированных классификаторов.

This work is devoted to the study of methods for detecting synthetic product images in e-commerce systems and the development of an effective approach for their classification using artificial intelligence. The research set the following goals: 1) Analysis of existing neural network architectures and methods for generating synthetic images to understand characteristic synthesis artifacts. 2) Creation of a specialized dataset of product images using modern generative models (Stable Diffusion XL and FLUX.1 Kontext). 3) Development of a two-level ensemble architecture based on dividing product images into foreground and background components. 4) Training and evaluation of the proposed method, comparison of its performance with baseline neural network architectures. The work was conducted using the open-source Amazon Berkeley Objects dataset containing 147,702 product images. A total of 18,000 synthetic product images were generated using Text-to-Image and Image-to-Image methods, ensuring dataset representativeness in the e-commerce context. Analysis was performed using deep neural network architectures (ResNet-50, EfficientNet-B4, Vision Transformer) and machine learning methods. As a result, a two-level ensemble architecture was developed using logistic regression as a meta-model for synthesizing predictions from specialized classifiers.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics