Details
| Title | Метод детекции синтетических изображений товаров в e-commerce с использованием искусственного интеллекта: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии» = Method for Detection of Synthetic Product Images in E-commerce Using Artificial Intelligence |
|---|---|
| Creators | Филин Максим Юрьевич |
| Scientific adviser | Косторнова Александра Сергеевна |
| Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Imprint | Санкт-Петербург, 2025 |
| Collection | Выпускные квалификационные работы ; Общая коллекция |
| Subjects | синтетические изображения ; e-commerce ; искусственный интеллект ; машинное обучение ; логистическая регрессия ; генеративные модели ; детекция синтетических изображений ; synthetic images ; artificial intelligence ; machine learning ; logistic regression ; generative models ; synthetic image detection |
| Document type | Bachelor graduation qualification work |
| Language | Russian |
| Level of education | Bachelor |
| Speciality code (FGOS) | 09.03.02 |
| Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
| DOI | 10.18720/SPBPU/3/2025/vr/vr26-674 |
| Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Additionally | New arrival |
| Record key | ru\spstu\vkr\40052 |
| Record create date | 4/20/2026 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
| Group | Anonymous |
|---|---|
| Network | Internet |
Данная работа посвящена исследованию методов детекции синтетических изображений товаров в системах электронной коммерции и разработке эффективного подхода к их классификации с использованием искусственного интеллекта. Задачи, которые решались в ходе исследования: 1) Анализ существующих архитектур нейросетей и методов генерации синтетических изображений для понимания характерных артефактов синтеза. 2) Создание специализированного датасета товарных изображений с использованием современных генеративных моделей (Stable Diffusion XL и FLUX.1 Kontext). 3) Разработка двухуровневой архитектуры ансамбля на основе разделения анализа товарного изображения на компоненты переднего плана и фона. 4) Обучение и оценка предложенного метода, сравнение его производительности с базовыми архитектурами нейросетей. Работа проведена с использованием открытого датасета Amazon Berkeley Objects, содержащего 147 702 товарных изображения. Были синтезированы 18 000 изображений товаров с применением методов Text-to-Image и Image-to-Image, что обеспечило репрезентативность датасета в контексте e-commerce. Анализ проводился с помощью глубоких нейросетевых архитектур (ResNet-50, EfficientNet-B4, Vision Transformer) и методов машинного обучения. В результате была разработана двухуровневая архитектура ансамбля с использованием логистической регрессии в качестве мета-модели для синтеза предсказаний специализированных классификаторов.
This work is devoted to the study of methods for detecting synthetic product images in e-commerce systems and the development of an effective approach for their classification using artificial intelligence. The research set the following goals: 1) Analysis of existing neural network architectures and methods for generating synthetic images to understand characteristic synthesis artifacts. 2) Creation of a specialized dataset of product images using modern generative models (Stable Diffusion XL and FLUX.1 Kontext). 3) Development of a two-level ensemble architecture based on dividing product images into foreground and background components. 4) Training and evaluation of the proposed method, comparison of its performance with baseline neural network architectures. The work was conducted using the open-source Amazon Berkeley Objects dataset containing 147,702 product images. A total of 18,000 synthetic product images were generated using Text-to-Image and Image-to-Image methods, ensuring dataset representativeness in the e-commerce context. Analysis was performed using deep neural network architectures (ResNet-50, EfficientNet-B4, Vision Transformer) and machine learning methods. As a result, a two-level ensemble architecture was developed using logistic regression as a meta-model for synthesizing predictions from specialized classifiers.
| Network | User group | Action |
|---|---|---|
| ILC SPbPU Local Network | All |
|
| Internet | Authorized users SPbPU |
|
| Internet | Anonymous |
|
Access count: 0
Last 30 days: 0