Детальная информация

Название Метод детекции синтетических изображений товаров в e-commerce с использованием искусственного интеллекта: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии» = Method for Detection of Synthetic Product Images in E-commerce Using Artificial Intelligence
Авторы Филин Максим Юрьевич
Научный руководитель Косторнова Александра Сергеевна
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика синтетические изображения ; e-commerce ; искусственный интеллект ; машинное обучение ; логистическая регрессия ; генеративные модели ; детекция синтетических изображений ; synthetic images ; artificial intelligence ; machine learning ; logistic regression ; generative models ; synthetic image detection
Тип документа Выпускная квалификационная работа бакалавра
Язык Русский
Уровень высшего образования Бакалавриат
Код специальности ФГОС 09.03.02
Группа специальностей ФГОС 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr26-674
Права доступа Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\40052
Дата создания записи 20.04.2026

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Данная работа посвящена исследованию методов детекции синтетических изображений товаров в системах электронной коммерции и разработке эффективного подхода к их классификации с использованием искусственного интеллекта. Задачи, которые решались в ходе исследования: 1) Анализ существующих архитектур нейросетей и методов генерации синтетических изображений для понимания характерных артефактов синтеза. 2) Создание специализированного датасета товарных изображений с использованием современных генеративных моделей (Stable Diffusion XL и FLUX.1 Kontext). 3) Разработка двухуровневой архитектуры ансамбля на основе разделения анализа товарного изображения на компоненты переднего плана и фона. 4) Обучение и оценка предложенного метода, сравнение его производительности с базовыми архитектурами нейросетей. Работа проведена с использованием открытого датасета Amazon Berkeley Objects, содержащего 147 702 товарных изображения. Были синтезированы 18 000 изображений товаров с применением методов Text-to-Image и Image-to-Image, что обеспечило репрезентативность датасета в контексте e-commerce. Анализ проводился с помощью глубоких нейросетевых архитектур (ResNet-50, EfficientNet-B4, Vision Transformer) и методов машинного обучения. В результате была разработана двухуровневая архитектура ансамбля с использованием логистической регрессии в качестве мета-модели для синтеза предсказаний специализированных классификаторов.

This work is devoted to the study of methods for detecting synthetic product images in e-commerce systems and the development of an effective approach for their classification using artificial intelligence. The research set the following goals: 1) Analysis of existing neural network architectures and methods for generating synthetic images to understand characteristic synthesis artifacts. 2) Creation of a specialized dataset of product images using modern generative models (Stable Diffusion XL and FLUX.1 Kontext). 3) Development of a two-level ensemble architecture based on dividing product images into foreground and background components. 4) Training and evaluation of the proposed method, comparison of its performance with baseline neural network architectures. The work was conducted using the open-source Amazon Berkeley Objects dataset containing 147,702 product images. A total of 18,000 synthetic product images were generated using Text-to-Image and Image-to-Image methods, ensuring dataset representativeness in the e-commerce context. Analysis was performed using deep neural network architectures (ResNet-50, EfficientNet-B4, Vision Transformer) and machine learning methods. As a result, a two-level ensemble architecture was developed using logistic regression as a meta-model for synthesizing predictions from specialized classifiers.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ
Прочитать Печать Загрузить
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика