Детальная информация
| Название | Экспериментальный анализ агрессивного поведения на городских видео. От сбора данных до сравнения моделей // Промышленный искусственный интеллект (ПИИ'2025): Всероссийская научно-практическая конференция с международным участием 3–4 июля 2025 года: cборник научных трудов |
|---|---|
| Авторы | Каспшицкий Алексей Александрович ; Карякин Юрий Евгеньевич |
| Организация | ООО Бюджетные финансовые технологии ; Тюменский государственный университет |
| Выходные сведения | Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2025 |
| Коллекция | Общая коллекция |
| Тип документа | Статья, доклад |
| Язык | Русский |
| DOI | 10.18720/SPBPU/2/id25-549 |
| Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Дополнительно | Новинка |
| Ключ записи | RU\SPSTU\edoc\77893 |
| Дата создания записи | 25.12.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
| Группа | Анонимные пользователи |
|---|---|
| Сеть | Интернет |
В работе рассмотрена задача автоматической бинарной классификации агрессивного и нормального поведения человека в городской среде. В качестве обучающего набора был собран собственный небольшой датасет, реализован полный пайплайн: сбор наборов движений по 16 кадров с уличных камер, полуавтоматическая разметка, обучение и сравнение моделей. Основная модель – ViViT, однако из-за малого объёма данных проведён сравнительный эксперимент с 3D-архитектурами (Conv3D, R(2+1)D и др.). Приведены метрики качества и анализ применимости подхода в реальных условиях. Новизна работы – практическая оценка эффективности современных и классических моделей на кастомном датасете в условиях дефицита данных.
This paper addresses the task of automatic binary classification of aggressive and normal human behavior in urban environments. A custom, smallscale dataset was collected as a training set. The full pipeline was implemented: collecting motion sequences of 16 frames from street cameras, semi-automatic annotation, training, and model comparison. The primary model used is ViViT; however, due to the limited amount of data, a comparative experiment was conducted with 3D architectures (Conv3D, R(2+1)D, etc.). Quality metrics and an analysis of the applicability of the approach in real-world conditions are provided. The novelty of this work lies in the practical evaluation of both modern and classical models on a custom dataset under data scarcity conditions.
| Место доступа | Группа пользователей | Действие |
|---|---|---|
| Локальная сеть ИБК СПбПУ | Все |
|
| Интернет | Авторизованные пользователи СПбПУ |
|
| Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0