Details
| Title | Экспериментальный анализ агрессивного поведения на городских видео. От сбора данных до сравнения моделей // Промышленный искусственный интеллект (ПИИ'2025): Всероссийская научно-практическая конференция с международным участием 3–4 июля 2025 года: cборник научных трудов |
|---|---|
| Creators | Каспшицкий Алексей Александрович ; Карякин Юрий Евгеньевич |
| Organization | ООО Бюджетные финансовые технологии ; Тюменский государственный университет |
| Imprint | Санкт-Петербург: ПОЛИТЕХ-ПРЕСС, 2025 |
| Collection | Общая коллекция |
| Document type | Article, report |
| Language | Russian |
| DOI | 10.18720/SPBPU/2/id25-549 |
| Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
| Additionally | New arrival |
| Record key | RU\SPSTU\edoc\77893 |
| Record create date | 12/25/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
| Group | Anonymous |
|---|---|
| Network | Internet |
В работе рассмотрена задача автоматической бинарной классификации агрессивного и нормального поведения человека в городской среде. В качестве обучающего набора был собран собственный небольшой датасет, реализован полный пайплайн: сбор наборов движений по 16 кадров с уличных камер, полуавтоматическая разметка, обучение и сравнение моделей. Основная модель – ViViT, однако из-за малого объёма данных проведён сравнительный эксперимент с 3D-архитектурами (Conv3D, R(2+1)D и др.). Приведены метрики качества и анализ применимости подхода в реальных условиях. Новизна работы – практическая оценка эффективности современных и классических моделей на кастомном датасете в условиях дефицита данных.
This paper addresses the task of automatic binary classification of aggressive and normal human behavior in urban environments. A custom, smallscale dataset was collected as a training set. The full pipeline was implemented: collecting motion sequences of 16 frames from street cameras, semi-automatic annotation, training, and model comparison. The primary model used is ViViT; however, due to the limited amount of data, a comparative experiment was conducted with 3D architectures (Conv3D, R(2+1)D, etc.). Quality metrics and an analysis of the applicability of the approach in real-world conditions are provided. The novelty of this work lies in the practical evaluation of both modern and classical models on a custom dataset under data scarcity conditions.
| Network | User group | Action |
|---|---|---|
| ILC SPbPU Local Network | All |
|
| Internet | Authorized users SPbPU |
|
| Internet | Anonymous |
|
Access count: 0
Last 30 days: 0