Детальная информация
Название | Создание программы для перевода языка жестов в текст в реальном времени: выпускная квалификационная работа бакалавра: направление 09.03.03 «Прикладная информатика» ; образовательная программа 09.03.03_03 «Интеллектуальные инфокоммуникационные технологии» |
---|---|
Авторы | Морозов Валерий Сергеевич |
Научный руководитель | Резединова Евгения Юрьевна |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Выходные сведения | Санкт-Петербург, 2025 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | распознавание жестов ; компьютерное зрение ; машинное обучение ; python ; lstm ; обработка изображений ; нейронная сеть ; классификация жестов ; интеллектуальный анализ ; gesture recognition ; computer vision ; machine learning ; image processing ; neural network ; gesture classification ; intelligent analysis |
Тип документа | Выпускная квалификационная работа бакалавра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Бакалавриат |
Код специальности ФГОС | 09.03.03 |
Группа специальностей ФГОС | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-1500 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\35708 |
Дата создания записи | 30.07.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
В данной работе описано создание программного обеспечения для распознавания жестов одной руки в режиме реального времени с использованием методов компьютерного зрения и машинного обучения. Объектом исследования являются технологии обработки изображений и видео, алгоритмы извлечения ключевых признаков с помощью библиотеки MediaPipe, а также методы классификации временных последовательностей с использованием нейронных сетей, в частности рекуррентных моделей LSTM. Целью разработки является создание устойчивой и кроссплатформенной системы, способной интерпретировать жесты пользователя и переводить их в текстовую форму. В процессе выполнения проекта был проведён обзор существующих решений в области жестового ввода, а также библиотек и инструментов, применяемых для захвата и анализа изображения с камеры. Были изучены особенности реализации моделей, распознающих как статические, так и динамические жесты, в условиях ограниченного объёма обучающих данных. Создан набор модулей, включающих средства сбора изображений, разметки данных, формирования обучающей выборки, тренировки модели и вывода предсказаний. Для удобства пользователя реализован графический интерфейс на базе Tkinter, позволяющий взаимодействовать с системой без необходимости работать с кодом. Работа системы протестирована на различных жестах, классификация которых осуществляется на основе анализа координат ключевых точек ладони и их изменений во времени. Полученные результаты подтверждают работоспособность предложенного подхода и демонстрируют возможность дальнейшего расширения системы для поддержки полноценного перевода жестового языка.
This work presents the development of software for real-time recognition of one-hand gestures using computer vision and machine learning methods. The object of the study includes image and video processing technologies, keypoint extraction algorithms using the MediaPipe library, and classification of temporal sequences with neural networks, particularly recurrent LSTM models. The main goal of the project is to create a stable and cross-platform system capable of interpreting user gestures and converting them into text. During the project, a review of existing solutions in the field of gesture input was carried out, as well as an analysis of libraries and tools used for capturing and analyzing camera images. The implementation details of models capable of recognizing both static and dynamic gestures were studied, taking into account the limitations of available training data. A set of modules was developed, including tools for image collection, data annotation, dataset creation, model training, and prediction output. For user convenience, a graphical interface based on Tkinter was implemented, allowing interaction with the system without requiring access to the source code. The system’s performance was tested on various gestures, with classification based on the analysis of hand keypoint coordinates and their temporal dynamics. The results confirm the effectiveness of the proposed approach and demonstrate the potential for further development of the system to support full sign language translation.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
- СОЗДАНИЕ ПРОГРАММЫ ДЛЯ ПЕРЕВОДА ЯЗЫКА ЖЕСТОВ В ТЕКСТ В РЕАЛЬНОМ ВРЕМЕНИ
- ВВЕДЕНИЕ
- 1. Введение в проблему автоматического распознавания жестового языка
- 2. Проектирование системы распознавания жестов
- 3. Реализация программной составляющей системы
- 4. Тестирование и апробация программы
- ЗАКЛЮЧЕНИЕ
- СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
- ПРИЛОЖЕНИЕ 1. КОД ПРОГРАММЫ
Количество обращений: 1
За последние 30 дней: 1