Детальная информация
Название | Разработка приложения для интеллектуального анализа и организации снимков экрана для ОС Android: выпускная квалификационная работа бакалавра: направление 09.03.01 «Информатика и вычислительная техника» ; образовательная программа 09.03.01_02 «Технологии разработки программного обеспечения» |
---|---|
Авторы | Граур Арсений Александрович |
Научный руководитель | Богач Наталья Владимировна |
Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Выходные сведения | Санкт-Петербург, 2025 |
Коллекция | Выпускные квалификационные работы ; Общая коллекция |
Тематика | Android ; Kotlin ; Jetpack Compose ; машинное обучение ; оптическое распознавание символов ; генеративный искусственный интеллект ; извлечение именованных сущностей ; анализ изображений ; machine learning ; optical character recognition ; generative artificial intelligence ; entity extraction ; semantic image analysis |
Тип документа | Выпускная квалификационная работа бакалавра |
Тип файла | |
Язык | Русский |
Уровень высшего образования | Бакалавриат |
Код специальности ФГОС | 09.03.01 |
Группа специальностей ФГОС | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-2999 |
Права доступа | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Дополнительно | Новинка |
Ключ записи | ru\spstu\vkr\37257 |
Дата создания записи | 19.09.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа | Анонимные пользователи |
---|---|
Сеть | Интернет |
В современном мире пользователи смартфонов создают бесчисленное количество снимков экрана, содержащих важную информацию, однако существует слишком мало доступных инструментов для эффективного поиска этой информации и взаимодействия с содержимым этих снимков экрана. Существующие решения либо ограничены конкретными устройствами, либо требуют передачи данных в облако, что создаёт риски для конфиденциальности данных. Развитие технологий машинного обучения и встроенного искусственного интеллекта открывает возможности для создания интеллектуальных систем анализа непосредственно на мобильных устройствах. Задачи, которые решались в ходе разработки: 1. Анализ существующих решений и технологий машинного обучения для анализа изображений 2. Проектирование архитектуры системы автоматического мониторинга и обработки снимков экрана 3. Разработка модулей оптического распознавания символов, извлечения именованных сущностей и генеративного искусственного интеллекта для семантического анализа снимков экрана 4. Разработка пользовательского интерфейса с функциями поиска и интерактивного взаимодействия 5. Тестирование производительности на устройствах различных классов В результате выполнения работы было создано современное приложение с автоматическим мониторингом и анализом снимков экрана, интеграцией трех типов моделей машинного обучения и системой управления моделями. Исходный код проекта доступен по ссылке: https://github.com/argraur/Screensense.
In the modern world, smartphone users create countless screenshots containing important information, however, there are too few available tools for efficient search of this information and interaction with the content of these screenshots. Existing solutions are either limited to specific devices or require cloud synchronization, which creates privacy risks. The development of machine learning technologies and embedded artificial intelligence opens up opportunities for creation of intelligent analysis systems directly on mobile devices. Tasks solved during development: 1. Analysis of existing solutions and machine learning technologies for image analysis 2. Architecting the system of automatic monitoring and processing of screenshots 3. Development of optical character recognition, named entity extraction and generative artificial intelligence modules for semantic analysis of screenshots 4. Development of user interface with search and interaction functionalities 5. Performance testing on devices of various classes As a result of this work, a modern application was created with automatic monitoring and analysis of screenshots, integration of three types of machine learning models and a model management system. Project source code is available at: https://github.com/argraur/Screensense.
Место доступа | Группа пользователей | Действие |
---|---|---|
Локальная сеть ИБК СПбПУ | Все |
|
Интернет | Авторизованные пользователи СПбПУ |
|
Интернет | Анонимные пользователи |
|
- СПИСОК УСЛОВНЫХ ОБОЗНАЧЕНИЙ И СОКРАЩЕНИЙ
- ВВЕДЕНИЕ
- ГЛАВА 1. ОБЗОР ПРЕДМЕТНОЙ ОБЛАСТИ
- Обзор существующих решений
- Технологии машинного обучения для анализа изображений
- Оптическое распознавание символов
- Мультимодальные генеративные модели
- Извлечение сущностей из текста
- ГЛАВА 2. ТЕХНИЧЕСКОЕ ЗАДАНИЕ
- Технологический стек
- Выбор операционной системы
- Выбор языка программирования
- Выбор среды разработки
- Выбор системы сборки
- Выбор фреймворка описания интерфейса
- Постановка задачи
- Функциональные требования
- Автоматическое обнаружение и анализ снимков экрана
- Извлечение и индексация текстовой информации
- Интеллектуальный поиск и фильтрация
- Нефункциональные требования
- Требования к совместимости
- Требования к безопасности и конфиденциальности
- Требования к интерфейсу
- Требования к пользовательскому интерфейсу
- Ограничения и допущения
- Ограничения используемых моделей машинного обучения
- Допущения о характере обрабатываемых данных
- Технические ограничения
- Технологический стек
- ГЛАВА 3. ПРОЕКТИРОВАНИЕ СИСТЕМЫ
- Нефункциональные решения
- Архитектура приложения
- Выбор архитектурного подхода
- Модульная структура приложения
- Взаимодействие между слоями
- Проектирование компонентов системы
- Структуры данных бизнес-логики
- Система мониторинга снимков экрана
- Модуль обработки изображений
- Cистема управления моделями
- Проектирование базы данных
- Сущности базы данных
- Схема базы данных
- ГЛАВА 4. РАЗРАБОТКА СИСТЕМЫ
- Реализация основных модулей
- Работа с данными
- Сервис мониторинга снимков экрана
- Процессор обработки изображений
- Менеджер загрузки и управления моделями
- Интеграция технологий машинного обучения
- Реализация оптического распознавания символов
- Интеграция генеративного искусственного интеллекта
- Извлечение сущностей и аннотирование
- Разработка пользовательского интерфейса
- Разработка системы навигации
- Главный экран
- Экран отображения снимка экрана
- Реализация основных модулей
- ГЛАВА 5. ТЕСТИРОВАНИЕ СИСТЕМЫ
- Проверка работоспособности на разных устройствах
- Оценка быстродействия методов машинного обучения на разных устройствах
- ЗАКЛЮЧЕНИЕ
- СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
- ПРИЛОЖЕНИЯ
- Приложение 1. Полное описание ScreenshotRepositoryImpl
- Приложение 2. Полное описание MetadataRepositoryImpl
- Приложение 3. Полное описание ScreenshotMonitorService
- Приложение 4. Полное описание ScreenshotProcessor
- Приложение 5. Полное описание ModelManager
- Приложение 6. Полное описание ModelDownloadService
- Приложение 7. Полное описание MediaPipeVisualEngine
- Приложение 8. Полное описание EntityExtractionEngine
- Приложение 9. Полное описание ScreensenseNavHost
- Приложение 10. Полное описание MainViewModel
- Приложение 11. Полное описание ScreenshotViewViewModel
- Приложение 12. Полное описание ScreenshotProcessingService
Количество обращений: 0
За последние 30 дней: 0