Details
Title | Разработка алгоритма обработки по совмещению сдвинутых и повёрнутых изображений объектов с привлечением методов искусственного интеллекта: выпускная квалификационная работа бакалавра: направление 02.03.01 «Математика и компьютерные науки» ; образовательная программа 02.03.01_01 «Системы искусственного интеллекта и суперкомпьютерные технологии» |
---|---|
Creators | Орлов Игорь Вячеславович |
Scientific adviser | Глазунов Вадим Валерьевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | регистрация изображений ; аффинное выравнивание ; ORB ; LoFTR ; StudentNet ; ECC ; RANSAC ; гибридный конвейер ; image registration ; affine alignment ; hybrid pipeline |
Document type | Bachelor graduation qualification work |
File type | |
Language | Russian |
Level of education | Bachelor |
Speciality code (FGOS) | 02.03.01 |
Speciality group (FGOS) | 020000 - Компьютерные и информационные науки |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-2946 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Additionally | New arrival |
Record key | ru\spstu\vkr\37198 |
Record create date | 9/19/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Цель. Создать гибридный конвейер Adaptive-Hybrid Alignment(AHA), обеспечивающий субпиксельную точность и время обработки<40 мс на пару спутниковых кадров. Выполненные задачи 1. Проанализированы классические (SIFT, ORB, ECC) и глубокие (SuperPoint, LoFTR) методы. 2. Сгенерирован датасет из 500 пар 256 ×256 px; «истина» получена sparse→dense-дистилляцией LoFTR. 3. Обучена сиамская сеть StudentNet (MobileNetV2→FC(3)) для прямой регрессии θ,∆x,∆y. 4. Собран четырёхслойный конвейер StudentNet→ORB→LoFTR→ECC с автопереключением по NCC и числу inliers. 5. Реализован прототип (Python, PyTorch, OpenCV) и проведена экспериментальная оценка. Результаты – Средние ошибки на 500 парах: MAEθ = 0.037◦, MAE∆x = 2.26 px, MAE∆y = 2.21 px; время 17 мс (GPU T4). – 92% сцен обрабатываются слоями StudentNet+ORB; LoFTR нужен лишь в 8 % «трудных» случаев. – Дистилляция знаний позволяет StudentNet давать погрешность ≈2 px, достаточную для субпиксельной доводки ECC. Практическая значимость. AHA готов к интеграции в навигацию БПЛА, геопривязку сцен, стабилизацию видео и медицинскую томографию; код адаптирован для серверов и edge-устройств.
Objective. Design a hybrid pipeline (Adaptive-Hybrid Alignment, AHA) that reaches sub-pixel accuracy under real-time constraints. Tasks 1. Reviewed feature-, intensity- and deep-learning registration methods. 2. Built a synthetic benchmark (500 pairs, 256 ×256 px); ground truth via LoFTR sparse-to-dense distillation. 3. Trained a lightweight siamese CNN (StudentNet) to regress θ,∆x,∆y. 4. Assembled a four-tier pipeline: StudentNet→ORB/RANSAC→LoFTR/RANSAC→ECC. 5. Implemented the prototype (Python 3.9, PyTorch 2.x, OpenCV 4.x) and ran extensive tests. Results – Achieved MAEθ = 0.037◦and MAE∆ = 2.2 px in 17 ms per pair (GPU T4). – StudentNet alone solved 28 % of cases and, with ORB, covered 92 %; LoFTR was required for only 8 % hardest scenes. – The hybrid design merges the speed of key-point methods with transformer-level robustness. Practical value. AHA is ready for UAV navigation, satellite mosaicking, video stabilisation and medical slice stitching; it runs without a high-end GPU.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
- СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ
- ВВЕДЕНИЕ
- Основы совмещения изображений и классические методы
- Основные понятия задачи совмещения изображений
- Классические методы совмещения изображений
- Преимущества и недостатки существующих методов
- Применение методов искусственного интеллекта в обработке изображений
- Общие подходы ИИ в обработке изображений
- Глубокое обучение для совмещения изображений
- Преимущества и ограничения методов ИИ
- Формальная постановка задачи
- Исходные данные и цель
- Подзадачи
- Ограничения
- Критерии качества
- Критерии оценки качества совмещения
- Метод решения
- Мотивация и общие требования
- Слои конвейера и их предназначение
- Логика включения слоёв
- Факторы, повлиявшие на выбор компонентов
- Оценка вычислительной состоятельности
- Ожидаемые количественные характеристики
- Разработка алгоритма
- Общая схема работы Adaptive-Hybrid Alignment (AHA)
- Архитектура и обоснование выбора StudentNet
- Дистилляция с помощью LoFTR и разметка данных
- Метрики уверенности и процедура refine_ecc
- Входные и выходные данные системы
- Блок-схема и архитектурные решения
- Реализация student_predict и оценка качества
- Результаты работы. проведение экспериментов
- Экспериментальная методика
- Покрытие слоёв и сводные метрики
- Качественные примеры
- Интерпретация результатов
- ЗАКЛЮЧЕНИЕ
- Список использованных источников
- ПРИЛОЖЕНИЕ А
Access count: 0
Last 30 days: 0