Details

Title Разработка алгоритма обработки по совмещению сдвинутых и повёрнутых изображений объектов с привлечением методов искусственного интеллекта: выпускная квалификационная работа бакалавра: направление 02.03.01 «Математика и компьютерные науки» ; образовательная программа 02.03.01_01 «Системы искусственного интеллекта и суперкомпьютерные технологии»
Creators Орлов Игорь Вячеславович
Scientific adviser Глазунов Вадим Валерьевич
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects регистрация изображений ; аффинное выравнивание ; ORB ; LoFTR ; StudentNet ; ECC ; RANSAC ; гибридный конвейер ; image registration ; affine alignment ; hybrid pipeline
Document type Bachelor graduation qualification work
File type PDF
Language Russian
Level of education Bachelor
Speciality code (FGOS) 02.03.01
Speciality group (FGOS) 020000 - Компьютерные и информационные науки
DOI 10.18720/SPBPU/3/2025/vr/vr25-2946
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\37198
Record create date 9/19/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Цель. Создать гибридный конвейер Adaptive-Hybrid Alignment(AHA), обеспечивающий субпиксельную точность и время обработки<40 мс на пару спутниковых кадров. Выполненные задачи 1. Проанализированы классические (SIFT, ORB, ECC) и глубокие (SuperPoint, LoFTR) методы. 2. Сгенерирован датасет из 500 пар 256 ×256 px; «истина» получена sparse→dense-дистилляцией LoFTR. 3. Обучена сиамская сеть StudentNet (MobileNetV2→FC(3)) для прямой регрессии θ,∆x,∆y. 4. Собран четырёхслойный конвейер StudentNet→ORB→LoFTR→ECC с автопереключением по NCC и числу inliers. 5. Реализован прототип (Python, PyTorch, OpenCV) и проведена экспериментальная оценка. Результаты – Средние ошибки на 500 парах: MAEθ = 0.037◦, MAE∆x = 2.26 px, MAE∆y = 2.21 px; время 17 мс (GPU T4). – 92% сцен обрабатываются слоями StudentNet+ORB;  LoFTR нужен лишь в 8 % «трудных» случаев. – Дистилляция знаний позволяет StudentNet давать погрешность ≈2 px, достаточную для субпиксельной доводки ECC. Практическая значимость. AHA готов к интеграции в навигацию БПЛА, геопривязку сцен, стабилизацию видео и медицинскую томографию; код адаптирован для серверов и edge-устройств.

Objective. Design a hybrid pipeline (Adaptive-Hybrid Alignment, AHA) that reaches sub-pixel accuracy under real-time constraints. Tasks 1. Reviewed feature-, intensity- and deep-learning registration methods. 2. Built a synthetic benchmark (500 pairs, 256 ×256 px); ground truth via LoFTR sparse-to-dense distillation. 3. Trained a lightweight siamese CNN (StudentNet) to regress θ,∆x,∆y. 4. Assembled a four-tier pipeline: StudentNet→ORB/RANSAC→LoFTR/RANSAC→ECC. 5. Implemented the prototype (Python 3.9, PyTorch 2.x, OpenCV 4.x) and ran extensive tests. Results – Achieved MAEθ = 0.037◦and MAE∆ = 2.2 px in 17 ms per pair (GPU T4). – StudentNet alone solved 28 % of cases and, with ORB, covered 92 %; LoFTR was required for only 8 % hardest scenes. – The hybrid design merges the speed of key-point methods with transformer-level robustness. Practical value. AHA is ready for UAV navigation, satellite mosaicking, video stabilisation and medical slice stitching; it runs without a high-end GPU.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous
  • СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ
  • ВВЕДЕНИЕ
  • Основы совмещения изображений и классические методы
    • Основные понятия задачи совмещения изображений
    • Классические методы совмещения изображений
    • Преимущества и недостатки существующих методов
  • Применение методов искусственного интеллекта в обработке изображений
    • Общие подходы ИИ в обработке изображений
    • Глубокое обучение для совмещения изображений
    • Преимущества и ограничения методов ИИ
  • Формальная постановка задачи
    • Исходные данные и цель
    • Подзадачи
    • Ограничения
    • Критерии качества
    • Критерии оценки качества совмещения
  • Метод решения
    • Мотивация и общие требования
    • Слои конвейера и их предназначение
    • Логика включения слоёв
    • Факторы, повлиявшие на выбор компонентов
    • Оценка вычислительной состоятельности
    • Ожидаемые количественные характеристики
  • Разработка алгоритма
    • Общая схема работы Adaptive-Hybrid Alignment (AHA)
    • Архитектура и обоснование выбора StudentNet
      • Дистилляция с помощью LoFTR и разметка данных
    • Метрики уверенности и процедура refine_ecc
    • Входные и выходные данные системы
      • Блок-схема и архитектурные решения
      • Реализация student_predict и оценка качества
  • Результаты работы. проведение экспериментов
    • Экспериментальная методика
    • Покрытие слоёв и сводные метрики
    • Качественные примеры
    • Интерпретация результатов
    • ЗАКЛЮЧЕНИЕ
  • Список использованных источников
    • ПРИЛОЖЕНИЕ А

Access count: 0 
Last 30 days: 0

Detailed usage statistics