Details

Title Detection and Segmentation of Polyps in Colonoscopy Images Using RTDETR and U-Net++ Networks: выпускная квалификационная работа магистра: направление 09.04.01 «Информатика и вычислительная техника» ; образовательная программа 09.04.01_17 «Интеллектуальные системы (международная образовательная программа) / Intelligent Systems (International Educational Program)» = Обнаружение и сегментация полипов на колоноскопических изображениях с использованием сетей RTDETR и U-Net++
Creators Ло Вэйчжи
Scientific adviser Малыхина Галина Федоровна
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects early colorectal cancer ; colonic polyps ; deep learning ; object detection ; semantic segmentation ; ранний колоректальный рак ; полипы ободочной кишки ; глубокое обучение ; обнаружение объектов ; семантическая сегментация
Document type Master graduation qualification work
Language Russian
Level of education Master
Speciality code (FGOS) 09.04.01
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/3/2025/vr/vr26-348
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Additionally New arrival
Record key ru\spstu\vkr\39868
Record create date 2/24/2026

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Colorectal cancer remains a major global public health concern, and is one of the most frequently diagnosed digestive tract cancers. Studies show that around 90% of colorectal cancers originate from colorectal polyps, making early screening and diagnosis essential for prevention. This thesis proposes a deep learning-based approach for detecting colon polyps during colonoscopy by integrating object detection and image segmentation. The thesis research utilizes publicly available datasets including LDPolypVideo, CVC-ClinicDB, and Kvasir-SEG. For polyp detection, the RT-DETR model is improved by replacing its backbone with a lightweight version and optimizing key modules. The enhanced model achieves an mAP@0.5 of 0.932 (93.2%) with a compact parameter size of 28.15 MB. For segmentation, a multi-scale edge fusion network (MS-UNet++) is designed to handle complex polyp boundaries and reduce edge blurring. Enhancements include an edge fusion module, a MSCFA structure for effective Multi scale feature extraction, and the MS-CBAM++ attention mechanism to further improve accuracy. Experimental results demonstrate that the proposed method offers high performance in both detection and segmentation tasks, providing a reliable auxiliary tool for clinical diagnosis of colorectal polyps.

Колоректальный рак остаётся одной из основных проблем общественного здравоохранения в мире и является одним из наиболее часто диагностируемых злокачественных новообразований желудочно-кишечного тракта. Согласно исследованиям, около 90% случаев колоректального рака развиваются из колоректальных полипов, что делает ранний скрининг и диагностику крайне важными мерами профилактики. В данной диссертации предлагается метод обнаружения полипов ободочной кишки на основе глубокого обучения, сочетающий в себе задачи детекции объектов и сегментации изображений при проведении колоноскопии. В работе используются открытые наборы данных: LDPolypVideo, CVC-ClinicDB и Kvasir-SEG. Для задачи обнаружения полипов была усовершенствована модель RT-DETR путём замены её базовой архитектуры на облегчённую версию и оптимизации ключевых модулей. Улучшенная модель достигла значения mAP@0.5, равного 0.932 (93.2%) при размере параметров всего 28.15 МБ. Для сегментации разработана многоуровневая сеть с объединением границ (MS-UNet++), предназначенная для обработки сложных контуров полипов и уменьшения эффекта размытости на границах. Дополнительно были внедрены модуль слияния границ, структура MSCFA для эффективного многомасштабного извлечения признаков и механизм внимания MS-CBAM++, улучшающий точность сегментации. Результаты экспериментов показывают, что предложенный метод демонстрирует высокую эффективность как в задачах детекции, так и сегментации, обеспечивая надёжную вспомогательную диагностику полипов ободочной кишки в клинической практике.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous
  • INTRODUCTION
  • 1 Current research status
    • 1.1 Research status of target detection technology for colon polyps
    • 1.2 Research status of colon polyp image segmentation technology
    • 1.3 Problems with colon polyp detection technology
    • 1.4 Main research content of this thesis
  • 2 Related technology and theoretical basis
    • 2.1 Introduction to colonoscopy images
    • 2.2 Convolutional neural network
    • 2.3 Theoretical basis of attention mechanism
    • 2.4 Theoretical basis of the object detection algorithm
    • 2.4.1 Single-stage algorithm
    • 2.4.2 Two-stage algorithm
    • 2.5 Theoretical basis of image segmentation technology
    • 2.5.1 Traditional image segmentation method
    • 2.5.2 Image semantic segmentation method based on deep learning
    • 3 Colonoscopy data preprocessing and enhancement
    • 3.1 Background analysis
    • 3.2 Introduction and preprocessing of colonoscopy image dataSets
    • 3.2.1 Introduction to the colonoscopy image dataSets
    • 3.2.2 Image preprocessing
    • 3.3 Data enhancement
    • 3.4 Summary of this chapter
    • 4 Colonoscopic polyp detection based on RT-DETR network
    • 4.1 Overview of Transformer model
    • 4.2 DETR model theory
    • 4.3 RT-DETR detection algorithm
    • 4.3.1 RT-DETR network structure
    • 4.3.2 The Loss function of RT-DETR
    • 4.4 RT-DETR model improvement
    • 4.4.1 Enhancement of the backbone network
    • 4.4.2 Enhancement of AIFI
    • 4.4.3 Enhancement of the feature fusion module
    • 4.4.4 Improvement of upsampling
    • 4.5 Experiments and results analysis
    • 4.5.1 Experimental environment and parameter settings
    • 4.5.2 Performance Evaluation Indicator
    • 4.5.3 Performance comparison experiment
    • 4.5.4 Backbone ablation experiment
    • 4.6 Summary of this chapter
    • 5 Colonoscopic polyp segmentation based on U-Net++ network
    • 5.1 Background Analysis
    • 5.2 MS-UNet++ Segmentation Network
    • 5.2.1 Edge Blending Module
    • 5.2.2 Multi-Scale Convolutional Feature Attention Module
    • 5.2.3 MS-CBAM++ attention mechanism
    • 5.2.4 The Loss function of MS-UNet++
    • 5.3 Experiment and Analysis
    • 5.3.1 Experimental environment and parameter settings
    • 5.3.2 Performance Evaluation Indicator
    • 5.3.3 Model training process
    • 5.3.4 Performance comparison experiment
    • 5.3.5 Ablation experiment
    • 5.4 Summary of this chapter
  • CONCLUSION
  • REFRENCE LIST

Access count: 0 
Last 30 days: 0

Detailed usage statistics