Details
Title | Математические модели оптических и рентгеновских изображений и свойства группы природных и синтезируемых биологических объектов как сложных нелинейных физических систем: научный доклад: направление подготовки 11.06.01 «Электроника, радиотехника и системы связи» ; направленность 11.06.01_01 «Радиотехника, в том числе системы и устройства телевидения» |
---|---|
Creators | Шариати Фаридоддин |
Scientific adviser | Цыбин Олег Юрьевич |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт электроники и телекоммуникаций |
Imprint | Санкт-Петербург, 2025 |
Collection | Научные работы аспирантов/докторантов ; Общая коллекция |
Subjects | цифровая обработка изображений ; сегментация ; водораздел ; преобразование хафа ; радиомика ; текстурные признаки (glcm/haralick) ; glrlm ; слияние признаков ; глубокое обучение ; bioresnet-18 ; digital image processing ; segmentation ; watershed ; hough transform ; radiomics ; texture features (glcm/haralick) ; feature fusion ; deep learning |
Document type | Scientific report |
File type | Other |
Language | Russian |
Level of education | Graduate student |
Speciality code (FGOS) | 11.06.01 |
Speciality group (FGOS) | 110000 - Электроника, радиотехника и системы связи |
Rights | Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141 |
Additionally | New arrival |
Record key | ru\spstu\vkr\39389 |
Record create date | 10/15/2025 |
Научный доклад посвящён разработке интегрированного комплекса методов цифровой обработки изображений и гибридных алгоритмов искусственного интеллекта для радиотехнических и телевизионных систем. Цель работы — повысить точность анализа изображений за счёт сочетания корректной сегментации, извлечения и обработки признаков (feature extraction/processing) и специализированных архитектур глубокого обучения. Предложены и апробированы алгоритмы сегментации на основе маркер-контролируемого водораздела и преобразования Хафа, обеспечивающие устойчивое выделение структур при помехах и вариативности съёмки (Dice до 0.95, IoU до 0.91). Сформирована комплексная система признаков: геометрические, радиомические и текстурные (GLCM/Haralick, GLRLM), а также новые дескрипторы ATC, DTU и CTT, повышающие чувствительность к направленным и спектральным паттернам. Выполнена нормализация, отбор и слияние признаков (early/intermediate/late fusion); наилучшие результаты показало промежуточное слияние. Разработана гибридная архитектура BioResNet-18 с механизмами внимания и мультизадачным обучением (одновременная классификация и прогнозирование параметров обработки), дополненная средствами интерпретации Grad-CAM. Эксперименты на базе NSCLC-Radiogenomics (TCIA) подтвердили рост точности классификации мутаций EGFR/KRAS и устойчивости сегментации: Accuracy до 98.6%, AUC до 0.97, Dice до 0.95; прирост Accuracy 5–7% и AUC 4–6% относительно традиционных подходов. Научная новизна состоит в интеграции классических методов обработки, новых текстурных признаков и гибридной нейросетевой архитектуры для мультизадачного анализа. Практическая значимость — возможность внедрения в интеллектуальные системы технического зрения, мониторинга, диагностики и телевизионные комплексы. Ключевые слова: цифровая обработка изображений, сегментация, водораздел, преобразование Хафа, радиомика, GLCM, GLRLM, ATC, DTU, CTT, feature fusion, глубокое обучение, BioResNet-18, Grad-CAM, EGFR, KRAS, NSCLC-Radiogenomics.
This research report develops an integrated framework that combines robust image segmentation, feature extraction/processing, and tailored deep-learning architectures for analysis in radio engineering and television systems. The goal is to improve accuracy and robustness of image understanding under noise and acquisition variability. We propose marker-controlled watershed and Hough-transform–based segmentation, achieving reliable object delineation (Dice up to 0.95, IoU up to 0.91). A comprehensive feature suite is constructed: geometric, radiomic and texture descriptors (GLCM/Haralick, GLRLM), complemented by three novel descriptors—ATC, DTU, and CTT—that enhance sensitivity to spectral and directional patterns. Feature normalization, selection, and multi-modal fusion (early/intermediate/late) are studied; intermediate fusion yields the best performance. A hybrid BioResNet-18 architecture with attention and multi-task learning is introduced to jointly perform image classification and parameter prediction, with model interpretability provided by Grad-CAM. Experiments on the TCIA NSCLC-Radiogenomics dataset demonstrate improved detection of EGFR/KRAS mutations and robust segmentation: Accuracy up to 98.6%, AUC up to 0.97, and Dice up to 0.95, corresponding to 5–7% Accuracy and 4–6% AUC gains over conventional baselines. The novelty lies in integrating classical image processing, new texture descriptors, and a hybrid deep model for multi-task analysis. Practical impact includes deployment in intelligent machine-vision, monitoring/diagnostics, and television systems. Keywords: digital image processing, segmentation, watershed, Hough transform, radiomics, GLCM, GLRLM, ATC, DTU, CTT, feature fusion, deep learning, BioResNet-18, Grad-CAM, EGFR, KRAS, NSCLC-Radiogenomics.