Детальная информация

Название Математические модели оптических и рентгеновских изображений и свойства группы природных и синтезируемых биологических объектов как сложных нелинейных физических систем: научный доклад: направление подготовки 11.06.01 «Электроника, радиотехника и системы связи» ; направленность 11.06.01_01 «Радиотехника, в том числе системы и устройства телевидения»
Авторы Шариати Фаридоддин
Научный руководитель Цыбин Олег Юрьевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт электроники и телекоммуникаций
Выходные сведения Санкт-Петербург, 2025
Коллекция Научные работы аспирантов/докторантов ; Общая коллекция
Тематика цифровая обработка изображений ; сегментация ; водораздел ; преобразование хафа ; радиомика ; текстурные признаки (glcm/haralick) ; glrlm ; слияние признаков ; глубокое обучение ; bioresnet-18 ; digital image processing ; segmentation ; watershed ; hough transform ; radiomics ; texture features (glcm/haralick) ; feature fusion ; deep learning
Тип документа Научный доклад
Тип файла Другой
Язык Русский
Уровень высшего образования Аспирантура
Код специальности ФГОС 11.06.01
Группа специальностей ФГОС 110000 - Электроника, радиотехника и системы связи
Права доступа Текст не доступен в соответствии с распоряжением СПбПУ от 11.04.2018 № 141
Дополнительно Новинка
Ключ записи ru\spstu\vkr\39389
Дата создания записи 15.10.2025

Научный доклад посвящён разработке интегрированного комплекса методов цифровой обработки изображений и гибридных алгоритмов искусственного интеллекта для радиотехнических и телевизионных систем. Цель работы — повысить точность анализа изображений за счёт сочетания корректной сегментации, извлечения и обработки признаков (feature extraction/processing) и специализированных архитектур глубокого обучения. Предложены и апробированы алгоритмы сегментации на основе маркер-контролируемого водораздела и преобразования Хафа, обеспечивающие устойчивое выделение структур при помехах и вариативности съёмки (Dice до 0.95, IoU до 0.91). Сформирована комплексная система признаков: геометрические, радиомические и текстурные (GLCM/Haralick, GLRLM), а также новые дескрипторы ATC, DTU и CTT, повышающие чувствительность к направленным и спектральным паттернам. Выполнена нормализация, отбор и слияние признаков (early/intermediate/late fusion); наилучшие результаты показало промежуточное слияние. Разработана гибридная архитектура BioResNet-18 с механизмами внимания и мультизадачным обучением (одновременная классификация и прогнозирование параметров обработки), дополненная средствами интерпретации Grad-CAM. Эксперименты на базе NSCLC-Radiogenomics (TCIA) подтвердили рост точности классификации мутаций EGFR/KRAS и устойчивости сегментации: Accuracy до 98.6%, AUC до 0.97, Dice до 0.95; прирост Accuracy 5–7% и AUC 4–6% относительно традиционных подходов. Научная новизна состоит в интеграции классических методов обработки, новых текстурных признаков и гибридной нейросетевой архитектуры для мультизадачного анализа. Практическая значимость — возможность внедрения в интеллектуальные системы технического зрения, мониторинга, диагностики и телевизионные комплексы. Ключевые слова: цифровая обработка изображений, сегментация, водораздел, преобразование Хафа, радиомика, GLCM, GLRLM, ATC, DTU, CTT, feature fusion, глубокое обучение, BioResNet-18, Grad-CAM, EGFR, KRAS, NSCLC-Radiogenomics.

This research report develops an integrated framework that combines robust image segmentation, feature extraction/processing, and tailored deep-learning architectures for analysis in radio engineering and television systems. The goal is to improve accuracy and robustness of image understanding under noise and acquisition variability. We propose marker-controlled watershed and Hough-transform–based segmentation, achieving reliable object delineation (Dice up to 0.95, IoU up to 0.91). A comprehensive feature suite is constructed: geometric, radiomic and texture descriptors (GLCM/Haralick, GLRLM), complemented by three novel descriptors—ATC, DTU, and CTT—that enhance sensitivity to spectral and directional patterns. Feature normalization, selection, and multi-modal fusion (early/intermediate/late) are studied; intermediate fusion yields the best performance. A hybrid BioResNet-18 architecture with attention and multi-task learning is introduced to jointly perform image classification and parameter prediction, with model interpretability provided by Grad-CAM. Experiments on the TCIA NSCLC-Radiogenomics dataset demonstrate improved detection of EGFR/KRAS mutations and robust segmentation: Accuracy up to 98.6%, AUC up to 0.97, and Dice up to 0.95, corresponding to 5–7% Accuracy and 4–6% AUC gains over conventional baselines. The novelty lies in integrating classical image processing, new texture descriptors, and a hybrid deep model for multi-task analysis. Practical impact includes deployment in intelligent machine-vision, monitoring/diagnostics, and television systems. Keywords: digital image processing, segmentation, watershed, Hough transform, radiomics, GLCM, GLRLM, ATC, DTU, CTT, feature fusion, deep learning, BioResNet-18, Grad-CAM, EGFR, KRAS, NSCLC-Radiogenomics.