Details
Title | Классификация болезней растений на ранних стадиях на основании гиперспектральных данных и методов машинного обучения: выпускная квалификационная работа магистра: направление 02.04.01 «Математика и компьютерные науки» ; образовательная программа 02.04.01_03 «Искусственный интеллект и машинное обучение» |
---|---|
Creators | Кузнецова Дарья Владимировна |
Scientific adviser | Мулюха Владимир Александрович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
Imprint | Санкт-Петербург, 2025 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | гиперспектральные данные ; машинное обучение ; классификация ; заболевания растений ; спектральные признаки ; shap ; предобработка ; интерпретируемость моделей ; hyperspectral data ; machine learning ; classification ; plant diseases ; spectral features ; preprocessing ; model interpretability |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 02.04.01 |
Speciality group (FGOS) | 020000 - Компьютерные и информационные науки |
DOI | 10.18720/SPBPU/3/2025/vr/vr25-3797 |
Rights | Доступ по паролю из сети Интернет (чтение) |
Additionally | New arrival |
Record key | ru\spstu\vkr\37442 |
Record create date | 9/19/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Работа посвящена разработке метода раннего выявления заболеваний растений на основе гиперспектральных данных с применением алгоритмов машинного обучения. Актуальность исследования обусловлена потребностью в своевременной диагностике фитопатологий в сельском хозяйстве и особенностями гиперспектральных данных — их высокой размерностью и избыточностью, что требует специализированных методов обработки и анализа. Целью работы является построение интерпретируемой и надёжной модели классификации, способной распознавать признаки заболевания по спектральным характеристикам растений. В рамках исследования реализован полный цикл анализа: от получения спектральных кривых до извлечения информативных признаков и обучения моделей. Использованы реальные данные пшеницы, поражённой стеблевой ржавчиной. Проведена предобработка (нормализация, сглаживание), сформированы различные типы признаков: агрегированные, производные, категориальные и экстремальные. Сравнены модели машинного обучения по метрикам F1, precision и recall. Для оценки интерпретируемости применён метод SHAP, позволивший выявить наиболее информативные спектральные диапазоны, влияющие на принятие решений моделью.
This study is devoted to the development of a method for early detection of plant diseases using hyperspectral data and machine learning algorithms. The relevance of the research stems from the need for timely phytopathology diagnosis in agriculture, as well as from the nature of hyperspectral data — high dimensionality and redundancy — which requires specialized methods of processing and analysis. The aim of the work is to build an interpretable and robust classification model capable of recognizing disease symptoms based on the spectral characteristics of plants. The research covers the full analysis pipeline: from generating spectral curves to extracting informative features and training classification models. Real data of wheat affected by stem rust were used. Preprocessing was carried out (including normalization and smoothing), and various types of features were engineered: aggregated, derivative-based, categorical, and extremum-based. Several machine learning models were compared using F1-score, precision, and recall. To assess interpretability, the SHAP method (SHapley Additive exPlanations) was applied, allowing identification of the most informative spectral regions contributing to model predictions.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 0
Last 30 days: 0