Детальная информация

Название: Выявление заболеваний сердца с использованием методов интеллектуального анализа данных: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии»
Авторы: Данилова Влада Вадимовна
Научный руководитель: Нестеров Сергей Александрович
Другие авторы: Магер Владимир Евстафьевич
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2021
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: язык R; классификация; интеллектуальный анализ данных; метод главных компонент; множественный анализ соответствий; R language; classification; data mining; principal component analysis; multiple correspondence analysis
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 09.03.02
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
Ссылки: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2021/vr/vr21-1987
Права доступа: Доступ по паролю из сети Интернет (чтение, печать)
Ключ записи: ru\spstu\vkr\14882

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Тема выпускной квалификационной работы: «Выявление заболеваний сердца с использованием методов интеллектуального анализа данных». Данная работа посвящена прогнозированию сердечно-сосудистых заболеваний на основе 70000 записей пациентов с использованием интеллектуального анализа данных с помощью языка программирования R. Задачи, которые решались в ходе выполнения данной работы: 1. Изучение методов интеллектуального анализа данных. 2. Изучение атрибутов набора данных для дальнейшей интерпретации. 3. Подготовка данных. 4. Анализ данных с помощью методов главных компонент и множественного анализа соответствий. 5. Прогнозирование данных с помощью различных методов классификации. 6. Сравнение эффективности методов. Работа проведена на базе набора данных о пациентов, полученного с сайта Kaggle [16]. Набор содержит в себе 70000 записей с 14 атрибутами (возраст, вес, рост, показания холестерина и т.д.). Был проведен анализ данного набора с помощью методов главных компонент и множественного анализа соответствий для выявления наиболее влияющих на прогноз атрибутов. Далее данные были разделены на тестовые и тренировочные для обучения и проверки моделей интеллектуального анализа данных. В результате были получены оценки точности моделей классификации. На основе полученных данных был сделан вывод об эффективности методов классификации.

The subject of the graduate qualification work: "Detection of heart diseases using data mining methods". The given work is devoted to the prediction of cardiovascular diseases based on 70,000 patient records using data mining with R programming language. The research set the following goals: 1. Study of data mining methods. 2. Study the attributes of the dataset for further interpretation. 3. Data preparation. 4. Data analysis using principal component analysis and multiple correspondence analysis. 5. Forecasting data using various classification methods. 6. Comparison of the effectiveness of the methods. The work was fulfilled based on a set of patient data obtained from the Kaggle website [16]. The set contains 70,000 records with 14 attributes (age, weight, height, cholesterol, etc.). The analysis of this set was carried out using the methods of principal components and multiple correspondence analysis to identify the most influential attributes on the forecast. Further, the data was divided into test and training data for training and testing data mining models. As a result, estimates of the accuracy of classification models were obtained. Based on the data obtained, a conclusion was made about the effectiveness of the classification methods.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать
Интернет Авторизованные пользователи СПбПУ Прочитать Печать
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 30
За последние 30 дней: 1
Подробная статистика