Details

Title: Выявление заболеваний сердца с использованием методов интеллектуального анализа данных: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии»
Creators: Данилова Влада Вадимовна
Scientific adviser: Нестеров Сергей Александрович
Other creators: Магер Владимир Евстафьевич
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2021
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: язык R; классификация; интеллектуальный анализ данных; метод главных компонент; множественный анализ соответствий; R language; classification; data mining; principal component analysis; multiple correspondence analysis
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 09.03.02
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
Links: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2021/vr/vr21-1987
Rights: Доступ по паролю из сети Интернет (чтение, печать)
Record key: ru\spstu\vkr\14882

Allowed Actions:

Action 'Read' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Тема выпускной квалификационной работы: «Выявление заболеваний сердца с использованием методов интеллектуального анализа данных». Данная работа посвящена прогнозированию сердечно-сосудистых заболеваний на основе 70000 записей пациентов с использованием интеллектуального анализа данных с помощью языка программирования R. Задачи, которые решались в ходе выполнения данной работы: 1. Изучение методов интеллектуального анализа данных. 2. Изучение атрибутов набора данных для дальнейшей интерпретации. 3. Подготовка данных. 4. Анализ данных с помощью методов главных компонент и множественного анализа соответствий. 5. Прогнозирование данных с помощью различных методов классификации. 6. Сравнение эффективности методов. Работа проведена на базе набора данных о пациентов, полученного с сайта Kaggle [16]. Набор содержит в себе 70000 записей с 14 атрибутами (возраст, вес, рост, показания холестерина и т.д.). Был проведен анализ данного набора с помощью методов главных компонент и множественного анализа соответствий для выявления наиболее влияющих на прогноз атрибутов. Далее данные были разделены на тестовые и тренировочные для обучения и проверки моделей интеллектуального анализа данных. В результате были получены оценки точности моделей классификации. На основе полученных данных был сделан вывод об эффективности методов классификации.

The subject of the graduate qualification work: "Detection of heart diseases using data mining methods". The given work is devoted to the prediction of cardiovascular diseases based on 70,000 patient records using data mining with R programming language. The research set the following goals: 1. Study of data mining methods. 2. Study the attributes of the dataset for further interpretation. 3. Data preparation. 4. Data analysis using principal component analysis and multiple correspondence analysis. 5. Forecasting data using various classification methods. 6. Comparison of the effectiveness of the methods. The work was fulfilled based on a set of patient data obtained from the Kaggle website [16]. The set contains 70,000 records with 14 attributes (age, weight, height, cholesterol, etc.). The analysis of this set was carried out using the methods of principal components and multiple correspondence analysis to identify the most influential attributes on the forecast. Further, the data was divided into test and training data for training and testing data mining models. As a result, estimates of the accuracy of classification models were obtained. Based on the data obtained, a conclusion was made about the effectiveness of the classification methods.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print
Internet Authorized users SPbPU Read Print
-> Internet Anonymous

Usage statistics

stat Access count: 30
Last 30 days: 1
Detailed usage statistics