Выявление заболеваний сердца с использованием методов интеллектуального анализа данных: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии»

Данилова, Влада Вадимовна

Details

Title	Выявление заболеваний сердца с использованием методов интеллектуального анализа данных: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии»
Creators	Данилова Влада Вадимовна
Scientific adviser	Нестеров Сергей Александрович
Other creators	Магер Владимир Евстафьевич
Organization	Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint	Санкт-Петербург, 2021
Collection	Выпускные квалификационные работы ; Общая коллекция
Subjects	язык R ; классификация ; интеллектуальный анализ данных ; метод главных компонент ; множественный анализ соответствий ; R language ; classification ; data mining ; principal component analysis ; multiple correspondence analysis
Document type	Bachelor graduation qualification work
File type	PDF
Language	Russian
Level of education	Bachelor
Speciality code (FGOS)	09.03.02
Speciality group (FGOS)	090000 - Информатика и вычислительная техника
Links	Отзыв руководителя ; Отчет о проверке на объем и корректность внешних заимствований
DOI	10.18720/SPBPU/3/2021/vr/vr21-1987
Rights	Доступ по паролю из сети Интернет (чтение, печать)
Record key	ru\spstu\vkr\14882
Record create date	9/24/2021

Allowed Actions

–

Action 'Read' will be available if you login or access site from another network

Group	Anonymous
Network	Internet

Тема выпускной квалификационной работы: «Выявление заболеваний сердца с использованием методов интеллектуального анализа данных». Данная работа посвящена прогнозированию сердечно-сосудистых заболеваний на основе 70000 записей пациентов с использованием интеллектуального анализа данных с помощью языка программирования R. Задачи, которые решались в ходе выполнения данной работы: 1. Изучение методов интеллектуального анализа данных. 2. Изучение атрибутов набора данных для дальнейшей интерпретации. 3. Подготовка данных. 4. Анализ данных с помощью методов главных компонент и множественного анализа соответствий. 5. Прогнозирование данных с помощью различных методов классификации. 6. Сравнение эффективности методов. Работа проведена на базе набора данных о пациентов, полученного с сайта Kaggle [16]. Набор содержит в себе 70000 записей с 14 атрибутами (возраст, вес, рост, показания холестерина и т.д.). Был проведен анализ данного набора с помощью методов главных компонент и множественного анализа соответствий для выявления наиболее влияющих на прогноз атрибутов. Далее данные были разделены на тестовые и тренировочные для обучения и проверки моделей интеллектуального анализа данных. В результате были получены оценки точности моделей классификации. На основе полученных данных был сделан вывод об эффективности методов классификации.

The subject of the graduate qualification work: "Detection of heart diseases using data mining methods". The given work is devoted to the prediction of cardiovascular diseases based on 70,000 patient records using data mining with R programming language. The research set the following goals: 1. Study of data mining methods. 2. Study the attributes of the dataset for further interpretation. 3. Data preparation. 4. Data analysis using principal component analysis and multiple correspondence analysis. 5. Forecasting data using various classification methods. 6. Comparison of the effectiveness of the methods. The work was fulfilled based on a set of patient data obtained from the Kaggle website [16]. The set contains 70,000 records with 14 attributes (age, weight, height, cholesterol, etc.). The analysis of this set was carried out using the methods of principal components and multiple correspondence analysis to identify the most influential attributes on the forecast. Further, the data was divided into test and training data for training and testing data mining models. As a result, estimates of the accuracy of classification models were obtained. Based on the data obtained, a conclusion was made about the effectiveness of the classification methods.

Network	User group	Action
ILC SPbPU Local Network	All
Internet	Authorized users SPbPU
Internet	Anonymous

Access count: 33
Last 30 days: 0

Detailed usage statistics