Table | Card | RUSMARC | |
Allowed Actions: –
Action 'Read' will be available if you login or access site from another network
Group: Anonymous Network: Internet |
Annotation
Тема выпускной квалификационной работы: «Выявление заболеваний сердца с использованием методов интеллектуального анализа данных». Данная работа посвящена прогнозированию сердечно-сосудистых заболеваний на основе 70000 записей пациентов с использованием интеллектуального анализа данных с помощью языка программирования R. Задачи, которые решались в ходе выполнения данной работы: 1. Изучение методов интеллектуального анализа данных. 2. Изучение атрибутов набора данных для дальнейшей интерпретации. 3. Подготовка данных. 4. Анализ данных с помощью методов главных компонент и множественного анализа соответствий. 5. Прогнозирование данных с помощью различных методов классификации. 6. Сравнение эффективности методов. Работа проведена на базе набора данных о пациентов, полученного с сайта Kaggle [16]. Набор содержит в себе 70000 записей с 14 атрибутами (возраст, вес, рост, показания холестерина и т.д.). Был проведен анализ данного набора с помощью методов главных компонент и множественного анализа соответствий для выявления наиболее влияющих на прогноз атрибутов. Далее данные были разделены на тестовые и тренировочные для обучения и проверки моделей интеллектуального анализа данных. В результате были получены оценки точности моделей классификации. На основе полученных данных был сделан вывод об эффективности методов классификации.
The subject of the graduate qualification work: "Detection of heart diseases using data mining methods". The given work is devoted to the prediction of cardiovascular diseases based on 70,000 patient records using data mining with R programming language. The research set the following goals: 1. Study of data mining methods. 2. Study the attributes of the dataset for further interpretation. 3. Data preparation. 4. Data analysis using principal component analysis and multiple correspondence analysis. 5. Forecasting data using various classification methods. 6. Comparison of the effectiveness of the methods. The work was fulfilled based on a set of patient data obtained from the Kaggle website [16]. The set contains 70,000 records with 14 attributes (age, weight, height, cholesterol, etc.). The analysis of this set was carried out using the methods of principal components and multiple correspondence analysis to identify the most influential attributes on the forecast. Further, the data was divided into test and training data for training and testing data mining models. As a result, estimates of the accuracy of classification models were obtained. Based on the data obtained, a conclusion was made about the effectiveness of the classification methods.
Document access rights
Network | User group | Action | ||||
---|---|---|---|---|---|---|
ILC SPbPU Local Network | All |
![]() ![]() |
||||
External organizations N2 | All |
![]() |
||||
External organizations N1 | All | |||||
Internet | Authorized users SPbPU |
![]() ![]() |
||||
Internet | Authorized users (not from SPbPU, N2) |
![]() |
||||
Internet | Authorized users (not from SPbPU, N1) | |||||
![]() |
Internet | Anonymous |
Usage statistics
|
Access count: 26
Last 30 days: 0 Detailed usage statistics |