Details
Title | Методы анализа данных средствами R и СУБД MS SQL Server: магистерская диссертация: 09.04.02 |
---|---|
Creators | Пацульда Полина Вячеславовна |
Scientific adviser | Нестеров Сергей Александрович |
Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий |
Imprint | Санкт-Петербург, 2016 |
Collection | Выпускные квалификационные работы ; Общая коллекция |
Subjects | Базы данных ; Нейронные сети ; Программирования языки ; интеллектуальный анализ данных ; кластеризация ; data mining ; clustering |
UDC | 004.655.3(043.3) |
Document type | Master graduation qualification work |
File type | |
Language | Russian |
Level of education | Master |
Speciality code (FGOS) | 09.04.02 |
Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
DOI | 10.18720/SPBPU/2/v16-2815 |
Rights | Доступ по паролю из сети Интернет (чтение, печать, копирование) |
Record key | RU\SPSTU\edoc\35368 |
Record create date | 12/29/2016 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group | Anonymous |
---|---|
Network | Internet |
Настоящая работа посвящена методам интеллектуального анализа данных средствами языка R и СУБД SQL Server. Работа состоит из введения, трех разделов, заключения. Во введении отражена актуальность задачи и описаны основные требования к работе. В первой главе проведен обзор аналитических задач в различных постановках и методов их решения. Были рассмотрены следующие задачи: поиск ассоциаций, классификация, кластеризация, анализ временных рядов, визуализация результатов. Во второй главе проводилась работа с реляционной базой данных средствами R и MS SQL Server. В третьей главе была проделана работа с плохо структурированными данными, а именно, проведен анализ тональности высказываний в социальной сети. Заключение включает основные выводы по работе.
The aim of this thesis is to investigate data analysis and data mining methods presented in MS SQL Server and R. This thesis first examines various mining methods used in data analysis in different situations. The following problem types were considered: clustering, association rules, classification, time series and visualization. In a second stage the work with relational database was performed. The relevant methods were applied to the specific problem in order to build mining models with MS SQL Server and R for clustering, classification and prediction purposes. Finally, the specific R tools for the analysis of poorly structured data were used and the Twitter posts sentiment analysis was performed.
Network | User group | Action |
---|---|---|
ILC SPbPU Local Network | All |
|
Internet | Authorized users SPbPU |
|
Internet | Anonymous |
|
Access count: 1991
Last 30 days: 0