Details

Title Методы анализа данных средствами R и СУБД MS SQL Server: магистерская диссертация: 09.04.02
Creators Пацульда Полина Вячеславовна
Scientific adviser Нестеров Сергей Александрович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint Санкт-Петербург, 2016
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects Базы данных ; Нейронные сети ; Программирования языки ; интеллектуальный анализ данных ; кластеризация ; data mining ; clustering
UDC 004.655.3(043.3)
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 09.04.02
Speciality group (FGOS) 090000 - Информатика и вычислительная техника
DOI 10.18720/SPBPU/2/v16-2815
Rights Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key RU\SPSTU\edoc\35368
Record create date 12/29/2016

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Action 'Download' will be available if you login or access site from another network

Group Anonymous
Network Internet

Настоящая работа посвящена методам интеллектуального анализа данных средствами языка R и СУБД SQL Server. Работа состоит из введения, трех разделов, заключения. Во введении отражена актуальность задачи и описаны основные требования к работе. В первой главе проведен обзор аналитических задач в различных постановках и методов их решения. Были рассмотрены следующие задачи: поиск ассоциаций, классификация, кластеризация, анализ временных рядов, визуализация результатов. Во второй главе проводилась работа с реляционной базой данных средствами R и MS SQL Server. В третьей главе была проделана работа с плохо структурированными данными, а именно, проведен анализ тональности высказываний в социальной сети. Заключение включает основные выводы по работе.

The aim of this thesis is to investigate data analysis and data mining methods presented in MS SQL Server and R. This thesis first examines various mining methods used in data analysis in different situations. The following problem types were considered: clustering, association rules, classification, time series and visualization. In a second stage the work with relational database was performed. The relevant methods were applied to the specific problem in order to build mining models with MS SQL Server and R for clustering, classification and prediction purposes. Finally, the specific R tools for the analysis of poorly structured data were used and the Twitter posts sentiment analysis was performed.

Network User group Action
ILC SPbPU Local Network All
Read Print Download
Internet Authorized users SPbPU
Read Print Download
Internet Anonymous

Access count: 1991 
Last 30 days: 0

Detailed usage statistics