Details

Title: Методы анализа данных средствами R и СУБД MS SQL Server: магистерская диссертация: 09.04.02
Creators: Пацульда Полина Вячеславовна
Scientific adviser: Нестеров Сергей Александрович
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2016
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: Базы данных; Нейронные сети; Программирования языки; интеллектуальный анализ данных; кластеризация; data mining; clustering
UDC: 004.655.3(043.3)
Document type: Master graduation qualification work
File type: PDF
Language: Russian
Speciality code (FGOS): 09.04.02
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/2/v16-2815
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

Настоящая работа посвящена методам интеллектуального анализа данных средствами языка R и СУБД SQL Server. Работа состоит из введения, трех разделов, заключения. Во введении отражена актуальность задачи и описаны основные требования к работе. В первой главе проведен обзор аналитических задач в различных постановках и методов их решения. Были рассмотрены следующие задачи: поиск ассоциаций, классификация, кластеризация, анализ временных рядов, визуализация результатов. Во второй главе проводилась работа с реляционной базой данных средствами R и MS SQL Server. В третьей главе была проделана работа с плохо структурированными данными, а именно, проведен анализ тональности высказываний в социальной сети. Заключение включает основные выводы по работе.

The aim of this thesis is to investigate data analysis and data mining methods presented in MS SQL Server and R. This thesis first examines various mining methods used in data analysis in different situations. The following problem types were considered: clustering, association rules, classification, time series and visualization. In a second stage the work with relational database was performed. The relevant methods were applied to the specific problem in order to build mining models with MS SQL Server and R for clustering, classification and prediction purposes. Finally, the specific R tools for the analysis of poorly structured data were used and the Twitter posts sentiment analysis was performed.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
Internet Authorized users (not from SPbPU)
-> Internet Anonymous

Usage statistics

stat Access count: 168
Last 30 days: 0
Detailed usage statistics