Детальная информация

Название: Методы анализа данных средствами R и СУБД MS SQL Server: магистерская диссертация: 09.04.02
Авторы: Пацульда Полина Вячеславовна
Научный руководитель: Нестеров Сергей Александрович
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2016
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: Базы данных; Нейронные сети; Программирования языки; интеллектуальный анализ данных; кластеризация; data mining; clustering
УДК: 004.655.3(043.3)
Тип документа: Выпускная квалификационная работа магистра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Магистратура
Код специальности ФГОС: 09.04.02
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/2/v16-2815
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Ключ записи: RU\SPSTU\edoc\35368

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Настоящая работа посвящена методам интеллектуального анализа данных средствами языка R и СУБД SQL Server. Работа состоит из введения, трех разделов, заключения. Во введении отражена актуальность задачи и описаны основные требования к работе. В первой главе проведен обзор аналитических задач в различных постановках и методов их решения. Были рассмотрены следующие задачи: поиск ассоциаций, классификация, кластеризация, анализ временных рядов, визуализация результатов. Во второй главе проводилась работа с реляционной базой данных средствами R и MS SQL Server. В третьей главе была проделана работа с плохо структурированными данными, а именно, проведен анализ тональности высказываний в социальной сети. Заключение включает основные выводы по работе.

The aim of this thesis is to investigate data analysis and data mining methods presented in MS SQL Server and R. This thesis first examines various mining methods used in data analysis in different situations. The following problem types were considered: clustering, association rules, classification, time series and visualization. In a second stage the work with relational database was performed. The relevant methods were applied to the specific problem in order to build mining models with MS SQL Server and R for clustering, classification and prediction purposes. Finally, the specific R tools for the analysis of poorly structured data were used and the Twitter posts sentiment analysis was performed.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 1991
За последние 30 дней: 2
Подробная статистика