Детальная информация

Название: Аналитика экономических процессов методами комплекснозначной экономики: выпускная квалификационная работа бакалавра: 38.03.05 - Бизнес-информатика
Авторы: Барыев Дмитрий Викторович
Научный руководитель: Светуньков Сергей Геннадьевич
Другие авторы: Багаева Ирина Владимировна
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли
Выходные сведения: Санкт-Петербург, 2019
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: машинное обучение; фондовые биржи; Twitter; нейролингвистическое программирование; ETL; анализ тональности текста; большие данные; комплекснозначная эконометрика; Mongo DB; Spark; Python; machine learning; sentiment analysis; NLP; complex-valued econometrics; stock markets; Big Data
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Код специальности ФГОС: 38.03.05
Группа специальностей ФГОС: 380000 - Экономика и управление
Ссылки: Отзыв руководителя; Отчет о проверке на объем и корректность внешних заимствований
DOI: 10.18720/SPBPU/3/2019/vr/vr19-5101
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Теория комплекснозначной эконометрики позволяет создавать качественно новые признаки, которые можно использовать в алгоритмах машинного обучения. В данной работе демонстрируется задача определения долгосрочной зависимости будущих цен акций компаний от сгенерированного временного признака – вычисляемого коэффициента тональности, получаемого методами семантического анализа текстов из социальных сетей. Данные собирались с платформы Twitter с использованием Big Data ETL-сценариев. Полученные наборы данных были использованы для обучения специализированных алгоритмов машинного обучения, предназначенных для работы с технологиями больших данных. Семантический коэффициент рассчитывался ежедневно на основе агрегированных оценок с дальнейшим применением методов комплекснозначной эконометрики. Для демонстрации нового подхода к созданию признаков, была построена модель комплекснозначной линейной регрессии, основанной на семантических коэффициентах и показателях фондовых рынков. Результат, полученный новым подходом, был сравнен с существующими решениями с точки зрения точности. Наконец, мы демонстрируем возможный путь воздействия на улучшения существующих алгоритмов для торговых стратегий с использованием комплексной регрессии.

Theory of complex-valued econometrics makes it possible to generate qualitatively new features that can be used in machine learning algorithms. Our study reveals the task of determining the long-term dependence of future companies’ stocks prices on a time-generated feature – a calculated tonality coefficient gained by methods of semantic analysis of texts from social networks. Data was gathered from Twitter platform with the use of Big Data ETL-scenarios. The resulting data sets were used to train machine learning algorithms designed to work with Big Data technologies. A semantic coefficient was calculated on the basics of aggregated estimates for each day, with the further application of the methods of complex-valued econometrics. To demonstrate the new approach of feature generation a complex-valued linear regression model based on the semantic coefficients and stock markets data was constructed. The outcome obtained by new approach was compared to existing solutions in terms of accuracy and. Finally, we demonstrate a possible route for impact in improvements of the existing algorithms for trading strategies using the complex-valued regression.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 32
За последние 30 дней: 1
Подробная статистика