Таблица | Карточка | RUSMARC | |
Разрешенные действия: –
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
Группа: Анонимные пользователи Сеть: Интернет |
Аннотация
Теория комплекснозначной эконометрики позволяет создавать качественно новые признаки, которые можно использовать в алгоритмах машинного обучения. В данной работе демонстрируется задача определения долгосрочной зависимости будущих цен акций компаний от сгенерированного временного признака – вычисляемого коэффициента тональности, получаемого методами семантического анализа текстов из социальных сетей. Данные собирались с платформы Twitter с использованием Big Data ETL-сценариев. Полученные наборы данных были использованы для обучения специализированных алгоритмов машинного обучения, предназначенных для работы с технологиями больших данных. Семантический коэффициент рассчитывался ежедневно на основе агрегированных оценок с дальнейшим применением методов комплекснозначной эконометрики. Для демонстрации нового подхода к созданию признаков, была построена модель комплекснозначной линейной регрессии, основанной на семантических коэффициентах и показателях фондовых рынков. Результат, полученный новым подходом, был сравнен с существующими решениями с точки зрения точности. Наконец, мы демонстрируем возможный путь воздействия на улучшения существующих алгоритмов для торговых стратегий с использованием комплексной регрессии.
Theory of complex-valued econometrics makes it possible to generate qualitatively new features that can be used in machine learning algorithms. Our study reveals the task of determining the long-term dependence of future companies’ stocks prices on a time-generated feature – a calculated tonality coefficient gained by methods of semantic analysis of texts from social networks. Data was gathered from Twitter platform with the use of Big Data ETL-scenarios. The resulting data sets were used to train machine learning algorithms designed to work with Big Data technologies. A semantic coefficient was calculated on the basics of aggregated estimates for each day, with the further application of the methods of complex-valued econometrics. To demonstrate the new approach of feature generation a complex-valued linear regression model based on the semantic coefficients and stock markets data was constructed. The outcome obtained by new approach was compared to existing solutions in terms of accuracy and. Finally, we demonstrate a possible route for impact in improvements of the existing algorithms for trading strategies using the complex-valued regression.
Права на использование объекта хранения
Место доступа | Группа пользователей | Действие | ||||
---|---|---|---|---|---|---|
Локальная сеть ИБК СПбПУ | Все | |||||
Интернет | Авторизованные пользователи СПбПУ | |||||
Интернет | Анонимные пользователи |
Статистика использования
Количество обращений: 38
За последние 30 дней: 0 Подробная статистика |