Детальная информация

Название Investigating the impact of news on stock prices using machine learning: выпускная квалификационная работа магистра: направление 38.04.01 «Экономика» ; образовательная программа 38.04.01_27 «Количественные финансы (международная образовательная программа)»
Авторы Тимошенков Алексей Максимович
Научный руководитель Тихомиров Антон Федорович
Организация Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли
Выходные сведения Санкт-Петербург, 2025
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика акции ; рынок ценных бумаг ; анализ ; машинное обучение ; важность переменных ; инвестиции ; stocks ; securities market ; analysis ; machine learning ; importance of variables ; investments
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 38.04.01
Группа специальностей ФГОС 380000 - Экономика и управление
DOI 10.18720/SPBPU/3/2025/vr/vr25-2064
Права доступа Доступ по паролю из сети Интернет (чтение)
Дополнительно Новинка
Ключ записи ru\spstu\vkr\35418
Дата создания записи 10.07.2025

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

Данная работа посвящена анализу влияния новостной информации на изменение движения цен акций с использованием методов естественного языка ( NLP ) и алгоритмов машинного обучения. Исследование сосредоточено на построение модели прогнозирования напр авления изменения индекса MOEX на основе тональности новостей. В работе рассмотрены теоретические аспекты влияния информационного фона на изменение цен акций. Были проанализированы поведенческие эффекты, примеры исторических реакций на новости. Также были рассмотрены и представлены основные преимущества и недостатки современных языков программирования, а именно Python и R , которые используются для анализа данных, а также визуализации. Далее в работе была описана методология исследования. Был описан процесс сбора, последующего преобразования и подготовки данных цен индекса, а также новостные заголовки. В ходе работы подробно описан процесс преобразования данных, а именно новостей из текс тового формата в формат числовой. Была описана модель, которая использовалась в данном исследование, а именно Random Forest Classifier . Также подробно описан процесс проверки важности переменных, которые используются для построения модели. По ходу работы все теоретически описанные методы были применены на практике. Полученная модель показала точность результатов в 58 % , что свидетельствует о том, что на основе наших данных модель выбирает правильный исход в больше половины случаев, что лучше, чем если бы вы бор делался наугад. Также после проведения тестов на важность переменных было выявлено, что новости с задержкой в 2 - 3 дня оказывают значительное влияние на изменение движения индекса. В заключение исследования подведены итоги, обозначена теоретическая и п рактическая значимость работы, а также предложены направления для дальнейшего развития данной темы.

This paper is devoted to the analysis of the impact of news information on changes in stock price movements using natural language (NLP) methods and machine learning algorithms. The research focuses on building a model for predicting the direction of change in the MOEX index based on the tone of the news. The paper considers the theoretical aspects of the influence of the information background on the change in stock prices. Behavioral effects and examples of historical reactions to the news were analyzed. The main advantages and disadvantages of modern programming languages, namely Python and R, which are used for data analysis and visualization, were also considered and presented. The research methodology was further described in the paper. The process of collecting, then converting, and preparing index price data, as well as news headlines, was described. In the course of the work, the process of converting data, namely news from a text format to a numeric format, is described in detail. The model used in this study, namely the Random Forest Classifier, was described. The process of verifying the importance of variables that are used to build a model is also described in detail. In the course of the work, all the theoretically described methods were applied in practice. The resulting model showed an accuracy of 58%, which indicates that based on our data, the model chooses the correct outcome in more than half of the cases, which is better than if the choice was made at random. Also, after conducting tests on the importance of variables, it was revealed that news with a delay of 2-3 days has a significant impact on the change in the movement of the index. At the end of the study, the results are summarized, the theoretical and practical significance of the work is outlined, and directions for further development of this topic are proposed.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи

Количество обращений: 0 
За последние 30 дней: 0

Подробная статистика