Details

Title Investigating the impact of news on stock prices using machine learning: выпускная квалификационная работа магистра: направление 38.04.01 «Экономика» ; образовательная программа 38.04.01_27 «Количественные финансы (международная образовательная программа)»
Creators Тимошенков Алексей Максимович
Scientific adviser Тихомиров Антон Федорович
Organization Санкт-Петербургский политехнический университет Петра Великого. Институт промышленного менеджмента, экономики и торговли
Imprint Санкт-Петербург, 2025
Collection Выпускные квалификационные работы ; Общая коллекция
Subjects акции ; рынок ценных бумаг ; анализ ; машинное обучение ; важность переменных ; инвестиции ; stocks ; securities market ; analysis ; machine learning ; importance of variables ; investments
Document type Master graduation qualification work
File type PDF
Language Russian
Level of education Master
Speciality code (FGOS) 38.04.01
Speciality group (FGOS) 380000 - Экономика и управление
DOI 10.18720/SPBPU/3/2025/vr/vr25-2064
Rights Доступ по паролю из сети Интернет (чтение)
Additionally New arrival
Record key ru\spstu\vkr\35418
Record create date 7/10/2025

Allowed Actions

Action 'Read' will be available if you login or access site from another network

Group Anonymous
Network Internet

Данная работа посвящена анализу влияния новостной информации на изменение движения цен акций с использованием методов естественного языка ( NLP ) и алгоритмов машинного обучения. Исследование сосредоточено на построение модели прогнозирования напр авления изменения индекса MOEX на основе тональности новостей. В работе рассмотрены теоретические аспекты влияния информационного фона на изменение цен акций. Были проанализированы поведенческие эффекты, примеры исторических реакций на новости. Также были рассмотрены и представлены основные преимущества и недостатки современных языков программирования, а именно Python и R , которые используются для анализа данных, а также визуализации. Далее в работе была описана методология исследования. Был описан процесс сбора, последующего преобразования и подготовки данных цен индекса, а также новостные заголовки. В ходе работы подробно описан процесс преобразования данных, а именно новостей из текс тового формата в формат числовой. Была описана модель, которая использовалась в данном исследование, а именно Random Forest Classifier . Также подробно описан процесс проверки важности переменных, которые используются для построения модели. По ходу работы все теоретически описанные методы были применены на практике. Полученная модель показала точность результатов в 58 % , что свидетельствует о том, что на основе наших данных модель выбирает правильный исход в больше половины случаев, что лучше, чем если бы вы бор делался наугад. Также после проведения тестов на важность переменных было выявлено, что новости с задержкой в 2 - 3 дня оказывают значительное влияние на изменение движения индекса. В заключение исследования подведены итоги, обозначена теоретическая и п рактическая значимость работы, а также предложены направления для дальнейшего развития данной темы.

This paper is devoted to the analysis of the impact of news information on changes in stock price movements using natural language (NLP) methods and machine learning algorithms. The research focuses on building a model for predicting the direction of change in the MOEX index based on the tone of the news. The paper considers the theoretical aspects of the influence of the information background on the change in stock prices. Behavioral effects and examples of historical reactions to the news were analyzed. The main advantages and disadvantages of modern programming languages, namely Python and R, which are used for data analysis and visualization, were also considered and presented. The research methodology was further described in the paper. The process of collecting, then converting, and preparing index price data, as well as news headlines, was described. In the course of the work, the process of converting data, namely news from a text format to a numeric format, is described in detail. The model used in this study, namely the Random Forest Classifier, was described. The process of verifying the importance of variables that are used to build a model is also described in detail. In the course of the work, all the theoretically described methods were applied in practice. The resulting model showed an accuracy of 58%, which indicates that based on our data, the model chooses the correct outcome in more than half of the cases, which is better than if the choice was made at random. Also, after conducting tests on the importance of variables, it was revealed that news with a delay of 2-3 days has a significant impact on the change in the movement of the index. At the end of the study, the results are summarized, the theoretical and practical significance of the work is outlined, and directions for further development of this topic are proposed.

Network User group Action
ILC SPbPU Local Network All
Read
Internet Authorized users SPbPU
Read
Internet Anonymous

Access count: 0 
Last 30 days: 0

Detailed usage statistics