Details
| Title | Анализ сентимента комментариев в социальной сети с помощью машинного обучения: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии» |
|---|---|
| Creators | Ларченко Полина Игоревна |
| Scientific adviser | Журавская Анжелика |
| Organization | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Imprint | Санкт-Петербург, 2025 |
| Collection | Выпускные квалификационные работы ; Общая коллекция |
| Subjects | анализ сентимента ; машинное обучение ; трансформенные модели ; RuBERT ; социальные сети ; тональность ; эмоции ; sentiment analysis ; machine learning ; transformer models ; social media ; tonality ; emotions |
| Document type | Bachelor graduation qualification work |
| File type | |
| Language | Russian |
| Level of education | Bachelor |
| Speciality code (FGOS) | 09.03.02 |
| Speciality group (FGOS) | 090000 - Информатика и вычислительная техника |
| DOI | 10.18720/SPBPU/3/2025/vr/vr25-5161 |
| Rights | Доступ по паролю из сети Интернет (чтение, печать) |
| Additionally | New arrival |
| Record key | ru\spstu\vkr\37354 |
| Record create date | 9/19/2025 |
Allowed Actions
–
Action 'Read' will be available if you login or access site from another network
| Group | Anonymous |
|---|---|
| Network | Internet |
Тема выпускной квалификационной работы: «Анализ сентимента комментариев в социальной сети с помощью машинного обучения». Данная работа посвящена разработке программного обеспечения для автоматического анализа тональности русскоязычных комментариев из социальной сети ВКонтакте, используя предобученные трансформенные модели RuBERT. Задачи, которые решались в ходе исследования: 1) Изучение методов машинного обучения для анализа сентимента текста. 2) Сбор и обработка русскоязычных комментариев из социальной сети ВКонтакте. 3) Разработка программного обеспечения с графическим интерфейсом для анализа тональности. 4) Тестирование программы на реальных данных и оценка ее эффективности. 5) Оценка эмоционального восприятия и отношения аудитории паблика в социальной сети ВКонтакте на основе анализа сентимента их комментариев. Работа выполнена на основе данных, собранных вручную из паблика «Санкт-Петербургский политехнический университет» ВКонтакте (108 комментариев), и двух тестовых датасетов по 30 записей. Использованы предобученные модели: blanchefort/rubert-base-cased-sentiment для сентимента, helinivan/multilingual-sarcasm-detector для сарказма и cointegrated/rubert-tiny2-cedremotion-detection для эмоций. Разработана программа на языке Python с использованием библиотек Pandas,Transformers, TKinter и других. Программа позволяет загружать файлы CSV или Excel, анализировать комментарии и отображать результаты в виде таблицы, группируя их по хэштегам. Использованные информационные технологии: язык программирования Python, IDE PyCharm, библиотеки pandas, transformers, torch, tkinter, emoji, chardet.
Thesis topic: "Sentiment Analysis of Comments on a Social Network Using Machine Learning." This work is dedicated to the development of software for the automatic analysis of the tonality of Russian-language comments from the social network VKontakte, utilizing pretrained transformer models RuBERT. Tasks addressed in the study: 1) Studying machine learning methods for text sentiment analysis. 2) Collecting and processing Russian–language comments from the VKontakte social network. 3) Developing software with a graphical interface for analyzing tonality. 4) Testing the program on real data and evaluating its effectiveness. 5) Assessment of the emotional perception and attitude of the audience of a public in the VKontakte social network based on sentiment analysis of their comments The work is based on data manually collected from the VKontakte public page "Saint Petersburg Polytechnic University" (108 comments) and two test datasets of 30 entries each. Pretrained models used include: blanchefort/rubert-base-cased-sentiment for sentiment, helinivan/multilingual-sarcasm-detector for sarcasm, and cointegrated/rubert-tiny2-cedr-emotion-detection for emotions. A program was developed in Python using libraries such as Pandas, Transformers, TKinter, and others. The program allows loading CSV or Excel files, analyzing comments, and displaying results in a table, grouped by hashtags. Information technologies used: Python programming language, PyCharm IDE, Pandas, Transformers, Torch, TKinter, Emoji, Chardet. libraries.
| Network | User group | Action |
|---|---|---|
| ILC SPbPU Local Network | All |
|
| Internet | Authorized users SPbPU |
|
| Internet | Anonymous |
|
Access count: 0
Last 30 days: 0