Детальная информация
| Название | Анализ сентимента комментариев в социальной сети с помощью машинного обучения: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии» |
|---|---|
| Авторы | Ларченко Полина Игоревна |
| Научный руководитель | Журавская Анжелика |
| Организация | Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности |
| Выходные сведения | Санкт-Петербург, 2025 |
| Коллекция | Выпускные квалификационные работы ; Общая коллекция |
| Тематика | анализ сентимента ; машинное обучение ; трансформенные модели ; RuBERT ; социальные сети ; тональность ; эмоции ; sentiment analysis ; machine learning ; transformer models ; social media ; tonality ; emotions |
| Тип документа | Выпускная квалификационная работа бакалавра |
| Тип файла | |
| Язык | Русский |
| Уровень высшего образования | Бакалавриат |
| Код специальности ФГОС | 09.03.02 |
| Группа специальностей ФГОС | 090000 - Информатика и вычислительная техника |
| DOI | 10.18720/SPBPU/3/2025/vr/vr25-5161 |
| Права доступа | Доступ по паролю из сети Интернет (чтение, печать) |
| Дополнительно | Новинка |
| Ключ записи | ru\spstu\vkr\37354 |
| Дата создания записи | 19.09.2025 |
Разрешенные действия
–
Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети
| Группа | Анонимные пользователи |
|---|---|
| Сеть | Интернет |
Тема выпускной квалификационной работы: «Анализ сентимента комментариев в социальной сети с помощью машинного обучения». Данная работа посвящена разработке программного обеспечения для автоматического анализа тональности русскоязычных комментариев из социальной сети ВКонтакте, используя предобученные трансформенные модели RuBERT. Задачи, которые решались в ходе исследования: 1) Изучение методов машинного обучения для анализа сентимента текста. 2) Сбор и обработка русскоязычных комментариев из социальной сети ВКонтакте. 3) Разработка программного обеспечения с графическим интерфейсом для анализа тональности. 4) Тестирование программы на реальных данных и оценка ее эффективности. 5) Оценка эмоционального восприятия и отношения аудитории паблика в социальной сети ВКонтакте на основе анализа сентимента их комментариев. Работа выполнена на основе данных, собранных вручную из паблика «Санкт-Петербургский политехнический университет» ВКонтакте (108 комментариев), и двух тестовых датасетов по 30 записей. Использованы предобученные модели: blanchefort/rubert-base-cased-sentiment для сентимента, helinivan/multilingual-sarcasm-detector для сарказма и cointegrated/rubert-tiny2-cedremotion-detection для эмоций. Разработана программа на языке Python с использованием библиотек Pandas,Transformers, TKinter и других. Программа позволяет загружать файлы CSV или Excel, анализировать комментарии и отображать результаты в виде таблицы, группируя их по хэштегам. Использованные информационные технологии: язык программирования Python, IDE PyCharm, библиотеки pandas, transformers, torch, tkinter, emoji, chardet.
Thesis topic: "Sentiment Analysis of Comments on a Social Network Using Machine Learning." This work is dedicated to the development of software for the automatic analysis of the tonality of Russian-language comments from the social network VKontakte, utilizing pretrained transformer models RuBERT. Tasks addressed in the study: 1) Studying machine learning methods for text sentiment analysis. 2) Collecting and processing Russian–language comments from the VKontakte social network. 3) Developing software with a graphical interface for analyzing tonality. 4) Testing the program on real data and evaluating its effectiveness. 5) Assessment of the emotional perception and attitude of the audience of a public in the VKontakte social network based on sentiment analysis of their comments The work is based on data manually collected from the VKontakte public page "Saint Petersburg Polytechnic University" (108 comments) and two test datasets of 30 entries each. Pretrained models used include: blanchefort/rubert-base-cased-sentiment for sentiment, helinivan/multilingual-sarcasm-detector for sarcasm, and cointegrated/rubert-tiny2-cedr-emotion-detection for emotions. A program was developed in Python using libraries such as Pandas, Transformers, TKinter, and others. The program allows loading CSV or Excel files, analyzing comments, and displaying results in a table, grouped by hashtags. Information technologies used: Python programming language, PyCharm IDE, Pandas, Transformers, Torch, TKinter, Emoji, Chardet. libraries.
| Место доступа | Группа пользователей | Действие |
|---|---|---|
| Локальная сеть ИБК СПбПУ | Все |
|
| Интернет | Авторизованные пользователи СПбПУ |
|
| Интернет | Анонимные пользователи |
|
Количество обращений: 0
За последние 30 дней: 0