Детальная информация

Название: Распознавание эмоций в тексте с помощью методов машинного обучения: выпускная квалификационная работа бакалавра: направление 09.03.02 «Информационные системы и технологии» ; образовательная программа 09.03.02_02 «Информационные системы и технологии»
Авторы: Косырев Александр Валерьевич
Научный руководитель: Журавская Анжелика
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и кибербезопасности
Выходные сведения: Санкт-Петербург, 2024
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: SVM; Naive Bayes; Bag of Words; Vader; Textblob; Google Cloud Natural Language API; IBM Watson Natural Language Understanding; Amazon Comprehend; машинное обучение; глубокое обучение; семантический анализ; токенизация; лемматизация; Rubert; usability; machine learning; deep learning; semantic analysis; tokenization; lemmatisation
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Уровень высшего образования: Бакалавриат
Код специальности ФГОС: 09.03.02
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
DOI: 10.18720/SPBPU/3/2024/vr/vr24-962
Права доступа: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Дополнительно: Новинка
Ключ записи: ru\spstu\vkr\27653

Разрешенные действия:

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети Действие 'Загрузить' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

Тема выпускной квалификационной работы: Распознавание эмоций в тексте с помощью методов машинного обучения. Данная работа посвящена изучению различных методов анализа тональности текста, основных подходов и инструментов, используемых в процессе анализа, анализу алгоритмов машинного обучения, а также разработке программного продукта для анализа тональности текста на основе машинного обучения. Задачи, которые решались в ходе исследования: 1) Обзор существующих методов распознавания эмоций в тексте. 2) Сравнение инструментов анализа тональности текста. 3) Анализ и предобработка данных. 4) Выбор алгоритмов машинного обучения для классификации эмоций. 5) Обучение выбранной модели на подготовленных данных. 6) Оценка качества модели и ее параметров. 7) Проведение экспериментов и получение результатов. Работа проведена на базе языка программирования Python с использованием библиотеки для работы с анализом текста, в частности распознавания эмоций, под названием Transformer (Hugging Face). Также была использована предобученная модель RuBERT которая обучалась на большой выборке текстов на русском языке. Для обучения использовалась выборка отзывов о мобильных приложениях. Все тексты были размечены по тональности. В результате была проведена разработка программного продукта для анализа тональности текста на основе машинного обучения, проведен анализ алгоритмов и методов анализа и социально-этических аспектов использования этой технологии.

The subject of the graduate qualification work is «Recognition of emotions in text using machine learning methods». This work is devoted to the study of various methods for analyzing text sentiment, the main approaches and tools used in the analysis process, the analysis of machine learning algorithms, as well as the development of a software product for analyzing text sentiment based on machine learning. The research set the following goals: 1) Review of existing methods for recognizing emotions in text. 2) Comparison of text sentiment analysis tools. 3) Data analysis and data preparation. 4) Selecting machine learning algorithms for emotion classification. 5) Training the selected model on prepared data. 6) Assessment of the quality of the model and its parameters. 7) Conducting experiments and obtaining results. The work was carried out using the Python programming language using a library for working with text analysis, in particular emotion recognition, called Transformer (Hugging Face). A pre-trained RuBERT model was also used, which was trained on a large sample of texts in Russian. For training, a sample of reviews about mobile applications was used. All texts were marked by tone. As a result, a software product was developed for analyzing the sentiment of text based on machine learning, an analysis of algorithms and analysis methods and social and ethical aspects of using this technology was carried out.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
Интернет Авторизованные пользователи СПбПУ Прочитать Печать Загрузить
-> Интернет Анонимные пользователи

Статистика использования

stat Количество обращений: 2
За последние 30 дней: 0
Подробная статистика