Детальная информация

Название Automated Sentiment Analysis of Feminitives in the Russian Language: выпускная квалификационная работа магистра: направление 45.04.04 «Интеллектуальные системы в гуманитарной среде» ; образовательная программа 45.04.04_01 «Цифровая лингвистика (международная образовательная программа)/Digital Linguistics (International Educational Program)»
Авторы Софронова Елизавета Васильевна
Научный руководитель Белов Вадим Алексеевич
Организация Санкт-Петербургский политехнический университет Петра Великого. Гуманитарный институт
Выходные сведения Санкт-Петербург, 2024
Коллекция Выпускные квалификационные работы ; Общая коллекция
Тематика feminitives ; algorithms for sentiment analysis ; corpus ; connotation ; natural language processing ; феминитивы ; алгоритм анализа тональности ; корпус ; коннотация ; анализ естественного языка
ББК 81.411.2-9 ; 81.112
Тип документа Выпускная квалификационная работа магистра
Тип файла PDF
Язык Русский
Уровень высшего образования Магистратура
Код специальности ФГОС 45.04.04
Группа специальностей ФГОС 450000 - Языкознание и литературоведение
DOI 10.18720/SPBPU/3/2024/vr/vr24-5826
Права доступа Доступ по паролю из сети Интернет (чтение)
Ключ записи ru\spstu\vkr\33108
Дата создания записи 29.08.2024

Разрешенные действия

Действие 'Прочитать' будет доступно, если вы выполните вход в систему или будете работать с сайтом на компьютере в другой сети

Группа Анонимные пользователи
Сеть Интернет

The main purpose of our research is to improve the algorithm for analyzing the tonality of texts containing feminitives. In the course of our work, we had the task of selecting corpus materials to test one of the systems for evaluating the tonality of texts containing feminitives, and if the evaluation algorithm works inaccurately, retrain it to obtain more correct results. As a hypothesis, it was suggested that a significant part of the feminitives describing womens professional activities are used more often with negative connotations in various contexts. The practical part of the study was carried out in several stages. First, we analyzed the proposals of the NKRJ newspaper half-corps using the Dostoevsky library. The results obtained at this stage were compared with the assessment of the emotional coloring of the sentences, which was obtained during a psycholinguistic experiment to determine the assessment. 39 students of the SPbPU took part in the survey. At the third stage, the algorithm for evaluating proposals was improved, for which the SpaCy library was used. To work, we first selected comments on Yandex Zen and conducted an analysis to train the model. We also used a dictionary of evaluative words.  Expressions of the Russian language - Rusentilex. Then we re-analyzed the proposals in order to verify the operation of the system. For this purpose, the same proposals were used that we analyzed at the first stage, and the students in the process of completing the survey. The result turned out to be much more accurate and more consistent with the answers received when evaluating the tonality of sentences by native speakers.

Основной целью нашего исследования является усовершенствование алгоритма анализа тональности текстов, содержащих в себе феминитивы. В ходе работы нами стояла задача отобрать корпусные материалы для проверки одной из систем оценки тональности текстов, содержащих феминитивы, и в случае, если алгоритм оценки работает неточно - переучить его для получения более корректных результатов. В качестве гипотезы было выдвинуто предположение о том, что значительная часть феминитивов, описывающих профессиональную деятельность женщин, используются чаще с негативной коннотацией в различных контекстах. Практическая часть исследования проводилась в несколько этапов. Сперва мы анализировали предложения газетного полкорпуса НКРЯ с использование библиотеки “Dostoevsky”. Полученные результаты на этом этапе сравнивались с оценкой эмоциональной окраски предложений, которая была получена в ходе психолингвистического эксперимента на определение оценки. В опросе приняли участие 39 студентов ГИ СПбПУ. На третьем этапе был усовершенствован алгоритм оценки предложений, для чего использовали библиотеку SpaCy. Для работы мы сперва отобрали комментарии на Яндекс Дзене и провели анализ для тренировки модели. Нами также использовался словарь оценочных слов. Выражений русского языка - РуСентиЛекс. Затем мы повторно провели анализ предложений с целью проверки работы системы. Использовались для этой цели те же предложения, что мы анализировали на первом этапе, а студенты в процессе прохождения опроса. Результат оказался гораздо более точным и больше совпадал с ответами, полученными при оценке тональности предложений носителями языка.

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все
Прочитать
Интернет Авторизованные пользователи СПбПУ
Прочитать
Интернет Анонимные пользователи
  • ABSTRACT
    • INTRODUCTION
  • CHAPTER 1. THEORETICAL ASPECTS OF FEMINITIVES AS LINGUISTIC PHENIMENON, APPROACHES TO SENTIMENT ANALYSIS
    • 1.1. The origin of feminitives and the ways of their formation
    • 1.2. Adaptation of feminitives in the Russian language at the present stage of its development
    • 1.3. Feminitives in modern Internet discourse
    • 1.5. Approaches to the analysis of the tonality of the text
    • 1.6. Classification of texts by machine learning methods. Classification algorithms.
  • Conclusions on Chapter 1
    • CHAPTER 2. IMPROVEMENT OF THE ALGORITHM FOR SENTIMENT ANALYSIS
    • 2.1. Libraries for analyzing the tonality of natural language text
  • 2.2. Accuracy, precision, and recall
  • 2.3. Primary analysis of corpus data
    • 2.4. Experiment
    • 2.5 Improving the tonality assessment system
  • CONCLUSION
  • REFERENCES
  • APPENDIX 1: Survey

Количество обращений: 6 
За последние 30 дней: 0

Подробная статистика