Details

Title: Анализ тональности сообщений социальной сети: выпускная квалификационная работа бакалавра: 09.03.01 - Информатика и вычислительная техника ; 09.03.01_02 - Технологии разработки программного обеспечения
Creators: Мануйлова Мария Игоревна
Scientific adviser: Богач Наталья Владимировна
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2018
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: анализ тональности; словарный подход; наивный байесовский классификатор; социальная сеть
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 09.03.01
Speciality group (FGOS): 090000 - Информатика и вычислительная техника
Links: Отзыв руководителя; Рецензия
DOI: 10.18720/SPBPU/2/v18-5041
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: RU\SPSTU\edoc\57445

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В данной работе разработана программа, которая автоматически определяет тональность отзывов, найденных в социальной сети Twitter, о каком-либо событии или мероприятии по введенному ключевому слову. Был проведен обзор предметной области, в результате которого были выделены подходы автоматического определения тональностей и возможные проблемы. Были исследованы особенности сообщений данной социальной сети, а также подробнее были изучены наивный байесовский классификатор и словарный подход.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Table of Contents

  • ВВЕДЕНИЕ
  • 1. Автоматическое определение тональности
    • 1.1. Подходы автоматического определения тональности
      • 1.1.1. Подход, основанный на правилах
      • 1.1.2. Подход, основанный на использовании словарей тональности
      • 1.1.3. Подход, основанный на машинном обучении с учителем
      • 1.1.4. Подход, основанный на обучении без учителя
    • 1.2. Проблемы автоматического определения тональности
      • 1.2.1. Использование сарказма и иронии
      • 1.2.2. Использование отрицания
      • 1.2.3. Зависимость значения тональности от предметной области
      • 1.2.4. Безграмотные тексты и опечатки
    • 1.3. Вывод
  • 2. Исследование выбранных компонентов
    • 2.1. Особенности сообщений в социальной сети Twitter
      • 2.1.1. Малый размер сообщений
      • 2.1.2. Использование эмотиконов и других специальных символов
      • 2.1.3. Использование сленга, сокращений, наличие грамматических ошибок и опечаток
    • 2.2. Словарный подход анализа тональности
    • 2.3. Наивный байесовский классификатор
  • 3. Реализация автоматического определения тональности
    • 3.1. Используемые библиотеки
      • 3.1.1. tweepy
      • 3.1.2. nltk
      • 3.1.3. pymorphy2
      • 3.1.4. Word2Vec
      • 3.1.5. PyEnchant
      • 3.1.6. tkinter
    • 3.2. Алгоритм работы
      • 3.2.1. Загрузка и считывание словарей
      • 3.2.2. Поиск сообщений по ключевому слову
      • 3.2.3. Определение тональности
      • 3.2.4. Вывод результата
    • 3.3. Тестирование системы
      • 3.3.1. Ввод ключевого слова
      • 3.3.2. Поиск сообщений
      • 3.3.3. Анализ тональности
      • 3.3.4. Вывод результатов
      • 3.3.5. Работоспособность кнопок «Next» и «Exit»
    • 3.4. Результаты
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • ПРИЛОЖЕНИЕ. КОД ПРОГРАММЫ

Usage statistics

stat Access count: 151
Last 30 days: 2
Detailed usage statistics