Details

Title: Анализ тональности текстов с использованием классификаторов на основе методов машинного обучения: выпускная квалификационная работа бакалавра: 02.03.03 - Математическое обеспечение и администрирование информационных систем ; 02.03.03_01 - Информационные системы и базы данных
Creators: Циось Алена Игоревна
Scientific adviser: Кожевников В. А.
Organization: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Imprint: Санкт-Петербург, 2018
Collection: Выпускные квалификационные работы; Общая коллекция
Subjects: анализ тональности текста; классификация; word2vec; сверточная нейронная сеть
Document type: Bachelor graduation qualification work
File type: PDF
Language: Russian
Level of education: Bachelor
Speciality code (FGOS): 02.03.03
Speciality group (FGOS): 020000 - Компьютерные и информационные науки
Links: Отзыв руководителя
DOI: 10.18720/SPBPU/2/v18-3743
Rights: Доступ по паролю из сети Интернет (чтение, печать, копирование)
Record key: RU\SPSTU\edoc\55917

Allowed Actions:

Action 'Read' will be available if you login or access site from another network Action 'Download' will be available if you login or access site from another network

Group: Anonymous

Network: Internet

Annotation

В данной работе рассматривается задача анализа тональности текста. В первой главе дано ее описание и способы решения. Произведен обзор существующих систем для определения тональности текста. Во второй главе исследуются методы машинного обучения. В третьей главе описана программная реализация оценивающего качество классификации модуля на языке Python. В четвертой главе представлены результаты оценки качества работы рассмотренных методов машинного обучения.

Document access rights

Network User group Action
ILC SPbPU Local Network All Read Print Download
Internet Authorized users SPbPU Read Print Download
-> Internet Anonymous

Table of Contents

  • ВВЕДЕНИЕ
  • ГЛАВА 1. ЗАДАЧА АНАЛИЗА ТОНАЛЬНОСТИ ТЕКСТОВ
    • 1.1. Подходы к классификации тональности
    • 1.2. Проблемы анализа тональности текста
    • 1.3. Типы сентимент-анализа
      • 1.3.1. Уровень документа
      • 1.3.2. Уровень предложения
      • 1.3.3. Уровень аспектов или сущностей
    • 1.4. Обзор существующих систем для определения тональности текстов
  • ГЛАВА 2. ОБЗОР ЗАДАЧИ КЛАССИФИКАЦИИ
    • 2.1. Постановка задачи классификации текста
    • 2.2. Оценка эффективности классификации
      • 2.2.1. Методы оценки классификации
      • 2.2.2. Метрики качества классификации
    • 2.3. Индексирование документов
      • 2.3.1. Предварительная обработка текстов
      • 2.3.2. Bag-of-words
      • 2.3.3. Word2vec
      • 2.3.4. Метрики TF-IDF и Delta TF-IDF.
    • 2.5. Методы машинного обучения для классификации текстов
      • 2.5.1. Наивный классификатор Байеса
      • 2.5.2. Метод опорных векторов
      • 2.5.3. AdaBoost
      • 2.5.4. Логистическая регрессия
      • 2.5.7. Сверточная нейронная сеть
      • 2.5.5. Дерево принятия решений
      • 2.5.6. Случайный лес
  • ГЛАВА 3. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ
    • 3.1. Описание работы модуля
    • 3.3. Используемые инструменты
      • 3.3.1. Обработка и хранение текстовых данных
      • 3.3.2. Векторизация
      • 3.3.3. Классификация
      • 3.3.4. Обработка и предоставление результатов
  • ГЛАВА 4. ЧИСЛЕННЫЕ ЭКСПЕРИМЕНТЫ
    • 4.1. Оценка качества работы нейронной сети
    • 4.2. Оценка качества работы алгоритмов классификации
      • 4.2.1. Классический подход
      • 4.2.2. Подход Word2Vec
      • 4.2.3. Оптимальные параметры
      • 4.2.4. Лучший алгоритм классификации
    • 4.3. Сравнение подходов
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • Приложение 1
  • Приложение 2

Usage statistics

stat Access count: 955
Last 30 days: 1
Detailed usage statistics