Table | Card | RUSMARC | |
Allowed Actions: –
Action 'Read' will be available if you login or access site from another network
Action 'Download' will be available if you login or access site from another network
Group: Anonymous Network: Internet |
Annotation
В данной работе разработана программа, которая автоматически определяет тональность отзывов, найденных в социальной сети Twitter, о каком-либо событии или мероприятии по введенному ключевому слову. Был проведен обзор предметной области, в результате которого были выделены подходы автоматического определения тональностей и возможные проблемы. Были исследованы особенности сообщений данной социальной сети, а также подробнее были изучены наивный байесовский классификатор и словарный подход.
Document access rights
Network | User group | Action | ||||
---|---|---|---|---|---|---|
ILC SPbPU Local Network | All | |||||
Internet | Authorized users SPbPU | |||||
Internet | Anonymous |
Table of Contents
- ВВЕДЕНИЕ
- 1. Автоматическое определение тональности
- 1.1. Подходы автоматического определения тональности
- 1.1.1. Подход, основанный на правилах
- 1.1.2. Подход, основанный на использовании словарей тональности
- 1.1.3. Подход, основанный на машинном обучении с учителем
- 1.1.4. Подход, основанный на обучении без учителя
- 1.2. Проблемы автоматического определения тональности
- 1.2.1. Использование сарказма и иронии
- 1.2.2. Использование отрицания
- 1.2.3. Зависимость значения тональности от предметной области
- 1.2.4. Безграмотные тексты и опечатки
- 1.3. Вывод
- 1.1. Подходы автоматического определения тональности
- 2. Исследование выбранных компонентов
- 2.1. Особенности сообщений в социальной сети Twitter
- 2.1.1. Малый размер сообщений
- 2.1.2. Использование эмотиконов и других специальных символов
- 2.1.3. Использование сленга, сокращений, наличие грамматических ошибок и опечаток
- 2.2. Словарный подход анализа тональности
- 2.3. Наивный байесовский классификатор
- 2.1. Особенности сообщений в социальной сети Twitter
- 3. Реализация автоматического определения тональности
- 3.1. Используемые библиотеки
- 3.1.1. tweepy
- 3.1.2. nltk
- 3.1.3. pymorphy2
- 3.1.4. Word2Vec
- 3.1.5. PyEnchant
- 3.1.6. tkinter
- 3.2. Алгоритм работы
- 3.2.1. Загрузка и считывание словарей
- 3.2.2. Поиск сообщений по ключевому слову
- 3.2.3. Определение тональности
- 3.2.4. Вывод результата
- 3.3. Тестирование системы
- 3.3.1. Ввод ключевого слова
- 3.3.2. Поиск сообщений
- 3.3.3. Анализ тональности
- 3.3.4. Вывод результатов
- 3.3.5. Работоспособность кнопок «Next» и «Exit»
- 3.4. Результаты
- 3.1. Используемые библиотеки
- ЗАКЛЮЧЕНИЕ
- СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
- ПРИЛОЖЕНИЕ. КОД ПРОГРАММЫ
Usage statistics
Access count: 149
Last 30 days: 0 Detailed usage statistics |