Детальная информация

Название: Распознавание естественных языков на предмет их принадлежности одной языковой группе: выпускная квалификационная работа бакалавра: 09.03.01 - Информатика и вычислительная техника ; 09.03.01_08 - Встраиваемые системы управления
Авторы: Чурляев Дмитрий Олегович
Научный руководитель: Никитин Кирилл Вячеславович
Организация: Санкт-Петербургский политехнический университет Петра Великого. Институт компьютерных наук и технологий
Выходные сведения: Санкт-Петербург, 2018
Коллекция: Выпускные квалификационные работы; Общая коллекция
Тематика: дистрибутивная семантика; word2vec; реккурентные нейронные сети; lstm
Тип документа: Выпускная квалификационная работа бакалавра
Тип файла: PDF
Язык: Русский
Код специальности ФГОС: 09.03.01
Группа специальностей ФГОС: 090000 - Информатика и вычислительная техника
Ссылки: http://doi.org/10.18720/SPBPU/2/v18-5031; http://elib.spbstu.ru/dl/2/rev/v18-5031-o.pdf; http://elib.spbstu.ru/dl/2/rev/v18-5031-r.pdf
Права доступа: Свободный доступ из сети Интернет (чтение, печать, копирование)

Разрешенные действия: Прочитать Загрузить (0,7 Мб) Для чтения документа необходим Flash Player

Группа: Анонимные пользователи

Сеть: Интернет

Аннотация

В данной работе проведен обзор некоторых разновидностей рекуррентных нейронных сетей. Рассмотрен раздел лингвистики под названием дистрибутивная семантика, а также описана реализация системы для получения семантических характеристик слов, на основе дистрибутивной гипотезы – Word2Vec. На основании выше перечисленных технологий создан классификатор языковых групп, а также приведены полученные результаты близости изолированных языков к приведенным языковым группам.

Права на использование объекта хранения

Место доступа Группа пользователей Действие
Локальная сеть ИБК СПбПУ Все Прочитать Печать Загрузить
-> Интернет Все Прочитать Печать Загрузить

Оглавление

  • ВВЕДЕНИЕ
  • 1. Дистрибутивная семантика
    • 1.1. Математическая модель
    • 1.2. Традиционная счётная модель
    • 1.3. Предсказательная модель, Word2Vec
      • 1.3.1. Skip-gram
      • 1.3.2. Continuous bag of words
  • 2. Рекуррентные нейронные сети
    • 2.1. Архитектуры РНС
    • 2.2. Обучение
    • 2.3. Сети долгой краткосрочной памяти
  • 3. Разработка предсказательной системы
    • 3.1. Параметры сети
    • 3.2. Обучение и тестирование
  • 4. Реализация классификатора
    • 4.1. Параметры сети
    • 4.2. Обучение и тестирование
  • ЗАКЛЮЧЕНИЕ
  • СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
  • ПРИЛОЖЕНИЕ 1. ЛИСТИНГ

Статистика использования документа

stat Количество обращений: 109
За последние 30 дней: 8
Подробная статистика